Procesamiento y análisis de imágenes digitales I Alejandra García, TM Centro de Estudios Moleculares de la Célula, FONDAP, Facultad de Medicina, Universidad de Chile Procesamiento de Imágenes Digitales Una imagen natural capturada con una cámara, un telescopio, un microscopio o cualquier otro tipo de instrumento óptico presenta una variación de sombras y tonos. Imágenes de este tipo se llaman z imágenes analógicas. Para que grises o ordenador, formato es z una imagen analógica, en blanco y negro, en escala de a color puede ser "manipulada" usando un primero deben convertirse a un formato adecuado. Este la imagen digital correspondiente. La transformación de una imagen analógica a otra discreta se llama digitalización (de las coordenadas espaciales x,y) y es el primer paso en cualquier aplicación de procesamiento de imágenes digitales. z El proceso de digitalización consta de dos partes: muestreo y cuantificación • Un muestreo consiste en una subdivisión de la imagen analógica en porciones. Estos polígonos representan sensores sensibles a la intensidad de luz. Muestreo El número de niveles de gris es usualmente potencia de 2, exponente es el número de bits en la representación binaria del nivel de brillo. Cuantificación: Se llama al proceso de discretización del color. La salida de estos sensores es un valor (amplitud) dentro de una escala (color). La salida pueden ser, o un único valor (escala de grises) o un vector con tres valores por polígono (RGB). La escala de colores también tiene un rango discreto (por ejemplo, de 8-bits = 256 valores). Las imágenes en escala de grises con sólo 2 colores: blanco y negro (0 y 1, respectivamente), se llaman imágenes binarias. Un polígono de color constante es un píxel. Pasos a seguir Paso 1: Adquisición de la imagen Paso 2: Preprocesamiento y restauración Paso 3: Segmentación Paso 4: Representación y descripción Paso 5: Reconocimiento e interpretación Tratamiento y Mejora de la Imagen A) Métodos de dominio espacial: Se refieren al propio plano de la imagen, es decir, manipulación directa de los pixeles. B) Teorema de Convolución. C) Métodos de dominio de frecuencia: Se basa en la modificación de la transformada de Fourier de la imagen. La imagen | Generación & Corrección Fuentes de heterogenidades La muestra: - Reflecciones - ‘Basura‘ - ... El instrumento: - Iluminación - Camino óptico - ... La cámara: - Ruido - Smear - ... Mezclas: - ... La imagen | Métodos de Corrección Análisis Métodos Dominio Espacial: - Lineales - No lineales -Teorema Convolución: -Kernel Métodos Dominio Frecuencia: - Análisis de Fourier Métodos de Dominio Espacial 1. Funciones básicas de transformación de niveles de grises: Negativos de Imágenes, Transformación Logarítmica y Transformaciones Logarítmicas Inversas 2. Transformación de Potencia (Power-Law): Corrección Gamma 3. Contraste / Histograma: Ecualización del Histograma 4. Operaciones aritmético-lógicas: AND, OR, Sustracción y Promediado (Mean) 5. Filtros espaciales:Suavizado, Median y Mean 6. Filtros para definir Bordes y Gradientes: Roberts, Sobel, Laplacian, Gauss y Anisotrópicos 7. Filtros de Nitidez: Sharping/Unsharping 8. Combianación de Filtros Métodos de dominio espacial • Procedimiento que opera directamente con pixeles g(x,y) = T[f(x,y)] donde – f(x,y) es la imagen input – g(x,y) es la imagen de salida – T es un operador • Vecindad = 1x1 pixel • g depende solo del valor de f a (x,y) • T = niveles de grises s = T(r) • Donde – r = Nivel de grises f(x,y) – s = Nivel de grises g(x,y) 1. Funciones básicas de transformación de niveles de grises • Función lineal Negative Output gray level, s nth root Log nth power – Negativo y transformación del negativo • Función logarítmica – Transformación Log y anti-log Identity Inverse Log Input gray level, r • Función Power-law – Transformaciones nth potencia and nth raíz Negativos de Imágenes Negative Output gray level, s nth root Log nth power Identity Inverse Log Input gray level, r • Una imagen con un niveles de grises en el rango[0, L-1] donde L = 2n ; n = 1, 2… • Transformación Negativa : s=L–1–r • Revertiendo los niveles de intensidad de una imagen. • Utilizado para mejorar detalles blancos o grises situados en regiones oscuras de una imagen, cuando el área negra es dominante. Ejemplo Original mammogram showing a small lesion of a breast Negative Image : gives a better vision to analyze the image Transformación Logarítmica s = c log (1+r) • c is a constant y r ≥ 0 • Usada para expandir los valores de pixeles oscuros a pixeles más claros en una imagen mientras se comprimen los valores de alto nivel. Transformaciones Logarítmicas Inversas • Realiza el proceso contrario a transformaciones logarítmicas • Usada para expandir los valores de pixeles claros mientras se comprimen los pixeles oscuros 2. Transformación de Potencia (Power-Law) s = cr1/γ Output gray level, s • c y γ son valores positivos y constantes • La curva Power-law con valores fraccionados de γ estrecha los valores oscuros de entrada y amplia los niveles más claros en la salida de la imagen Input gray level, r Corrección Gamma Monitor Gamma correction γ = 2.5 Monitor γ =1/2.5 = 0.4 • Tubos de rayos catódicos (CRT) tienen una respuesta intensidad-a-voltaje con un γ que varía desde 1.8 a 2.5 • La imagen se verá más oscura de lo que es. • Esta corrección se hace por procesamiento de la imagen antes de la entrada de los datos al monitor con s = cr1/γ Ejemplo: MRI (Imagen de Resonancia Magnética) (a) Columna vertebral humana con fracturada y dislocación de la médula espinal impingement – La imagen es predominantemente oscura – Se desea una expansión de los niveles de grisesD γ < 1 (b) γ = 0.6, c=1 (c) γ = 0.4 (d) γ = 0.3 Ejemplo a c b d (a) Imagen con aspecto nebuloso, que necesita compresión de los niveles de grises: γ > 1 (b) γ = 3.0 (c) γ = 4.0 (d) γ = 5.0 3. Contraste / Histograma Cuatro tipo de imágenes y sus correspondientes histogramas: Oscura Brillante Bajo contraste Alto contraste Ecualización del histograma •Es una transformación que pretende obtener un histograma con una distribución uniforme. Es decir, que exista el mismo número de pixels para cada nivel de gris del histograma. •En la transformación, todos los pixels de un mismo nivel de gris se transformarán a otro nivel de gris, y el histograma se distribuirá en todo el rango disponible separando en lo posible las ocupaciones de cada nivel. •El resultado de la ecualización maximiza el contraste de una imagen sin perder información de tipo estructural. Ejemplo 4. Operaciones aritmético-lógicas • Se desarrollan pixel por pixel entre dos o más imágenes Operación Sustracción g(x,y) = f(x,y) – h(x,y) • Diferencias entre imágenes mask image Una imagen (tomada después de la inyección de un medio de contraste), con la máscara restada Nota: El fondo es oscuro, porque no cambia mucho en las dos imágenes. El área de la diferencia es brillante porque tiene un gran cambio • h (x, y) es la máscara, una imagen de rayos X de una región del cuerpo de un paciente capturado por una cámara de TV intensificada. • f (x, y) es una imagen de rayos X tomadas después de la inyección de medio de contraste en el torrente sanguíneo del paciente. Promediado de imágenes (Mean) • Considerar una imagen ruidosa g (x, y) formada por la adición de ruido η (x, y) de una imagen original f (x, y) g(x,y) = f(x,y) + η(x,y) box filter Media Promediada Ejemplo a c e a) Imagen Original b) Imagen alterada por ruido aditivo Gaussiano con media cero y una desviación estándar de 64 niveles de gris. c). - f). Resultados de un promedio de K = 8, 16, 64 y 128 imágenes ruidosas b d f Ejemplo n=1 n=2 n=4 n=6 n=8 n=10 5. Filtros espaciales • El uso de filtros (también se puede llamar como máscara / plantilla de ventana). • Los valores en un filtro sub-image se conocen como coeficientes, en lugar de píxeles. a. Filtros de suavizado • Utilizados principalmente para la reducción de ruido • El centro es el más importante y otros píxeles son inversamente ponderado (promediados) en función de su distancia desde el centro de la máscara box filter Media Promediada Ejemplo a c e a) Imagen original 500x500 pixel b) - f) Resultado de suavizado utilizando el promedio cuadrado de las máscaras de tamaño: = 3, 5, 9, 15 and 35, respectivamente. b d f b. Filtro Median, (no lineal) • Reemplaza el valor de un pixel por la media de los valores de grises en el vecindario de un pixel. • Utilizada para reducir ruidos al azar de una imagen. MED(x) = y m1[3x3] = [10,10,20,20,10,20,10,10,10] MED[m1]= [10,10,10,10,10,10,20,20,20] = 10 m2[3x3] = [10,20,20,10,10,20,10,20,20] MED[m2]= [10,10,10,10,20,20,20,20,20] = 20 Ejemplo Filtros locales no lineales : - “Median“ M(x) = y Median Median Mean Removes Salt & Pepper Noise ! Smoothes but does not blur edges ! El método ‘mean‘: Para objetos pequeños, homogeniamente distribuidos. El método ‘median‘: Para objetos grandes que tocan los bordes. 6. Filtros para definir Bordes y Gradientes • Se utiliza para acentuar detalles y bordes de una imagen. 37 Roberts : 1 -1 Ojo ! Simetría ! = -1 -1 Sobel : = -2 -2 0 -2 0 2 0 2 2 Ojo ! Simetría ! Laplacian • Aumenta la nitidez, destacando los detalles de la imagen, al afinar las líneas de transición de niveles de gris. • El valor central de la máscara de los filtros laplacianos es negativo entre 4 a 8 veces menor que los parámetros del entorno. Esto crea el problema que la imagen queda muy oscura después de aplicar el filtro. a) Imagen del hemisferio norte de la luna b) Filtro- Laplacian-con 1 1 1 1 -8 1 1 1 1 c) Imagen filtrada y escalada para aumentar el contraste d) Imagen sobre puesta con la original Gauss H =1/8 · Original : 0 1 0 1 4 1 0 1 0 H= 0 0 0 0 1 0 0 0 0 0 1 0 - 1/8 · 1 4 1 0 1 0 0 -1 0 = 1/8 · -1 4 -1 0 -1 0 Anisotrópicos Pueden conservar la simetría: -2 -2 0 MAX de -2 0 2 0 2 2 -2 -2 -2 , 0 0 0 2 2 2 , 0 -2 -2 2 0 -2 , ... 2 2 0 7. Filtro de Nitidez (sharpining/unsharping) • Sharping: Mejora la nitidez de los detalles de las imágenes borrosas, mediante la eliminación de baja frecuencia de la información espacial de la imagen original. •Unsharping: Genera una imagen borrosa a partir de una imagen nítida (contrario a sharping) 8. Combinación de filtros