Capítulo 5: Caracterización de Texturas. Métodos Estadísticos

Anuncio
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
5
5.1
CARACTERIZACIÓN DE TEXTURAS.
TRANSFORMADA WAVELET.
MÉTODOS
ESTADÍSTICOS
BASADOS
EN
LA
INTRODUCCIÓN
El análisis de texturas juega un importante papel en muchas tareas de procesamiento de imágenes,
desde percepción remota hasta imágenes médicas, visión robótica o buscar entre el contenido de una gran
base de datos de imágenes. Por ello en las últimas décadas se han propuesto varios métodos para extraer
características de textura, pero el problema recae en la dificultad de encontrar un método óptimo.
La principal clase de característica extraída depende de la suposición de que la textura se puede
definir por las propiedades estadísticas locales de un píxel en escala de grises. A partir del histograma
de la imagen se pueden derivar los estadísticos de primer orden y usarse como características de textura.
Pronto se sostuvo que no eran suficientes para una descripción adecuada de textura, y se vio la necesidad
de introducir estadísticos de segundo orden. Éstos se reflejan de forma eficiente en las características
computadas a partir de la matriz de co-ocurrencia.
La conjetura de que los estadísticos de segundo orden eran suficientes para el análisis de textura fue
rechazada más tarde y se introdujeron otros esquemas de análisis de texturas, como los basados en campos
aleatorios de Markov o modelos fractales.
El punto débil que tienen en común todos estos análisis de textura es que la imagen se analiza en una
única escala. Estudios del sistema visual humano sostienen que el córtex visual puede ser modelado como
un sistema de canales independientes, cada uno con una orientación y sintonización de frecuencia
espacial determinadas. Por tanto esa limitación puede ser superada empleando representaciones
multiescala.
Varios sistemas de análisis de texturas han sido descubiertos. En particular los filtros Gabor fueron
empleados para llevar a cabo la segmentación de texturas. Sin embargo la teoría Wavelet ha llegado a ser el
marco matemático más idóneo para el análisis de imagen multiescala [5] [8]. Como ya se ha estudiado en
el capítulo anterior, la transformada Wavelet mapea la imagen en una sub-imagen de baja resolución, o
imagen tendencia, y una serie de imágenes de detalles. La imagen tendencia se obtiene enturbiando
iterativamente la imagen, mientras que las imágenes de detalles contienen la información perdida durante
dicha operación. La energía o la desviación típica de las sub-imágenes de detalles son las
características más usadas para clasificación de texturas y problemas de segmentación. Constituirán, por
tanto, un primer conjunto de propiedades que caracterizarán la textura.
En conclusión, este trabajo combina la estadística y la visión multiescala e intenta demostrar que la
textura puede ser completamente caracterizada a partir de las propiedades estadísticas de los coeficientes
de su representación multiescala. Para describir óptimamente esas estadísticas, se introducen otros dos
conjuntos de características: el histograma Wavelet y la matriz de concurrencia.
La información estadística de primer orden se deriva del histograma de la imagen de detalles. Como
observó Mallat [5], estos histogramas de detalles obtenidos a partir de texturas naturales pueden ser
modelados por una familia de funciones exponenciales. Introduciendo los parámetros de dicho modelo como
características de textura se describen completamente los coeficientes estadísticos Wavelet de primer orden.
Se obtiene una mejora adicional en la descripción de texturas a partir de los coeficientes estadísticos
de segundo orden, los cuales pueden ser descritos usando la matriz de concurrencia de la imagen de
detalles. Aunque la descripción más completa se obtiene combinando ambos, información estadística de
primer y de segundo orden. Se consigue con ello un cuarto conjunto de características de textura.
En resumen, los patrones de textura se identificarán usando cuatro conjuntos distintos de
características:
• La energía de la sub-imagen de detalles.
•
Los parámetros del modelo que representa al histograma de la sub-imagen de detalles.
•
Los descriptores obtenidos a partir de la matriz de concurrencia de la sub-imagen de detalles.
“Extracción de características de textura basada en la transformada Wavelet discreta”
17
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
•
Combinación de las características extraídas del histograma y de la matriz de concurrencia.
Los apartados siguientes se detienen en cada uno de los conjuntos de características que se pueden
extraer partiendo de las matrices de detalles.
5.2
ENERGÍA
La energía normalizada de una sub-imagen formada por N coeficientes se define como:
[
]
2
E ni = 1 · ∑ D ni (b j , b k )
N j,k
(7)
La característica de energía Wavelet {Eni} n=1...d, i= H, V, D refleja la distribución de energía a lo largo del
eje de frecuencia sobre una escala y en una orientación determinada. Además, se ha comprobado que es
muy potente para caracterización de texturas. Como la información de textura más relevante ha sido borrada
filtrando pasobaja iterativamente, la energía de la imagen de baja resolución Ld generalmente no se
considera una característica de textura.
Generalmente, la energía de las imágenes se concentra en las frecuencias bajas ya que su
espectro se reduce con el incremento de las frecuencias. Estas propiedades de las imágenes quedan
reflejadas en la transformada Wavelet de la imagen. Los niveles más bajos de compresión se corresponden
con las bandas de alta frecuencia. En particular, el primer nivel representa la banda de más alta frecuencia y
el nivel más fino de resolución. A la inversa, el último nivel (n) de descomposición corresponde con la banda
de frecuencia más baja y la resolución más tosca. Así, al desplazarse de los niveles de descomposición más
altos a los más bajos, o sea, de baja frecuencia a alta frecuencia, se observa una disminución de la energía
contenida en las sub-bandas recorridas.
Consecuentemente, si los coeficientes Wavelet obtenidos para un nivel concreto poseen pequeñas
magnitudes (valores próximos a cero) de energía, se espera que esos coeficientes Wavelet estén en los
primeros niveles de descomposición. El aumento del nivel de descomposición Wavelet produce unos
coeficientes con mayores magnitudes.
Una medida alternativa que se usa a veces como característica de textura es la desviación media,
dada por la ecuación (8):
MD ni = 1 · ∑ D ni (b j , b k )
N j,k
(8)
Las características de energía y desviación media son una medida de la dispersión de los
coeficientes Wavelet y están fuertemente correladas ya que existe una cierta relación entre los coeficientes
de la misma posición espacial en las diferentes bandas. En este trabajo utilizaremos sólo las de energía para
caracterizar la textura ya que al estar correladas, usar las dos sería redundante y la primera requiere menor
coste computacional. Se obtiene un vector de características de doce elementos, que se corresponden con la
energía de cada una de las doce matrices de coeficientes de detalle Wavelet. Hay que recordar que son tres
sub-imágenes por cada uno de los cuatro niveles de descomposición Wavelet.
5.3
HISTOGRAMA
El histograma de una imagen es una herramienta visual de gran aceptación y utilidad para el estudio
de imágenes digitales. Con una simple mirada puede proporcionar una idea muy aproximada de la
distribución de niveles de gris, el contraste que presenta la imagen y alguna pista del método más
adecuado para manipularla.
“Extracción de características de textura basada en la transformada Wavelet discreta”
18
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
El histograma de una imagen digital con L niveles de gris en el rango [0, L-1] es una función discreta
de la forma:
h(rk ) = n k
(9)
N
donde:
¾
rk es el k-ésimo nivel de gris
¾
nk es el número de píxeles en la imagen con el nivel de gris rk
¾
N es el número total de píxeles de la imagen
¾
k = 0, 1, 2, ..., L-1 niveles de gris
Las intensidades o niveles de gris están representadas a lo largo del eje x, y suele ir de 0 a 255,
mientras que el número de ocurrencias para cada intensidad se representan en el eje y. Debe remarcarse
que la frecuencia de aparición de cada nivel de gris en el histograma se muestra siempre en forma relativa
debido al hecho que el valor absoluto puede variar bastante en función del tamaño de la imagen, así como
también puede variar el máximo valor a representar.
Figura 15: Imagen original en escala de grises y su histograma
En el caso de una imagen en color, no podemos hablar de un único histograma que caracterice a la
imagen sino de tres histogramas, uno para cada color (RGB, por ejemplo). Si bien el uso del histograma y
sus posteriores modificaciones son más aplicables a imágenes en escala de grises.
Figura 16: Imagen original en color RGB y sus tres histogramas,
correspondientes al rojo, al verde y al azul
“Extracción de características de textura basada en la transformada Wavelet discreta”
19
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
La forma del histograma proporciona información importante, como la intensidad media y la
dispersión de los valores de nivel de gris, siendo esta última, la medida de contraste de la imagen.
En lo referente al contraste, cuanto mayor es la dispersión a lo largo del eje de los niveles de gris
mayor es el contraste de la imagen y es entonces cuando el sistema visual humano consigue una máxima
respuesta en su apreciación de la imagen, véase la figura 17 (b). Por su parte, un histograma que presente
un perfil estrecho corresponderá a una imagen de bajo contraste, como la que se aprecia en la figura 17 (a).
Figura 17: Apreciación del contraste de una imagen a partir de su histograma.
(a) Imagen de bajo contraste, (b) Imagen de alto contraste
En cuanto a la intensidad, el histograma proporciona una descripción de la apariencia global de una
imagen de forma que si los niveles de gris están concentrados hacia el extremo oscuro del rango de la
escala de gris, la apariencia global de la imagen será oscura; mientras que si sucede justo lo contrario,
valores cercanos a 255, la imagen correspondiente será brillante.
Figura 18: Intensidad de una imagen reflejada en su histograma.
(a) Imagen brillante, (b) Imagen oscura
5.3.1
Modelo del Histograma de Detalles Wavelet
En este apartado se describe el método de caracterización de textura mediante información
procedente de los histogramas Wavelets de las sub-bandas obtenidas a distintas escalas. Las características
de primer orden analizadas son las de energía y las de histograma. Las características de histograma
permiten indetificar mejor la textura, respecto de las características de energía. Para ello, se obtendrá el
histograma asociado a cada sub-banda de detalle.
“Extracción de características de textura basada en la transformada Wavelet discreta”
20
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
Mallat [5] demostró experimentalmente que las densidades de probabilidad de las sub-matrices de
detalle de imágenes de texturas naturales podían ser modeladas por una familia de exponenciales:
h(u) = K · exp⎛⎜ - ⎛⎜ | u | ⎞⎟ β ⎞⎟
⎝ ⎝ α⎠ ⎠
(10)
donde:
¾
α refleja la varianza de la función densidad de probabilidad, es decir, da una idea de la
anchura del histograma.
¾
β refleja lo rápido que decae el valor máximo de dicha función (así, con β igual a dos, se
tiene una Gaussiana). Es inversamente proporcional a la tasa de decrecimiento del
histograma.
¾
K es una constante de normalización para asegurar que ∫ h(u) ·du =1
Este modelo fue construido estudiando los histogramas de siete imágenes diferentes descompuestas
en cuatro niveles de resolución.
Si se asume que el histograma es equivalente a la función densidad de probabilidad, pues
también modela la distribución de los coeficientes Wavelet de la sub-banda de detalle correspondiente, todos
los estadísticos de primer orden de dicha sub-banda estarán contenidos en dos únicos parámetros, α y β,
que son las denominadas características del histograma Wavelet.
El cálculo de estos dos parámetros se basa en la estimación del momento de primer y segundo
orden del histograma de la imagen de detalles:
m1 = ∫ | u |·h(u)·du
m 2 = ∫ | u | 2 ·h(u)·du
(11)
Insertando la definición del histograma (10) y usando la condición de normalización se obtienen las
ecuaciones que proporcionan α, β y K:
F (x ) =
( x)
Γ(3 )Γ(1 )
x
x
Γ2 2
(12)
Donde Γ es la función gamma dada por:
Γ(x ) = ∫ e -t ·t x -1dt
(13)
Se obtiene β a partir de la función F-1(x) y, posteriormente, α y K:
⎛
2
⎞
β = F -1 ⎜ m1 m ⎟
2⎠
⎝
(14)
Γ⎛⎜ 1 ⎞⎟
β⎠
α = m1 ⎝
Γ⎛⎜ 2 ⎞⎟
⎝ β⎠
(15)
“Extracción de características de textura basada en la transformada Wavelet discreta”
21
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
K=
β
2α ⋅ Γ⎛⎜ 1 ⎞⎟
⎝ β⎠
(16)
Notar que la energía (7) y la desviación media (8) son exactamente las estimaciones m2 y m1,
respectivamente, exigidas para computar α y β. La transformación altamente no lineal (14) (15) mapea las
características correladas Eni y MDni en las características de histograma Wavelet α y β, los cuales se
interpretan fácilmente como características específicas e independientes del histograma de detalles. Además
α y β contienen toda la información de primer orden presente en el histograma.
En este caso, el vector de características estará formada por 24 elementos, ya que cada una de las
doce sub-imágenes de detalles estará definida por dos parámetros, α y β.
La formulación para la computación de las características Wavelet que se ha presentado aquí, puede
emplearse fácilmente para otras tareas de análisis de texturas. Por ejemplo, para segmentación las
características Wavelet se computan sobre una pequeña ventana local centrada en cada píxel de la imagen,
dando como resultado un vector de características por píxel. La imagen se subdivide entonces en un número
de regiones, asociando cada píxel a una región particular basándose en su vector de características.
5.4
MATRIZ DE CO-OCURRENCIA
Cuando las características basadas en estadísticos de primer orden no son suficientes, los
estadísticos de segundo orden pueden mejorar la discriminación de texturas. A partir de toda la información
estadística de primer orden de las imágenes de detalles capturada en las características de histograma, la
extensión obvia es la computación de la matriz de co-ocurrencia para describir los estadísticos de segundo
orden de dichas sub-imágenes.
La información textural en una imagen está contenida en la relación espacial que los tonos de gris
tienen entre ellos. Esas relaciones están especificadas en la matriz de co-ocurrencia espacial (o de niveles
de gris) que son computadas en una dirección especifica (o bien para todas: 0°, 45°, 90° y 135°) entre los
píxeles vecinos dentro de una ventana móvil dentro en la imagen.
Este método permite extraer una gran cantidad de información de textura de imagen por la gran
variedad de descriptores que es posible obtener de esta matriz, que hacen posible caracterizar con un
conjunto de valores cuantificables cada imagen analizada.
5.4.1
Definición de la Matriz de Co-ocurrencia
Cada coeficiente de la matriz de detalles Wavelet es un número real, mientras que la matriz de coocurrencia se define para una imagen con un número discreto de niveles de gris. Así, el histograma de
detalles es discretizado eligiendo M valores {uj,∆uj} j=1…M :
Δu
Δu ⎤
~
⎡
Dni = j si Dni ∈ ⎢u j − j , u j + j ⎥
2
2⎦
⎣
(17)
El elemento (j, k) de la matriz de co-ocurrencia Cniδθ se define como la probabilidad conjunta de
que un coeficiente Wavelet D̃ni=j co-suceda con un coeficiente D̃ni=k en una distancia δ en la dirección θ [1].
Así, cuanto mayores sean los valores de su diagonal principal, Cniδθ (j, j), más homogénea será la textura
que representa, mientras que cuanto más repartidos estén los valores fuera de la diagonal más heterogénea
será.
Normalmente se usan valores pequeños para δ ya que existe una correlación más relevante entre
píxeles cercanos. La relación espacial entre el píxel de referencia y su vecino puede ser en cualquiera de las
ocho direcciones (Norte, Sur, Este, Oeste y las 4 diagonales), pero solo se toman cuatro, ya que la Norte es
“Extracción de características de textura basada en la transformada Wavelet discreta”
22
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
opuesta a la Sur y en vez de contarlas separadamente hay formas mas sencillas de medirlas (matriz
simétrica, que más adelante se detalla). Cuando se habla de una relación “espacialmente invariante” se
eligen las cuatro direcciones N, NE, E y SE y se promedian. (Esto también se expresa respectivamente como
0°, 45°, 90° y 135°).
Figura 19: Los 8 vecinos del píxel de referencia X de acuerdo al ángulo θ utilizado en el
cálculo de la matriz de co-ocurrencia para una distancia δ=1.
A partir de esta matriz se calculan 8 variables estadísticas de segundo orden, propuestas por Haralick
(1973) [1], las cuales describen propiedades como contraste, energía, entropía, uniformidad local,
probabilidad máxima, tonalidad, importancia y correlación. Estas características extraídas de la imagen de
detalles serán las características de co-ocurrencia Wavelet.
Características similares fueron propuestas por Thyaragajan [9], sin embargo se obtuvieron usando
una transformada Wavelet sub-muestreada, resultando imágenes de detalles muy pequeñas para escalas
bajas para las cuales las características de la matriz de co-ocurrencia no son robustas y pueden ser
engañosas. También computa las características de co-ocurrencia de la imagen tendencia para cada escala,
lo que puede conducir a redundancia ya que las imágenes de baja resolución a dos escalas diferentes
contienen información de baja frecuencia superpuesta.
5.4.2
Construcción de la matriz
En la figura 20 se representa la imagen prueba u original donde los valores corresponden a Niveles
de Grises. La imagen tiene 4 píxeles de lado y 4 niveles de grises: 0, 1, 2 y 3. (Haralick et al. 1973). Todos
los cálculos de las medidas texturales que se presentan en este apartado están basados en esta imagen.
Figura 20: Imagen prueba de dimensión 4x4 con 4 valores de niveles de gris (0, 1, 2 y 3)
La matriz de co-ocurrencia considera la relación espacial entre dos píxeles, llamados píxel de
referencia y píxel vecino. Por ejemplo, si se escoge el píxel vecino que está situado un píxel a la derecha
de cada píxel de referencia, 0º, esto se expresa como (1,0): 1 píxel en la dirección x, 0 píxel en la dirección y.
Cada píxel en la ventana se va convirtiendo sucesivamente en el píxel de referencia, empezando por
el ubicado arriba a la izquierda y finalizando abajo a la derecha. En el caso del ejemplo, (1,0), los píxeles
ubicados en el margen derecho de la imagen original, no tienen vecino a la derecha por lo tanto no son
usados en el computo.
“Extracción de características de textura basada en la transformada Wavelet discreta”
23
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
Se pueden utilizar diferentes relaciones entre píxeles, por ejemplo: (-1,0) un píxel a la izquierda del
píxel de referencia, (1,1) un píxel a la derecha y un píxel abajo (en diagonal). En este trabajo hemos usado
las siguientes combinaciones que dan lugar a las cuatro orientaciones principales, θ= 0º, 45º, 90º y 135º,
para una distancia de un píxel, δ=1:
¾
(1,0) Æ orientación horizontal, 0º
¾
(0,-1) Æ orientación vertical, 90º
¾
(1,1) Æ orientación diagonal hacia arriba, 45º
¾
(1,-1) Æ orientación diagonal hacia abajo, 135º
Las posibles combinaciones de niveles de grises para la imagen de prueba se presentan en la tabla
2, estas etiquetas no se volverán a mostrar en las matrices de co-ocurrencia.
Píxel Vecino
Píxel Referencia
0
1
2
3
0
1
2
3
(0,0)
(1,0)
(2,0)
(3,0)
(0,1)
(1,1)
(2,1)
(3,1)
(0,2)
(1,2)
(2,2)
(3,2)
(0,3)
(1,3)
(2,3)
(3,3)
Tabla 2: Todas las posibles combinaciones de los 4 niveles de gris de la imagen de prueba
La primera celda debe completarse con la cantidad de veces que ocurre la combinación (0,0).
Cuántas veces, en el área de la ventana un píxel con valor de gris igual a 0 (píxel vecino), esta situado a la
derecha de otro píxel con valor 0 (píxel de referencia), en el caso de tener una orientación horizontal 0º, que
se corresponde con la relación espacial (1,0).
Existen, por lo tanto diferentes matrices de co-ocurrencia para cada relación espacial, según se
considere el vecino de arriba, al costado o en diagonal. En la figura 21 se muestra la matriz de co-ocurrencia
(b) correspondiente a la matriz de coeficientes de prueba (a) para la relación espacial (1,0).
Figura 21: Matriz de co-ocurrencia para la imagen de prueba
Esta matriz se interpreta de la siguiente manera: En la imagen de prueba, dos veces el píxel de
referencia es 0 y su vecino a la derecha es también 0 (Primera celda). Tres veces el píxel de referencia es 2
y su vecino a la derecha es 2 (tercera celda de la diagonal, en azul en la figura 21.
En la matriz precedente, se cuenta cada píxel de referencia con su vecino a la derecha. Si el calculo
se realiza solo de este modo, usando sólo una dirección, entonces el número de veces que aparece la
combinación (2,3) no es el mismo que la combinación (3,2) (por ejemplo el 3 está a la derecha del 2 una vez,
pero a la izquierda ninguna), por lo tanto la matriz no es simétrica respecto de la diagonal.
“Extracción de características de textura basada en la transformada Wavelet discreta”
24
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
Sin embargo, la simetría es necesaria para el cálculo. Ésto se logra si cada par de píxeles se
cuentan dos veces: una vez a la derecha y otra vez a la izquierda (se intercambian los píxeles de referencia y
vecino en el segundo cálculo). Para obtener una matriz simétrica la forma más sencilla, en vez de contar dos
veces, es sumarle a esta matriz su matriz traspuesta. La matriz traspuesta se logra intercambiando las filas y
columnas de la matriz original.
Sumando cada elemento de la matriz de co-ocurrencia original del ejemplo anterior y su traspuesta,
se llega a la matriz simétrica de la tabla 3:
4
2
0
0
2
4
0
0
0
0
6
1
0
0
1
2
Tabla 3: Matriz simétrica para una relación horizontal (derecha 0º + izquierda 180º)
de la imagen de prueba
Una vez obtenida la matriz simétrica, el paso siguiente es expresar esta matriz como probabilidad. La
definición mas simple de la probabilidad es: ”el número de veces que un evento ocurre, dividido por el
número total de posibles eventos” y la ecuación para su cálculo es:
Ci, j =
Vi , j
N −1
∑V
i , j =0
(18)
i, j
Donde:
¾
i es el número de filas y j el número de columnas
¾
V es el valor de la celda (i,,j) en la ventana
¾
Ci,j es la probabilidad en la celda i,j
¾
N es el numero de filas o columnas
Considerando la imagen de prueba de 4 x 4 píxeles, y la relación (1,0) el número total de posibles
pares es de 12, como muestra la figura 22, y para una relación horizontal (derecha más izquierda) ese
número se duplica (24).
Figura 22: Total de pares posibles para una relación espacial (1,0) si la matriz es 4x4
Observando la matriz horizontal de la tabla 3, se comprueba que, por ejemplo, la combinación (2,2)
aparece 6 veces de las 24 posibles (12 a la derecha y 12 a la izquierda) y la combinación (2,3) solo 1 vez. La
combinación (2,2) ocurre 6 veces sobre 24 posibles, por lo que la probabilidad es de ¼ ó 0.250. Mientras que
la combinación (2,3) es de 1/24 ó 0.042.
“Extracción de características de textura basada en la transformada Wavelet discreta”
25
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
La ecuación (18) transforma la matriz de co-ocurrencia en una aproximación de tabla de
probabilidad. Decimos, que es una aproximación, porque una verdadera probabilidad requiere de valores
continuos, y los valores de grises son valores enteros, por lo tanto discretos.
Este proceso se denomina Normalización de la matriz. Aplicando esta ecuación a la matriz simétrica
de la tabla 3 se obtiene la matriz de la tabla 4, donde el sumatorio de todos los elementos debe ser igual a 1,
pues está normalizada.
0.166
(4/24)
0.083
0.042
0
0.083
(2/24)
0.166
0
0
0.042
(1/24)
0
0.250
0.042
0
(0/24)
0
0.042
0.083
Tabla 4: Matriz normalizada horizontal
Se asume que toda la información está contenida en la matriz de dependencia espacial
desarrolladas para las 4 direcciones de la figura 19. En general, cuanto mayor es el número de la diagonal en
la matriz de co-ocurrencia, mas homogénea es la textura en esa parte de la imagen que está siendo
analizada.
5.4.3
Características de la matriz
Con respecto a la matriz de co-ocurrencia simétrica y normalizada hay algunos aspectos a resaltar:
™ Los elementos de la diagonal representan pares de píxeles que no tienen diferencias en su
nivel de gris. Si estos elementos tienen probabilidades grandes, entonces la imagen no
muestra mucho contraste, la mayoría de los píxeles son idénticos a sus vecinos.
™ Sumando los valores de la diagonal tenemos la probabilidad que un píxel tenga el mismo
nivel de gris que su vecino.
™ Las líneas paralelas a la diagonal separadas una celda, representan los pares de píxeles con
una diferencia de 1 nivel de gris. De la misma manera sumando los elementos separados
dos celdas de la diagonal, tenemos los pares de píxeles con dos valores de grises de
diferencia. A medida que nos alejamos de la diagonal la diferencia entre niveles de grises es
mayor.
™ Sumando los valores de estas diagonales paralelas obtenemos la probabilidad que un píxel
tenga 1, 2, 3, etc. niveles de grises de diferencia con su vecino.
Las principales propiedades de una matriz de co-ocurrencia son:
™ Cuadrada:
El rango de los niveles de gris de los píxeles de referencia y el de los vecinos es el mismo,
por lo tanto las filas y las columnas tienen idéntico número.
™ Tiene el mismo número de filas y columnas que el número de bits de la imagen.
La imagen de prueba tiene solo 4 valores posibles (0, 1, 2 y 3), es decir es una imagen de 2
bits (22= 4). Los datos de 8 bits tienen 256 (28= 256) posibles niveles de gris, así la matriz de
co-ocurrencia es de 256 x256.
“Extracción de características de textura basada en la transformada Wavelet discreta”
26
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
™ Es simétrica con respecto a la diagonal
Una matriz simétrica significa que los mismos valores ocurren en las celdas opuestas a la
diagonal. Por ejemplo, el valor en la celda (3,2) debería ser el mismo que el valor en la celda
(2,3) para que la matriz sea simétrica. En el apartado anterior se explicó cómo conseguir que
la matriz sea simétrica.
5.4.4
Descriptores de Textura de la Matriz de Co-ocurrencia
Hasta este punto se ha detallado como se crea una matriz normalizada, expresada como
probabilidad, para una determinada relación espacial entre dos píxeles vecinos. Una vez construida, de esta
matriz pueden derivarse diferentes medidas. Las siguientes son una breve explicación de algunas de estas
descriptores texturales, que serán los que formen el vector de características de co-ocurrencia:
™ Inercia (o contraste)
Es una medida de la variación local en una imagen. Alcanza un valor alto cuando la imagen tiene
mucho contraste y tiene un valor bajo cuando los valores altos de la matriz están cerca de la
diagonal principal.
C1 = ∑ (i − j ) ⋅ C i , j
2
(19)
i, j
™ Energía (o momento angular de segundo orden)
Esta medida da valores altos cuando en la matriz de co-ocurrencia tiene pocas entradas de gran
magnitud, y es baja cuando todas las entradas son similares. Si todos los píxeles son iguales la
energía es mínima. Es una medida de la homogeneidad local.
C 2 = ∑ Ci , j
2
(20)
i, j
™ Entropía
Este descriptor nos mide la aleatoriedad de la imagen, alcanzando su máximo cuando todos los
elementos de la matriz de coocurrencia son iguales.
[ ]
C 3 = ∑ − C i , j ⋅ log 2 C i , j
(21)
i, j
Se asume que 0*log(0)=0.
™ Homogeneidad
Es lo opuesto al contraste y se calcula mediante la ecuación:
C4 = ∑
i, j
Ci , j
1 + (i − j )
2
(22)
Otra forma de realizar el cálculo es en forma matricial, multiplicando la matriz de probabilidades
(Tabla 4) por la matriz de pesos. Aunque en la tabla 5 se presentan los pesos más comunes para
calcular la homogeneidad, en este trabajo no se utiliza matriz de pesos para calcular la
homogeneidad. Los pesos son menores para los coeficientes más alejados de la diagonal.
“Extracción de características de textura basada en la transformada Wavelet discreta”
27
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
1
0.5
0.2
0.1
0.5
1
0.5
0.2
0.2
0.5
1
0.5
0.1
0.2
0.5
2
Tabla 5: Matriz de pesos más utilizada en el cálculo de la homogeneidad
La homogeneidad es alta cuando la matriz de coocurrencia se concentra a lo largo de la
diagonal. Esto ocurre cuando la imagen es localmente homogénea.
™ Probabilidad máxima
Se obtiene fácilmente como:
C 5 = max{C i , j }
(23)
™ Tonalidad
Lo primero que se debe calcular es la media de la matriz de co-ocurrencia, tanto para filas como
para columnas. Se hace notar la diferencia que existe entre esta GLCM media de la media
aritmética de los valores de grises de los píxeles de la ventana. La media en la matriz de
coocurrencia no es simplemente el promedio de los valores originales de los niveles de gris en la
ventana. El valor del píxel no es ponderado por su frecuencia por si mismo, sino por la frecuencia
de su co-ocurrencia en combinación de un determinado valor del píxel vecino.
M x = ∑ i ⋅ Ci , j
M y = ∑ j ⋅ Ci , j
i, j
(24)
i, j
Se define entonces la tonalidad como:
C 6 = ∑ (i − M x + j − M y ) ⋅ C i , j
3
(25)
i, j
™ Importancia
Medida similar a la tonalidad cuya expresión viene dada por:
C 7 = ∑ (i − M x + j − M y ) ⋅ C i , j
4
(26)
i, j
™ Medida de Información de Correlación
En [1], Haralick propone la siguiente expresión:
C8 =
Donde:
C 3 − H xy
max (H x , H y )
S x (i ) = ∑ C i , j
j
(27)
H x = −∑ S x (i ) ⋅ log 2 [S x (i )]
(28)
i
“Extracción de características de textura basada en la transformada Wavelet discreta”
28
Capítulo 5: Caracterización de Texturas.
Métodos Estadísticos Basados en la Transformada Wavelet
[
]
H y = −∑ S y ( j ) ⋅ log 2 S y (i )
S y (i ) = ∑ C i , j
i
(29)
j
[
]
H xy = −∑ C i , j ⋅ log 2 S x (i ) ⋅ S y ( j )
(30)
i, j
Este descriptor nos mide la semejanza de la imagen consigo misma desplazada. Algunas
propiedades de la correlación son:
• Un objeto tiene más alta correlación dentro de él que entre objetos adyacentes.
• Píxeles cercanos están más correlacionados entre si que los píxeles más distantes
El vector de características de co-ocurrencia estará formado por 96 elementos. A partir de cada subimagen de detalles se calculan sus cuatro GLCM (Grey Level Co-ocurrence Matriz), una en cada orientación
principal. De las matrices GLCM 0º, 45º, 90º y 135º de la sub-imagen se obtienen las ocho características
anteriores (son 24 características en total) y se promedian para tener las ocho características de coocurrencia que definen una sub-imagen de detalles. Como una imagen de textura se descompone en doce
sub-imágenes de detalles (tres en cada nivel y cuatro niveles de descomposición) y de las que se calculan
ocho medidas, la imagen de textura se identifica por 96 (12 sub-matrices * 8 descriptores) características de
co-ocurrencia.
El último vector de características utilizado para determinar texturas se construye uniendo las 24
características de histograma con las 96 características de co-ocurrencia, obteniendo un vector de 120
elementos.
“Extracción de características de textura basada en la transformada Wavelet discreta”
29
Descargar