24 - Cimat

Anuncio
La transformada Guillen; nueva representación para una imagen
digital
J. Trinidad Guillen-Bonillaa, H. Guillen-Guillenb, A. Guillen-Bonillac y Dulce H.
Arias Jiménezd
Centro de Investigaciones en Óptica, A.C., Loma del Bosque 115, Lomas del Campestre,
37150 León, Guanajuato, México. E-mail: [email protected]
b
Departamento de Física CUCEI, Universidad de Guadalajara, Blvd. Marcelino García
Barragán. 1421, Guadalajara, Jalisco, México, C. P. 44430. e-mail:
[email protected]
c
Centro de Investigaciones Científicas y de Educación Superior de Ensenada, Apdo.
Postal 2732, 22880 Ensenada, B. C., México. e-mail: [email protected]
d
Hospital general de occidente, av. Zoquipan N # 1050 Col. Seattle. Zapopan Jalisco,
México; e-mail: [email protected]
Resumen
Se presenta la transformada Guillen para imágenes de niveles de gris. La transformación
define una distribución de probabilidad de ocurrencias de patrones locales extraídos
desde la imagen y esta basada en un análisis de correlación por regiones en la imagen.
Las propiedades de la transformada Guillen como: dimensionalidad de su espacio
característico, la información promedio (entropía) extraída desde la imagen y los
órdenes de correlación detectados por la transformada, son calculados en este trabajo y
comprobados experimentalmente.
1. Introducción
La teoría de las transformadas ha desarrollado un papel importante en el área de
procesamiento de imágenes durante muchos años, y continua siendo un tema de interés
tanto en el trabajo teórico como experimental. Recientemente se presentaron las
transformadas por sus siglas en inglés Coordinated Cluster Representation (CCR) [1-3]
y Local Binary Pattern (LBP) [4,5]. Ambas transformadas definen un histograma desde
una imagen y fueron empleadas en reconocimiento de imágenes [3,4]. Ahora, en este
trabajo se presenta la transformada Guillen. La transformada Guillen hace un mapeo de
patrones locales desde una imagen de niveles de gris y define una distribución de
probabilidad de ocurrencias de estos patrones. El patrón es detectado por medio de una
ventana móvil que se desplaza sobre toda la imagen con pasos de un píxel. Se muestra
la dimensionalidad, órdenes de correlación y entropía en la transformada Guillen y son
calculadas experimentalmente.
2. Transformada Guillen
La transformada Guillen define una función de probabilidad de ocurrencias de patrones
locales desde una imagen de niveles de gris S. Esta transformación realiza un análisis de
correlación por regiones en la imagen. La imagen S se considerada como una matriz ó
un espacio característico finito de tamaño L  M . Mientras que, los patrones locales
(  ´s) son detectados desde la imagen de niveles de gris S por medio de una ventana
cuadrada móvil de tamaño W (W  I  J ) píxeles. El tamaño de la ventana W debe
1
cumplir con las condiciones I  L y J  M , un ejemplo de patrón local  es mostrado
en la Figura 1. Para calcular la transformada se define el siguiente algoritmo.
Patrón Local 125

127
217
147
137
99
145
215
215
Unidad Patrón
Local

125 217 147
127 137 99 


145 215 215
Matriz B
20
 0
2
20

 B
20 

20 
2 0 
125 217 147
127 274 99 
21


0


145
215
215
2

d  125  127  145  217  274  215  147  99  215
d  1564
20
Código decimal
Figura 1. Patrón local  obtenido desde una imagen digital usando una ventana W de
tamaño 3  3 píxeles.
Sea S  [slm ] una matriz de una imagen con intensidad de niveles de gris, donde
l = 1, 2,.., L y m = 1, 2,.., M son las dimensiones de la imagen. Para calcular la
transformada Guillen de una imagen de niveles de gris S, primero se establece una
ventana rectangular de tamaño W = I x J ( I  L y J  M ). Luego inspeccionamos
secuencialmente toda la imagen S por medio de una ventana móvil con pasos de un
píxel, generando de esta manera un histograma de ocurrencias de unidades de patrones
locales que la ventana móvil va detectando. Una unidad de patrón local (UPL) consiste
de W = I x J píxeles. Existen D UPL que describen una imagen, para una vecindad de
3x3 píxeles hay 2,560 unidades. Este número define la longitud del histograma.
Posteriormente el histograma es normalizado, este es considerado una distribución de
probabilidad de ocurrencias ó histograma ecualizado, G( d ) (ecuación 1). Esta
distribución de probabilidad es llamada transformada Guillen,
T  d 
G ( d ) 
d  1,2,3,..., D
.
(1)
A
Donde A es el número total de ocurrencias de  en el espacio S y es definido como [6]
(2)
A  L  I  1M  J  1
y D es el valor máximo decimal obtenido por la conversión de  a d, este valor también
define la longitud del histograma T  d  ,
D  256  Bij .
(3)
ij
2
Cada UPL UPL    se codifica con un número decimal. Para calcular el
código, la matriz UPL es multiplicada por una máscara de potencias de 2, elemento por
elemento, los resultados son sumados. La Figura 1 muestra un paso de barrido con la
ventana de 3x3 píxeles sobre una imagen y la codificación decimal de la Unidad de
Patrón Local, el valor decimal corresponde al índice del histograma. Mientras que, la
Figura 2 presenta la transformada Guillen de la imagen de la Figura 1.
-3
6
W=3x3 Píxeles
x 10
5
d
G( )
4
3
2
1
0
0
500
1000
1500
d
2000
2500
D=2,560 UPL
Figura 2. Transformada Guillen G( d ) de la imagen de la Figura 1 usando W  3 3 .
3. Entropía
En teoría fundamental de la información se tiene que la medición de información se
modela como un proceso probabilístico [7]. Como la transformada Guillen define una
distribución de probabilidad de ocurrencias desde una imagen de niveles a través de un
proceso aleatorio. Entonces, considerando la imagen de niveles de gris S como una
fuente de información, se tiene que la información promedio o entropía se define como,
D
H G( )   G( d ) log2 G( d ) .
(4)
d 1
La expresión (4) define la información promedio ó entropía obtenida por la
transformada Guillen desde la imagen de niveles de gris S. Se cumple que entre mas
grande sea el patrón local mayor es la entropía extraída desde la imagen S. Para medir la
entropía cualitativamente se realizan una serie de experimentos en la siguiente sección.
4. Trabajo Experimental
En el trabajo experimental calculamos la distribución de probabilidad G( d ) y la
entropía (H) de la imagen de niveles de gris S mostrada en la Figura 6 a). El tamaño de
la imagen es 620  820 píxeles. Para calcular la distribución de probabilidad G( d ) se
usa la versión de MatLab 7.4.0 (2007 2a), una Laptop Toshiba con 512 Mb RAM, 2.3
Mb de velocidad y se consideran patrones (W) con tamaño de 3  3 , 5  5 , 7  7 y 9  9
píxeles. Los resultados obtenidos se muestran en la Tabla I. Partiendo de la tabla se
observa que a mayor tamaño del patrón local más grande es el espacio dimensional,
mayor ordenes de correlación son obtenidos y más información se extrae desde la
imagen de niveles de gris. El tiempo de cálculo de la transformada es relativamente alto
3
pero se puede disminuir usando lenguajes de programación más adecuados como: VLSI,
ensamblador, C/C++ etc.
Tabla I. Resultados de dimensionalidad (D), tiempo de ejecución, ordenes de correlación (OC)
y entropía (H) en la transformada Guillen ( G( d ) ) para los patrones locales de tamaño 3  3 ,
5  5 , 7  7 y 9  9 píxeles.
Tiempo de
ejecución para
calcular la
función G( d ) ,
(segundos)
3 3
Dimensiones de
espacio
característico de
la transformada
Guillen, D
(UPL)
2,560
55
9,216
234.73
77
24,576
235.62
99
57,344
238.63
Tamaño de patrón
local 
(  W  I  J ) ,
píxeles
230.27
Órdenes de
autocorrelación
(OC)
Entropía (H)
obtenida desde
la imagen S con
la transformada
Guillen (bit´s)
8
24
10.29
12.14
48
13.55
80
14.73
5. Conclusiones
Una transformada nueva para representar imágenes digitales de niveles de gris fue
presentada en este trabajo. La transformada es llamada Guillen. La transformada esta
basada en un mapeo de patrones locales desde una imagen de niveles de gris y define
una función de probabilidad de ocurrencia. Tiene un espacio característico de baja
dimensionalidad, alto órdenes de correlación, y a mayor tamaño del patrón local
empleado más grande es la cantidad de entropía extraída desde la imagen. La función de
probabilidad puede ser empleada como vector característico en reconocimiento de
patrones o para binarización de imágenes.
El tiempo de ejecución es relativamente alto. Sin embargo, este se puede reducir
considerablemente empleando lenguajes como: Ensamblador, C/C++, VLSI, etc.
Referencias
[1]
E.V. Kurmyshev and R. Soto, Digital pattern recognition in the coordinated cluster
representation, Proc. of the 1996 (IEEE) Nordic Signal Processing Simposium, Espoo, Finland, 463-466
(1996).
[2]
E.V. Kurmyshev and R.E. Sánchez Yáñez, Comparative experiment with color texture classifiers
using the CCR feature space, Pattern Recogn. Lett. 26 (9), 1346-1353 (2005).
[3]
J. T. Guillen Bonilla, Evguenii Kurmyshev, and Antonio Fenández, Quantifying a similarity of
classes of texture images, Applied Optics, Vol. 46, No. 22, (2007)
[4]
T. Ojala, M. Pietikäinen & T. Mäenpää, A generalized Local Binary Pattern operator for
multiresolution
gray
scale
and
rotation
invariant
texture
classification,
In: Advances in Pattern Recognition, ICAPR 2001 Proceedings, Lecture Notes in Computer Science 2013,
Springer, 397-406 (2001).
[5]
T. Mäenpää, T. Ojala, M. Pietikäinen & M. Soriano, Robust texture classification by subsets of
local binary patterns, Proc. 15th International Conference on Pattern Recognition, Barcelona, Spain,
3:947-950 (2000).
[6]
E.V. Kurmyshev and M. Cervantes, A qusi-statistical approach to digital image representation,
Rev. Mex. Fis. 42 (1), 104-116 (1996).
[7]
S. Roman, Introduction to coding and information theory, First Edition, Dover Publications,
New York, (1997).
4
5
Descargar