La transformada Guillen; nueva representación para una imagen digital J. Trinidad Guillen-Bonillaa, H. Guillen-Guillenb, A. Guillen-Bonillac y Dulce H. Arias Jiménezd Centro de Investigaciones en Óptica, A.C., Loma del Bosque 115, Lomas del Campestre, 37150 León, Guanajuato, México. E-mail: [email protected] b Departamento de Física CUCEI, Universidad de Guadalajara, Blvd. Marcelino García Barragán. 1421, Guadalajara, Jalisco, México, C. P. 44430. e-mail: [email protected] c Centro de Investigaciones Científicas y de Educación Superior de Ensenada, Apdo. Postal 2732, 22880 Ensenada, B. C., México. e-mail: [email protected] d Hospital general de occidente, av. Zoquipan N # 1050 Col. Seattle. Zapopan Jalisco, México; e-mail: [email protected] Resumen Se presenta la transformada Guillen para imágenes de niveles de gris. La transformación define una distribución de probabilidad de ocurrencias de patrones locales extraídos desde la imagen y esta basada en un análisis de correlación por regiones en la imagen. Las propiedades de la transformada Guillen como: dimensionalidad de su espacio característico, la información promedio (entropía) extraída desde la imagen y los órdenes de correlación detectados por la transformada, son calculados en este trabajo y comprobados experimentalmente. 1. Introducción La teoría de las transformadas ha desarrollado un papel importante en el área de procesamiento de imágenes durante muchos años, y continua siendo un tema de interés tanto en el trabajo teórico como experimental. Recientemente se presentaron las transformadas por sus siglas en inglés Coordinated Cluster Representation (CCR) [1-3] y Local Binary Pattern (LBP) [4,5]. Ambas transformadas definen un histograma desde una imagen y fueron empleadas en reconocimiento de imágenes [3,4]. Ahora, en este trabajo se presenta la transformada Guillen. La transformada Guillen hace un mapeo de patrones locales desde una imagen de niveles de gris y define una distribución de probabilidad de ocurrencias de estos patrones. El patrón es detectado por medio de una ventana móvil que se desplaza sobre toda la imagen con pasos de un píxel. Se muestra la dimensionalidad, órdenes de correlación y entropía en la transformada Guillen y son calculadas experimentalmente. 2. Transformada Guillen La transformada Guillen define una función de probabilidad de ocurrencias de patrones locales desde una imagen de niveles de gris S. Esta transformación realiza un análisis de correlación por regiones en la imagen. La imagen S se considerada como una matriz ó un espacio característico finito de tamaño L M . Mientras que, los patrones locales ( ´s) son detectados desde la imagen de niveles de gris S por medio de una ventana cuadrada móvil de tamaño W (W I J ) píxeles. El tamaño de la ventana W debe 1 cumplir con las condiciones I L y J M , un ejemplo de patrón local es mostrado en la Figura 1. Para calcular la transformada se define el siguiente algoritmo. Patrón Local 125 127 217 147 137 99 145 215 215 Unidad Patrón Local 125 217 147 127 137 99 145 215 215 Matriz B 20 0 2 20 B 20 20 2 0 125 217 147 127 274 99 21 0 145 215 215 2 d 125 127 145 217 274 215 147 99 215 d 1564 20 Código decimal Figura 1. Patrón local obtenido desde una imagen digital usando una ventana W de tamaño 3 3 píxeles. Sea S [slm ] una matriz de una imagen con intensidad de niveles de gris, donde l = 1, 2,.., L y m = 1, 2,.., M son las dimensiones de la imagen. Para calcular la transformada Guillen de una imagen de niveles de gris S, primero se establece una ventana rectangular de tamaño W = I x J ( I L y J M ). Luego inspeccionamos secuencialmente toda la imagen S por medio de una ventana móvil con pasos de un píxel, generando de esta manera un histograma de ocurrencias de unidades de patrones locales que la ventana móvil va detectando. Una unidad de patrón local (UPL) consiste de W = I x J píxeles. Existen D UPL que describen una imagen, para una vecindad de 3x3 píxeles hay 2,560 unidades. Este número define la longitud del histograma. Posteriormente el histograma es normalizado, este es considerado una distribución de probabilidad de ocurrencias ó histograma ecualizado, G( d ) (ecuación 1). Esta distribución de probabilidad es llamada transformada Guillen, T d G ( d ) d 1,2,3,..., D . (1) A Donde A es el número total de ocurrencias de en el espacio S y es definido como [6] (2) A L I 1M J 1 y D es el valor máximo decimal obtenido por la conversión de a d, este valor también define la longitud del histograma T d , D 256 Bij . (3) ij 2 Cada UPL UPL se codifica con un número decimal. Para calcular el código, la matriz UPL es multiplicada por una máscara de potencias de 2, elemento por elemento, los resultados son sumados. La Figura 1 muestra un paso de barrido con la ventana de 3x3 píxeles sobre una imagen y la codificación decimal de la Unidad de Patrón Local, el valor decimal corresponde al índice del histograma. Mientras que, la Figura 2 presenta la transformada Guillen de la imagen de la Figura 1. -3 6 W=3x3 Píxeles x 10 5 d G( ) 4 3 2 1 0 0 500 1000 1500 d 2000 2500 D=2,560 UPL Figura 2. Transformada Guillen G( d ) de la imagen de la Figura 1 usando W 3 3 . 3. Entropía En teoría fundamental de la información se tiene que la medición de información se modela como un proceso probabilístico [7]. Como la transformada Guillen define una distribución de probabilidad de ocurrencias desde una imagen de niveles a través de un proceso aleatorio. Entonces, considerando la imagen de niveles de gris S como una fuente de información, se tiene que la información promedio o entropía se define como, D H G( ) G( d ) log2 G( d ) . (4) d 1 La expresión (4) define la información promedio ó entropía obtenida por la transformada Guillen desde la imagen de niveles de gris S. Se cumple que entre mas grande sea el patrón local mayor es la entropía extraída desde la imagen S. Para medir la entropía cualitativamente se realizan una serie de experimentos en la siguiente sección. 4. Trabajo Experimental En el trabajo experimental calculamos la distribución de probabilidad G( d ) y la entropía (H) de la imagen de niveles de gris S mostrada en la Figura 6 a). El tamaño de la imagen es 620 820 píxeles. Para calcular la distribución de probabilidad G( d ) se usa la versión de MatLab 7.4.0 (2007 2a), una Laptop Toshiba con 512 Mb RAM, 2.3 Mb de velocidad y se consideran patrones (W) con tamaño de 3 3 , 5 5 , 7 7 y 9 9 píxeles. Los resultados obtenidos se muestran en la Tabla I. Partiendo de la tabla se observa que a mayor tamaño del patrón local más grande es el espacio dimensional, mayor ordenes de correlación son obtenidos y más información se extrae desde la imagen de niveles de gris. El tiempo de cálculo de la transformada es relativamente alto 3 pero se puede disminuir usando lenguajes de programación más adecuados como: VLSI, ensamblador, C/C++ etc. Tabla I. Resultados de dimensionalidad (D), tiempo de ejecución, ordenes de correlación (OC) y entropía (H) en la transformada Guillen ( G( d ) ) para los patrones locales de tamaño 3 3 , 5 5 , 7 7 y 9 9 píxeles. Tiempo de ejecución para calcular la función G( d ) , (segundos) 3 3 Dimensiones de espacio característico de la transformada Guillen, D (UPL) 2,560 55 9,216 234.73 77 24,576 235.62 99 57,344 238.63 Tamaño de patrón local ( W I J ) , píxeles 230.27 Órdenes de autocorrelación (OC) Entropía (H) obtenida desde la imagen S con la transformada Guillen (bit´s) 8 24 10.29 12.14 48 13.55 80 14.73 5. Conclusiones Una transformada nueva para representar imágenes digitales de niveles de gris fue presentada en este trabajo. La transformada es llamada Guillen. La transformada esta basada en un mapeo de patrones locales desde una imagen de niveles de gris y define una función de probabilidad de ocurrencia. Tiene un espacio característico de baja dimensionalidad, alto órdenes de correlación, y a mayor tamaño del patrón local empleado más grande es la cantidad de entropía extraída desde la imagen. La función de probabilidad puede ser empleada como vector característico en reconocimiento de patrones o para binarización de imágenes. El tiempo de ejecución es relativamente alto. Sin embargo, este se puede reducir considerablemente empleando lenguajes como: Ensamblador, C/C++, VLSI, etc. Referencias [1] E.V. Kurmyshev and R. Soto, Digital pattern recognition in the coordinated cluster representation, Proc. of the 1996 (IEEE) Nordic Signal Processing Simposium, Espoo, Finland, 463-466 (1996). [2] E.V. Kurmyshev and R.E. Sánchez Yáñez, Comparative experiment with color texture classifiers using the CCR feature space, Pattern Recogn. Lett. 26 (9), 1346-1353 (2005). [3] J. T. Guillen Bonilla, Evguenii Kurmyshev, and Antonio Fenández, Quantifying a similarity of classes of texture images, Applied Optics, Vol. 46, No. 22, (2007) [4] T. Ojala, M. Pietikäinen & T. Mäenpää, A generalized Local Binary Pattern operator for multiresolution gray scale and rotation invariant texture classification, In: Advances in Pattern Recognition, ICAPR 2001 Proceedings, Lecture Notes in Computer Science 2013, Springer, 397-406 (2001). [5] T. Mäenpää, T. Ojala, M. Pietikäinen & M. Soriano, Robust texture classification by subsets of local binary patterns, Proc. 15th International Conference on Pattern Recognition, Barcelona, Spain, 3:947-950 (2000). [6] E.V. Kurmyshev and M. Cervantes, A qusi-statistical approach to digital image representation, Rev. Mex. Fis. 42 (1), 104-116 (1996). [7] S. Roman, Introduction to coding and information theory, First Edition, Dover Publications, New York, (1997). 4 5