Reconocimiento de Formas: Firma de un Objeto Sampallo, Guillermo Departamento de Física - Facultad de Ciencias Exactas y Naturales y Agrimensura - UNNE. GISIA - Facultad Regional Resistencia - UTN. E-mail: [email protected] INTRODUCCION En este trabajo se propone un método para obtener la firma de la forma de un objeto y a partir de esta hacer el reconocimiento de objetos residentes en una imagen. La firma de la forma de un objeto es la representación funcional de su contorno. El proceso que se sigue consiste en extraer el objeto de la imagen, determinar su contorno y el centro de masa, luego se orienta su eje principal respecto al eje horizontal y se obtiene las coordenadas polares de cada punto del contorno del objeto, con estas y el método de interpolación cúbica se determina una matriz característica de la relación polar estandarizada a la que se denominará firma de objeto. Esto es posible hacer para objetos de diferentes formas, de manera que a partir de las firmas se puede construir una base de datos de las formas de los objetos de interés. La identificación de la forma de un objeto puede realizarse comparado la firma del mismo con las firmas de los objetos pertenecientes a la base de datos mediante la operación de correlación. Los algoritmos desarrollados fueron realizados en un utilitario matemático, actualmente se está construyendo el software en JAVA con el objetivo de que se disponga de una interfase amigable con el usuario. IMPLEMENTACION Si la imagen presenta varios objetos, la extracción del objeto de interés se puede hacer con un algoritmo de umbralización, por ejemplo, cuyo nivel de gris umbral fue determinado a partir del histograma de la imagen, se dispone ahora una nueva imagen del objeto aislado sobre un fondo negro (nivel de gris =0, por cuestiones de impresión en la figura 1 se muestra el negativo). Para determinar su contorno, se aplica un detector de borde convencional ( por ejemplo Sobel) con tres condiciones a la salida: un reescalonamiento de los niveles de gris, una nueva umbralización y un proceso de adelgazamiento del contorno, de modo de lograr una traza de ancho igual a un píxel, como se muestra en la figura 1. Ahora se dispone de una imagen solo del contorno perfectamente definido del objeto. A continuación es posible extraer de la imagen la posición (i, j) de los píxeles del contorno, con estos datos se determina el centro de masa del contorno del objeto, también los momentos centrales de inercia µp,q y con los momentos µ11 , µ20 y µ02 el ángulo que forma el eje principal del objeto con la horizontal; si este ángulo es distinto de cero, se hace rotar el contorno del objeto hasta lograr que su eje principal sea horizontal, con esto los objetos quedan orientados de forma standarizada. Con el contorno, el centro de masa del objeto bien definidos y su eje principal horizontal, se determina la posición polar r y θ de cada una de las coordenadas de su contorno y se la representa en un grafico como el de la figura 2.. Empleando interpolación cúbica, es posible ajustar estos valores a una función r(θ) (ver figura 2) y a partir de esta definir una nueva tabla de valores de r en forma standarizada ( por ejemplo, valores de r con paso de θ de 10º). Por eso en la figura 2 se nota un ligero cambio entre 150º y 200º para este caso y es debido al muestreo entre una y otra traza. El desplazamiento es solo con fines de la presentación.Esta tabla de valores representará el contorno del objeto y se denomina la firma del objeto. CONSTRUCCION DE LA BASE DE DATOS De lo anterior queda claro que procediendo de manera secuencial es posible lograr la firma de los objetos de interés. En realidad, la firma, matemáticamente, se puede interpretar como un vector de 36 elementos (para el caso de ∆θ.=10º) que son los suficientes para la descripción. Dada una clase de objetos, es posible obtener el objeto representativo de la misma a partir del promedio de las firmas de un conjunto de objetos de esa clase. Se puede construir una base de datos reuniendo las firmas representativas de los objetos de interés, construyendo una matriz donde cada columna representa la firma de la forma de un objeto. Se construyó una base de datos con la firma de 18 figuras geométricas (3 triángulos, 3 rectángulos, 3 pentágonos, 3 hexágonos, 3 circunferencias y 3 elipses) algunas de las cuales están mostradas en la tabla 1. IDENTIFICACION DEL OBJETO La identificación del objeto se realiza comparando la firma del objeto incógnita con las firmas representativas de objetos conocidos disponible en la base de datos antes mencionada, la comparación se realiza mediante el cálculo del coeficiente de correlación de Pearson, dado por r= donde ∑(x − m )(y − m ) i µxy = x i N i µ xy σ xσ y (1) ∑(x − m ) 2 y i σx = i N ∑(y − m ) 2 x i σy = i N y (2) Con N el número de elementos del vector firma y m el valor medio. Si definimos un umbral adecuado (por ejemplo r ≥ 0.95) para el coeficiente de Pearson se podrá seleccionar objetos de una forma particular. En el caso que lo anterior conduzca a cierta incerteza, por ejemplo, luego de la comparación por correlación, existan más de un objeto seleccionado, se podría incorporar una nueva condición para la identificación: número de máximos y mínimos relativos de la misma. RESULTADOS En la tabla1 se muestra algunas formas geométricas conocidas, con sus respectivas firmas – por cuestión de espacio solo se incluyen las que caben en una página, la base de datos prototipo formada está compuesta de 18 firmas de sus correspondientes figuras. En la figura 3.1 se presenta un objeto cuyo contorno es un hexágono, que no pertenece a la base, su firma y en la 3.2 está el resultado de la correlación con todas, mostrando que el coeficiente de correlación mayor es con el hexágono. En la figura 4 se muestra las firmas de un conjunto de hojas tomadas al azar de una misma planta y de obtiene la firma promedio, con una desviación standard promedio 0.08, con el fin de construir la correspondiente base de datos. Cuando se efectúa la correlación entre la firma promedio y cualquiera del conjunto resulta 0.97 ≤ r ≤ 1, por ello es que se propone anteriormente el umbral para este coeficiente de 0.95. CONCLUSION En este trabajo se muestra procedimiento para obtener la firma de la forma de objeto de manera estandarizada y con ella, es posible la identificación de la forma geométrica de objetos extraídos de una imagen y a partir de la forma su posible reconocimiento, siempre que se disponga de una base de datos adecuada, para su comparación. La construcción de la base de datos no representa un nivel de dificultad significativo, basta establecer una selección de objetos de formas representativas para un fin específico. También se nota su aspecto modular, por que sustituyendo la base de datos, es posible extender a otras formas de interés para el usuario. Figura Firma 1.2 1 ρh 0.5 0 0 0 50 100 150 200 250 300 θh 0 350 350 Figura 3.1 Figuras Figura 3.2 Figura 4 elip 3 elip 2 elip 1 circ 3 circ 2 circ 1 hexa 3 hexa 2 hexa 1 pen 3 pen 2 pen 1 rect 3 rect 2 rect 1 -0.400 -0.600 tr1 3 0.200 0.000 -0.200 tr1 2 0.600 0.400 tri 1 Coef de Corr. r 1.000 0.800 Forma Figura Firma FIGURA 100 100 1 1 Triángulo yh ρh 50 0.5 0 0 0 0 0 50 100 150 50 100 0 xh 100 200 250 300 θh 0 0 350 350 FIGURA 100 100 1 1 Rectángulo yh ρh 50 0.5 0 0 0 0 0 0 50 100 0 xh 100 50 100 150 200 250 300 θh 0 350 350 FIGURA 100 100 1 1 Pentágono yh ρh 50 0.5 0 0 0 0 0 50 100 150 50 100 0 xh 100 200 250 300 θh 0 0 350 350 FIGURA 100 100 1.2 1 Circulo yh ρh 50 0.5 0 0 0 0 0 50 100 150 50 100 0 xh 100 200 250 300 θh 0 0 350 350 FIGURA 100 100 1.2 1 Elipse yh ρh 50 0.5 0 0 0 0 0 0 0 50 100 0 xh 100 50 100 150 200 250 300 θh 350 350 TABLA 1 BIBLIOGRAFIA • • • Parker J.R. “Practical Computer Vision using C” Ed. Wiley & Sons 1993. Gonzalez R. Y Woods R.“Tratamiento digital de Imágenes” Ed.Addison Wesley .1996. Castleman K.” Digital Imagen Processing” Prentice Hall. 1996. • • Ya-Lum Chou “Analisis Estadistico” Nueva Editorial Interamericana 1972 Castillo E. Gutierrez J. Hadi A. Sistemas Expertos y Modelos de redes Probabilísticas Monografías de la Academia de Ingeniería 1996.