Computación y Sistemas Vol. 3 No.4 pp. 274 -286 @ 2000, CIC -IPN. ISSN 1405-5546 Impreso en México Optimización de una Medida Tridimensionales a Partir de Semejanza de Invariantes para Objetos y Transformaciones Hermilo Sánchez Departamento en Ciencias de la Computación Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas Universidad Nacional Autónoma de México Apdo. Postal 20- 726 Admon. No.20. Delegación Alvaro Obregón. CP: 01000. Ciudad Universitaria, D.F. México [email protected] Artículo recibido elB de noviembre. 1999: acevtado el2 de marzo. 2000 Resumen 1 Uno de /os prob/emas actua/es dentro de visión por computadora es e/ reconocimiento de /a forma de /os objetos o figuras tridimensiona/es. En éste trabajo se propone /a optimización de un método para /ograr este objetivo. Para e//o se uti/izan ros invariantes y /a teoría de gráficas que permiten //evar a cabo /a transformación de objetos irregu/ares de representación binaria y medir su semejanza. Para obtener e/ parecido se presentan cuatro invariantes para objetos tridimensiona/es; se obtiene e/ trabajo mínimo en su transformación a/ usar /a teoría de gráficas. En /a parte de asignación óptima y, como parte importante de/ reconocimjento después de/ cá/cu/o de invariantes, se presenta e/ a/goritmo húngaro, que permite hacer dicha transformación de manera óptima y obtener así una buena medida de semejanza. Palabras clave: Medida de semejanza, slgoritmo húngaro, invariantes, momentos centrales, gráficas bipartitas, camino extendido, trabajo, ceros independientes, apareo óptimo. Introducción El objetivo del presente trabajo es optimizar una medida de semejanza de objetos o figuras tridimensionales irregulares. El gasto o trabajo realizado en medir la semejanza de las figuras debe ser el menor posible. Para representar a nuestras figuras tridimensionales, se emplea la voxelizaciónl. Como parte del proceso de reconocimiento de la forma, a través de la medida de similitud, se propone utilizar cuatro invariantes bajo transformaciones de traslación, cambio de escala y rotación. Para ello se hace un estudio de los momentos centrales. De esta manera se verá que el cálculo de los invariantes así como la transformación de los objetos permitirá obtener una medida de semejanza óptima. Sobre el reconocimiento de la forma de objetos tridimensionales, hasta ahora han existido algunos autores que han aplicado diferentes técnicas para lograr su propósito, tales como Besl(1988), Besl & lain(1985), lain (1989), Boyse (1979), Brooks (1983) y Dickinson, Pentland & Rosenfeld (1992), entre otros, quienes basan sus métodos de reconocimiento en el uso de primitivas, es decir, ciertas figuras geométricas que sirven como unidades para conformar a los objetos, tales como conos, conos truncados, cilindros, elipsoides, etc. Otro tipo de técnica que se ha utilizado para representar la superficie de un sólido, es a través de curvas digitales (lonas and Kiryati, 1997). Sobre descripción de IRepresentar a un objeto mediante voxels. Un voxel es un elemento de volumen representado por el vector: [propiedades, posición] donde las propiedades son las características del voxel, tales como brillo, color, intensidad, densidad, etc. La posición esta dado por las coordenadas espaciales (x,y,z). Ver Ballard & Brown(1982). Hermilo Sánchez: Optimización de una Medida de Semejanza superficie de cuerpos sólidos a través de propiedades de invariancia se puede ver a Cohen & Wang (1994). Sin embargo el método planteado en este trabajo se basa en las ideas iniciadas por Bribiesca (1995), quien defme una métrica y una medida de similitud, susceptibles de aplicarse para la transformación de figuras tridimensionales irregulares y no solo figuras regulares, como lo han venido haciendo los autores anteriores. En este artículo se logra optimizar el método de Bribiesca. para Objetos Tridimensionales... Los momentos centrales son invariantes bajo translación al tener la siguiente transformación de coordenadas: x' = x + a y' = y + 13 de los Invariantes = .u ' (p+q)/2+1 Interpretación de loS Invariantes 2.1 (3) 7 Los momentos dados por la siguiente relación: .Upq 2 Teoría con a y 13constantes J.lpq .u (p+q)/2 con p + q = 3,4, Considérese un objeto geométrico S en el espacio X. Se supone un grupo de transformaciones admisibles G que actúa en el espacio X. Un invariante escalar de un objeto S es una cantidad que no cambia su valor cuando el objeto S sufre cualquiera de las transformaciones admisibles (tales como una rotación, traslación o bien cambio de escala). Supóngase que el objeto S tiene invariantes escalares Il,I2,...,In. Considérese S'. Si S' se obtiene al transformar apropiadamente al objeto S usando transformaciones admisibles, los valores de estos invariantes escalares deben ser idénticos. Sin embargó, en general, lo contrario no es cierto. Para ello se necesita la siguiente definición. Definición: se dice que un conjunto de invariantes es una base invariante si la coincidencia de invariantes escalares para dos objetos implica la existencia de una transformación admisible que mapea uno al otro (Kanatani, 1990). Se sigue, entonces, que para transformar a dos objetos es necesario calcular primero sus invariantes. (4) donde .u = 1/ p(x,y) dxdy (5) son invariantes bajo cambio de escala al tener la siguiente transfonnación de coordenadas: x'=ax y'=ay (6) con a constante 2.3 Momentos Invariantes Ortogonales rotación transformaciones Bajo se tiene: ortogonales o de x (7) y 2.2 Momentos Centrales Sea p ( x, y) ~ o una función real y acotada, definida en una región !Jí'. Los momentos (p+q) se definen como: bidimensionales x I/xPy(jp mpq de orden dxdy I) 91 Por otro lado, los momentos centrales bidimensionales .Upqse definen como: .Upq = II (x-I';)P (y -1J)q p (x, y) dxdy 91 (2) donde p,q ~ E N = m¡Jmoo, 11 = mol /m, y Con el álgebra de invariantes, se llega a los 7 invariantes ortogonales, los cuales fueron dados por primera vez por Hu (1962): tjJl = .U20+ .UO2, tjJ2 = (.u20 -.UO2)2 + 4.u112 . tjJ3 = (.U30-3.u12)2 + (3.u21- .UO3)2. tjJ4 = (.u30 + .U12J2+ (.u21 + .UO3)2. tjJ5 = (.U30-3 .u12J (.u30 + .U12)[(.u30 + .U12J2- (8) 3<1121 + .uo3;2] + (3.u21- .UO3)(.U21 -.UO3) [ (.u30 + .u12J2 -(.u21 + .UO3)2], tjJ6 = (.U20 -.uo2J [ (.u30 + .U12J2 -(.u21 + .UO3)2] + 4.ull (.U30 + .U12) (.U21+ .UO3). Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos rjJ7 = (3.u21 -.UOJJ (.U30 + .U12J[(u30 + .U12J2-3(u21 + .UO3)2]-(u30 -3.u12J (u21 + .UO3)[3(u30 + .U12J2- Tridimensionales... Al considerar esta transfonnación utilizarlas en (12), se llega a que (u21 + .uo3;2], , 'Upqr Los momentos invariantes ortogonales absolutos, dados por (8) pueden utilizarse directamente para identificar un patrón independientemente de la posición y cambio de escala. -p+q+r+3 -a Si p = q = r = O, tenemos de coordenadas y 'Upqr,. que .u ' ooo=aJ Sea .uOOO = .u, entonces, .uOOO de (15) y (16) se tiene el siguiente invariante nonnalizado: Análisis 2.4 .u pqr Los momentos centrales en tres dimensiones se puede definir como I1pqr = .u ' (p+q+r)/3+1 11 (p+q+r)/3+ 1 , con p + q + r = 3,4, .Upqr = II/ ( x-.;) P( y -17) q( z -c;)r p ( x,y,z ) dxdydz, 9l donde p,q,r N. (9) Sea p(x,y,z)=l, pues aquí no importarán las características de la imagen, tales como sus intensidades de brillo, de color, etc. sino solo la posición de los voxels. La ecuación anterior se reduce a J.lpqr = /ff (x-~)P(y -17)q( z -t;)r dxdydz, (10) !Ji donde p.q,r N . El cual es invariante bajo cambios de escala. (Ver Figura 1 y el apéndice, donde se muestran los valores numéricos calculados de los invariantes en traslación y cambio de escala, asi como el centro de masa de cada objeto). .Ningún autor hasta ahora ha deducido invariantes en 3-D utilizando el método de Hu. .Se propondrá en este artículo utilizar los centros de masa y los ejes mayores de los objetos (que pasen por el centro de masa) como los invariantes bajo rotación. En el caso discreto, la ecuación anterior se puede escribir como Jlpqr = LLL (11) --9 ( Xi-; )P( Yj -17)q( zk -I;" )r ~Xi~Yj~Zk. -9::: xyz Si se piensa en los voxels como cubos de lado unitario, entonces Axj=Ayj=Azk=l. Así que la ecuación anterior queda simplemente .Upqr = LLL xyz la cual siguiente como ( xi-I;)P( es invariante Y) -1] )q( zk -t;y, bajo traslación, (12) al considerar transformación: con a, 13 y y constantes. Bajo de escala se utiliza b) la (13) siguiente transformación: x' =ax y' =ay z' =az. la 9 x' = x + a y' = y + 13 z' = z + y. cambio a) con a constante (14) Figura 1: a) Al aplicar una traslación sobre la figura (un nueve), los momentos centrales se mantienen invariantes. b) Al aplicar un cambio en la escala, la ec. 4) se mantiene invariante (ver apéndice para valores numéricos). Hermilo Sánchez: Optimización 3 , Gráficas Bipartitas y de una Medida de Semejanza Asignación 3.6 para Objetos Tridimensionales... Problema de Asignación Óptima Optima A continuación se presenta una introducción a la teoría de gráficas para enseguida estudiar el algoritmo húngaro, base de la optimización de la medida de semejanza, propuesto por Bribiesca (1995). 3.1 Teoría de Gráficas Una gráfica es un conjunto fmito, no vacío, compuesto de un conjunto de vértices V. Sea E el conjunto de parejas (aristas) de la forma {u,v}. Una gráfica puede defmirse simplemente a través de los conjuntos V y E como G = G(v; E) (Chartrand, 1985). 3.2 Pesos en las Aristas Existe un método llamado método Húngaro (Bondy, 1976) (que es el método clásico), que pu~de encontrar apareos perfectos. El problema de Asignación Óptima que se considerará consiste en que la suma de las distancias que los voxels que conforman a un objeto tienen que recorrer, para transformarlo en otro objeto, sea la menor de todas las posibilidades. Sea una gráfica bipartita pesada completa con bipartición (X;}), donde X={xl' x2, ...,xJ, y = {Y¡'Y2'...'YJ. El conjunto X puede representar al conjunto de voxels de un objeto a transformar Y el conjunto Ya los voxels del objeto transformado. Las aristas {Xi.Yj} tienen un peso Wjj = W(XiYJ. En esta gráfica pesada, se debe encontrar un apareo perfecto de peso mínimo, es decir, un Apareo Óptimo. x A cada arista de una gráfica G, se asocia un número real w(e), al cual se llamará su peso. En este sentido a G se le llama gráfica pesada. Si H es una subgráfica de o, el peso w(H) de H es la suma de los pesos de las aristas de H: ¿ w(e), donde )y¡ X¡ eEE(H). Cuando se desea que la suma de los pesos de las aristas que conforman una subgráfica H sea la menor, esta subgráfica debe ser conectada y acíclica. .En este caso se obtiene un spanning tree de peso mínimo. El peso mínimo de una gráfica es aquel tal que w(H) = ¿ w(e) sea el menor de todas las subgráficas conectadas de o. 3.4 y X2 x )y 3 Y3 Gráficas Bipartitas X4( Una gráfica G(V,E) es bipartita si existe una partición de los vértices en dos conjuntos U y V, tales que si (u, v) está enEimplicaqueuEU 3.5 2 Figura 2: Un apareo óptimo, dado por las aristas remarcadas en y vEV(oalrevés). Apareo Sea M ~ E un subconjunto de aristas de la gráfica G, el cual es llamado apareo en G si cada uno de sus vértices son adyacentes a, a lo más, una arista de M. Se dice que un apareo M satura a un vértice v, que sea extremo de una arista en M, entonces v está saturado si alguna arista de M es adyacente a v, de otra forma, ves no saturado. Si todos los vértices de G son M-saturados, el apareo M esperfecto. Sea M un apareo en G, un camino alternante en G es un camino cuyas aristas están alternativamente en E\M y en M. Un camino extendido es un camino alternante cuyo inicio y final no están saturados. y+ negro. Bondy y Murty (1976), presentan un algoritmo que resuelve el problema de asignación al encontrar un apareo óptimo de peso máximo. Gould encuentra el apareo óptimo de peso mínimo basado en el a[goritmo húngaro. 3.7 Algoritmo Húngaro Sea el peso de un apareo M dado por W(M) = L w(e), eEM. Una solución óptima es un apareo perfecto con W(M) como mínimo. I. Se representa a la gráfica bipartita en forma de matriz de tamaño n x n, U = [Wij]. 2. Minimizar la matriz de la siguiente manera: Hermilo Sánchez: Optimización de una Medida de Semejanza -Elegir el valor más pequefio de cada renglón y restarlo a ese renglón. -Elegir el valor más pequefio de cada columna y restarlo a esa columna. 3. Al encontrar n ceros independientes, esto es, se etiquetan n ceros, tales que no haya otro cero (etiquetado) en el renglón y columna. Se seleccionan los números correspondientes a estos ceros en la matriz como solución. 4. Sin embargo, la gráfica inicial puede ser tal que al minimizarla por primera vez no se puedan encontrar n ceros independientes. Entonces, se marcan los renglones y/o columnas que contengan ceros. La idea es "cubrir" todos los ceros (se utilizará el menor número de líneas posibles para marcar los ceros). 5. Encontrar el número más pequefio, min, que esté en la submatriz, es decir que no esté en ninguno de los renglones o columas marcados. 6. a) Restar min a las columnas y renglones de la stiÉmatriz. b) Sumar min a los pesos que están doblemente marcados. 7. Enseguida una función (o rutina) checa si se pueden encontrar n ceros independientes. Si es así, el algoritmo termina satisfactoriamente y se llega a un apareo óptimo. Si no, se va otra vez al paso 4. 8. Se suman los valores que estaban en la matriz original en la posición de los ceros independientes de la última matriz modificada, obteniendo el valor buscado W(M). IZI El algoritmo presentado en este capítulo y que soluciona el probl~ma de encontrar el peso mínimo en la transformación de los objetos se conoce como algoritmo Húngaro. La versión original (en la que no se habla de marcar los ceros como lo hace Gould, 1988) se debe a Konig (1931) y Egerváry (1931). Una forma de implementar el algoritmo anterior de manera eficiente es utilizando e11lamadoÁrbol Húngaro. para Objetos TridimensionaJes... XI( XI0--0YI ) Y2 X2 ~ ) XJ YJ X~ y~ ~YI X2~Y2 v b) a) Figura 3: a) Gráfica bipartita con vértices adyaoentes que representan los ceros de la matriz. b) Gráfica con un apareo arbitrario elegido. 2.- Se toma un vértice raíz x de la gráfica bipartita. 3.- A partir de este vértice raíz se van buscando todos los caminos altemantes posibles. 4.- Se repite el paso anterior con los vértices x's para los que las y's estaban saturadas. 5.- Si alguna y no encuentra su respectiva x para ser saturada. entonces se ha encontrado un camino extendido. 6.- Si hay otra x que no esté saturada (raíz) regresar a 3. De lo contrario se detiene el programa y se construye un nuevo apareo M al usar el camino extendido. en el que se intercambian las x adyacentes a las y's que no estaban en el apareo M anterior por un apareo nuevo (M). y viceversa. se sacan del apareo anterior la x-y que se encontraban bajo M. De esta manera se ha encontrado un apareo perfecto. es decir un apareo óptimo. 7.- Si nunca se encontró el camino extendido. regresar al paso 1. En la figura 4 se muestra que el camino dado por X4.Y2.X2.y4 es el camino extendido buscado. camino extendido / 3.8 Árbol Húngaro Una vez que se aplica el algoritmo Húngaro a la matriz original, queda una matriz con posibles ceros independientes, para buscarlos, se procede a construir al llamado árbol húngaro, y posteriormente se busca el llamado camino húngaro dado por un camino extendido. J X2 Y2 ~ Y3 Y2 '0 Figura 4. Árbol Así, el nuevo ~ y X4 1.- Para construir el árbol húngaro se visitan los ceros de la matriz y se elige un apareo cualquiera. La figura 3 a) muestra el apareo obtenido a partir de los ceros encontrados y la figura 3 b) la elección de un apareo arbitrario. X3 X21 apareo X4 X4 húngaro y camino extendido. queda como en la figura 5 Hermilo Sánchez: Optimización de una Medida de Semejanza " w = L Si = D i=1 Transformación Otro de un Objeto a (en unidades de trabajo ) Por tanto, el valor numérico del trabajo será, en artículo, igual a la distancia total recorrida. En general no debe ser cierto, sin embargo para el propósito de artículo esto no traerá consecuencias negativas. Para encontrar el trabajo al transformar dos objetos este esto este A y B: En este capítulo se defmirá un concepto 'muy importante, el trabajo. Debido a que en la transformación de un objeto a otro se tienen qu~ mover voxels, entonces se debe realizar un cierto trabajo al hacer dicha operación, Se verá que el valor numérico del trabajo total (por haber movido los voxeIs en la transformación) coincide numéricamente con la distancia recorrida total de los voxels involucrados en la transformación. 4.1 Tridimensionales. Sea Fi (la fuerza para mover los voxels) constante e igual a 1 (un Newton o una dina, por ejemplo). Por el momento no importará la masa de los voxels o la fricción que podría "obstaculizar" su movimiento. De manera que el trabajo total para transformar a los dos objetos será: XI0--0YI 4 para Objetos Trabajo Requerido para Transformar a los Objetos 1.- Se superponen los dos objetos A y B. Esto es, una vez que son invariantes en escala (mismo número de voxels, todos del mismo tamaño) se hace una traslación de los objetos de manera que coincidan sus centros de masa y sus ejes de simetría. Al llevar a cabo la superposición, existen voxels que son comunes a los dos objetos. Se debe considerar a los conjuntos Ia<r,c,k) e Ib(r,c,k) (donde (r,c,k) son las coordenadas cartesianas de los voxels) que representan la imagen binaria 3-D de los cuerpos A y B respectivamente. La superposición de los objetos, se define como la imagen binaria dada por el conjunto Is(c,r,k) = IA(r,c,k) n IB(r,c,k) En la transformación, cada voxel se mueve de la posición X(Xl'X2'XJ) a la posición Y(YI'Y2'YJ)' lo que requiere de un trabajo realizado. De la física clásica el trabajo dW se define como 2.- Voxels positivos. Voxels negativos. Enseguida se mueven los voxels del objeto A que no ocupan la posición respectiva en el objeto B. En términos de la imagen binaria 3-D se mueve: dW = Fds Ip(c,r,k) = IA(r,c,k) \ IB(r,c,k) El trabajo total para transformar a los objetos es Ip(c,r,k) Donde F; es la fuerza aplicada a cada voxel para moverlo una distancia Si' Así, se puede construir una métrica para II W = L FiSi i=1 transformar un objeto A en un objeto B (W(A -+- B»: W(A ~ B) = W(B~ A), W(A ~ B) ~ O, W(A ~ B) = ° <:::> A = B, y W(A~C)~ W(A~B)+ W(B~C). representa a loS voxels positivos. Los voxels negativos están d~dos por IMc,r,k) = IB(r,c,k) \ IA(r,c,k) 3.- Se aplica el algoritmo húngaro para mover los voxels (de manera que el trabajo realizado en ello sea el mínimo). Se supondrá que al mover los voxels en la transformación de los objetos, la fuerza empleada al hacerlo es constante e igual a una unidad de fuerza (por ejemplo una dina o un newton). El método usado en este trabajo, considera una gráfica G bipartita con bipartición (Ip,IN) donde Ip = {ip),ip2'...'ip.} e IN = {iNl'iN2,...,iN.}. Hermilo Sánchez: 4.2 Optimización de una Medida de Semejanza para Objetos Tridimensionales... Medida de Semejanza El i-ésimo voxel recorrerá una distancia euclidiana Si = d(Ai,BJ al moverse del objeto A al objeto B. Aquí, Aj es la posición del voxel positivo i, y Bj la posición del voxel negativo correspondiente. De esta manera se puede definir la Medida de Semejanza como: Una vez que se han encontrado los invariantes (10 cual es una parte crucial en el reconocimiento de la fQrma, pues debemos construir una base invariante como se dijo en la secc. 2.1, esto es, no se puede transformar sin antes haber calculado los invariantes) se procederá a transformar a los objetos. La figura 6 muestra a los objetos utilizados para realizar las siguientes transformaciones: A ~ B, A ~ C, B ~C,D~EyF~G. II D = LLd(Ai,~j) i;1 o A E II Las tablas I y 2 muestran los resultados de haber realizado las transformaciones entre los objetos de la figura 6 en la forma que se muestra en las figuras 7, 8 Y. 9. En estas figuras aparecen las transformaciones en forma progresiva. j;1 s c 2 E F Transforn1ación Voxels comunes G Figura 6: Siete objetos diferentes a transformar una vez que son invariantes bajo traslación, cambio de escala y rotación A-+B 24 8 A~C 28 4 B~C 24 8 D~E 75 12 F~G 75 Tabla Número de voxels positivos Puesto que se ha considerado trabajo 1otal numéricamente a la fuerza Voxels a mover D igual comunes a ambos objetos y voxels a mover en cada transformación. a 1, el a transfonnar los objetos coincidirá con la desemejanza de los objetos. 4.3 Trabajo Realizado al Transformar Objetos y Medida de Semejanza. 12 los Los objetos se hicieron invariantes en traslación, cambio de escala, centro de masa y los ejes de simetría principales que pasan por el centro, de masa. (ver los valores numéricos en .el apéndice). Ello permitirá dar una medida de semejanza óptima. Los objetos a transformar deben tener la misma información (mismo número de voxels) lo que representa invariancia en escala; sus centros de masa deben coincidir después de una translación y por último se deben alinear sus ejes de simetría. .Cabe aclarar que fueron suficientes a lo más dos ejes perpendiculares que pas!ifan por el centro de masa. Además se alinearon de manera que el número de voxels a mover fuese el menor posible. Se hace una comparación entre el método empleado en este artículo y el utilizado por Bribiesca (1995). El método de Bribiesca (1995) se basa en recorrer primero los voxels más cercanos y luego los más lejanos. En términos de gráficas pesadas bipartitas, significa encontrar un apareo tal que primero se apareen los vértices cuyas aristas son de menor peso, y luego, en orden creciente, los de mayor peso, hasta tener un apareo completo. Lo anterior claramente no da un apareo óptimo, es decir, no se obtiene la menor distancia recorrida por los voxels. En este trabajo se optimiza la medida de semejanza propuesta por Bribiesca(1995). Se puede observar que el trabajo realizado al hacer las transformaciones empleando el método de Bribiesca (1995) es mayor o igual que el trabajo realizado al emplear el método Húngaro. Hermilo Sánchez: Optimización de una Medida de Semejanza Discusión 5 Como se puede observar, el número de voxels a mover no excede los 12. ¿Qué sucede si queremos transformar el robot en el primer avión? Ello significaría mover 58 voxels. ¿Qué pasa si aumentamos la definición o el tamatlo de los objetos? ¿por qué no transformamos algunos de estos casos? Un estudio de la forma de cómo trabaja el algoritmo implementado, nos permite ver por qué no se pudo aplicar el método a transformaciones en las que el número de voxels a mover excede a 12. Se ha llegado a los siguientes resultados y razones: .El método planteado e implementado para el reconocimiento de objetos es consistente con la teoría y los métodos propuestos por la literatura, tal como puede verse en Bondy (1976) y Gould (1988). .No se tiene ningún problema con los inv~riantes de translación y cambio de escala, pues la aplicación de estos puede hacerse con un número relativamente grande de voxels (más de 3000). El problema aparece cuando se aplica el algoritmo húngaro. Ello sucede cuando, en el transcurso de la búsqueda de los ceros independientes, se llega a una etapa de la matriz como la presentada en la figura 10. para Objetos Tridimensionales.. Como se puede observar, ya no es posible trabajar con una submatriz que pemlita buscar los] O ceros ihdependientes. Sin embargo, al hacerlo personalmente usando un cierto criterio, uno cubriría los ceros de la manera en que se muestra en la figura 12. En ella podemos observar que se ha empleado una línea más para poder marcar todos los ceros y así seguir buscando los ceros independientes,.. o , A,. A", "~I "~~ "!~ n.1 O "" n" ",. D.~ "" "le "., "'8 ",~ n "!1 ".v "., ".. ".7 O "iR O ni 19 n" I\ nil ni~ n" n n,. ",' n" ",~ O n.. "."'v ",' I\ ",~ ",'v O n., n.n n.n n.,n "61 "6~ "6~ n "6~ n "6' "68 "6~ n618 A,. A,. O A,J 881 Q 88J 884 88) 8.0 "7' "7. "7J ",' A" I\ "'u A" "'V Q ",' O "'7 "'.U 8.. Q Q "'U "7~ I\ o A¡V¿ A¡V" AIU't A¡V;) A¡VOA.Vf A,vo A¡V" O Figura II: Matriz con todos sus ceros marcados con el mínimo número (10) de renglones y/o columnas. /" o nl2 n13 n14 n 15 n16 n17 nl8 n19 O n21 n22 n23 n24 O n26 n27 n28 n29 O n31 O n38 O n310 n41 n42 O n51 n52 n53 O n61 n62 n63 O n71 n72 O n74 ns1 U DS3 DS4 DS5 D9l D92 D93 D94 O O D1O2 D1O3 Dl04 n33 n34 n35 n44 n36 n45 n55 n37 n46 O n65 O n75 O n49 n410 n57 n58 n59 n51O n67 n68 n69 n610 n76 n77 O DS6 U DS~ U D97 D9S D99 O D1O7 DIOS D1O9 O D96 DlO5 n47 D1O6 n79 n710 " " U \ Figura 10: Matriz de 10xl0 en la que nij ~ Q ./ A la cual todavía no se le pueden extraer sus lO ceros independientes. A través del método empleado aquí para encontrar los ceros independientes, usando las ideas de Gould (1988), los renglones y columnas a marcar quedan como se muestra en la figura 11. Figura 12: Matriz con todos sus ceros marcados con 11 renglones y/o columnas permitiendo que quede una submatriz. Ningún ejemplos caso como el experimentales. de la figura 12 sucedió en los Hermilo 6 Sánchez: Optimización de una Medida Conclusiones Para lograr .el propósito de encontrar una medida de semejanza óptima, se vio que son suficientes y adecuados sólo 4 invariantes a encontrar en objetos tridimensionales a diferencia de los siete que deduce Hu (1962). Para transformar a los objetos se implementó el Algoritmo Húngaro, aplicándose a algunos ejemplos. En la sección 4 se muestra que el trabajo realizado en la transformación de los objetos a través del método empleado en este articulo, siempre es menor o igual que el utilizado por Bribiesca en (1995). Con lo anterior se tiene entonces que: con teoria de invariantes y con Algoritmo Húngaro se obtiene una medida de semejanza óptima entre objetos. Por lo tanto, se ha resuelto un problema que Bribiesca plantea en (1995) para optimizar una medida de similitud o semejanza de figuras tridimensionales. En realidad tal reconocimiento se hizo para objetos pequeños, como los planteados en la sección 4. Debido a la discusión dada en la sección 5 se concluye que el método de Gould planteado en 1988 no es consistente, y que el problema de elaborar un algoritmo que resuelva encontrar un apareo óptimo (para encontrar el trabajo mínimo) y asi poder transformar objetos de gran resolución sigue abierto. Sin embargo se considera que el método aqui planteado, basado en los invariantes y en el concepto de trabajo, es una buena línea de investigación que puede llevar a diferentes aplicaciones. 7 Trabajo para Objetos Tridimensionales... expresadas para el mejoramiento del mismo. También quiero agradecer al Dr. Ernesto Bribiesca por sus comentarios y consejos durante la realización de esta investigación. Referencias Ballard, D. H. & Brown, C. M. Computer Vision. Prentice Hall, Ennglewood Cliffs, New Jersey (1982). Bondy, J. A. and Murty, U.S.R. Graph Theory with Applications. Departrnent of Combinatorics and Optimization, University of Waterloo, Ontario, Canada. 1976. Boyse, J. W ., Data Structure for Solid mode11er, NFS Workshop on the Representation on Three-Dimensiona1 Objects, University of Pennsy1vania 1979. Besl P .J., Surfaces in range image Understanding. New York Springer. 338 pp. 1988. 1988. Besl, P. Recognition, Bribiesca and Jain, R Three-dimensional ACM Comput. Surv. 17(1).75-145 E., Measuring Progresive Transformations. 1995. pp. 1-13. 3-D Shape Object (1985). Similarity Pattem Recognition, Using vol 29, futuro Respecto a los invariantes, un trabajo posterior debe plantear un algoritmo para automatizar la búsqueda de los ejes mayores y rotar los objetos de manera de transformar objetos grandes o de gran resolución. Con ello se reforzará la idea de si los 4 invariantes encontrados hasta ahora son suficientes para establecer nuestra medida de similitud o tal vez podrían ser superados. Hasta ahora el cálculo de los invariantes de rotación, sobre todo los ejes de simetría, no ha representado problema, debido al relativo pequeño número de voxels de los ejemplos expuestos. Un trabajo posterior debe atacar el problema de marcar correctamente los ceros de la matriz. Tal trabajo debe encontrar un algoritmo que "sepa decidir" cómo marcar todos los ceros sin llegar a marcar todos los renglones (o columnas). 8 de Semejanza Brooks R., Model Based 3-0 Interpretations of 2-0 Images, IEEE Trans. Pattem Anal. Mach. Intell. 5(2), 1983. pp 140-150. Cohen, F. and Wang, J. Part I: Modeling images curves using invariant 3D object curve models a path to 3D recognition and shape estimation from image contours, IEEE Trans. Patem Analysis Mach. Intell. PAMI-16(1), 112, 1994. Chartrand, Publications Gary 1985. Introductory Graph Teory, Dover Dickinson S. J., Pentland A. P. and Rosenfeld A., From Volumes lo Views: an aproach lo 3-D Objecl Recognilion. CVGIP: Image Understanding 55,1992, pp 130-154. Egerváry, J., Matrixok Kombinatorikus Tulajdonságairól. Mathematika és Fizikai Lápok, vol 38 1931, pp 16-28. Agradecimientos Quiero agradecer a los revisores por sus acertados comentarios acerca del trabajo, así como las sugerencias Gould, R., Graph Theory, Benjarnin/Curnrnings Publishing Ernory University, Cornpany, Inc. 1988 The Hermilo Sánchez: Optimización de una Medida de Semejanza Bu M. K., Visual Pattern Recognition by Moment Invariants. lRE, vol 8, Feb 1962, pp 179- 187. Jain K., Fundamentals of Digital Image Processing. Prentice Hall Information and System Sciences Series. Thomas Kailath, series Editor. 1989, pp 569. Jonas, A. and Kiryati, Schemes for 3-D Curves, N., Digital Representations Pattem Recognition. 30, 1817- 1827,1997. para Objetos Tridimensionales... o o 0.408875 0 J.lO3=O J.l13=O J.l04=13398 J.l14=O Objeto B Invariancia traslación en ~oo=32 O ~10=O Kanatani K., Understanding, Group of Theoretical Methods in Image 1990, Springer -Verlag. 0.117188 ~20=120 0 ~30=O 0.020325 ~40=666 Konig, D., Graphs and Matrices (Hungarian). Mat. Fig. Lapok, vo138, 1931, pp 26-30. 0 ~01=O -0.058594 ~11=-60 0 ~21=O Apéndice ~31=-375 -0.011444 ~02=448 0.4375 0 ~12=O 0.048218 ~22=1580 Valores de los lnvariantes en traslación y cambio de escala de las figuras dadas en el artículo. Se han encontrado los momentos hasta cuarto orden. Para los objetos que representan caracteres numéricos se calcularon invariantes bidimensionales por estar formados por una sola capa. Para el resto se calcularon invariantes tridimensionales. Invariancia en cambio de escala (esc1) 1 0 ~03=O ~13=-765 -0.023346 ~04=12190 0.372009 Objeto C Invariancia en traslación Invariancia en cambio de escala (esc1) .Upq Sea escl = .u (p+q)/2+1 y .Upqr esc2 = A 1.100=32 Invariancia en cambio de escala (esc1) 1 1.110=0 O Invariancia traslación 1.120=160 1.130=0 1.140=958 en 0.15625 0 0.029236 1.101=0 0 1.111=0 0 1.121=0 0 1.131=0 0 1.102=528 1.112=0 1.122=2090 1 Jl10=O o Jl20=136.875 0.133667 Jl30=-66.796875 -0.065231 Jl40=814.990417 0.024872 JlO1=0 Jl (p+q+r)/3+1 Objeto Jloo=32 0.515625 0 0.063782 0 Jl11=23.125 0.022583 Jl21=-23.203125 -0.022659 Jl31=159.509277 0.004868 JlO2=504.875 0.493042 Jl12=-91.796875 Jl22= 1948.927856 -0.089645 JlO3=411.796875 0.402145 Jl13=81.697189 Jl04=13422.617188 0.002493 Objeto 0.059477 0.409626 D Invariancia en traslación Invariancia en cambio de escala (esc3) ~ooo=87 ~1oo=9.536743e-O7 1 1.096177e-08 ~2oo=1528.413818 17.567975 ~3oo=-386.004822 -0.050998 Hermilo Sánchez: Optimización de una Medida de Semejanza para Objetos /.l4oo=48168.535156 6.363923 ~201=68.729927 0.00908 /.lo1o=4.48226ge-05 5.152034e-07 ~3o1=162.995163 0.021535 /.l11o=-88.413803 -1.016251 -0.024206 ~o11=53.977005 ~111=37. 770649 0.620425 /.l21o=-183.213135 /.l31o=-2332.521973 -0.308168 ~211=1206.491577 0.159399 /.lo2o=517.747131 5.951116 ~o21=172.693817 0.022816 /.l12o=107.466461 0.014198 ~121=175.771103 0.023223 /.l22o=8633.792969 1.140678 0.124446 /.lo3o=-111.198029 -0.014691 ~o31=941.933594 ~oo2=42 .436775 /.l13o=-1112.552002 -0.146988 ~1o2=19.03594 0.002515 /.lo4o=6954.779297 /.lOO1 =-2. 9563ge-05 0.91885 ~2o2=836.585876 0.110528 -3.39815e-07 ~o12=130.287491 0.017213 /.l1o1=31.482759 0.361871 ~112=78.796211 0.01041 /.l2o1=3.01742 0.000399 ~o22=598.626648 0.079089 /.l3o1=669.666077 0.088475 ~oo3=78.399796 0.010358 /.lo11=71.183899 0.818206 ~103=61.977261 0.008188 /.l111=82.959579 0.01096 ~o13~314.50766 0.041552 /.l211=1167.696045 0.154273 ~004=204.0616 0.02696 /.lo21=192.381516 0.025417 /.l121=368.438812 0.048677 Objeto /.lo31=1214.243896 0.160423 /.loo2=60.229862 0.692297 Invariancia traslación /.l1o2=47.426472 0.006266 /.l2o2=935.522705 0.123599 ~ooo=87 /.lo12=169.04863 0.022334 ~1oo=-8.58306ge-06 /.l11~=164.73587 0.021765 ~2oo=1522.482666 /.lo22=762.975403 0.100803 ~3oo=-23.772869 /.loo3=99.210197 0.013107 ~4oo=47126.816406 /.l1o3=110.579216 0.014609 ~o1o=2.0504e-05 /.lo13=405.54953 0.05358 ~110=137.655167 /.loo4=271.552673 0.035877 ~210=129.255722 en ~o2o=791.103333 E Invariancia traslación en ~ooo=87 Invariancia en cambio de escala (esc3) ~120=-216.197586 1 ~o3o=-400.223724 ~220=13638.788086 ~1oo=9.536743e-06 1.096177e-07 ~130=2740.707764 ~2oo=1518.988159 17.459634 ~o4o=14045.150391 ~3oo=80.621407 0.010652 ~001=-1.239777e-05 ~4oo=48938.09375 6.465596 ~101=-15.655175 ~201=-21.370535 ~o1o=-3.051758e-05 -3.507768e-07 ~110=-91.091957 -1.047034 ~301=-256.250793 ~210=-120.584312 -0.015931 ~011=-116.103523 ~310=-1875.03479 -0.247726 ~111=158.415817 ~o2o=479.264404 5.508786 ~211=-2118.086182 ~120=142.235382 0.018792 ~021=167.936356 ~220=8013.384766 ~o3o=61. 720974 1.058711 ~121=-247.996201 0.008154 ~031=-2068.522217 ~130=-946.156433 -0.125004 ~oo2=32.436764 ~o4o=5868.976563 ~oo1=-5.722046e-06 ~101=6.747128 0.00499 0.487779 F ~310=2458.357666 Objeto Tridimensionales.. 0.775397 ~102=-31.001989 -6.577064e-08 ~202=543.349426 0.077553 ~012=-21.338438 Invariancia en cambio de escala (esc3) 1 -9.865596e-08 17.499801 -0.003141 6.226294 2.356781e-07 1.582243 0.017077 0.324793 9.093142 -0.028564 1.801927 -0.052877 0.362096 1.855615 -1.425031 e-07 -0.179945 -0.002823 -0.033855 -1.334523 0.02093 -0.279837 0.022187 -0.032765 -0.273289 0.372836 -0.004096 0.071786 -0.002819 ~ Hermilo Sánchez: Optimización de una Medida 1.1112=80.559418 0.010643 1.1022=487.449677 0.064401 1.1003=0.874878 0.OC0116 1.1103=-22.834366 -0.003017 1.1013=-118.999275 -0.015722 1.1113=163.780533 0.021638 de Semejanza para Objetos B C D E F G Tridimensionales... (613,0) (6,3,0) (5, 7,1 ) (517,1) (5,3,2) (5,3,2) 0.00423 1.1004=32.01799 Nota: un cálculo preciso del centro de masa arroja valores reales, pero como se consideran figuras discretas, sÓlo se ha tomado la parte entera de dicho cálculo. Objeto G Invariancia traslacion en ~000=87 ~100=4.291534e-06 ~2oo=1587.057373 ~3óo=-123.841103 ~400=51552.738281 ~o1o=-2.861023e-05 ~110=-248.758621 ~210=-491.359375 ~310=-9814.264648 ~o2o=830.413696 ~120=-114.583534 ~220=14094.620117 ~o3o=210.970352 ~130=-3527.358887 ~040=15086.31 0547 ~001=3.71933e-05 ~101=17.632189 ~201=5.036937 ~301=932.001526 ~011=-100.34481 ~111=112.930664 ~211=-2104.812256 ~021=90.547813 ~121=441.249573 ~031=-1549.250488 ~002=33. 95401 ~102=-22.936455 ~202=647 .508423 ~012=3.248519 ~112=-106.402809 ~003=0.342679 ~103=16.022408 ~013=-99.961685 ~004=33.923798 Figura A Invariancia en cambio de escala (esc3) 1 4.932798e-08 18.242039 -0.016362 6.811037 -3.288532e-07 -2.859294 -0.064917 -1.29664 9.544985 -0.015139 1.862151 0.027873 -0.466027 1.993171 4.275092e-07 0.202669 0.000665 0.123134 -1.153389 0.01492 -0.278083 0.011963 0.058297 -0.204684 0.390276 -0.00303 0.085547 0.000429 -0.014058 4.527398e-05 0.002117 -0.013207 0.004482 Centro de Masa (6,3,0) Hermilo Sánchez Cruz. Nació en la Ciudad de México. Actualmente es estudiante del doctorado en Ciencia e Ingeniería en Computación de la Universidad Nacional Autónoma de México, con sede en el Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas. Obtuvo el grado de Físico en la Facultad de Ciencias de la UNAM; en abril de 1995, el grado de maestro en Ciencias de la Computación en febrero de 1998, a través de la Unidad Académica de los Ciclos Profesional y de Posgrado del CCH. Sus áreas de interés son: Visión por Computadora y Reconocimiento de Patrones.