Mejora paramétrica de la interacción lateral en computación

Mejora paramétrica de la interacción lateral en computación acumulativa Javier Martı́nez-Cantos1 , Enrique Carmona1 , Antonio Fernández-Caballero2 y Marı́a T. López2 2 1 Departamento de Inteligencia Artificial E.T.S.I. Informática, U.N.E.D, 28040-Madrid, España [email protected],[email protected] Instituto de Investigación en Informática de Albacete (I3A) y Escuela Politécnica Superior de Albacete Universidad de Castilla-La Mancha, 02071-Albacete, España {caballer,mlopez}@info-ab.uclm.es Resumen El problema de la segmentación de objetos en movimiento en secuencias de vı́deo ha sido abordado desde varias aproximaciones. Aumenta un grado la dificultad cuando los objetos monitorizados poseen una apariencia deformable. El método usado en este documento utiliza una red neuronal, explotando la mecánica de la computación acumulativa en conjunción con la interacción lateral recurrente. A pesar de los resultados contrastados en anteriores trabajos, realizamos en este artı́culo un estudio para mejorar la segmentación sin recurrir a conocimiento de alto nivel. Los módulos propuestos incluyen un filtrado de los objetos según caracterı́sticas de tamaño y compacidad y un algoritmo genético capaz de aprender los parámetros que se comportan de un modo mejor. 1. Introducción El análisis del movimiento visual a partir de imágenes cambiantes en el tiempo es un área importante en visión por computador [2] y en procesamiento de imágenes [10]. Se trata de un único problema con múltiples aplicaciones, al que se destina mucha investigación [9],[10],[4],[1],[13] y que ya ha dado buenos frutos. En particular, los estudios sobre detección de objetos no rı́gidos están entre los de mayor importancia en análisis del movimiento [4]. Según el enfoque que se utilice en el desarrollo de estos métodos, es posible distinguir entre métodos basados en modelos y métodos guiados por datos. Los primeros, de tipo descendente (“top-down”), utilizan conocimiento especı́fico sobre el dominio para construir modelos de aquello que se espera aparezca en la imagen. Luego, se intenta hacer encajar esos modelos con los datos que se presentan en la imagen. El otro tipo de métodos se corresponde con una arquitectura ascendente (“bottom-up”). Éstos son apropiados cuando no existe conocimiento sobre qué tipo de objetos pueden aparecer, o bien cuando la A. Fernández-Caballero, M.G. Manzano, E. Alonso & S. Miguel (Eds.): CMPI-2006, pp. 262-273, 2006. © Universidad de Castilla-La Mancha, Departamento de Sistemas Informáticos, Albacete (España). Mejora paramétrica de la ILCA 263 diversidad puede ser muy amplia, complicando excesivamente el diseño de un modelo. Estas técnicas operan en tres pasos: preprocesan la imagen para realzar los datos de interés y suprimir el ruido, segmentan los objetos agrupando pı́xeles pertenecientes a las mismas estructuras en regiones y finalmente interpretan la escena basándose en las caracterı́sticas obtenidas. La interacción lateral en computación acumulativa [5],[6],[7] (de aquı́ en adelante, ILCA), es un método conducido por datos, capaz de obtener con bastante claridad los objetos deformables presentes en una secuencia de imágenes indefinida, independientemente del tipo de movimiento. La ILCA se implementa como una red neuronal multicapa inspirada en dos modelos: la computación acumulativa local [8] y la interacción lateral recurrente [11]. El método es orientado al pı́xel y no a regiones, por lo que es más apropiado para ciertos problemas como las oclusiones (ambigüedad del movimiento de los objetos sobre el fondo). Ahora bien, en un aspecto práctico, tanto las condiciones ambientales, como las distorsiones introducidas por el propio equipo de captación o el tipo de elementos presentes en la escena hacen variar mucho los resultados. La adaptación a estas circunstancias depende de la calibración de los parámetros del sistema. Dicha labor no es automática y requiere un experto que la realice, es decir, un agente externo que interprete la escena a priori y ajuste el sistema para detectar aquello que le interesa. La propuesta presentada en este artı́culo pretende lograr la autoconfiguración, prescindiendo de conocimiento de alto nivel. Para ello se introducen dos módulos: el primero orientado a mejorar la salida a partir de la incorporación de nuevos parámetros y el segundo dirigido a la realimentación del sistema para aprender los parámetros más adecuados mediante un algoritmo genético al estilo de otros trabajos [3],[14]. 2. Breve descripción del método ILCA Basado en el proceso de visión artificial descrito por Mira y Delgado [12], el sistema se compone de una red neuronal multicapa hacia delante de cuatro capas. Cada pı́xel en el fotograma de entrada alimenta una neurona en la capa inferior. La capa superior del modelo produce otra imagen de idéntico tamaño, donde se observan un conjunto de siluetas. El método ILCA se ofrece de un modo resumido, ya que puede consultarse en extenso en [7]. 2.1. Capa 0: Segmentación por bandas de nivel de gris Se segmenta la imagen de entrada (en niveles de gris N G) separando en diversas bandas (k) de niveles de gris (BN G) los pı́xeles que pertenecen a cada una de ellas (ver ecuación 1). Por cada fotograma de la secuencia habrá tantas imágenes como bandas de niveles de gris. El número de bandas de gris n constituye el primero de los parámetros que ofrece la ILCA. Estas bandas tienen el mismo tamaño y no se produce solapamiento entre ellas. + 1 = k, ∀k ∈ [0, n − 1] 1, si N G[x,y,t] 256 (1) BN Gk (x, y, t) = −1, en caso contrario 264 2.2. J. Martı́nez-Cantos y otros Capa 1: Interacción lateral para la computación acumulativa En esta capa se centra la atención sobre los pı́xeles que consigan un nivel suficiente de carga de permanencia (CP ) calculada a partir de la detección de movimiento a lo largo del tiempo. Denominamos a este método computación acumulativa (ecuación 2). Para ello se recorren todas las bandas, pı́xel a pı́xel. Un pı́xel con carga se identifica como un pı́xel donde se ha detectado movimiento recientemente. Un pı́xel donde se acaba de detectar movimiento en el instante actual es cargado al valor de máxima carga o valor de saturación (vsat ). Contrariamente, cuando en un pı́xel no se detecta movimiento, éste se descarga al valor mı́nimo de carga o valor de descarga (vdes ). Los pı́xeles con cierta carga, y en los que se mantiene detección de movimiento, van descargándose gradualmente en un valor vdm de descarga debida al movimiento. ⎧ vdes , si BN Gk (x, y, t) = −1 ⎪ ⎪ ⎨ vsat , si (BN Gk (x, y, t) = 1)&(BN Gk (x, y, t − t) = −1) CPk (x, y, t) = máx(CPk (x, y, t − t) − vdm , vdes ), ⎪ ⎪ ⎩ si (BN Gk (x, y, t) = 1)&(BN Gk (x, y, t − t) = 1) (2) Esta capa dispone de una estructura modular en forma de malla, donde todos los elementos se encuentran interconectados, vertical y horizontalmente, pudiendo comunicarse cada neurona con sus vecinas hasta una distancia de l1 pı́xeles a través de canales de entrada y salida. Hablamos de interacción lateral. Un pı́xel en proceso de descarga puede mantenerse dentro de la silueta del objeto al que pertenece a través de una recarga por vecindad (vrv ), pues los pı́xeles con máxima carga actúan como iniciadores de una interacción lateral, que transcurre a través de todos los pı́xeles cuya carga no sea absoluta (ni vsat , ni vdes ). Por eso, se dice que se comportan como estructuras transparentes. Del mismo modo, los pı́xeles con carga mı́nima paran el avance: son estructuras opacas. La ecuaciones 3 y 4 describen este comportamiento. CPk (x, y, t) = min(CPk (x, y, t) + · vrv , vsat ) (3) donde ⎧ 1, si ∃(i ≤ l1 )|∀(1 ≤ j ≤ i) ⎪ ⎪ ⎪ ⎪ ((CPk (x + i, y, t)) = vsat (CPk (x + j, y, t)) = vdes ⎪ ⎪ ⎪ ⎪ (CPk (x − i, y, t)) = vsat (CPk (x − j, y, t)) = vdes ⎨ (CPk (x, y + i, t)) = vsat (CPk (x, y + j, t)) = vdes = ⎪ ⎪ (CPk (x, y − i, t)) = vsat (CPk (x, y − j, t)) = vdes ) ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ 0, en caso contrario (4) Por último, se aplica un valor umbral denominado valor mı́nimo de mancha por banda de nivel de gris (θper ). Con todo ello, se obtiene el valor de permanencia final. 265 Mejora paramétrica de la ILCA 2.3. Capa 2: Interacción lateral para la obtención de elementos de siluetas Los valores de permanencia calculados por la capa 1 son ofrecidos a esta capa (ahora las cargas de permanencia pasan a denominarse C), donde de nuevo se presenta una estructura modular en forma de malla. En esta etapa, la carga es repartida entre todos los pı́xeles (en una distancia máxima l2 ) que forman una silueta, entendiendo como tal al conjunto de los pı́xeles vecinos, dentro de la misma banda, que tengan carga no nula. La interacción lateral se encargará de delimitar esos repartos y de repartir uniformemente la carga dentro de cada mancha. Ası́ se definen las siluetas de los objetos, se diluye el movimiento del fondo y se obtiene cierta aproximación a la clasificación de los objetos basándose en el color de las manchas (ver ecuación 5). En esta capa también existe un umbral final que restringe la salida a la siguiente capa, a saber, el valor mı́nimo de mancha para la fusión de objetos (θcar ). Ck (x, y, t) + l2 l2 δx+i,y+j · Ck (x + i, y + j, t) i=−l2 i=−l2 l2 Ck (x, y, t) = , δx+i,y+j 1+ i=−l2 ∀(i, j) = (0, 0) donde 2.4. (5) δα,β = 1, si Ck (α, β, t) > vdes 0, en caso contrario (6) Capa 3: Interacción lateral para la fusión de objetos en movimiento Por último, se reúnen de nuevo todas las subcapas para generar la imagen final S, según muestra la fórmula 7. S(x, y, t) = max(Ck (x, y, t)), ∀k ∈ [0, 255] (7) Se procede, aplicando a cada pı́xel de la imagen final el valor máximo entre los correspondientes a las mismas coordenadas, en cada subcapa anterior. Posteriormente, se realiza la media de cada punto con los vecinos del entorno (de nuevo, mediante la interacción lateral hasta una distancia de l3 pı́xeles)(ecuaciones 8 y 9). Finalmente, se aplica el último de los umbrales (θobj ), llamado valor mı́nimo de detección de siluetas. S(x, y, t) + S(x, y, t) = l3 l3 δx+i,y+j · S(x + i, y + j, t) i=−l3 i=−l3 l3 1+ ∀(i, j) = (0, 0) i=−l3 , δx+i,y+j (8) 266 J. Martı́nez-Cantos y otros donde 3. δα,β = 1, si S(α, β, t) > vdes 0, en caso contrario (9) Mejora paramétrica de la ILCA En esta sección se presenta un marco de trabajo que incluye el método ILCA (en sus cuatro capas) y añade unos módulos externos a la misma para la mejora paramétrica del método. Dicha mejora tendrá en cuenta la escena especı́fica tratada. El marco completo del sistema de segmentación se muestra en la figura 1. Como se ha visto, la ILCA produce conjuntos de siluetas para cada fotograma de la secuencia que procesa. El módulo “discriminación de objetos”filtra las siluetas, según criterios del usuario, y, dependiendo de la escena especı́fica, para obtener sólo los objetos de interés en cada una de las imágenes. El módulo “refinamiento de parámetros”manipula los parámetros de la ILCA basándose en el número de objetos detectados frente a los realmente de interés (dato indicado por el usuario). La composición de los parámetros se realiza aplicando un algoritmo genético. Sm R(x,y,t) Sd(t) amax, amin, hmax, hmin, cmax, cmin Discriminación de objetos Refinamiento de parámetros S(x,y,t) Tobj Interacción lateral para la fusión de objetos en movimiento ... Ck(x,y,t) Tcar Interacción lateral para la obtención de elementos de siluetas ... CPk(x,y,t) vsat, vdes, Tper Interacción lateral para la computación acumulativa ... BNGk(x,y,t) n Segmentación por bandas de nivel de gris NG(x,y,t) Secuencia de imágenes Figura 1. Marco de trabajo para la solución propuesta Mejora paramétrica de la ILCA 3.1. 267 Discriminación de objetos El conjunto de siluetas resultante del proceso de ILCA es filtrado por medio de los criterios de “tamaño “compacidad”. Cada escena especı́fica monitorizada marca en qué márgenes se encuentran los objetos de interés (en pı́xeles): anchura máxima (amax ), anchura mı́nima (amin ), altura máxima (hmax ) y altura mı́nima (hmin ). Otro factor que puede actuar en conjunción es el porcentaje que ocupan los objetos dentro de la caja (bounding box) que los rodea: hablamos de la compacidad máxima (cmax ) y de la compacidad mı́nima (cmin ). La escena resultante de todo el proceso es almacenada junto con la contabilización, en cada fotograma, del número de objetos detectados (Sd). Este módulo reduce la rigurosidad con que debe ser configurada la ILCA, pues puede filtrar algunos objetos no buscados o ruido. 2 3.2. Refinamiento de parámetros La estructura de la ILCA corresponde a una red neuronal y, por tanto, conlleva un sistema de aprendizaje de la misma. Tratamos de dotar de algún mecanismo que realimente el ciclo, desde la capa inferior, permitiendo modificar los parámetros de configuración. Se utiliza un algoritmo genético, por su idoneidad en la búsqueda de soluciones en problemas de optimización donde el espacio de búsqueda es tan amplio que no permite un recorrido exhaustivo. El usuario debe orientar al algoritmo genético, indicando cuántos objetos en movimiento hay en la imagen, o más correctamente, cuántos le interesan. El algoritmo genético asistirá al sistema en la búsqueda no supervisada de parámetros adecuados según el usuario establezca: tamaño (T ) de la población (conjunto de soluciones), puntos de recombinación crossover en la reproducción, probabilidad de mutación, número de generaciones (N ) y número de objetos esperados (Sm). Ası́ el algoritmo genético procesará la secuencia original T +N ∗(T /2) veces, con los parámetros que vayan determinando los individuos de la población. La ILCA es configurada en base a seis parámetros distintos (vistos con anterioridad) que formarán los cromosomas de los individuos: número de bandas de nivel de gris (n), descarga debida al movimiento (vdm ), recarga debida a la vecindad (vrv ), valor mı́nimo de mancha por banda de nivel de gris (θper ), valor mı́nimo de mancha para la fusión de objetos (θcar ) y valor mı́nimo de detección de siluetas (θobj ). Según la regla de los bloques de construcción, es recomendable situar en genes consecutivos los parámetros relacionados entre sı́. El número de bandas de nivel de gris (n), aparentemente, no tiene relación con el resto. Descarga debida al movimiento (vdm ) y recarga por vecindad (vrv ) sı́ que parecen mucho más afines y consecuentemente deberı́an ir uno junto al otro. Los tres últimos parámetros citados son umbrales (θper , θcar , θobj ). Aunque en principio parecen no guardar una relación directa, puede ser interesante reunirlos, pues todos ellos representan umbrales que determinan qué valores pasan a la capa siguiente. En consecuencia, la población se codificará en el orden (n, vdm , vrv , θper , θcar , θobj ). La función de evaluación seleccionada (E) pretende minimizar el error producido 268 J. Martı́nez-Cantos y otros por el número de objetos detectados en cada instante (Sd(t)) respecto al número de objetos esperados por el usuario (Sm), para una secuencia de k fotogramas, conforme se observa en la ecuación 10: E= k−1 t=0 |Sd(t) − Sm| |t − k2 | + 1 (10) Ası́ pues, esta función de adaptación o fitness considera en cada fotograma la diferencia entre el número de objetos detectados y los esperados, dotando de mayor importancia a los fotogramas centrales de la secuencia, ya que habitualmente al comienzo y al final de las secuencias no se visualizan todos los objetos o es difı́cil detectarlos, además de que al principio, el algoritmo requiere de algunos fotogramas para converger. 4. Datos y resultados Por último, se realiza un análisis de los resultados producidos según se manipulen los módulos de “discriminación de objetos de “refinamiento de parámetros”. Para ello se utiliza una secuencia formada por 49 fotogramas, en 256 niveles de escala de gris y con dimensiones 128x128 pı́xeles. Se trata de una escena sencilla, donde aparece un humano desplazándose a lo largo de una habitación (ver figura 2). 2 t=8 t=14 t=20 t=26 Figura 2. Algunas tramas de la secuencia de entrada Como ya se ha mencionado, la ILCA ofrece resultados aceptables cuando los parámetros están bien configurados [7]. El número de parámetros del método ILCA es elevado y su ajuste es complicado. Por ello, históricamente se suele acudir a un mismo conjunto cuyo comportamiento es satisfactorio en muchas escenas. Tı́picamente se vienen utilizando 8 bandas de nivel de gris, 63 como valor de descarga debida al movimiento, 31 como valor de recarga debida a la vecindad y 150 para cada uno de los umbrales, es decir, valor mı́nimo de mancha por banda de nivel de gris, valor mı́nimo de mancha para la fusión de objetos y valor mı́nimo de detección de siluetas, respectivamente. Según la descripción ofrecida acerca del “refinamiento de parámetros”, el cromosoma tı́pico que configura la ILCA es Mejora paramétrica de la ILCA 269 (8, 63, 31, 150, 150, 150). En la figura 3 aparece el resultado del procesamiento de la secuencia ejemplo con este cromosoma. Efectivamente se obtiene la silueta del objeto en movimiento; sin embargo alrededor de ella aparece mucha información extraña. La inclusión de ruido en cantidad es uno de los principales problemas que se derivan de la aplicación de unos parámetros poco efectivos. A pesar de no ser percibible visualmente, en cada fotograma existen alrededor de 500 objetos detectados. Esto dificulta el tratamiento de la información por capas de software de más alto nivel que utilicen la ILCA como base. Además, la silueta es confusa, pues unido a los contornos del objeto que se desplaza, existen otros contornos que pertenecen a elementos del fondo de la imagen o incluso a su propia sombra. Figura 3. Procesado con parámetros tı́picos (f itness = 2754 41) Los resultados se acompañan de la medida de fitness para poder comparar los diversos métodos de un modo más riguroso. En este caso la medida es muy alta, considerando que un valor cero representa que se detectaron únicamente los objetos indicados: en el ejemplo buscamos sólo un objeto (Sm = 1), es decir, al humano. 4.1. Resultados tras la “discriminación de objetos” Hemos indicado anteriormente que el filtrado de objetos puede realizarse según dos criterios: compacidad y tamaño. En el primero de los casos, el usuario se encarga de establecer la proporción de espacio que un objeto puede ocupar dentro de la caja que lo delimita. La figura 4a muestra el resultado de procesar la secuencia con el mismo cromosoma pero con una limitación de compacidad máxima del 95 %. Se observa con claridad cómo ha desaparecido de los fotogramas mucho ruido. Aunque no consta en los fotogramas presentados, este factor también tiene efecto beneficioso sobre el proceso de convergencia de la secuencia, pues evita la detección de movimiento en el primer fotograma debido a la carga inicial de todos los pı́xeles. La mejorı́a es visible y ası́ lo indica la reducción del fitness en más de siete veces su valor anterior. Por su parte, el establecimiento del valor menor de compacidad también es importante. Sobre la secuencia procesada con 270 J. Martı́nez-Cantos y otros el cromosoma tı́pico aplicamos ahora un lı́mite mı́nimo de compacidad del 40 %, sin imponer un máximo. (a) (b) (c) (d) Figura 4. Mejora por compacidad y tamaño. (a) Compacidad máxima 95 % (f itness = 377 45). (b) Compacidad mı́nima 40 % (f itness = 2721 21). (c) Altura 60-100 y anchura 25-90 (f itness = 0 167). (d) . Compacidad 40-95 %, altura 60-100 y anchura 25-90 (f itness = 4 854) En la figura 4b aparece el resultado. En este punto queda de manifiesto la relevancia de una configuración acertada en los parámetros de la ILCA. Anteriormente se visualizaba en todos los fotogramas el objeto en movimiento, además de otros tantos no deseados. Ahora, por la acción de la compacidad mı́nima, la persona queda filtrada en algunas imágenes. Esto se debe a que los objetos no son detectados con exactitud y con frecuencia son encerrados en grandes cajas junto con otros elementos extraños, formando una única silueta. Por este motivo, sucede que algunas cajas contienen al humano y éste ni tan siquiera ocupa el 40 % de ese espacio. Aunque el resultado no es demasiado bueno, se opta por mantener este parámetro de compacidad a dicha cantidad pues la pretensión es obtener siluetas que comprendan mayoritariamente al objeto que representan. El otro tipo de filtrado restringe el tamaño de estas cajas. Según la aplicación deberán medirse los objetos monitorizados, en pı́xeles, para especificar a partir de qué tamaño un Mejora paramétrica de la ILCA 271 objeto es interesante. Ası́ será posible evitar la interferencia de pequeños objetos y en general de ruido. De forma análoga, será conveniente establecer el tamaño máximo. La figura 4c presenta el resultado para cajas de anchuras entre 25 y 90 pı́xeles, y alturas entre 60 y 100 pı́xeles, sin restricciones de compacidad. Ahora, el resultado ha mejorado ostensiblemente. El ruido ha desaparecido por completo y el fitness presenta una medida muy buena. También desaparece el efecto de la convergencia. Sin embargo, sólo se ha limpiado el resultado del procesado original. Las siluetas representan claramente la posición del objeto en movimiento, mostrando incluso algunos de sus contornos principales, pero continúan existiendo bandas unidas al objeto que no forman parte de él. Ha sido posible extraer aquellos objetos de interés de entre los generados, pero sigue siendo necesario un modo de mejorarlos. En adelante aplicaremos ambos métodos de discriminación de un modo conjunto, aunque dificulten a priori la detección de objetos, tal como se observa en la figura 4d y sobre todo en su fitness: en algunos fotogramas el objeto de interés es filtrado por efecto de la compacidad mı́nima. 4.2. Resultados tras el “Refinamiento de parámetros” El algoritmo genético es el medio idóneo para obtener buenas configuraciones para la ILCA. Limitando la compacidad entre 40 y 95 %, la altura entre 60 y 100 pı́xeles, y la anchura entre 25 y 90 pı́xeles, se ha ejecutado en varias ocasiones este módulo. Generalmente, las poblaciones utilizadas fueron de 16 individuos o cromosomas, con crossover de 3 puntos y probabilidad de mutación del 8 % por gen. El algoritmo ha sido ejecutado durante 14 generaciones, calculando un total de 128 individuos cada vez. En algunas de estas ejecuciones se introdujeron en la población inicial determinados cromosomas para sesgar la evolución, por ejemplo, el cromosoma tı́pico (8, 63, 31, 150, 150, 150). A excepción de esos cromosomas, la población inicial es generada al azar: todos los parámetros varı́an entre 0 y 255, menos el número de bandas por nivel de gris (n) que sólo toma valores 2, 4, 8 o 16 por motivos de eficiencia. En la figura 5 aparecen algunos fotogramas caracterı́sticos de los cromosomas obtenidos de este modo. A pesar de no haber producido muchas generaciones, el algoritmo genético ofrece algunos resultados interesantes. Se han alcanzado medidas de fitness relativamente bajas y, exceptuando algunos fotogramas donde se pierde el objeto debido a las restricciones del módulo de discriminación, los resultados son satisfactorios. Dependiendo del cromosoma utilizado, la silueta se presenta más o menos definida, pero siempre suavizada y sólida. Debe observarse que en algunos fotogramas donde antes se perdı́a el objeto (figura 4d, t = 20 y t = 26), ahora no ocurre, pues la silueta producida es más perfecta y no presenta contornos del fondo unidos a ella. 5. Conclusiones La monitorización con cámaras fijas se caracteriza por vigilar espacios cuyas condiciones ambientales están controladas y son poco variables. Bajo estas 272 J. Martı́nez-Cantos y otros (a) (b) (c) Figura 5. Resultados con distintos cromosomas. (a) (4, 63, 106, 99, 150, 36) (f itness = 2 753). (b) (8, 30, 46, 105, 173, 31) (f itness = 2 197). (c) (8, 102, 200, 37, 210, 14) (f itness = 0 8781) condiciones, la ILCA dispone de capacidad suficiente para adaptarse a las pequeñas variaciones que puedan producirse en tal situación, siempre y cuando se parta de una buena configuración. Entonces, el problema es encontrar un conjunto de parámetros adecuado para el escenario elegido. El modelo propuesto configura automáticamente el sistema tomando una secuencia captada en el lugar donde vaya a implantarse. Además, añade un mecanismo para relajar la rigurosidad del proceso, pues se efectúan post-procesados para suprimir objetos indeseados. El algoritmo genético muestra un panorama alentador, pues con pequeñas pruebas genera resultados esperanzadores. Parece interesante continuar en el mismo camino, probando con otras configuraciones de ambos módulos, para conocer un tanto mejor la composición de los cromosomas. También conviene intentar conducir las ejecuciones, combinando varios cromosomas de buen comportamiento y obtener poblaciones más refinadas. Agradecimientos Este trabajo ha sido parcialmente financiado por los proyectos CICYT TIN200407661-C02-01 y TIN2004-07661-C02-02. Mejora paramétrica de la ILCA 273 Referencias 1. Aggarwal, J.K., Nandhakumar, N.: On the computation of motion from sequences of images - A review. Proceedings of the IEEE (1988) 917–935 2. Bathe, K.: Finite Element Procedures in Engineering. Prentice-Hall (1982) 3. Chiu, P., Girgensohn, A., Polak, W., Rieffel, E.G., Wilcox, L., Bennett, F.H. III: A genetic segmentation algorithm for image data streams and video. Proceedings of the Genetic and Evolutionary Computation Conference (2000) 666–673 4. Faugeras, O.D., Lustman, F., Toscani, G.: Motion and structure from motion from point and line matches. Proceedings of the 1st International Conference on Computer Vision (1987) 25–34 5. Fernández-Caballero, A., Mira, J., Fernández, M.A., López, M.T.: Segmentation from motion of non-rigid objects by neuronal lateral interaction. Pattern Recognition Letters 22:14 (2001) 1517–1524 6. Fernández-Caballero, A., Mira, J., Delgado, A.E., Fernández, M.A.: Lateral interaction in accumulative computation - A model for motion detection. Neurocomputing 50C (2003) 341–364 7. Fernández-Caballero, A., Fernández, M.A., Mira, J., Delgado, A.E.: Spatio-temporal shape building from image sequences using lateral interaction in accumulative computation. Pattern Recognition 36:5 (2003) 1131–1142 8. Fernández, M.A., Mira, J.: Permanence memory - A system for real time motion analysis in image sequences. Proceedings of the IAPR Workshop on Machine Vision Applications (1992) 249–252 9. Horn, B.K.P., Schunck, B.G.: Determining optical flow. Artificial Intelligence 17 (1981) 185–203 10. Jain, A.K.: Fundamentals of Digital Image Processing. Prentice-Hall (1989) 11. Mira, J., Delgado, A.E., Manjarrés, A., Ros, S., Alvarez, J.R.: Cooperative processes at the symbolic level in cerebral dynamics - Reliability and fault tolerance. Brain Processes Theories and Models, MIT Press, Cambridge, MA (1996) 244–255 12. Mira, J., Delgado, A.E., Boticario, J.G., Dı́ez, F.J.: Aspectos básicos de la inteligencia artificial. Editorial Sanz y Torres, S. L. Madrid (1995) 13. Mitiche, A., Bouthemy, P.: Computation and analysis of image motion - A synopsis of current problems and methods. International Journal of Computer Vision 19:1 (1996) 29–55 14. Ramos, V., Muge, F.: Image colour segmentation by genetic algorithms. Proceedings of the 11th Portuguese Conference on Pattern Recognition (2000) 125– 129

Mejora paramétrica de la interacción lateral en computación

Documentos relacionados

Productos

Apoyo

Mejora paramétrica de la interacción lateral en computación

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib