Invarianza en los Modelos Estadísticos de Forma y Apariencia . Federico Sukno Computational Imaging Lab, Department of Technology, Pompeu Fabra University España Esta charla se centra en la aplicación de métodos estadísticos al modelado y análisis facial. A partir del paradigma de los modelos de forma y apariencia, introducidos en la última década, se proponen extensiones algorítmicas que permiten mejorar su confianbilidad y su invarianza a distintos tipos de rotaciones. Dichas extensiones se plantean de forma genérica, tal que los modelos conserven su relevancia original en otros ámbitos de aplicación. La validación experimental de las técnicas propuestas se ha realizado en torno al análisis facial. Este campo ha cobrado especial relevancia en los últimos años, con un importante crecimiento de su mercado a nivel internacional. Uno de los hechos más destacables es la reciente adopción de biometría facial como tecnología de base en los nuevos pasaportes, relegando así a un segundo plano a otras modalidades como la basada en las huellas dactilares y en el iris, a pesar de ofrecer estas últimas menores tasas de error. Siendo la forma natural de identificación en el ser humano, el reconocimiento facial se ha visto favorecido por ser percibido como menos intrusivo que otras modalidades y por ofrecer, en teoría, la posibilidad de operar sin necesidad de colaboración de la persona a identificar. Se describen los componentes básicos de un sistema automático de reconocimiento facial, contextualizando así los modelos de forma y apariencia. Los modelos activos de forma (ASM) permiten la segmentación y análisis automático de imágenes a través de un método generativo. Introducidos en 1992 (por T. Cootes et al.), han dado lugar a numerosas publicaciones centradas en la aplicación de los ASM a diversos tipos de imágenes, entre las cuales las imágenes médicas y faciales han sido las más comunes, pero no las únicas. Por otro lado, el modelado por medio de ASM resultó ser excesivamente simplificado para algunas aplicaciones. Como resultado, una segunda línea de publicaciones se concentra actualmente en extensiones y mejoras a la formulación original. Una de las más importantes dió origen en 1998 a los modelos activos de apariencia (AAM). De hecho, los AAM pronto tomaron entidad propia, de forma independiente a los ASM. Introducimos tres nuevas extensiones a los ASM que se centran en mejorar dichos modelos en cuanto a su invarianza y confiabilidad. La mejora de los algoritmos de segmentación derivará en una delineación más precisa de los rasgos faciales, permitiendo una interpretación más adecuada de la información contenida en las imágenes faciales. La primera de estas extensiones enfoca el problema de segmentar con precisión los distintos rasgos faciales en tomas frontales. El método propuesto generaliza los ASMs utilizando un modelo de intensidad no lineal para la descripción de la imagen a nivel local. Dichos descriptores son invariantes a transformaciones rígidas y su número puede controlarse mediante algoritmos de selección secuencial. Al contrario que en la formulación original de los ASM, la distribución de los valores de intensidad en el conjunto de entrenamiento no se asume unimodal ni Gaussiana. El método propuesto ha demostrado una mejora significativa en la precisión de las segmentaciones con respecto a los ASM, lo que también se ha visto reflejado en menores tasas de error en experimentos de verificación de identidad. La segunda extensión se centra en la invarianza del algoritmo de segmentación en presencia de rotaciones fuera del plano de la imagen cuando se trabaja con objetos casi planos. Acotando adecuadamente las regiones faciales analizadas, es posible asumir que sus contornos son aproximadamente coplanares y utilizar entonces conceptos de geometría proyectiva. De este modo, los ASM se modifican de modo tal que su funcionamiento sea más robusto ante rotaciones fuera del plano (siempre que los contornos permanezcan visibles). Como resultado, un ASM construido sólo con tomas frontales puede utilizarse para la segmentación de imágenes tomadas desde otros ángulos. El método propuesto se ha validado en imágenes faciales seleccionadas sistemáticamente de acuerdo al ángulo de rotación fuera del plano, incluyendo tres vistas hacia cada lado más dos vistas con variaciones arribaabajo. Estos experimentos constituyen la mayor evaluación cuantitativa en segmentación bajo variaciones sistemáticas de pose facial publicada hasta la fecha. La tercera extensión provee una medida de confianza para el análisis efectuado sobre cada imagen. Es decir, el modelo pueda estimar automáticamente si el resultado de una segmentación es confiable o no. Esto se vuelve muy importante cuando los ASM son utilizados en sistemas totalmente automáticos, donde el éxito de la etapa de segmentación es crucial para la posterior interpretación de la imagen. Esta estimación de confiabilidad puede ser de relevancia en varias aplicaciones. Como ejemplo se han abordado dos de ellas: selección automática de modelos y verificación confiable de identidad, obteniendo en ambos casos resultados altamente positivos. La principal fortaleza del método propuesto reside en su bajo índice de falsos positivos (las imágenes incorrectamente segmentadas rara vez son clasificadas como confiables). De este modo, las dos primeras extensiones comparten el concepto de invarianza (a rotaciones en y fuera del plano de la imagen). Por otro lado, se verá que la primera extensión también incrementa la precisión de las segmentaciones, mientras que la tercera extensión se concentra en la estimación del grado de éxito obtenido en el procesado de cada una de las imágenes. En los tres casos se ha realizado una exhaustiva valiación experimental, demostrando la superioridad de las técnicas propuestas sobre otras técnicas existentes en la literatura