Invarianza en los Modelos Estadísticos de Forma y Apariencia

Anuncio
Invarianza en los Modelos Estadísticos de Forma y Apariencia
. Federico Sukno
Computational Imaging Lab, Department of Technology, Pompeu Fabra University
España
Esta charla se centra en la aplicación de métodos estadísticos al modelado y análisis facial. A partir del
paradigma de los modelos de forma y apariencia, introducidos en la última década, se proponen
extensiones algorítmicas que permiten mejorar su confianbilidad y su invarianza a distintos tipos de
rotaciones. Dichas extensiones se plantean de forma genérica, tal que los modelos conserven su
relevancia original en otros ámbitos de aplicación.
La validación experimental de las técnicas propuestas se ha realizado en torno al análisis facial. Este
campo ha cobrado especial relevancia en los últimos años, con un importante crecimiento de su
mercado a nivel internacional. Uno de los hechos más destacables es la reciente adopción de biometría
facial como tecnología de base en los nuevos pasaportes, relegando así a un segundo plano a otras
modalidades como la basada en las huellas dactilares y en el iris, a pesar de ofrecer estas últimas
menores tasas de error. Siendo la forma natural de identificación en el ser humano, el reconocimiento
facial se ha visto favorecido por ser percibido como menos intrusivo que otras modalidades y por
ofrecer, en teoría, la posibilidad de operar sin necesidad de colaboración de la persona a identificar.
Se describen los componentes básicos de un sistema automático de reconocimiento facial,
contextualizando así los modelos de forma y apariencia. Los modelos activos de forma (ASM)
permiten la segmentación y análisis automático de imágenes a través de un método generativo.
Introducidos en 1992 (por T. Cootes et al.), han dado lugar a numerosas publicaciones centradas en la
aplicación de los ASM a diversos tipos de imágenes, entre las cuales las imágenes médicas y faciales
han sido las más comunes, pero no las únicas. Por otro lado, el modelado por medio de ASM resultó ser
excesivamente simplificado para algunas aplicaciones. Como resultado, una segunda línea de
publicaciones se concentra actualmente en extensiones y mejoras a la formulación original. Una de las
más importantes dió origen en 1998 a los modelos activos de apariencia (AAM). De hecho, los AAM
pronto tomaron entidad propia, de forma independiente a los ASM.
Introducimos tres nuevas extensiones a los ASM que se centran en mejorar dichos modelos en cuanto a
su invarianza y confiabilidad. La mejora de los algoritmos de segmentación derivará en una delineación
más precisa de los rasgos faciales, permitiendo una interpretación más adecuada de la información
contenida en las imágenes faciales.
La primera de estas extensiones enfoca el problema de segmentar con precisión los distintos rasgos
faciales en tomas frontales. El método propuesto generaliza los ASMs utilizando un modelo de
intensidad no lineal para la descripción de la imagen a nivel local. Dichos descriptores son invariantes a
transformaciones rígidas y su número puede controlarse mediante algoritmos de selección secuencial.
Al contrario que en la formulación original de los ASM, la distribución de los valores de intensidad en
el conjunto de entrenamiento no se asume unimodal ni Gaussiana. El método propuesto ha demostrado
una mejora significativa en la precisión de las segmentaciones con respecto a los ASM, lo que también
se ha visto reflejado en menores tasas de error en experimentos de verificación de identidad.
La segunda extensión se centra en la invarianza del algoritmo de segmentación en presencia de
rotaciones fuera del plano de la imagen cuando se trabaja con objetos casi planos. Acotando
adecuadamente las regiones faciales analizadas, es posible asumir que sus contornos son
aproximadamente coplanares y utilizar entonces conceptos de geometría proyectiva. De este modo, los
ASM se modifican de modo tal que su funcionamiento sea más robusto ante rotaciones fuera del plano
(siempre que los contornos permanezcan visibles). Como resultado, un ASM construido sólo con tomas
frontales puede utilizarse para la segmentación de imágenes tomadas desde otros ángulos. El método
propuesto se ha validado en imágenes faciales seleccionadas sistemáticamente de acuerdo al ángulo de
rotación fuera del plano, incluyendo tres vistas hacia cada lado más dos vistas con variaciones arribaabajo. Estos experimentos constituyen la mayor evaluación cuantitativa en segmentación bajo
variaciones sistemáticas de pose facial publicada hasta la fecha.
La tercera extensión provee una medida de confianza para el análisis efectuado sobre cada imagen. Es
decir, el modelo pueda estimar automáticamente si el resultado de una segmentación es confiable o no.
Esto se vuelve muy importante cuando los ASM son utilizados en sistemas totalmente automáticos,
donde el éxito de la etapa de segmentación es crucial para la posterior interpretación de la imagen. Esta
estimación de confiabilidad puede ser de relevancia en varias aplicaciones. Como ejemplo se han
abordado dos de ellas: selección automática de modelos y verificación confiable de identidad,
obteniendo en ambos casos resultados altamente positivos. La principal fortaleza del método propuesto
reside en su bajo índice de falsos positivos (las imágenes incorrectamente segmentadas rara vez son
clasificadas como confiables).
De este modo, las dos primeras extensiones comparten el concepto de invarianza (a rotaciones en y
fuera del plano de la imagen). Por otro lado, se verá que la primera extensión también incrementa la
precisión de las segmentaciones, mientras que la tercera extensión se concentra en la estimación del
grado de éxito obtenido en el procesado de cada una de las imágenes. En los tres casos se ha realizado
una exhaustiva valiación experimental, demostrando la superioridad de las técnicas propuestas sobre
otras técnicas existentes en la literatura
Descargar