en otra ventana

Anuncio
CAPÍTULO 1
INTRODUCCIÓN
El reconocimiento de rostros es una tarea relativamente fácil para los humanos, y un
ejemplo claro de esto es el caso de los niños quienes rápidamente aprenden a reconocer el
rostro de sus padres. Esto podría hacer pensar que enseñarle a una computadora como
reconocer diferentes rostros es una tarea sencilla, pero desafortunadamente esto no es así.
El reconocimiento de rostros es un problema que fue considerado desde las primeras etapas
de visión por computadora. Este problema ha sido estudiado más a fondo en los últimos
años, gracias a los avances del poder computacional que han permitido implementar
algoritmos más complejos utilizando diferentes técnicas. Entre estas técnicas se puede
hacer mención de las basadas en igualamiento de plantillas, eigenface, igualamiento basado
en características, y las técnicas basadas en Redes Neuronales.
En este proyecto utilizamos la técnica basada en redes neuronales para realizar el
reconocimiento de rostros, aprovechando sus diferentes características, tales como la
capacidad de aprendizaje y generalización.
Descripción del problema
La tarea de reconocimiento de rostros la podemos encontrar en lugares donde se necesite
tener un acceso restringido a una cierta área, o en sistemas de identificación de personas
como los que son utilizados por la policía.
De manera general, los sistemas de reconocimiento de rostros se pueden clasificar en dos
categorías:
1.-Cuando se quiere encontrar la identidad de una persona utilizando una base de datos.
Este tipo de sistemas no necesitan hacer un reconocimiento en tiempo real.
2.- Cuando se quiere identificar a una persona en tiempo real (por ejemplo, en un
sistema de monitoreo de seguridad), o cuando se desea permitir el acceso únicamente
a un grupo de personas.
En este proyecto nos enfocamos en los sistemas de la primera categoría, es decir, los
sistemas que no se ejecutan en tiempo real.
El proyecto lo podemos describir de manera muy general como sigue: dada como entrada la
imagen del rostro de una persona, una red neuronal artificial será capaz de identificar el
rostro, dando como resultado la identidad de dicha persona.
Objetivos
Objetivo General
El objetivo general de este proyecto, es el desarrollo de un sistema que sea capaz de
reconocer rostros, utilizando como conjunto de entrenamiento y prueba de la eficiencia del
sistema, la base de datos de rostros ORL (Olivetti Research Lab) [1], la cual contiene 10
imágenes diferentes de 40 sujetos distintos.
Objetivos Específicos
1 . Analizar la base de datos y determinar la necesidad de desarrollar una etapa de
preprocesamiento sobre las imágenes.
2. Realizar la extracción de características de los rostros, para reducir la imagen en un
número más pequeño de componentes, los cuales contengan la información
discriminante del rostro.
3 . Estudiar varios modelos de redes neuronales y escoger el más apropiado para el
desarrollo del sistema.
4. Desarrollar la etapa de entrenamiento de la red usando una parte de la base de datos de
rostros ORL [1] como datos de entrenamiento.
5. Realizar el reconocimiento utilizando los rostros de la base de datos que no fueron
utilizados durante el entrenamiento y algunos de los rostros que también se usaron
durante el entrenamiento, para obtener de este modo, un porcentaje de generalización y
un porcentaje de reconocimiento del sistema, respectivamente.
Diagrama de Bloques del Sistema
El sistema consta básicamente de dos etapas: la etapa de entrenamiento y la etapa de
reconocimiento. Las tareas que se realizan en cada una de las etapas se muestran en la
Figura 1-1
Imagen
Preprocesamiento
Extracción
de
Características
Entrenamiento
de
la red neuronal
Red
Entrenada
Reconocimiento
Identidad
del rostro
a)
Imagen
Preprocesamiento
Extracción
de
Características
b)
Figura 1-1. Diagrama a bloques del sistema. a) etapa de entrenamiento, b) etapa de
reconocimiento.
Alcances y limitaciones
El sistema fue entrenado y probado utilizando la base de datos de rostros del Olivetti
Research Laboratory [1] (ORL) para poder realizar un análisis comparativo del porcentaje
de error obtenido por el sistema propuesto y otros sistemas ya existentes, los cuales también
utilizaron esta base de datos.
El sistema únicamente reconoce una cantidad limitada de personas, para este caso
únicamente se utilizaron 10 imágenes diferentes de 40 personas distintas. Esto es debido a
que con una cantidad mayor de personas la complejidad de la red se incrementa.
Hardware y Software utilizado
Hardware
El hardware que se utilizó para el desarrollo del sistema fue una computadora SUN y una
computadora personal con un procesador Pentium III a 500 Mhz.
Software
Para la programación de las diferentes etapas del sistema, se utilizó el lenguaje JAVA
debido a las facilidades que este lenguaje ofrece para la lectura de imágenes y para el
manejo de memoria.
Además, como se mencionó anteriormente se utilizó la base de datos de ORL [1], la cual
contiene 10 imágenes diferentes de 40 sujetos distintos.
Descargar