Visión artificial

Anuncio
UNIVERSIDAD POLITECNICA SALESIANA

VISION ARTIFICIAL
Oscar David Sari Villa
UNIVERSIDAD POLITÉCNICA SALESIANA
Carrera de Ingeniería Electrónica Y Telecomunicaciones
[email protected]
este diagrama se explica desde arriba hacia abajo,
en esta se dice que existen tres perfiles de usuario:
Básico, intermedio y avanzado [5].
Resumen—En este documento se presenta un
informe de las diversas formas de visión artificial,
sus diferentes usos y aplicaciones, como por
ejemplo la visión artificial aplicada a la detección
de transeúntes para que de esta manera con poco
personal humano se pueda realizar un trabajo
amplio que originalmente requeriría muchas
personas.
PALABRAS CLAVES: Procesamiento de
imágenes, seguimiento visual, conteo de personas,
detección de flujo vehicular.
I. INTRODUCCIÓN
El proceso general que realizaremos es la de
detectar el movimiento ya sea de personas u otro
objeto mediante el uso de aparatos electrónicos o
software como por ejemplo el Display IMG,
TeamSoftware, Irmotion, Goratech Ireport. De esta
manera facilitaremos el trabajo de las personas ya
estas no tendrán que estar todo el tiempo tras las
cámaras de vigilancia.
Sea cual sea el mecanismo o software que vayamos
a utilizar debe poseer la capacidad de detectar,
analizar e informar sobre cualquier evento que
suceda en área determinada [1] [2] [3].
Los sistemas de visión artificial deben tener la gran
capacidad de detectar objetos tal y cual como lo
hacen los seres humanos, mediante la detección de
objetos estos deben tomar decisiones pero esto ya se
vincula con la inteligencia artificial que en este caso
no hablares mucho de ello [4].
FIG. 1 ESTRUCTURA DEL SOFTWARE
III. ESTRUCTURA DEL CAMPO VISUAL
Esto hace referencia a la imagen plana que refleja
una escena generalmente tridimensional, para esto
se han usado sensores foveales los cuales presentan
un perfil de resolución variable a lo largo del campo
de visión. Al realizar esto permite que la percepción
y al ambiente visual en el que estamos trabajando
sean coordinados y que se dé una mejor interacción,
gracias a esto podremos recibir las imágenes más
detalladas pero sin perder de vista el campo visual
en que estamos [6].
II. ESTRUCTURA DEL SOFTWARE
En la siguiente figura (Fig. 1) se indica la estructura
implementada en el software de visión artificial,
1
UNIVERSIDAD POLITECNICA SALESIANA
De la misma manera podemos aplicar esto para
detectar el densidad de peatonal en tiempo real, de
esta manera podremos detectar aumenta densidad de
personas en ciertas horas del día y sin la necesidad
de que alguna persona este sentado todo el día
enfrente de una cámara de vigilancia para realizar
todo esto se presenta el siguiente diagrama de
bloque detallando cada una de las etapas [8]:
También presentamos una propuesta para el
reconocimiento invariante de objetos que está
basada en el uso de formas cónicas dentro de la base
más simple de conocimiento, esto se puede
representar mediante un vector que se llama
[CDF&POSE] [9].
Generación del vector descriptivo [CDF&POSE]:
Cuando la información ya ha sido procesada se
conforma el vector descriptivo que en realidad es la
entrada a la red neuronal.
Di es la distancia al centro del perímetro.
Xc, Yc, son las coordenadas del centroide.
Φ es el ángulo de orientación.
Z es la altura del objeto.
ID es un numero codificado relacionado a la
geometría de los componentes [9].
1. Detección de movimiento invariante a la luz:
IV. DETECCION
DE
OBJETOS
EN
MIVIMIENTO
Cunado un objeto está en movimiento estos
producen cambios de intensidad debido a los
reflejos producidos por la luz, eso significa que si
analizamos dos imágenes sucesivamente esto
producirán cambios de intensidad tanto en objetos
móviles como estáticos [8][9].
2
UNIVERSIDAD POLITECNICA SALESIANA
3. Clasificación
VI. IMPLEMENTACION Y RESULTADOS
Para la implementación de la visión artificial se
utilizó una PC con un procesador Intel Pentium IV
de 2.8 GHz y 512 MB de memoria RAM en un
sistema operativo de Windows XP. La aplicación se
la realizo en la plataforma de LabVIEW 8.0 de
National Instruments.
La siguiente imagen se la capto con una cámara
Web convencional o sea común y corriente la
cámara estaba a 3.5m del suelo en una posición
acimutal, captando una área de 9 metros cuadrados
V. EXTRACCION DE CARACTERISITICAS
Y CLASIFICACION
Descriptores de Fourier
[8].
Mediante esta descripción se trata de extraer
imágenes a partir de imágenes bizarras utilizando
un análisis de conectividad, para esto primero se
utilizan detectores de bordes. Los descriptores de
Fourier se caracterizan por ser invariantes a
transformación es geométricas y tolerantes al ruido
[10]. Cuando se trata de una superficie cerrada la
serie de Fourier se la puede representar con una
adecuada parametrizacion
z(k) = [Xk,Yk], k=1.2……N
z(k) = Xk + jYk
(1)
(2)
la transformada discreta de Fourier de a(n)=z(k) es:
Se realizaron varias pruebas para una mejor
verificación de resultados con diferentes
velocidades de muestreo 7.5, 15, 30 pies, pero
lastimosamente no se pudo hacer pruebas en tiempo
3
UNIVERSIDAD POLITECNICA SALESIANA
[6] Arrebola, F., Urdiales, C., Camacho, P. y
Sandoval, F.,
(1998) “Vision system based on shifted fovea
multirresolution retinotopologies”, Proc. of the
25th
Annual Conf. IEEE Ind. Electronics Soc., 3, pp.
13571361, Aachen-Alemania.
[7]A. Bandera, C. Urdiales, J.L. Herreros y F.
Sandoval
Dpto.
Tecnología
Electrónica,
E.T.S.I.
Telecomunicación
Universidad de Málaga, Campus de
Teatinos, 29071 Málaga, España
[8] Scientia et Technica Año XIII, No 35, Agosto
de 2007. Universidad Tecnológica de Pereira.
ISSN 0122-1701
real debido al software que se utilizó. Para la
distancia de 15 y 30 pies se obtuvieron resultados
estadísticamente equivalentes por lo daba igual los
datos a 15 pies que los datos a 30 pies.
Las pruebas se realizaron en ambientes estáticos en
donde no haya más movimiento que la que produce
el objeto que estamos analizando, esto es un gran
problema ya que en un ambiente real van a existir
muchos objetos en movimiento y tratar de analizar
uno en específico nos resultara muy difícil [8].
VII. CONCLUCIONES
Con toda la información que presentamos
anteriormente tratamos de demostrar la importancia
que tiene la visión artificial que es una parte que
abarca la inteligencia artificial, pero de igual
manera no deja de ser importante ya que gracias a
la visión artificial podemos crear mecanismos que
realicen trabajo no por el simple hecho de recibir
órdenes si no que son capaces de visualizar su
objetivo, tomar decisiones y ejecutarlas.
En este artículo también se trata de explicar un poco
más sobre los proyectos que involucran la visión
artificial, como por ejemplo aplicada en la detección
de peatones.
Pero todo esto solo es un trabajo de investigación ya
que todo lo realizado es simplemente una
recopilación de información o experimentos que ya
fueron realizados.
[9]Mario Peña Cabrera1, Ismael López Juárez2,
H. Gómez N1., R. Osorio C.1, Oleg Sergiyenko3
1 Instituto de Investigaciones en Matemáticas
Aplicadas y en Sistemas (IIMAS-UNAM)
Circuito Escolar, Cd. Universitaria, D.F. CP
4100,México.
[email protected]
2 CINVESTAV, Saltillo , Coahuila, México.
3 Engineering Institute, Autonomous University
of Baja California, Mexicali, Baja California,
México.
[10]E. G, V. F. Batlle. A. A: Oliver y L. S.
“Descriptores de Fourier para identificacin y
posicionamiento de objetos en entornos 3D”. In
Proc. 2004 XXV Jornadas de Automatica Cuidad
Real. España, pp 8-10.
VIII. REFERENCIAS
[1] Hughett. P, ”A programable command
interpreter to automate image
processing of infrared thermography”,SPIE Vol
1467, Thermosense XIII,1991.
[2] Ballard, D. y Brown, C. (1982) Computer
Vision, Prentice
[3] Hughett. P, ”A programmable command
interpreter to automate image
processing of infrared thermography”,SPIE Vol
1467, Thermosense
XIII,1991.
[4] Tombropolous,R.Z., J.R. Adler et al. (1999),
»Carabeamer : A treatment planner for a robotic
radiosirurgical system with general kinematics »,
Medical Image Analysis 3(3) : 237,264.
[5] Hern´an Ben´ıtez,Humberto Loaiza,Bladimir
Vacca,Javier Acevedo
4
Descargar