Procesamiento inteligente de imágenes digitales de ecosistemas

Anuncio
MOMENTOS DE
Universidad de la
AMAZONIA
Momentos de Ciencia 6:(1), 2009
CIENCIA
Procesamiento inteligente de imágenes digitales de
ecosistemas acuáticos amazónicos basado en computación
GRID enfocada a la gestión del conocimiento
Edwin Eduardo Millán-Rojas1,*, Jose Nelson Pérez-Castillo2
1
Grupo de investigación GITUCAM. Universidad de la Amazonia. Florencia (Caquetá), Colombia.
2
Grupo de investigación GICOGE. Universidad Distrital Francisco José de Caldas. Bogotá, D. C.
Recibido 7 de Noviembre de 2008; aceptado 11 de Marzo de 2009
Resumen
En la actualidad se pueden tener algoritmos estructurados para la clasificación digital e, incluso, algoritmos ya probados que
pueden clasificar y extraer la información relevante de una imagen digital, sin embargo hay un elemento estructural que limita el
desempeño de estos algoritmos: la capacidad de cómputo. Es fácil trabajar con una imagen digital tomada con una cámara digital
casera, debido a su baja resolución. Pero si se tienen muchas imágenes, el escenario es diferente y se necesita un mayor recurso de
cómputo. Y si, además, se asocian a las imágenes bases de datos alimentadas por años, sería más complejo su procesamiento. Es en
este último escenario donde el procesamiento mediante computación GRID es de gran ayuda.
© 2009 Universidad de la Amazonia. Todos los derechos reservados.
Palabras clave: gestión del conocimiento, computación GRID, imágenes digitales, ecosistemas acuáticos.
Abstract
It can be obtained at present structured algorithms for digital classification and even tested algorithms for classifying and taking out
relevant information from a digital image; however, there is a structural element that causes limited algorithm performance:
computing capacity. Because of the low pixel density, it is easy to work on a picture taken by a compact digital camera. But a higher
computation resource is necessary for processing a lot of pictures taken by the same camera. And if data bases filled out by years
were associated to that images, it would be more complex their processing. On this last scenario, the computing GRID processing is
helpful.
© 2009 Universidad de la Amazonia. All rights reserved.
Key words: knowledge management, computing GRID, digital images, aquatic ecosystems.
Introducción
computacionales) e imágenes digitales, que
pretenden dar un mayor alcance al proceso de
clasificación y ayudan a tener la información en
bases de datos digitales, permitiendo una gestión
del conocimiento puntual.
Las imágenes tomadas son cargadas con
información que puede llegar a tener un alto
volumen de datos e importancia significativa en
los procesos de investigación, como lo son las
imágenes digitales tomadas a los ecosistemas
acuáticos amazónicos, las cuales pueden ayudar a
determinar gran cantidad de especies y elementos
nuevos en el campo de la biología animal o
vegetal, conocimiento esencial en las
investigaciones.
En este contexto, se encuentra gran cantidad de
Los últimos años han visto un rápido incremento
del tamaño de las colecciones de imágenes
d i gital e s (médicas , hi s tó ri ca s , p o l i c ia l e s ,
pictóricas, etc.). Esta situación plantea una
necesidad básica: la búsqueda y obtención de las
imágenes deseadas entre una extensa colección.
Los métodos tradicionales de procesamiento y
clasificación de la información (anotaciones
textuales, establecimiento de taxonomías) se
muestran insuficientes e inadecuados por falta de
tie m po, re c urso de c ó mputo , e spa c i o d e
almacenamiento, entre otros motivos. En este
campo aparecen los conceptos de procesamiento
in t el ige n t e, c omput ac ió n GR ID (m all as
* Autor para correspondencia. E-mail: [email protected]
8
Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13
administrar la información, para mantener el
conocimien to de los ecosist emas a cuát i cos
amazónicos en el tiempo y que la información
sirva en las investigaciones y permita tomar
decisiones.
información gráfica que debe ser procesada por
los expertos y los algoritmos de clasificación de
imágenes pueden ayudar a agilizar estos procesos
de sistematización. Lo que se pretende es mejorar
uno de esos algoritmos y adaptarlo en un servicio
GRID para el tr a b a jo con i m á genes sin
procesamiento previo y, de esta forma, contar con
una herramienta de procesamiento inteligente
sobre computación GRID que mejore los tiempos
de procesamiento de los elevados volúmenes de
información en los cuales se pueden convertir las
b ases de da tos digitales de imágenes de
ecosistemas Acuáticos Amazónicos.
Imágenes digitales
Las imágenes digitales son fotos electrónicas
toma d as d e una e sce n a o es c aneadas de
documentos -fotografías, manuscritos, textos
impresos e ilustraciones. Se realiza una muestra
de la imagen digital y se confecciona un mapa de
ella en forma de cuadrícula de puntos o elementos
de la figura (píxeles).
A cada píxel se le asigna un valor tonal (negro,
blanco, matices de gris o color), el cual está
representado en un código binario (ceros y unos).
Los dígitos binarios (bits) para cada píxel son
almacenados por una computadora en una
secuencia, y con frecuencia se los reduce a una
representación matemática (comprimida). Luego
el computador interpreta y lee los bits para
producir una versión para su visualización o
impresión.
Conceptos generales
Ecosistemas Acuáticos
Colombia, por su pri v ileg i ad a s ituació n
geográfica, tiene abundantes reservas y cursos de
agua que se encuentran dispersos a lo largo y
ancho de su territorio. En las cordilleras central y
oriental abundan los diferentas ecosistemas
acuáticos que cumplen una función esencial en la
conservación de la flora y fauna y en su mayoría
son el nacimiento de ríos que son de vital
importancia para los pobladores.
Los ecosistemas acuáticos se dividen en dos
grupos: los de agua dulce (ríos, lagos, humedales),
y los ecosistemas marinos (mares, estuarios). Los
ecosistemas de agua dulce se pueden clasificar en
dos: de aguas quietas o lénticos (lago, estanque,
pantano, charcas) y de aguas corrientes o lóticos,
tales como los manantiales, riachuelos, arroyos,
ríos (Quinlan 1993).
Mallas computacionales (computación GRID)
El principio de la computación GRID es la
agregación de re c urs o s c omputacion a l e s
he te rogéneos di s trib u idos entre distintas
organizaciones para formar una meta ordenador.
Para hacer más fácil la utilización de estas
infraestructuras distribuidas, surge la necesidad
de establecer una arquitectura global que sea
plasmada en la práctica en una serie de servicios
básicos en form a d e midd l eware , y que
simplificarán el modo de desarrollar aplicaciones
que puedan hacer uso de estas infraestructuras.
Las mallas computacionales son un modelo
relativamente nuevo que plantea la unión de los
recursos computacional e s de di f erentes
organizaciones para resolver problemas fuera del
alcance del más poten t e s u perordenador
individual (Borja 2007).
Gestión del conocimiento
“La gestión del conocimiento es el nuevo
paradigma de la gestión que ha sustituido,
integrándolos y dándolos por supuesto, a los
anteriores. Para que una organización funcione es
necesario disponer, entre otras cosas, de una
estrategia, de un plan de objetivos y un sistema de
control de la gestión, un conjunto de procesos
básicos definidos y asegurados, un sistema de
comunicación interna y de evaluación del
rendimiento, una cultura corporativa
propia”(Molina & Marsal-Serra 2002).
En el contexto de la clasificación de imágenes se
busca organizar el conocimiento de los expertos y
entrenar una de las soluciones planteadas más
adelante, con el fin de organizar, gestionar y
Algoritmos de clasificación
Algoritmos de clasificación basados en redes
neuronales: Las redes neuronales se utilizan como
herramientas o métodos para resolver problemas,
en especial los relacionados con el conocimiento
humano: reconocimiento de patrones,
9
Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13
reconocimiento del lenguaje hablado,
reconocimiento de imágenes, procesos de control
adaptativo y estudio del comportamiento de
ciertos problemas para los que no están muy bien
dotados los ordenadores tradicionales.
El aprendizaje de una red neuronal está
relacionado con los pesos de las conexiones entre
sus nodos (Hebb 1949).
Cuando se presenta un patrón a la red, ésta
produce una respuesta. Si la respuesta o salida de
la red n o es la supuesta, deben hacerse
modificaciones para acercar la respuesta obtenida
a la esperada. La señal que se recibe en la capa de
neuronas de entrada cuando se le presenta el
patrón se mueve a través de los enlaces o
conexiones entre capas, hacia las neuronas de la
capa de salida.
se busca en los ejemplos almacenados casos
similares y se asigna la clase más probable en
éstos.
Máquinas de vectores de soporte: (SVM, por sus
siglas en inglés) han mostrado conseguir buen
desempeño de generalización sobre una amplia
varied a d de problemas de clasificación,
destacando recientemente en problemas de
clasificación de textos (Joachims1998, Dumais et
al. 1998, Joachims 2001), donde se aprecia que
SVM tiende a minimizar el error de
generalización, i.e. los errores del clasificador
sobre nuevas instancias
. En términos geométricos, SVM puede ser visto
como el intento de encontrar una superficie que
separe a los ejemplos positivos de los negativos
por el margen más amplio posible (Hearst et al.
1998).
Clasificador Naive Bayes: El clasificador Naive
Bayes (NB) se considera como parte de los
clasificadores probabilísticos, los cuales se basan
en la suposición que las cantidades de interés se
rigen por distribuciones de probabilidad, y que la
decisión óptima puede tomarse por medio de
razonar acerca de esas probabilidades junto con
los datos observados (Mitchell 1997).
Atributos de los ecosistemas acuáticos
Aguas quietas o lénticas: profundidad, tamaño y
periodos de retención de agua.
Lagos: profundidades considerables, originadas
por:
a. Disolución de sustrato: circulación de aguas
subterráneas, regiones de alta precipitación
b Acumulación de materia orgánica:
Originados por avalanchas.
Formació n de represas (Propósitos
hidroeléctricos, suministro de agua
control de inu n daciones,
potable,
recreación).
c. Acción de los ríos: brazos de los ríos forman
ciénagas
Ciénagas: Conexión (directa al río,
indirecta, sin conexión) Zonas
(profundidad -Ubicación de vegetación)
d. Inundaciones: excesos de aguas
Variaciones de niveles de agua
Interconexión entre ríos y lagos
Tipos de aguas:
Aguas blancas (várzeas)
Aguas negras (igapós)
Clasificador C4.5: El esquema C4.5 fue diseñado
como una extensión del algoritmo ID3 (Quinlan
1986) que forma parte de los clasificadores
conocidos como árboles de decisión, donde sus
nodos internos son etiquetados como atributos;
las ramas salientes de cada nodo representan
pruebas para los valores del atributo, y las hojas
del árbol identifican a las categorías.
Estos algoritmos proporcionan un método
práctico para aproximar conceptos y funciones
con valores discretos, e.g. en clasificación de textos
(Cohen & Hirsh 1998, Cohen & Singer1999,
Joachims1998).
Vecinos más cercanos: (k-NN, por sus siglas en
inglés) es uno de los métodos de aprendizaje
basados en instancias más básicos, pero con
resultados aceptables en tareas que involucran el
análisis de texto (ver Joachims1998, Yang &
Pedersen 1997, Yang & Liu 1999).
En resumen, este algoritmo no tiene una fase de
entrenamiento fuera de línea, por lo tanto, el
principal cálculo se da en línea cuando se localizan
los vecinos más cercanos. La idea en el algoritmo
es almacenar el conjunto de entrenamiento, de
modo tal que para clasificar una nueva instancia,
Lagunas: poca profundidad, partes bajas de los
ríos, inundaciones de los ríos.
Aguas corrientes o lóticas: riachuelos, ríos,
arroyos y quebradas. Profundidad, longitud,
anchura, caudal y extensión de la orilla.
10
Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13
Clasificación de la corriente:
a. Tipo uno (no tributarios
b. Tipo dos (2 tributarios de tipo uno)
c. Tipo tres (tipo uno y dos)
-
clasificación de imágenes digitales y servicios
para mallas computacionales
Exploración de las técnicas utilizadas para
clasificación de imágenes digitales basadas en
contenido.
Exploración de los conceptos de servicio Grid y
mallas computacionales
Explorar los algoritmos que permiten la
cla sif ica ci ó n a uto má tica de i m á g e ne s
digitales
Definición de criterios de clasificación de la
información, las métricas para cada uno y la
forma en la que pueden ser implementados en
un prototipo.
Definir los parámetros para el servicio Grid de
Clasificación.
Tipo de corrientes:
a. Permanentes: nacimientos subterráneos,
caídas de agua, nivel de cauce > nacimiento
b. Intermitentes: reciben agua de escorrentía
superficial, pueden disminuir su nivel en
sequías
c. Interrumpidas: alternan cauces superficiales
y subterráneos
-
Flujo:
a. Laminar: lento
b. Turbulento: alta velocidad
c. Movimiento irregular
-
Transporte:
a. Disuelto
b. Suspendidos (restos de arcilla, arena y
similares)
- A partir de la fase teórica desarrollada,
- Implementar una plataforma de computación
Grid para la ejecución del Proyecto
- Seleccionar un algoritmo para la clasificación
de I m á gen e s dig ita le s ca p tu r a da s co n
dis p os itiv o s s im p le s i mp le m e nta n do u n
servicio Grid.
- Hacer el planteamiento de una mejora sobre el
algoritmo seleccionado, para aplicarlo a la
c la s i fic a ció n de im á ge n e s dig it a le s de
ecosistemas acuáticos Amazónicos.
- Implementación de un servicio Grid para el
algoritmo aplicándolo a un estudio de casos:
colección digital de imágenes de Ecosistemas
Amazónicos del Grupo de Investigación
CAPREA de la Uniamazonia.
- Determinación y definición de la Colección
Bibliográfica
-
-
Fase de desarrollo
Riachuelos:
a. Ubicados en partes altas de montaña
b. Aguas claras y transparentes
c. Poco caudal
d. Corren por lechos rocosos, pedregosos o
arenosos
Quebradas:
a. Unión de riachuelos
b. Más sólidos suspendidos que riachuelos
c. Torrentosas
d. A veces forman caídas de agua
Ríos:
a. Unión de las quebradas
b. Aumentan sólidos suspendidos y disueltos
c. Más productividad, menos diversidad de
especies
d. Caudales corren a velocidad más lenta
e. Serpentean formando meandros
Fase de validación
- Validación del servicio con la ejecución de
pruebas y comparación con otros modelos y
sistemas en el área de estudio.
- Análisis y determinación de resultados de la
aplicación del prototipo propuesto.
Metodología propuesta GCMC
Procesamiento inteligente de imágenes
Se ha definido una metodología enmarcada
dentro de tres fases: una Fase Teórica, una Fase de
Desarrollo y una Fase de Validación, así:
Una vez encaminados y definidos los algoritmos
de clasificación (en este caso, el concepto de red
neuronal) se define un algoritmo programado en
un lenguaje java, el cual cuente con variables
apropiadas para el trabajo gráfico, que represente
las imá ge n es d e e c o s is t e m as acuá t ic os
Fase Teórica
- Exploración de los trabajos relacionados con la
11
Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13
Figura 1. Esquema Plataforma GRID.
amazónicos, dentro del complejo trabajo de la
computación Grid. Se define entonces un servicio
Web, el cual recibirá una imagen en formato jpg
como un objeto dentro del método de captura.
Una vez implementado el servicio, este se
desplegará dentro de la plataforma Grid que se ha
configurado inicialmente (Figura 1) con la
herramienta globus toolkit.
El prototipo expuesto fue creado en maquinas
virtuales bajo el sistema operativo Scientific
Linux, c o n herramientas de Globus para
desplegar la red neuronal (Figura 2), la cual fue
creada a partir del algoritmo Backpropagation (ver
http://ohm.utp.edu.co/neuronales/).
debido a las dificultades encontradas por el
formato de la imagen. Una vez el servicio se
despliega en la plataforma, pasa a ser un servicio
GRID, que puede ser instanciado desde cualquier
maquina dentro de la GRID que esté certificada.
De esta forma, se puede programar trabajos de
forma sencilla o en paralelo, para darle respuesta a
la necesidad de clasificar el alto volumen de las
colecciones de datos e imágenes digitales que
existen.
Conclusiones
El manejo de bases de datos multimedia de
diversos tamaños y contenidos precisa de técnicas
adecuadas de implementación de sistemas de
recuperación y exploración. En el campo de las
bases de datos de imágenes, la complejidad de la
clasificación radica en que el usuario espera que el
sistema encuentre elementos relevantes basados
en semánticas personales o culturales.
La representación de informaciones de carácter
semántico es muy compleja y requiere soluciones
a problemas como la detección automática de
características, segmentación y reconocimiento.
Estos problemas todavía permanecen abiertos.
La computación Grid desplegada en una
plataforma puede ser usada como una
herramienta con características de procesamiento
muy altas, capaz de dar solución a las necesidades
de cómputo requeridas para las colecciones de
Figura 2. Red Multicapas de tres Niveles. Modificada de
http://ohm.utp.edu.co/neuronales/.
Ello permite realizar un procesamiento inicial de
las regiones para luego clasificarlas. Sin embargo,
esta etapa se encuentra en desarrollo permanente,
12
Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13
Trends and controversies - Support vector machines, IEEE
Intelligent systems, pp. 18-28.
Hebb, D. 1949. Organization of Behavior. Wiley & Sons. New
York.
Joachims, T. 1998. Text categorization with support vector
machines: Learning with many relevant features. In: Tenth
European Conference on Machine Learning (ECML'98).
Proceedings. Lecture Notes in Computer Science, Number
1398, pp. 137-142.
Joachims, T. 2001. A statistical learning model of text
classification with support vector machines. In: 24th ACM
International Conference on Research and Development in
Information Retrieval. Proceedings. ACM Press.
Leung, C. 1999. Image and Vision. Computing, pp. 463-464.
Mitchell, T. 1997. Machine Learning. McGraw-Hill. New-York.
Molina, J. L. & M. Marsal-Serra. 2002. La gestión del
conocimiento en las organizaciones. Negocios Empresa y
Economia, .
Quinlan, J. R. 1986. Induction of decision trees. Machine
Learning, 1:81-106.
Quinlan, J. R. 1993. C 4.5: Programs for machine learning.
Morgan Kaufmann.
Yang, T. & X. Liu. 1999. A re-examination of text categorization
methods. In: SIGIR-99, 22nd ACM International Conference
on Research and Development in Information Retrieval.
Proceedings. Berkeley, CA. pp. 42-49.
Yang, Y. & J. Pedersen. 1997. A comparative study on feature
selection in text categorization. In: 14th International
Conference on Machine Learning. Proceedings. pp. 412-420.
imágenes digitales de ecosistemas acuáticos
almacenadas en las bases de datos.
Existe la posibilidad de elaborar nuevos
servicios de clasificación y procesamiento, los
cuales pueden ser desplegados en la plataforma
Grid para realizar nuevas tareas en forma
paralela; este es un buen comienzo para realizar
trabajos futuros en esta área.
Literatura citada
Borja, S. 2007. España, con paso firme en Computación Grid.
Chicago.
Cohen, W. & H. Hirsh. 1998. Joins that generalize: text
classification using WHIRL. In: 4th International Conference
on Knowledge Discovery and Data Mining (KDD'98).
Proceedings. AAAI Press, pp. 169 –173.
Cohen, W. & Y. Singer. 1999. Context-sensitive learning
methods for text categorization. ACM Transactions on
Information Systems, (2):141 –173.
Dumais, S., J. Platt, D. Heckerman, & M. Sahami. 1998.
Inductive learning algorithms and representations for text
categorization. In: Seventh International Conference on
Information Retrieval and Knowledge Management (ACMCIKM'98) Proceedings. pp. 148-155.
Hearst, M., B. Schölkopf, S. Dumais, E. Osuna & J. Platt. 1998.
13
Descargar