posibilidades técnicas para el uso de redes neuronales en

Anuncio
POSIBILIDADES TÉCNICAS PARA EL USO DE REDES NEURONALES
EN LA SOLUCIÓN DE PROBLEMAS FITOSANITARIOS
M.C. Horacio Koji Osada Velázquez.
Area de Estadística y Apoyo. Depto. de Parasitología Agrícola.
Universidad Autónoma Chapingo.
Km.38.5 Carr.México-Texcoco. C.P.56230. Edo. de México.
[email protected]
Resumen
Los retos que aún quedan por resolver a la Informática dentro de la
Parasitología Agrícola concurren básicamente en: Los patosistemas que por
ser sistemas biológicos son muy complejos y heterogéneos para modelar y
simular. Y el diagnóstico, ya que la información en gran parte es del tipo
visual. En base a esta premisa se han buscado nuevas técnicas en cómputo
para poder estudiar estos sistemas y apoyar el diagnóstico con mayor
precisión y menor tiempo. En un inicio la tecnología de los sistemas de
cómputo no podía satisfacer las necesidades del parasitólogo, básicamente
eran equipos destinados únicamente al cálculo numérico, sin embargo, en la
última década el desarrollo de la tecnología electrónica a provocado que los
sistemas de cómputo tengan mejor desempeño a un menor costo y la
posibilidad de equiparse con componentes que les brindan características del
tipo sensorial (digitalizar fotografías o sonidos) y poder almacenar la
información que de ellos se obtiene.
La Informática en la búsqueda de algoritmos que imiten el
funcionamiento del cerebro humano generó algoritmos conocidos como
redes neuronales artificiales (ANN, Artificial Neural Networks). Estos
algoritmos tienen como característica principal que pueden extraer el
conocimiento de un conjunto de datos en base a un periodo de
entrenamiento, en otras palabras, pueden simular el aprendizaje a partir de
cierta información ya conocida. Aprovechando esta característica de las
redes neuronales, podemos crear sistemas que simulen el comportamiento
de los patosistemas en base al conjunto de datos obtenido y la respuesta del
mismo en base a los cambios registrados y en el caso del diagnóstico la
información gráfica puede ser analizada en sus características más
importantes (interpretar la imagen) para la identificación de un posible agente
causal.
Actualmente estos algoritmos están siendo probados e integrados en
el control de calidad de productos agrícolas e identificación de lesiones
foliares con buenos resultados.
Introducción
Los fenómenos biológicos involucrados en la Parasitología Agrícola generan
respuestas tan diversas, aun en las mismas situaciones, que se convierten
en un reto de gran importancia su estudio y modelación. En el estudio de los
patosistemas siempre se busca ajustar algún modelo matemático lineal o no
lineal para simular su dinámica, sin embargo existen muchas variables que
como tales no tiene una relación continua sobre el resto del sistema en gran
parte son variables discretas, que en términos generales son difíciles de
integrar a todas a la vez en un solo modelo matemático. En el caso del
diagnóstico tomemos como ejemplo la sintomatología de una enfermedad
foliar, en este caso es difícil encontrar dos manchas idénticas, por lo que la
descripción de las lesiones en realidad son una generalización de las
características presentes en la enfermedad, situación que no puede ser
representada en términos de comparación 1:1 como las técnicas
matemáticas de comparación de imágenes utilizadas en la industria.
La red neuronal artificial
Las redes neuronales artificiales (ANN, Artificial Neural Networks) se definen
actualmente como un sistema de procesamiento de información, ya sea en
software o hardware, que tiene ciertas características de desempeño en
común con las redes neuronales biológicas. También se les conoce como
modelos conexionistas, de procesamiento paralelo distribuido o sistemas
neuromórficos. Estas empezaron a desarrollarse desde 1943, cuando el
neurofisiologo Warren McCulloch y el matemático Walter Pitts plantean por
vez primera el modelo artificial de red neuronal. A pesar de tener casi 60
años la investigación por obtener algoritmos que funcionen de manera
semejante a una red neuronal biológica no se obtuvieron resultados de
aplicación aceptables hasta la década de los 80's, casi 40 años después,
debido en gran parte a la imposibilidad tecnológica de los sistemas de
cómputo. Actualmente las áreas en las cuales han sido probados los modelo
neuronales van desde la medicina hasta la militar. Las redes neuronales
presentan las siguientes ventajas:
Aprendizaje adaptativo: En base a un conjunto de datos las redes
neuronales pueden adaptar su respuesta sin necesidad de programar
todo el sistema en caso de incluir nuevos datos al entrenamiento.
Autoorganización: La forma como organizan el conocimiento dentro de
sus conexiones es automático conforme se da el proceso de
entrenamiento.
Tolerancia a fallos: Las redes neuronales aún cuando no reciban la
información en todos los neuronodos de entrada (información parcial)
pueden generar una respuesta con cierta certeza sin llegar a bloquearse.
Operación en tiempo real: El funcionamiento es casi inmediato, el
procedimiento de aprendizaje puede ser lento, sin embargo cuando la red
neuronal está entrenada su funcionamiento es rápido, aún en sistemas de
cómputo de menor desempeño.
Fácil inserción en la tecnología existente: Los tipos de redes neuronales
desarrollados han sido probados en diversos sistemas de cómputo y
áreas de aplicación, integrandose de manera natural a las nuevas
tecnologías debido a la simplicidad como manejan los datos de entrada y
salida.
El modelo matemático del neuronodo, que es el elemento básico de la red
neuronal -equivalente a la neurona- puede observase en la figura 1a y la
representación gráfica de una red neuronal en la figura 1b.
Figura 1. Representación matemática de un neuronodo (a) y representación gráfica de una
red neuronal (b).
Identificando problemas fitosanitarios
Para experimentar la funcionalidad de las redes neuronales se probaron con
problemas de clasificación. Con el éxito obtenido para este tipo de problemas
también se les conoció a las redes neuronales como clasificadores
universales. Dentro de los quehaceres del parasitólogo agrícola es la
identificación de los agentes causales de los problemas fitosanitarios, una
actividad que es básicamente de clasificación.
La implementación de las redes neuronales para la identificación de
los problemas puede ser tan simple (textual) o compleja (sensorial) como se
desee, en ambas situaciones se debe definir de manera concreta todo el
universo de variables o datos que intervienen en la descripción de los
problemas involucrados en el patosistema de interés. La cualidad que tiene
la implementación de las redes neuronales en un sistema de identificación es
que la solicitud de la información involucrada en el patosistema puede
plasmarse en un formato general, sin la necesidad de preguntas
encadenadas a manera de clave de identificación, como funcionan la
mayoría de los sistemas expertos, de tal manera que el usuario no se ve
forzado a proporcionar todos los datos para obtener alguna respuesta, las
redes neuronales pueden generar una respuesta a pesar de la parcialidad de
los datos originales. Los sistemas de cómputo actualmente tiene la
capacidad de ver por medio de cámaras de video, digitales o digitalizadores
de imágenes impresas (scanner), sin embargo no pueden observar (analizar
y relacionar las imágenes con algún conocimiento) de manera inherente.
Esta cualidad debe ser creada a la medida para cada área del conocimiento
humano, entre ellas, la Parasitología Agrícola, donde en gran medida la
información es de origen gráfico. La topología de una red neuronal
clasificadora se puede ver en la figura 2a.
(a)
(b)
Figura 2. Topología tipica de una red neuronal clasificadora (a) y la forma como puede
integrar diferentes bases de datos fitosanitarias (b).
Las redes neuronales como clasificadores pueden utilizarse como un
enlace entre bases de datos de colecciones criptogámicas e información
técnica respecto a los ejemplares (figura 2b), proporcionandole al usuario un
sistema de referencia técnica interactivo. El sistema IMAF (Identificador de
Machas Foliares) probó la posibilidad de desarrollar dichos sistemas sin la
necesidad de grandes equipos de cómputo.
Modelando patosistemas
Actualmente se han desarrollado nuevos tipos de redes neuronales donde la
información de salida forma parte de los datos de entrada para el siguiente
ciclo de funcionamiento, considerando esta característica, podemos
utilizarlas para el pronóstico de patosistemas, sistemas muy dinámicos en
espacio y tiempo.
De la misma manera que en las redes clasificadoras nosotros
debemos seleccionar todas las variables que estén involucradas con el
patosistema, sin embargo el dato de respuesta debe considerarse como dato
de entrada para el siguiente ciclo, una necesidad inseparable en todo
sistema de simulación. La ventaja en la selección de variables para realizar
la simulación, es que las variables no tiene que ajustarse a un modelo
matemático lineal o no lineal para que se le integre, la red neuronal durante
el procedimiento de entrenamiento le asigna el peso matemático que juega
en el sistema de simulación, ahorrándonos tiempo en hacer correlaciones o
otras técnicas involucradas en la simulación de sistemas, obviamente la
forma matemática de representar el patosistema no podrá ser una función
matemática sino la topología de la red neuronal, la cual puede ser como la
presentada en la figura 3.
Figura 3. Topología para una red neuronal para la simulación de patosistemas.
¿Cómo aprende una red neuronal?
La forma como adquiere el conocimiento una red neuronal es en base a un
procedimiento repetitivo de calibración de todas las conexiones entre los
neuronodos que componen a la red neuronal planteada. Este proceso de
entrenamiento depende que el experto le proporcione a la red neuronal un
conjunto de datos de entrada con la salida o respuesta que debe ser, por lo
tanto se da un efecto de ensayo y error dentro de la red (muy semejante
cuando uno está estudiando). Cuando la red neuronal no presenta error con
los datos para el entrenamiento se pasa a una etapa de verificación donde se
le proporcionan otros datos que la red no utilizó para el entrenamiento.
Entonces, si el error esta dentro de lo aceptable se da por entrenada la red.
Actualmente se están desarrollando otros tipos de redes neuronales donde
ellas mismas busquen la respuesta adecuada, como es en el caso de los
insectos plaga donde se desea conocer cuantos estados juveniles (p.e.
larvales) de desarrollo comprende su ciclo de vida y debido a dificultades en
su cría artificial o el habito que tienen (plagas que desarrollan totalmente su
fase juvenil dentro de frutos), la única fuente de datos es a partir de
muestreos destructivos.
Bibliografía
1.Fausett L. 1994. “Fundamentals of neural networks: Architectures, algorithms and
applications.” Prentice-Hall. 461 p.
2.Osada V.H.K. 2000. “IMAF: Identificador de Manchas Foliares. Una aproximación
entre redes neuronales y sistemas multimedia fitosanitarios.” Tesis de Maestría en
Ciencias. Colegio de Postgraduados. ISEI. Montecillo, Mexico. 63 p.
3.Schultz, A. & R. Wieland. 1997. “The use of neural networks in agroecological
modeling.” Computers and Electronics in Agriculture 18(2,3): 73-90.
Ejercicios sobre el tema:
Redes neuronales para la identificación de problemas fitosanitarios.
1) Como se observó un perceptrón con un par de entradas define un hiperplano, el
cual separa dos regiones de decisión. Observe en el programa perceptrón como es
el comportamiento de los pesos (w) y el hiperplano con los siguientes conjuntos de
datos.
Datos para entrenar:
Punto
1
2
3
4
x1
x2
y (salida)
0.9
-0.7
0.6
0.1
0.4
0.3
0.8
-0.7
1
-1
1
-1
¿Cómo quedó el hiperplano, los puntos y los pesos(w)?
w1=________
w2=________
Datos a clasificar:
Punto
1
2
3
4
5
6
7
8
9
10
x1
x2
0.1
0.9
0.1
-0.2
0.8
-0.6
-0.5
-0.1
-0.8
0.3
0.1
0.8
0.5
0.7
-0.7
0.5
-0.7
-0.3
0.5
-0.9
esperado
y (salida)
¿Qué pasa si cambia los valores verdaderos a falsos?
¿Cómo tendrían que distribuirse los datos para que el perceptrón tenga problemas al
entrenarse?
Descargar