POSIBILIDADES TÉCNICAS PARA EL USO DE REDES NEURONALES EN LA SOLUCIÓN DE PROBLEMAS FITOSANITARIOS M.C. Horacio Koji Osada Velázquez. Area de Estadística y Apoyo. Depto. de Parasitología Agrícola. Universidad Autónoma Chapingo. Km.38.5 Carr.México-Texcoco. C.P.56230. Edo. de México. hkoji2000@gmail.com Resumen Los retos que aún quedan por resolver a la Informática dentro de la Parasitología Agrícola concurren básicamente en: Los patosistemas que por ser sistemas biológicos son muy complejos y heterogéneos para modelar y simular. Y el diagnóstico, ya que la información en gran parte es del tipo visual. En base a esta premisa se han buscado nuevas técnicas en cómputo para poder estudiar estos sistemas y apoyar el diagnóstico con mayor precisión y menor tiempo. En un inicio la tecnología de los sistemas de cómputo no podía satisfacer las necesidades del parasitólogo, básicamente eran equipos destinados únicamente al cálculo numérico, sin embargo, en la última década el desarrollo de la tecnología electrónica a provocado que los sistemas de cómputo tengan mejor desempeño a un menor costo y la posibilidad de equiparse con componentes que les brindan características del tipo sensorial (digitalizar fotografías o sonidos) y poder almacenar la información que de ellos se obtiene. La Informática en la búsqueda de algoritmos que imiten el funcionamiento del cerebro humano generó algoritmos conocidos como redes neuronales artificiales (ANN, Artificial Neural Networks). Estos algoritmos tienen como característica principal que pueden extraer el conocimiento de un conjunto de datos en base a un periodo de entrenamiento, en otras palabras, pueden simular el aprendizaje a partir de cierta información ya conocida. Aprovechando esta característica de las redes neuronales, podemos crear sistemas que simulen el comportamiento de los patosistemas en base al conjunto de datos obtenido y la respuesta del mismo en base a los cambios registrados y en el caso del diagnóstico la información gráfica puede ser analizada en sus características más importantes (interpretar la imagen) para la identificación de un posible agente causal. Actualmente estos algoritmos están siendo probados e integrados en el control de calidad de productos agrícolas e identificación de lesiones foliares con buenos resultados. Introducción Los fenómenos biológicos involucrados en la Parasitología Agrícola generan respuestas tan diversas, aun en las mismas situaciones, que se convierten en un reto de gran importancia su estudio y modelación. En el estudio de los patosistemas siempre se busca ajustar algún modelo matemático lineal o no lineal para simular su dinámica, sin embargo existen muchas variables que como tales no tiene una relación continua sobre el resto del sistema en gran parte son variables discretas, que en términos generales son difíciles de integrar a todas a la vez en un solo modelo matemático. En el caso del diagnóstico tomemos como ejemplo la sintomatología de una enfermedad foliar, en este caso es difícil encontrar dos manchas idénticas, por lo que la descripción de las lesiones en realidad son una generalización de las características presentes en la enfermedad, situación que no puede ser representada en términos de comparación 1:1 como las técnicas matemáticas de comparación de imágenes utilizadas en la industria. La red neuronal artificial Las redes neuronales artificiales (ANN, Artificial Neural Networks) se definen actualmente como un sistema de procesamiento de información, ya sea en software o hardware, que tiene ciertas características de desempeño en común con las redes neuronales biológicas. También se les conoce como modelos conexionistas, de procesamiento paralelo distribuido o sistemas neuromórficos. Estas empezaron a desarrollarse desde 1943, cuando el neurofisiologo Warren McCulloch y el matemático Walter Pitts plantean por vez primera el modelo artificial de red neuronal. A pesar de tener casi 60 años la investigación por obtener algoritmos que funcionen de manera semejante a una red neuronal biológica no se obtuvieron resultados de aplicación aceptables hasta la década de los 80's, casi 40 años después, debido en gran parte a la imposibilidad tecnológica de los sistemas de cómputo. Actualmente las áreas en las cuales han sido probados los modelo neuronales van desde la medicina hasta la militar. Las redes neuronales presentan las siguientes ventajas: Aprendizaje adaptativo: En base a un conjunto de datos las redes neuronales pueden adaptar su respuesta sin necesidad de programar todo el sistema en caso de incluir nuevos datos al entrenamiento. Autoorganización: La forma como organizan el conocimiento dentro de sus conexiones es automático conforme se da el proceso de entrenamiento. Tolerancia a fallos: Las redes neuronales aún cuando no reciban la información en todos los neuronodos de entrada (información parcial) pueden generar una respuesta con cierta certeza sin llegar a bloquearse. Operación en tiempo real: El funcionamiento es casi inmediato, el procedimiento de aprendizaje puede ser lento, sin embargo cuando la red neuronal está entrenada su funcionamiento es rápido, aún en sistemas de cómputo de menor desempeño. Fácil inserción en la tecnología existente: Los tipos de redes neuronales desarrollados han sido probados en diversos sistemas de cómputo y áreas de aplicación, integrandose de manera natural a las nuevas tecnologías debido a la simplicidad como manejan los datos de entrada y salida. El modelo matemático del neuronodo, que es el elemento básico de la red neuronal -equivalente a la neurona- puede observase en la figura 1a y la representación gráfica de una red neuronal en la figura 1b. Figura 1. Representación matemática de un neuronodo (a) y representación gráfica de una red neuronal (b). Identificando problemas fitosanitarios Para experimentar la funcionalidad de las redes neuronales se probaron con problemas de clasificación. Con el éxito obtenido para este tipo de problemas también se les conoció a las redes neuronales como clasificadores universales. Dentro de los quehaceres del parasitólogo agrícola es la identificación de los agentes causales de los problemas fitosanitarios, una actividad que es básicamente de clasificación. La implementación de las redes neuronales para la identificación de los problemas puede ser tan simple (textual) o compleja (sensorial) como se desee, en ambas situaciones se debe definir de manera concreta todo el universo de variables o datos que intervienen en la descripción de los problemas involucrados en el patosistema de interés. La cualidad que tiene la implementación de las redes neuronales en un sistema de identificación es que la solicitud de la información involucrada en el patosistema puede plasmarse en un formato general, sin la necesidad de preguntas encadenadas a manera de clave de identificación, como funcionan la mayoría de los sistemas expertos, de tal manera que el usuario no se ve forzado a proporcionar todos los datos para obtener alguna respuesta, las redes neuronales pueden generar una respuesta a pesar de la parcialidad de los datos originales. Los sistemas de cómputo actualmente tiene la capacidad de ver por medio de cámaras de video, digitales o digitalizadores de imágenes impresas (scanner), sin embargo no pueden observar (analizar y relacionar las imágenes con algún conocimiento) de manera inherente. Esta cualidad debe ser creada a la medida para cada área del conocimiento humano, entre ellas, la Parasitología Agrícola, donde en gran medida la información es de origen gráfico. La topología de una red neuronal clasificadora se puede ver en la figura 2a. (a) (b) Figura 2. Topología tipica de una red neuronal clasificadora (a) y la forma como puede integrar diferentes bases de datos fitosanitarias (b). Las redes neuronales como clasificadores pueden utilizarse como un enlace entre bases de datos de colecciones criptogámicas e información técnica respecto a los ejemplares (figura 2b), proporcionandole al usuario un sistema de referencia técnica interactivo. El sistema IMAF (Identificador de Machas Foliares) probó la posibilidad de desarrollar dichos sistemas sin la necesidad de grandes equipos de cómputo. Modelando patosistemas Actualmente se han desarrollado nuevos tipos de redes neuronales donde la información de salida forma parte de los datos de entrada para el siguiente ciclo de funcionamiento, considerando esta característica, podemos utilizarlas para el pronóstico de patosistemas, sistemas muy dinámicos en espacio y tiempo. De la misma manera que en las redes clasificadoras nosotros debemos seleccionar todas las variables que estén involucradas con el patosistema, sin embargo el dato de respuesta debe considerarse como dato de entrada para el siguiente ciclo, una necesidad inseparable en todo sistema de simulación. La ventaja en la selección de variables para realizar la simulación, es que las variables no tiene que ajustarse a un modelo matemático lineal o no lineal para que se le integre, la red neuronal durante el procedimiento de entrenamiento le asigna el peso matemático que juega en el sistema de simulación, ahorrándonos tiempo en hacer correlaciones o otras técnicas involucradas en la simulación de sistemas, obviamente la forma matemática de representar el patosistema no podrá ser una función matemática sino la topología de la red neuronal, la cual puede ser como la presentada en la figura 3. Figura 3. Topología para una red neuronal para la simulación de patosistemas. ¿Cómo aprende una red neuronal? La forma como adquiere el conocimiento una red neuronal es en base a un procedimiento repetitivo de calibración de todas las conexiones entre los neuronodos que componen a la red neuronal planteada. Este proceso de entrenamiento depende que el experto le proporcione a la red neuronal un conjunto de datos de entrada con la salida o respuesta que debe ser, por lo tanto se da un efecto de ensayo y error dentro de la red (muy semejante cuando uno está estudiando). Cuando la red neuronal no presenta error con los datos para el entrenamiento se pasa a una etapa de verificación donde se le proporcionan otros datos que la red no utilizó para el entrenamiento. Entonces, si el error esta dentro de lo aceptable se da por entrenada la red. Actualmente se están desarrollando otros tipos de redes neuronales donde ellas mismas busquen la respuesta adecuada, como es en el caso de los insectos plaga donde se desea conocer cuantos estados juveniles (p.e. larvales) de desarrollo comprende su ciclo de vida y debido a dificultades en su cría artificial o el habito que tienen (plagas que desarrollan totalmente su fase juvenil dentro de frutos), la única fuente de datos es a partir de muestreos destructivos. Bibliografía 1.Fausett L. 1994. “Fundamentals of neural networks: Architectures, algorithms and applications.” Prentice-Hall. 461 p. 2.Osada V.H.K. 2000. “IMAF: Identificador de Manchas Foliares. Una aproximación entre redes neuronales y sistemas multimedia fitosanitarios.” Tesis de Maestría en Ciencias. Colegio de Postgraduados. ISEI. Montecillo, Mexico. 63 p. 3.Schultz, A. & R. Wieland. 1997. “The use of neural networks in agroecological modeling.” Computers and Electronics in Agriculture 18(2,3): 73-90. Ejercicios sobre el tema: Redes neuronales para la identificación de problemas fitosanitarios. 1) Como se observó un perceptrón con un par de entradas define un hiperplano, el cual separa dos regiones de decisión. Observe en el programa perceptrón como es el comportamiento de los pesos (w) y el hiperplano con los siguientes conjuntos de datos. Datos para entrenar: Punto 1 2 3 4 x1 x2 y (salida) 0.9 -0.7 0.6 0.1 0.4 0.3 0.8 -0.7 1 -1 1 -1 ¿Cómo quedó el hiperplano, los puntos y los pesos(w)? w1=________ w2=________ Datos a clasificar: Punto 1 2 3 4 5 6 7 8 9 10 x1 x2 0.1 0.9 0.1 -0.2 0.8 -0.6 -0.5 -0.1 -0.8 0.3 0.1 0.8 0.5 0.7 -0.7 0.5 -0.7 -0.3 0.5 -0.9 esperado y (salida) ¿Qué pasa si cambia los valores verdaderos a falsos? ¿Cómo tendrían que distribuirse los datos para que el perceptrón tenga problemas al entrenarse?