MOMENTOS DE Universidad de la AMAZONIA Momentos de Ciencia 6:(1), 2009 CIENCIA Procesamiento inteligente de imágenes digitales de ecosistemas acuáticos amazónicos basado en computación GRID enfocada a la gestión del conocimiento Edwin Eduardo Millán-Rojas1,*, Jose Nelson Pérez-Castillo2 1 Grupo de investigación GITUCAM. Universidad de la Amazonia. Florencia (Caquetá), Colombia. 2 Grupo de investigación GICOGE. Universidad Distrital Francisco José de Caldas. Bogotá, D. C. Recibido 7 de Noviembre de 2008; aceptado 11 de Marzo de 2009 Resumen En la actualidad se pueden tener algoritmos estructurados para la clasificación digital e, incluso, algoritmos ya probados que pueden clasificar y extraer la información relevante de una imagen digital, sin embargo hay un elemento estructural que limita el desempeño de estos algoritmos: la capacidad de cómputo. Es fácil trabajar con una imagen digital tomada con una cámara digital casera, debido a su baja resolución. Pero si se tienen muchas imágenes, el escenario es diferente y se necesita un mayor recurso de cómputo. Y si, además, se asocian a las imágenes bases de datos alimentadas por años, sería más complejo su procesamiento. Es en este último escenario donde el procesamiento mediante computación GRID es de gran ayuda. © 2009 Universidad de la Amazonia. Todos los derechos reservados. Palabras clave: gestión del conocimiento, computación GRID, imágenes digitales, ecosistemas acuáticos. Abstract It can be obtained at present structured algorithms for digital classification and even tested algorithms for classifying and taking out relevant information from a digital image; however, there is a structural element that causes limited algorithm performance: computing capacity. Because of the low pixel density, it is easy to work on a picture taken by a compact digital camera. But a higher computation resource is necessary for processing a lot of pictures taken by the same camera. And if data bases filled out by years were associated to that images, it would be more complex their processing. On this last scenario, the computing GRID processing is helpful. © 2009 Universidad de la Amazonia. All rights reserved. Key words: knowledge management, computing GRID, digital images, aquatic ecosystems. Introducción computacionales) e imágenes digitales, que pretenden dar un mayor alcance al proceso de clasificación y ayudan a tener la información en bases de datos digitales, permitiendo una gestión del conocimiento puntual. Las imágenes tomadas son cargadas con información que puede llegar a tener un alto volumen de datos e importancia significativa en los procesos de investigación, como lo son las imágenes digitales tomadas a los ecosistemas acuáticos amazónicos, las cuales pueden ayudar a determinar gran cantidad de especies y elementos nuevos en el campo de la biología animal o vegetal, conocimiento esencial en las investigaciones. En este contexto, se encuentra gran cantidad de Los últimos años han visto un rápido incremento del tamaño de las colecciones de imágenes d i gital e s (médicas , hi s tó ri ca s , p o l i c ia l e s , pictóricas, etc.). Esta situación plantea una necesidad básica: la búsqueda y obtención de las imágenes deseadas entre una extensa colección. Los métodos tradicionales de procesamiento y clasificación de la información (anotaciones textuales, establecimiento de taxonomías) se muestran insuficientes e inadecuados por falta de tie m po, re c urso de c ó mputo , e spa c i o d e almacenamiento, entre otros motivos. En este campo aparecen los conceptos de procesamiento in t el ige n t e, c omput ac ió n GR ID (m all as * Autor para correspondencia. E-mail: edwineduardomillan@hotmail.com 8 Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13 administrar la información, para mantener el conocimien to de los ecosist emas a cuát i cos amazónicos en el tiempo y que la información sirva en las investigaciones y permita tomar decisiones. información gráfica que debe ser procesada por los expertos y los algoritmos de clasificación de imágenes pueden ayudar a agilizar estos procesos de sistematización. Lo que se pretende es mejorar uno de esos algoritmos y adaptarlo en un servicio GRID para el tr a b a jo con i m á genes sin procesamiento previo y, de esta forma, contar con una herramienta de procesamiento inteligente sobre computación GRID que mejore los tiempos de procesamiento de los elevados volúmenes de información en los cuales se pueden convertir las b ases de da tos digitales de imágenes de ecosistemas Acuáticos Amazónicos. Imágenes digitales Las imágenes digitales son fotos electrónicas toma d as d e una e sce n a o es c aneadas de documentos -fotografías, manuscritos, textos impresos e ilustraciones. Se realiza una muestra de la imagen digital y se confecciona un mapa de ella en forma de cuadrícula de puntos o elementos de la figura (píxeles). A cada píxel se le asigna un valor tonal (negro, blanco, matices de gris o color), el cual está representado en un código binario (ceros y unos). Los dígitos binarios (bits) para cada píxel son almacenados por una computadora en una secuencia, y con frecuencia se los reduce a una representación matemática (comprimida). Luego el computador interpreta y lee los bits para producir una versión para su visualización o impresión. Conceptos generales Ecosistemas Acuáticos Colombia, por su pri v ileg i ad a s ituació n geográfica, tiene abundantes reservas y cursos de agua que se encuentran dispersos a lo largo y ancho de su territorio. En las cordilleras central y oriental abundan los diferentas ecosistemas acuáticos que cumplen una función esencial en la conservación de la flora y fauna y en su mayoría son el nacimiento de ríos que son de vital importancia para los pobladores. Los ecosistemas acuáticos se dividen en dos grupos: los de agua dulce (ríos, lagos, humedales), y los ecosistemas marinos (mares, estuarios). Los ecosistemas de agua dulce se pueden clasificar en dos: de aguas quietas o lénticos (lago, estanque, pantano, charcas) y de aguas corrientes o lóticos, tales como los manantiales, riachuelos, arroyos, ríos (Quinlan 1993). Mallas computacionales (computación GRID) El principio de la computación GRID es la agregación de re c urs o s c omputacion a l e s he te rogéneos di s trib u idos entre distintas organizaciones para formar una meta ordenador. Para hacer más fácil la utilización de estas infraestructuras distribuidas, surge la necesidad de establecer una arquitectura global que sea plasmada en la práctica en una serie de servicios básicos en form a d e midd l eware , y que simplificarán el modo de desarrollar aplicaciones que puedan hacer uso de estas infraestructuras. Las mallas computacionales son un modelo relativamente nuevo que plantea la unión de los recursos computacional e s de di f erentes organizaciones para resolver problemas fuera del alcance del más poten t e s u perordenador individual (Borja 2007). Gestión del conocimiento “La gestión del conocimiento es el nuevo paradigma de la gestión que ha sustituido, integrándolos y dándolos por supuesto, a los anteriores. Para que una organización funcione es necesario disponer, entre otras cosas, de una estrategia, de un plan de objetivos y un sistema de control de la gestión, un conjunto de procesos básicos definidos y asegurados, un sistema de comunicación interna y de evaluación del rendimiento, una cultura corporativa propia”(Molina & Marsal-Serra 2002). En el contexto de la clasificación de imágenes se busca organizar el conocimiento de los expertos y entrenar una de las soluciones planteadas más adelante, con el fin de organizar, gestionar y Algoritmos de clasificación Algoritmos de clasificación basados en redes neuronales: Las redes neuronales se utilizan como herramientas o métodos para resolver problemas, en especial los relacionados con el conocimiento humano: reconocimiento de patrones, 9 Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13 reconocimiento del lenguaje hablado, reconocimiento de imágenes, procesos de control adaptativo y estudio del comportamiento de ciertos problemas para los que no están muy bien dotados los ordenadores tradicionales. El aprendizaje de una red neuronal está relacionado con los pesos de las conexiones entre sus nodos (Hebb 1949). Cuando se presenta un patrón a la red, ésta produce una respuesta. Si la respuesta o salida de la red n o es la supuesta, deben hacerse modificaciones para acercar la respuesta obtenida a la esperada. La señal que se recibe en la capa de neuronas de entrada cuando se le presenta el patrón se mueve a través de los enlaces o conexiones entre capas, hacia las neuronas de la capa de salida. se busca en los ejemplos almacenados casos similares y se asigna la clase más probable en éstos. Máquinas de vectores de soporte: (SVM, por sus siglas en inglés) han mostrado conseguir buen desempeño de generalización sobre una amplia varied a d de problemas de clasificación, destacando recientemente en problemas de clasificación de textos (Joachims1998, Dumais et al. 1998, Joachims 2001), donde se aprecia que SVM tiende a minimizar el error de generalización, i.e. los errores del clasificador sobre nuevas instancias . En términos geométricos, SVM puede ser visto como el intento de encontrar una superficie que separe a los ejemplos positivos de los negativos por el margen más amplio posible (Hearst et al. 1998). Clasificador Naive Bayes: El clasificador Naive Bayes (NB) se considera como parte de los clasificadores probabilísticos, los cuales se basan en la suposición que las cantidades de interés se rigen por distribuciones de probabilidad, y que la decisión óptima puede tomarse por medio de razonar acerca de esas probabilidades junto con los datos observados (Mitchell 1997). Atributos de los ecosistemas acuáticos Aguas quietas o lénticas: profundidad, tamaño y periodos de retención de agua. Lagos: profundidades considerables, originadas por: a. Disolución de sustrato: circulación de aguas subterráneas, regiones de alta precipitación b Acumulación de materia orgánica: Originados por avalanchas. Formació n de represas (Propósitos hidroeléctricos, suministro de agua control de inu n daciones, potable, recreación). c. Acción de los ríos: brazos de los ríos forman ciénagas Ciénagas: Conexión (directa al río, indirecta, sin conexión) Zonas (profundidad -Ubicación de vegetación) d. Inundaciones: excesos de aguas Variaciones de niveles de agua Interconexión entre ríos y lagos Tipos de aguas: Aguas blancas (várzeas) Aguas negras (igapós) Clasificador C4.5: El esquema C4.5 fue diseñado como una extensión del algoritmo ID3 (Quinlan 1986) que forma parte de los clasificadores conocidos como árboles de decisión, donde sus nodos internos son etiquetados como atributos; las ramas salientes de cada nodo representan pruebas para los valores del atributo, y las hojas del árbol identifican a las categorías. Estos algoritmos proporcionan un método práctico para aproximar conceptos y funciones con valores discretos, e.g. en clasificación de textos (Cohen & Hirsh 1998, Cohen & Singer1999, Joachims1998). Vecinos más cercanos: (k-NN, por sus siglas en inglés) es uno de los métodos de aprendizaje basados en instancias más básicos, pero con resultados aceptables en tareas que involucran el análisis de texto (ver Joachims1998, Yang & Pedersen 1997, Yang & Liu 1999). En resumen, este algoritmo no tiene una fase de entrenamiento fuera de línea, por lo tanto, el principal cálculo se da en línea cuando se localizan los vecinos más cercanos. La idea en el algoritmo es almacenar el conjunto de entrenamiento, de modo tal que para clasificar una nueva instancia, Lagunas: poca profundidad, partes bajas de los ríos, inundaciones de los ríos. Aguas corrientes o lóticas: riachuelos, ríos, arroyos y quebradas. Profundidad, longitud, anchura, caudal y extensión de la orilla. 10 Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13 Clasificación de la corriente: a. Tipo uno (no tributarios b. Tipo dos (2 tributarios de tipo uno) c. Tipo tres (tipo uno y dos) - clasificación de imágenes digitales y servicios para mallas computacionales Exploración de las técnicas utilizadas para clasificación de imágenes digitales basadas en contenido. Exploración de los conceptos de servicio Grid y mallas computacionales Explorar los algoritmos que permiten la cla sif ica ci ó n a uto má tica de i m á g e ne s digitales Definición de criterios de clasificación de la información, las métricas para cada uno y la forma en la que pueden ser implementados en un prototipo. Definir los parámetros para el servicio Grid de Clasificación. Tipo de corrientes: a. Permanentes: nacimientos subterráneos, caídas de agua, nivel de cauce > nacimiento b. Intermitentes: reciben agua de escorrentía superficial, pueden disminuir su nivel en sequías c. Interrumpidas: alternan cauces superficiales y subterráneos - Flujo: a. Laminar: lento b. Turbulento: alta velocidad c. Movimiento irregular - Transporte: a. Disuelto b. Suspendidos (restos de arcilla, arena y similares) - A partir de la fase teórica desarrollada, - Implementar una plataforma de computación Grid para la ejecución del Proyecto - Seleccionar un algoritmo para la clasificación de I m á gen e s dig ita le s ca p tu r a da s co n dis p os itiv o s s im p le s i mp le m e nta n do u n servicio Grid. - Hacer el planteamiento de una mejora sobre el algoritmo seleccionado, para aplicarlo a la c la s i fic a ció n de im á ge n e s dig it a le s de ecosistemas acuáticos Amazónicos. - Implementación de un servicio Grid para el algoritmo aplicándolo a un estudio de casos: colección digital de imágenes de Ecosistemas Amazónicos del Grupo de Investigación CAPREA de la Uniamazonia. - Determinación y definición de la Colección Bibliográfica - - Fase de desarrollo Riachuelos: a. Ubicados en partes altas de montaña b. Aguas claras y transparentes c. Poco caudal d. Corren por lechos rocosos, pedregosos o arenosos Quebradas: a. Unión de riachuelos b. Más sólidos suspendidos que riachuelos c. Torrentosas d. A veces forman caídas de agua Ríos: a. Unión de las quebradas b. Aumentan sólidos suspendidos y disueltos c. Más productividad, menos diversidad de especies d. Caudales corren a velocidad más lenta e. Serpentean formando meandros Fase de validación - Validación del servicio con la ejecución de pruebas y comparación con otros modelos y sistemas en el área de estudio. - Análisis y determinación de resultados de la aplicación del prototipo propuesto. Metodología propuesta GCMC Procesamiento inteligente de imágenes Se ha definido una metodología enmarcada dentro de tres fases: una Fase Teórica, una Fase de Desarrollo y una Fase de Validación, así: Una vez encaminados y definidos los algoritmos de clasificación (en este caso, el concepto de red neuronal) se define un algoritmo programado en un lenguaje java, el cual cuente con variables apropiadas para el trabajo gráfico, que represente las imá ge n es d e e c o s is t e m as acuá t ic os Fase Teórica - Exploración de los trabajos relacionados con la 11 Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13 Figura 1. Esquema Plataforma GRID. amazónicos, dentro del complejo trabajo de la computación Grid. Se define entonces un servicio Web, el cual recibirá una imagen en formato jpg como un objeto dentro del método de captura. Una vez implementado el servicio, este se desplegará dentro de la plataforma Grid que se ha configurado inicialmente (Figura 1) con la herramienta globus toolkit. El prototipo expuesto fue creado en maquinas virtuales bajo el sistema operativo Scientific Linux, c o n herramientas de Globus para desplegar la red neuronal (Figura 2), la cual fue creada a partir del algoritmo Backpropagation (ver http://ohm.utp.edu.co/neuronales/). debido a las dificultades encontradas por el formato de la imagen. Una vez el servicio se despliega en la plataforma, pasa a ser un servicio GRID, que puede ser instanciado desde cualquier maquina dentro de la GRID que esté certificada. De esta forma, se puede programar trabajos de forma sencilla o en paralelo, para darle respuesta a la necesidad de clasificar el alto volumen de las colecciones de datos e imágenes digitales que existen. Conclusiones El manejo de bases de datos multimedia de diversos tamaños y contenidos precisa de técnicas adecuadas de implementación de sistemas de recuperación y exploración. En el campo de las bases de datos de imágenes, la complejidad de la clasificación radica en que el usuario espera que el sistema encuentre elementos relevantes basados en semánticas personales o culturales. La representación de informaciones de carácter semántico es muy compleja y requiere soluciones a problemas como la detección automática de características, segmentación y reconocimiento. Estos problemas todavía permanecen abiertos. La computación Grid desplegada en una plataforma puede ser usada como una herramienta con características de procesamiento muy altas, capaz de dar solución a las necesidades de cómputo requeridas para las colecciones de Figura 2. Red Multicapas de tres Niveles. Modificada de http://ohm.utp.edu.co/neuronales/. Ello permite realizar un procesamiento inicial de las regiones para luego clasificarlas. Sin embargo, esta etapa se encuentra en desarrollo permanente, 12 Millán-Rojas & Pérez-Castillo, Momentos de Ciencia 6(1), 2009, pp: 8 - 13 Trends and controversies - Support vector machines, IEEE Intelligent systems, pp. 18-28. Hebb, D. 1949. Organization of Behavior. Wiley & Sons. New York. Joachims, T. 1998. Text categorization with support vector machines: Learning with many relevant features. In: Tenth European Conference on Machine Learning (ECML'98). Proceedings. Lecture Notes in Computer Science, Number 1398, pp. 137-142. Joachims, T. 2001. A statistical learning model of text classification with support vector machines. In: 24th ACM International Conference on Research and Development in Information Retrieval. Proceedings. ACM Press. Leung, C. 1999. Image and Vision. Computing, pp. 463-464. Mitchell, T. 1997. Machine Learning. McGraw-Hill. New-York. Molina, J. L. & M. Marsal-Serra. 2002. La gestión del conocimiento en las organizaciones. Negocios Empresa y Economia, . Quinlan, J. R. 1986. Induction of decision trees. Machine Learning, 1:81-106. Quinlan, J. R. 1993. C 4.5: Programs for machine learning. Morgan Kaufmann. Yang, T. & X. Liu. 1999. A re-examination of text categorization methods. In: SIGIR-99, 22nd ACM International Conference on Research and Development in Information Retrieval. Proceedings. Berkeley, CA. pp. 42-49. Yang, Y. & J. Pedersen. 1997. A comparative study on feature selection in text categorization. In: 14th International Conference on Machine Learning. Proceedings. pp. 412-420. imágenes digitales de ecosistemas acuáticos almacenadas en las bases de datos. Existe la posibilidad de elaborar nuevos servicios de clasificación y procesamiento, los cuales pueden ser desplegados en la plataforma Grid para realizar nuevas tareas en forma paralela; este es un buen comienzo para realizar trabajos futuros en esta área. Literatura citada Borja, S. 2007. España, con paso firme en Computación Grid. Chicago. Cohen, W. & H. Hirsh. 1998. Joins that generalize: text classification using WHIRL. In: 4th International Conference on Knowledge Discovery and Data Mining (KDD'98). Proceedings. AAAI Press, pp. 169 –173. Cohen, W. & Y. Singer. 1999. Context-sensitive learning methods for text categorization. ACM Transactions on Information Systems, (2):141 –173. Dumais, S., J. Platt, D. Heckerman, & M. Sahami. 1998. Inductive learning algorithms and representations for text categorization. In: Seventh International Conference on Information Retrieval and Knowledge Management (ACMCIKM'98) Proceedings. pp. 148-155. Hearst, M., B. Schölkopf, S. Dumais, E. Osuna & J. Platt. 1998. 13