Anteproyecto de Trabajo Fin de Carrera Redes neuronales en el sistema de inyección de un ciclomotor Guillermo Jiménez Margallo Ingeniería en Informática Escuela Técnica Superior de Ingeniería Informática Universidad de Alcalá gjmargallo@gmail.com Palabras clave: Redes neuronales, inyección, aprendizaje supervisado, optimización de funciones, back-propagation. 1 Introducción Desde el comienzo de la historia de la inteligencia artificial, los pioneros de esta ciencia moderna fueron navegando desde un inicio prometedor hasta la impotencia absoluta del que ha pretendido demasiado desde un comienzo. Un ejemplo de este inicial esfuerzo fue el descubrimiento las redes neuronales artificiales. Diseñadas en un principio como un modelo que copiaba el de una neurona simple biológica (McCulloch et al., 1943) fueron superadas pronto por otro científico, Frank Rosenblatt (1957), que concretó la estructura final del perceptrón. Según la aportación del americano, la nueva red podría incluso ser el sustituto de los cerebros humanos si se aplicaba correctamente. Aunque Rosenblatt (1960) demostró matemáticamente la convergencia del perceptron, lo cierto es que todo su trabajo quedó dilapidado una década más tarde. En concreto la publicación de Perceptrons (Minsky y Papert, 1969) señaló el fin de una era. Juntos descubrieron lo ineficaz que resultaba el modelo de Rosenblatt en una separación lineal simple. Precisamente, el ejemplo de la imposibilidad de separar una simple función XOR fue el que se hizo famoso en la comunidad científica. Después de un tiempo oscurantista en las redes neuronales, apareció la figura de Hopfield y otros científicos. En un intento por superar las limitaciones del perceptrón (ni es eficiente ni garantiza hallar un máximo global) recuperaron, con gran éxito por su parte, técnicas estadísticas matemáticas inventadas por Bryson y Ho (1969). Se denominó entonces aprendizaje por propagación posterior (back-propagation). Sus primeros resultados fueron esperanzadores, siendo el primer estudio satisfactorio publicado por Rumelhart y McClelland (1986). Su principal característica era poder entrenar una red que aprendiera cualquier función, por compleja que pareciese. Esto tiene gran importancia en problemas de categorización de elementos, cuando la información es incompleta. Por ello es usada en reconocimiento de textos, visión artificial, etc. Sus aplicaciones son prácticamente infinitas. Debido a esta gran capacidad de definir sistemas que no fueran lineales, se comenzaron a usar en industrias en las que nunca se habría pensado. Por ejemplo, un campo de la ciencia en la que la imprecisión suele ser patente (no por no estar definido, sino por su complejidad) es la variabilidad que pueden tener las variables de cambio de régimen de un motor clásico. Ha de tener necesariamente un control de múltiples elementos, a su vez altamente no lineales. El fin último sería minimizar los gases contaminantes expulsados por el tubo de escape. Algunos autores recomiendan usar la red neuronal de tipo CMAC, definiéndola como “muy eficiente computacionalmente, y por lo tanto ideal para la implementación en tiempo real” (Majors et al., 1994). Por otro lado, también se han desarrollado redes que simulan los gases de escape de un automóvil (Hafner et al., 1999), con el beneficio consecuente de poder simular la mejor de un motor, en función de la contaminación producida. Llevando el tema a un plano más práctico, no son muchas las aplicaciones que hayan podido ser implementadas con éxito. En la UPC ha habido un intento teórico de aplicación para el control de un motor de cuatro tiempos (Nevot 1999). Aunque el autor no alcanza a realizar la simulación real, invita a que un investigador lo intente, utilizando un hardware que permita implementar en tiempo real el control necesario. En un campo diferente como puede ser el de los ciclomotores no ha habido intentos de optimizar su control, pues son bastante menos atractivos económicamente. En los últimos años, los ciudadanos europeos hemos tenido que contemplar como las leyes que rigen la protección ambiental se han endurecido. Tal y como se preveía desde hace años, el cambio climático ya es un hecho, y es causa principalmente de del aumento de concentraciones de gases invernadero tales como el dióxido de carbono, metano, óxidos nitrosos y clorofluorocarbonos (Houghton et al., 1990, 1992). La Unión Europea intenta reducir al máximo esos contaminantes, con la Directiva 97/24 de vehículos de motor de 2 y 3 ruedas, que, aprobada por Consejo de Medio Ambiente de la UE el 8 de marzo de 2001, afecta especialmente a los ciclomotores. Debido a su diseño, el motor de un ciclomotor es terriblemente contaminante, a la vez que desperdicia gran parte de su gasolina. Por eso la coyuntura actual obliga a los fabricantes de ciclomotores a renovar su tecnología o a tener que salir del mercado. El futuro no parece muy prometedor para los ciclomotores. Tomando como ejemplo a Shangai, la ciudad china realizó en 1997 un estudio que reveló que los ciclomotores que recorrían sus calles generaban una quinta parte de la contaminación, aunque la proporción de población que transportaban era mínima. También descubrieron que contaminaban de un orden de 5 a 17 veces más que un coche normal (FYS 2004). Por todo ello están realizando en actualidad una campaña que acabará con todos los ciclomotores de gasolina en el 2005. Nuestra idea es crear con nuestros conocimientos actuales o investigando otras posibles redes nuevas, una minimización de las emisiones de gases contaminantes, que, cumpliendo con la Directiva 97/24, permita a los ciclomotores ser menos contaminantes y más eficientes. La aplicación de esta reducción será en un entorno de simulación real, con el banco de pruebas correspondiente, y con una sonda lambda para recoger los gases contaminantes. Figura 1: Sonda lambda para gases contaminantes 2 Objetivos El propósito de este proyecto es la optimización, por medio de redes neuronales, de un mapa de consumos de inyección de un ciclomotor, con el fin de cumplir la Directiva 97/24, la cual establece limitaciones en la expulsión de gases contaminantes. Los objetivos secundarios, ordenados cronológicamente, son los siguientes: 1. Búsqueda de información sobre la inyección en ciclomotores. 2. Búsqueda de información acerca de distintos tipos de redes neuronales y modelado de una red apropiada. 3. Diseñar una plataforma que permita entrenar esta red con los datos empíricos del ciclomotor. 4. Realizar un exhaustivo del nuevo mapa de consumos en un entorno real. 5. Elaboración y presentación de la memoria. 6. Publicación del trabajo – si procede – en una revista especializada. 3 Resultados El resultado principal será un mapa de consumos optimizado, que, junto a un ciclomotor con un sistema hardware de control, permita: - Cumplir la Directiva Europea 97/24 de gases contaminantes para ese ciclomotor. La satisfacción completa por parte del conductor del ciclomotor, no quedando reducidas las prestaciones ni el manejo de ésta. Demostrar la viabilidad de aplicaciones de Inteligencia Artificial en campos en lo que no sea usa actualmente. Permitir el desarrollo de un nuevo campo de investigación. 4 Metodología La metodología a emplear deberá partir de la plataforma utilizada para la simulación. Como la mejor herramienta para simular del mercado es Matlab, incorporando módulos predefinidos ya para redes neuronales, vamos a usarla desde el principio. Siguiendo un postulado de metodología estructurada valoraremos los siguientes puntos: 1. 2. 3. 4. 5. Análisis requisitos previo. Planteamiento teórico del modelo a utilizar. Modelado de diagramas de flujos (Diagramas de contexto y sistema) Evaluación de resultados. Documentación del sistema. Estos puntos se pueden llevar a cabo siguiendo las directrices de Métrica 3, escogiendo los procesos apropiados. Aun así, este proyecto no puede ser considerado como un desarrollo informático modelo, ya que entran en él elementos de investigación. 5 Recursos Podemos diferenciar dos partes en cuanto a recursos: en primer lugar, un espacio de trabajo de procesamiento de datos y diseño de las redes neuronales; por otro lado, la parte física de la simulación, donde los datos empíricos pueden ser obtenidos a priori para procesarlos y a posteriori para comprobar que cumplimos los criterios ambientales. En función de estas necesidades habrá que disponer de los siguientes elementos: 1. Una licencia de Matlab con Simulink y el toolbox nnet. 2. Una estación de trabajo para entrenar la red y diseñar el sistema. 3. El banco de pruebas con el ciclomotor incorporado para las verificaciones finales. 4. Una sonda de tipo lambda para detectar la contaminación generada por el tubo de escape del ciclomotor. PC BANCO DE PRUEBAS MATLAB Elementos para la simulación DATOS Elementos empíricos Figura 2: Recursos del proyecto 6 Bibliografía Bryson, A. E. y Ho, Y.-C. (1969). Applied Optimal Control. Blaisdell, New York. FYS (2004). Física y Sociedad. http://www.fisicaysociedad.es/view/default.asp?cat=705&id=893 (30 noviembre 2004). Hafner, M., Schüler, M. y Nelles, O. (1999). Dynamical Identification and Control of Combustión Engine Exhaust. Proceeding of the American Control Conference, June 1999:222-226 Hougton, J.T., Callander, B.A., and Varney, S.K. (1990). Climate Change: The IPCC Scientific Assessment. Cambridge University Press. pp. 365. Hougton, J.T., Callander, B.A., and Varney, S.K.(1992). Climate Change 1992: The Supplemental Report to the IPCC Scientific Assessment. Cambridge University Press. pp. 200. Majors, M., Stori, J. y Cho, Dong-il (1994). Neural Network Control of Automotive Fuel-Injection Systems. IEEE Control Systems, San Diego, USA, June 1994: 31-36 McCulloch, W. S. y Pitts, W. (1943). A logical calculus of the ideas immanent in nervous activity. Bulletin of Mathematical Biophysics, 5:115-137. Minsky, M. L. y Papert, S. (1969). Perceptrons: An Introduction to Computational Geometry. MIT Press, Cambridge, Massachusetts, primera edición. Nevot, J. (1999). Diseño de un Controlador Avanzado Basado en Redes Neuronales para la Gestión de la Mezcla Aire-Gasolina en un Motor Alternativo. Tesis doctoral UPC, Instituto de Organización y Control de Sistemas Industriales, Barcelona. Rosenblatt, F. (1957). The perceptron: A perceiving and recognizing automaton. Report 85-4601, Project PARA, Cornell Aeronautical Laboratory, Ithaca, New York Rosenblatt, F. (1960). On the convergence of reinforcement procedures in simple perceptrons. Report VG-1196-G-4, Cornell Aeronautical Laboratory, Ithaca, New York Rumelhart, D. E. y McClelland, J. L., editores (1986). Parallel Distributed Processing. MIT Press, Cambridge, Massachusetts. Dos volúmenes.