VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS EN FILOSOFÍA DE LA MENTE* David Pérez Chico 1. INTRODUCCIÓN En este trabajo se hablará, principalmente, sobre los actuales modelos conexionistas, de sus virtudes y sus limitaciones en el marco de la Filosofía de la Mente. En todo caso, no se trata de una muestra de adhesión inquebrantable ni de una exaltación de sus limitaciones. Más bien he optado una postura constructiva y realista en la tarea de relacionar los modelos conexionistas con los modelos de memoria. Para cumplir finalmente con este objetivo antes será conveniente aclarar tres cuestiones. Son las siguientes: A. Quiero mostrar que la utilización de los actuales modelos conexionistas para implementar fenómenos cognitivos abstractos tiene escaso interés en Filosofía de la mente. Entendidos de esta manera no pasan de ser una mera imitación de lo que tenemos que explicar y, si bien puede que en Inteligencia Artificial baste con imitaciones, no debería ser así en Filosofía de la Mente. B. Sin embargo, el Conexionismo contiene en su seno una gran cantidad de herramientas teóricas que permitirían la instauración de un nuevo paradigma en el estudio de la cognición humana. No obstante, para hacer de esta posibilidad una realidad es necesario que esta corriente se emancipe de los muchos supuestos que aún comparte con la tradición computacionalista simbólica y formal. C. Con el cumplimiento de esta última condición nos encontraríamos con que es posible dar cuenta de la complejidad, la flexibilidad y el dinamismo de nuestro sistema cognitivo. Es una concepción a todas luces más difícil de teorizar que la que habitualmente se supone en las ciencias cognitivas, pero probablemente sea una concepción más realista del verdadero objeto de estudio: el nivel holista y dinámico de donde emerge el orden y la unidad cognitivas. * Este trabajo es una versión revisada, actualizada y ampliada de la comunicación que con el título de «Horizontes en Filosofía de la Mente: Conexionismo vs. sistemismo» fue presentada en el XXXIV Congreso de Filósofos Jóvenes en Santiago de Compostela en Abril de 1997. Laguna, Revista de Filosofía, nº 5 (1998), pp. 233-252 15.pmd 233 25/02/2013, 8:06 234 DAVID PÉREZ CHICO 1.1 UN POCO DE HISTORIA Para encontrar la primera fecha importante en el desarrollo de los modelos conexionistas debemos remontarnos al año 19431 cuando McCulloch y Pitts2 proponen un modelo de unidades computacionales similares a las neuronas y, además, de- 1 Pese a su aparente juventud, los modelos conexionistas pueden ser vistos, y de hecho muchos lo hacen, como la evolución lógica de los modelos asociacionistas. Esto, que en sí mismo no debería ser problema alguno, ha sido aprovechado por muchos críticos de los modelos conexionistas para imputarles a estos las mismas críticas dirigidas contra los modelos asociacionistas decimonónicos (véase más adelante en este mismo trabajo, el apartado dedicado a las críticas realizadas por Fodor). Algunas de estas críticas son: 1) que se trata de modelos reduccionistas o atomistas en los que los elementos complejos pueden ser descompuestos en otros elementos más simples; 2) que esos elementos simples no son sino sensaciones; 3) que los elementos se asocian mecánicamente en virtud de unas relaciones de asociación definidas y determinadas por la experiencia; y 4) la existencia de leyes de asociación (principios mecánicos) (J. Sutton, Philosophy and memory traces, Cambridge, Cambridge University Press, 1998, pp. 240-2). Estas críticas han recibido cumplida respuesta por parte de los defensores del Conexionismo, quienes no por ello dejan de reconocer sus raíces, por ejemplo Bechtel y Abrahamsen comentan que si bien el Conexionismo dista mucho de ser un regreso al asociacionismo clásico sí es cierto que su más directo antepasado es de hecho el asociacionismo (W. Bechtel y A. Abrahamsen, Connectionism and the mind, Oxford, Basil Blackwell, 1991, p. 102). Las diferencias entre ambas corriente son según Bechtel y Abrahamsen que: los modelos presentan una serie de características como la existencia de unidades ocultas, modelos matemáticos de la dinámica del aprendizaje y algunos otros mecanismos de aprendizaje específicos que son totalmente novedosos (Ibíd., p. 102) En una misma línea se sitúa Clark cuando comenta que las funciones computacionales no lineales diferencian claramente al Conexionismo de asociacionismo clásico (A. Clark, Associative engines: Connectionism, concepts and representational change, Cambridge, MA, The MIT Press, 1993, p. 233). Aparte de esta relación de familiaridad hasta cierto punto obvia, existe otra que no lo es tanto y que John Sutton se ha encargado de sacar a la luz en su último trabajo (Sutton, op. cit.). Según Sutton, muchos de las características de los modelos conexionistas actuales estaban ya presentes en los modelos dinámicos de memoria de los siglos XVII y XVIII, concretamente en los de Descartes y Malebranche y algunos otros. Sutton lleva a cabo una exposición histórica de estos modelos, de sus características, de las motivaciones que causaron su nacimiento y de las críticas que recibieron, y enlaza todo ello con los modelos conexionistas actuales y las críticas que también éstos reciben. En su opinión estas dos clases de modelos comparten su rechazo a los modelos estáticos y localistas de memoria (modelos basados en la metáfora del almacén), asícomo su defensa en favor de las representaciones distribuidas con todas las consecuencias que conllevan y que nombraremos a lo largo de este trabajo (almacenamiento superpuesto, causación holista, etc.). 2 W.S. McCulloch y W. Pitts, «A logical calculus of the ideas inmanent in nervous activity», Bulletin of Mathematical Biophysics, 5, 1943, 115-33. 15.pmd 234 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 235 mostraron cómo estas unidades podían llevar a cabo operaciones lógicas. Se trataba de unidades binarias que podían estar activadas o desactivadas, y ello dependía del input que recibían de otras unidades con las que se hallaban conectadas. Los primeros estos modelos podían desempeñar funciones lógicas del tipo AND, OR y NOT. A partir de esos primeros resultados esperanzadores fueron apareciendo diferentes modelos que imitaban el comportamiento de las neuronas. En 1958 Rosenblatt3 diseñó el Perceptrón, un sistema capaz de aprender a clasificar rasgos haciendo uso solamente de principios simples para el cambio de la fuerza de las conexiones entre neuronas. Este diseño estaba basado en el trabajo de Hebb de 1949 sobre la actuación de la memoria4. Según Hebb las conexiones entre dos neuronas son plásticas, cambiando en proporción a la correlación activa de las células pre- y postsinápticas. Los primeros diseños conexionistas, como por ejemplo el Perceptrón, eran muy simples, constaban tan sólo de dos capas de unidades, una de entrada y otra de salida, resultando en un tipo de sistemas conocidos como «redes de flujo directo» de una sola dirección (desde la entrada hasta la salida). Esta simpleza provocó las críticas de Minsky y Papert en su libro Perceptrons de 19695. Según estos dos autores los modelos conexionistas difícilmente podrían llegar a simular algún día habilidades cognitivas mínimamente complejas. Estas críticas tuvieron consecuencias nefastas para el paradigma conexionista, como por ejemplo: la retirada de las subvenciones a las investigaciones sobre modelos conexionistas; o la pérdida de interés por parte de universidades y laboratorios en apoyar cualquier proyecto relacionado con el Conexionismo. Todo ello contribuyó a sumir en un olvido casi total a la corriente conexionista. Sin embargo, a principios de los años ochenta resurge el interés por estos modelos gracias, en gran parte, a los trabajos de Hopfield. A partir de ese momento fue posible diseñar arquitecturas recurrentes y de múltiples capas, ya que se disponía de un algoritmo de aprendizaje para estas nuevas redes multicapa. Se trataba del algoritmo de retropropagación de errores que Paul Werbos diseñó para su tesis doctoral en 1975. Este resurgimiento también fue debido al desengaño sufrido por muchos investigadores ante las crecientes limitaciones de los modelos computacionales formales y simbólicos en el campo de la Inteligencia Artificial6, de ahí que su principal oponente sean los modelos basados en una 3 F. Rosenblat, F., «Two theorems of separability in the perceptron», Mechanisation of Thought Processes: Procedings of a Symposium Held at the National Physical Laboratory. November, 1958, vol. 1, HMSO, London, pp. 451-56. 4 D.O. Hebb, The organization of behavior. John Wiley & Sons: New York, 1949 (trad. esp. Organización de la conducta. Madrid, Debate, 1985). 5 M.A. Minsky y S. Papert, Perceptrons, Cambridge, Mass, The MIT Press, 1969. 6 J.L. Tienson, «An introduction to connectionism», The Southern Journal of Philosophy, 126, 1987, pp. 1-16 (trad. Esp., «Una introducción al Conexionismo» en E. Rabossi (Comp.) Filosofía de la mente y ciencia cognitiva, Barcelona, Paidós, 1995, pp. 359-380), se refiere a este hecho en términos de crisis kuhniana de la Inteligencia Artificial clásica. 15.pmd 235 25/02/2013, 8:06 236 DAVID PÉREZ CHICO visión formalista y simbólica de la mente7. En su afán por sustituir a la concepción vigente la mayoría de los primeros modelos conexionistas trataron de demostrar que eran capaces de triunfar allí donde los modelos simbólicos habían fracasado. Dado este ambiente de rivalidad extrema, no es descabellado pensar que para los responsables de las investigaciones conexionistas era casi más importante superar a los modelos simbólicos que crear un nuevo paradigma que partiera de nuevos presupuestos en el estudio de la mente humana que ofreciera nuevas perspectivas y vías de investigación8. Por esto mismo, muchos de los fracasos de algunos modelos conexionistas se deben principalmente a que siguen adoptando presupuestos de la corriente simbólica y tratando de resolver los problemas planteados desde ésta en sus mismos términos. La consecuencia inmediata es que algunos diseñadores de modelos conexionistas se han visto forzados a inventarse formas totalmente artificiosas de solucionar problemas como el de la composicionalidad de nuestro pensamiento, cuando quizás no fuese necesario tal esfuerzo. Volveré sobre este punto más adelante. En cualquier caso, observando la situación actual en el campo de las ciencias cognitivas nos encontramos con dos corrientes enfrentadas, cada una más apropiada para según qué cosas. El auge inicial del Conexionismo se debió a la facilidad con la que solucionaba problemas irresolubles por la corriente sintáctica, pero actualmente nos encontramos en un momento en el que la atención a los problemas propios de los modelos conexionistas los han colocado en una situación de estancamiento (en lo que se refiere a la explicación de lo mental y a la posibilidad de predecir con fiabilidad) semejante a la que sus defensores denunciaron con respecto a los modelos simbólicos. Actualmente, las perspectivas que ofrece el paradigma conexionista incluye algunas buenas noticias, otras no tan buenas y sobre todo una gran cantidad de promesas para el futuro. Lo que en los siguientes apartados trataré de mostrar es que en lo que respecta al modelado de algunos rasgos cognitivos y al diseño de sistemas artifi- 7 La Imagen Simbólica o Sintáctica de la mente se basa, principalmente en lo que se ha dado en llamar la metáfora del ordenador. Se afirma desde esta corriente que, en el nivel cognitivo, la mente se compone de signos sintácticos definidos, estáticos e independientes del contexto cuya recombinación a base de reglas determina los fenómenos propios del pensamiento estructurado, esto es, su productividad, composicionalidad y sistematicidad. La aportación paradigmática de esta corriente es la hipótesis del lenguaje del pensamiento propuesta por Fodor (Cfr. J. Fodor, The language of thought, NY, Thomas Crowell, 1976, y J. Fodor, The modularity of mind, Cambridge, MA , The Mit Press, 1983). 8 Es necesario aclarar que, aún en estos casos, los modelos conexionistas sí suponen una innovación en tanto que plantean una nueva forma de entender cómo lleva a cabo el cerebro el procesamiento de la información, así como en lo que se refiere al punto de partida en el que se sitúan sus investigaciones: a diferencia de Fodor, que representa paradigmáticamente a los que opinan que lo verdaderamente relevante es el nivel abstracto de procesamiento racional, las investigaciones conexionistas se ocupan del nivel conocido como el de implementación. 15.pmd 236 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 237 ciales inteligentes el Conexionismo es probablemente la apuesta más segura, pero si lo que queremos es obtener una teoría completa de la cognición alternativa a la sintáctica, el conexionismo, a menos que libere todo su potencial de algunas cadenas autoimpuestas, no es la solución. Argumentaré que para beneficiarnos de las virtudes de los modelos conexionistas es necesario que nos replanteemos algunos supuestos aceptados en base a una determinada concepción del ser humano. De las conclusiones de esta argumentación espero poder ofrecer un ámbito de investigación y de aplicación más realista para los modelos conexionistas (4). Con anterioridad analizaré las características de los modelos conexionistas (2) y algunas de sus limitaciones más importantes (3). 2. CARACTERÍSTICAS DE LOS MODELOS CONEXIONISTAS La característica definitoria de cualquier modelo conexionista es su semejanza con el cerebro humano. Por supuesto, no estoy afirmando que dicha semejanza sea total, pues ya se sabe que el conocimiento que tenemos del cerebro es mas bien escaso y de difícil aplicación. En todo caso, los modelos conexionistas tratan de imitar la estructura sináptica del cerebro de donde, se supone, surge la cognición. Es importante resaltar que se trata de una imitación, pues más adelante volveremos sobre ello para destacar las limitaciones de estos modelos a la hora de explicar el proceder cognitivo humano. Antes comentaré algunas de las características esenciales de los modelos conexionistas. La semejanza entre lo que se conoce del cerebro y los modelos conexionistas es, de nuevo, parcial, es, en todo caso, una semejanza que se aprecia en que en los modelos conexionistas: 1) la actividad de las unidades, al igual que la de las neuronas, es el resultado de procesos dinámicos no-lineales; 2) dado el procesamiento local, el papel que juega cada unidad con respecto a latotalidad del sistema es insignificante, por lo que la tolerancia al error de una o varias de estas unidades es muy alto; 3) pueden «tomar» decisiones en situaciones de información incompleta o incluso contradictoria; 4) el procesamiento de la información se lleva a cabo masivamente en paralelo; 5) son sistemas que pueden aprender de la experiencia y adaptarse a su entorno; 6) pueden, así mismo, generalizar a partir de ejemplos previos; y 7) son capaces de abstraer características esenciales de inputs que no contienen información relevante. En lo que se refiere a su diseño, un sistema conexionista está formado por unidades simples colocadas en distintas «capas». Existen unidades de entrada, de salida y ocultas; cada una de estas unidades se conecta con varias de las unidades de otras capas. El número de conexiones (la conectividad del sistema) dependerá del diseño. Las unidades pueden estar activadas o desactivadas en función de la fuerza global de los inputs procedentes de otras unidades conectadas con ella. La «fuerza» de las conexiones entre unidades se denomina peso. Un detalle más cercano a lo filosófico de estos sistemas es que no es necesario para su correcto funcionamiento algo así como un ejecutor central (que según el contexto podrá denominarse: homúnculo, alma, etc), 15.pmd 237 25/02/2013, 8:06 238 DAVID PÉREZ CHICO sino que todas las conexiones son locales, con lo que se consigue que cada unidad tenga información solamente de las unidades con las que está conectada, pero no sabe lo que ocurre en el sistema considerado como globalidad. Por tanto, el comportamiento de cada unidad estará determinado por su estado actual y su input total, por lo que estos modelos muestran un procesamiento local, distribuido por todo el sistema. Un aspecto que no podemos olvidar es que se trata de sistemas que surgen como oposición al los modelos sintácticos de procesamiento de información. Clark9 enumera una serie de características básicas de los modelos conexionistas por oposición a las características definitorias de los modelos simbólicos. Afirma Clark, que los modelos simbólicos no atienden a la psicología evolucionista; que tienen una concepción sintáctica de la mente; y que se orientan hacia la psicología popular. Por el contrario, los modelos conexionistas son, según Clark, «genuinamente» evolucionistas; atienden antes a los procesos que se llevan a cabo en el sistema que a los datos (símbolos) o reglas; y son independientes de la psicología popular. Las anteriores propiedades y características podrían ser denominadas como reaccionarias. Sin embargo, hay otras, aquí las dividiré en tres (más sus consecuencias), que se identifican más y mejor con la naturaleza intrínseca del Conexionismo. Estas tres características son a su vez la base sobre las que surgen otras muchas propiedades importantes en términos filosóficos. Se trata de: 1) almacenamiento superpuesto de información; 2) sensibilidad al contexto; y 3) cambio progresivo de representaciones. 1) Almacenamiento superpuesto de la información: esencialmente quiere esto decir que la misma estructura puede ser utilizada para representar diferentes items de información. Tan sólo es necesario variar los pesos que caracterizan cada representación. Según Clark, «dos representaciones se superponen si los recursos empleados para representar a la primera son coextensivos con los recursos empleados para representar a la segunda».10 Así pues, representaciones semejantes compartirán muchas de estas unidades11, de forma que cuando un número apreciable de unidades son compar- 9 Clark, op. cit., p. 3. Ibíd., p. 17. 11 Lo que aquí vengo denominando con la expresión nuevos modelos conexionistas se caracterizan por representar la información de forma distribuida. Quiere esto decir que cada representación «está distribuida a lo largo de muchas conexiones diferentes, y cada conexión está presente en muchas representaciones diferentes» (J.L. McClelland y D.E. Rumelhart, «A Distributed Model of Human Learning and Memory», en J.L. McClelland y D.E. Rumelhart (eds.), Parallel Distributed Processing: Explorations in the Microstructure of Cognition, vol II: Psychological and biological Models, Cambridge, MA, The MIT Press, 1986, p. 176). Son un tipo de representaciones no identificables por una dirección de memoria constante y sí por el contenido; no están almacenadas explícita ni discretamente sino implícita y potencialmente. A modo de ejemplo, (aunque para el mejor entendimiento del ejemplo se asuma lo contrario, las redes 10 15.pmd 238 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 239 tidas por muchas representaciones podemos hablar de representaciones prototipo12, esto permite llevar a cabo generalizaciones con las que se obtiene nuevo conocimiento a partir de su semejanza con los prototipos, la extracción automática de prototipos, hacer juicios de tipicidad13 y otorga al sistema un comportamiento de gran flexibilidad. Otras consecuencias de este tipo de almacenamiento son que ninguna representación es arbitraria, y, lo que es más importante, es posible diseñar memorias direccionables por el contenido14. conexionistas no operan necesariamente con representaciones atómicas), en un sistema que represente las letras del abecedario por medio de los símbolos: «_», «__» y «|», la representación de la letra «E» compartirá un mayor número de unidades activadas con la representación de la letra «F» que con la de la letra «A». Una consecuencia de la existencia de representaciones distribuidas es la causación holista: todas las representaciones en un mismo sistema están automáticamente implicadas causalmente en el comportamiento del sistema. Esto quiere decir también que ningún sistema con estas características puede ser considerado independientemente de su historia. Estas características serán recuperadas en la última parte de este trabajo en donde se incidirá en su importancia para los objetivos de este trabajo. Pero es necesario señalar también que otras de las consecuencias que muchos críticos de los modelos conexionistas han extraído de la causación mental son la confusión y las interferencias entre representaciones, así como la inestabilidad de las mismas (Sutton, op. cit.). Esto no deja de ser una conclusión lógica y obvia de la definición dada para la causación holista, aunque si ocurre que nuestro sistema nervioso se comporta de esa forma caótica ¿estaríamos justificados a negarlo simplemente por mantener el rigor, la coherencia y la formalidad de los modelos cognitivos al uso? Sutton señala que este tipo de críticas fueron realizadas contra el modelo dinámico de memoria propuesto por Descartes y todos aquellos que adoptaron su misma línea de pensamiento en estos temas. A la base de estas críticas se hallaban siempre preocupaciones de carácter moral y normativo de todos aquellos que defendían modelos esencialistas en los que el alma u otro tipo de ente privilegiado garantizaban el orden y la coherencia en el funcionamiento de nuestra mente. Es de suponer que no existe una clara respuesta que convenza definitivamente a los defensores de una y otra opción: donde unos ven caos los otros ven creatividad, donde unos ven automatismo (actuar en respuesta pura y exclusivamente de los estímulos recibidos) los otros ven flexibilidad... 12 Se trata de las tendencias estadísticas centrales de los diferentes rasgos de los ejemplos suministrados al sistema. Estas tendencias proporcionan a las representaciones distribuidas una estructura que los críticos les niegan (Cfr. Apartado 3, abajo). 13 Por ejemplo: la representación del item «canario» tendrá más rasgos en común con la representación del item «pájaro» que la del item «pingüino». 14 En los sistemas conexionistas la información que no esté activa en un momento determinado no puede ser hallada en ningún lugar del sistema. La información inactiva se encuentra en el sistema de forma potencial o implícita (a diferencia de las representaciones explícitas postuladas 15.pmd 239 25/02/2013, 8:06 240 DAVID PÉREZ CHICO 2) Sensibilidad al contexto: a diferencia de los modelos simbólicos en los que los símbolos son estáticos e independientes del contexto, en los sistemas conexionistas los mismos pesos codifican múltiples inputs y conocimiento en general: un mismo sistema, con las mismas unidades y conexiones, se comportará de distinta forma dependiendo de su entorno. Sólo así es posible que las diferentes ocurrencias de un mismo item se clasifiquen de diferentes formas (aunque muy próximas dada sus semejanzas), siempre según el contexto. Además, este comportamiento puede ser interpretado semánticamente al observar el resultado de la actividad global de todo el sistema, pero en el nivel de procesamiento (unidades, pesos, ecuaciones de activación, etc.) no puede realizarse ninguna interpretación semántica. 3) Cambio progresivo de representaciones: esta característica tiene que ver con la evolución que sufren nuestras representaciones desde nuestra infancia hasta que somos adultos. Los modelos simbólicos por lo general no se preocupan, ni pueden dar cuenta, de este problema, pero desde la perspectiva conexionista el problema sí puede ser abordado y además con bastantes garantías de éxito. Esto es así en primer lugar porque no se opera con signos estáticos e independientes del contexto, y en segundo lugar porque no se hace una diferenciación clara entre procesos y datos15. Por tanto, los cambios en los procesos y en la información que tienen el sistema evolucionan conjuntamente. Cambios en la información disponible o la adquisición de nueva información modifican los procesos que a su vez originan cambios en la información disponible y así sucesivamente, todo lo cual, repercute en una reorganización del sistema original que ha de ser plástico16. 3. ALGUNAS CRÍTICAS: PROBLEMAS Y LIMITACIONES DE LOS MODELOS CONEXIONISTAS Veíamos anteriormente que el resurgir del Conexionismo se debió en gran parte a la disponibilidad de nuevas herramientas teóricas que posibilitaron incrementar la complejidad de los modelos existentes y, por tanto, responder así a las críticas realizadas por Minsky y Papert a los primeros modelos conexionistas. También comentamos que a los primeros investigadores y autores comprometidos con el Conexionismo les por los modelos simbólicos que poseen una dirección de memoria fija e independiente del contenido). Esto es así porque la información se representa como un patrón de activación. 15 Al encontrarse la información distribuida por todos los elementos del sistema, cualquier cambio en estos elementos modifica también a la información representada por ellos. A esto es a lo que nos referimos cuando decimos que un sistema conexionista es plástico: información y procesamiento se combinan para explicar los cambios cualitativos en la actuación del sistema. 16 Clark, op. cit. 15.pmd 240 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 241 movía lo que podemos denominar un ánimo de revancha hacia los modelos simbólicos y por ello, en un primer momento, se centraron en resolver los problemas en los que la corriente rival fracasaba estrepitosamente. La mayor capacidad de los modelos conexionistas para enfrentarse a una serie de problemas que se resistían a ser resueltos, como por ejemplo el problema del marco17. Esto provocó una situación de euforia inicial. Sin embargo, esta situación de euforia ha dado paso o otra de equilibrio en la que cada corriente presume ser mejor para según qué cosas a la vez que critica las debilidades de su oponente. Me gustaría comenzar señalando que a pesar de sus muchas diferencias, existen también algunas similitudes entre los modelos conexionistas y los simbólicos. Después de todo, los nuevos modelos conexionistas nacen dentro de la tradición computacionalista de la mente. En consecuencia, se trata en ambos casos de modelos algorítmicos (quiere esto decir que implican alguna forma de secuenciación temporal), y de modelos computacionales (en un caso se trata de reglas aplicadas a símbolos y en otro de procesos causales por las que unas unidades activan o desactivan a otras). Por otra parte, si aceptáramos el carácter asociacionista y atomista de los modelos conexionistas que algunos críticos apuntan18, podría extraerse la conclusión de que los modelos conexionistas no son más que una réplica de la posible implementación neurofisiológica de los procesos simbólicos19, propuesta que ejemplifica el punto de vista según el cual las diferencias existentes entre ambas concepciones responden a que se sitúan en diferentes niveles de abstracción. Las dificultades para decidirse por una de las dos alternativas y eliminar la otra, han dado lugar a diversas propuestas de modelos híbridos que tratan de aprovechar conjuntamente las bondades que cada uno de los dos paradigmas presenta por separado. Dennett, por ejemplo, habla de una máquina virtual en serie, la conciencia (con características propias de un modelo simbólico) que emerge del procesamiento en paralelo (un sistema conexionista) propio de un nivel inferior20. Smolensky propone el «principio de correspondencia cognitiva» según el cual «cuan- 17 Este problema se refiere en concreto a la «habilidad de los seres humanos (y de otros animales) para seleccionar, en un lapso muy breve de tiempo, los aspectos relevantes de una situación para el desarrollo de la actitud que se desea emprender» (J.E. Corbí y J.L. Pradés, «El Conexionismo y su impacto en la filosofía de la mente», en F. Broncano (ed.) La mente humana, Madrid, Trotta, p. 159). Se trata, por tanto, de un problema cuya resolución requiere una gran flexibilidad y rapidez, características estas que no presentan los excesivamente rígidos modelos simbólicos. 18 Cfr. nota 2, arriba. 19 Es el caso de Fodor y Pylyshyn («Connectionism and Cognitive Architecture: a Critical Analysis», Cognition, 28, 1988, pp. 3-71) al proponer que los defensores del Conexionismo deben centrar todos sus esfuerzos en implementar las características formales y simbólicas de los procesos mentales. 20 Dennett, Consciousness Explained, Little, Brown, 1991. 15.pmd 241 25/02/2013, 8:06 242 DAVID PÉREZ CHICO do los sistemas conexionistas son analizados en niveles superiores, los elementos de la computación simbólica aparecen como propiedades emergentes»21. Bechtel y Abrahamsen reconocen las virtudes de cada paradigma y apuestan por una investigación autónoma dentro de cada paradigma aunque, desde cada uno de ellos, se debería prestar atención a los resultados del otro22. Las críticas que he seleccionado y que expondré en el siguiente apartado muestran algunos de los malentendidos provocados por este, digamos, «aire de familia», además de alguna que otra mala intepretación de lo que son realmente los modelos conexionistas. El apartado se cierra con lo que en mi opinión son graves limitaciones de la corriente conexionista que persigue la imitación antes que la explicación para convertirse en el paradigma explicativo de la mente. 3.1 FODOR Y PYLYSHYN: LA SISTEMATICIDAD, COMPOSICIONALIDAD Y PRODUCTIVIDAD DE LOS ESTADOS MENTALES Las críticas quizás más comentadas en la bibliografía son las realizadas por Fodor y Pylyshyn23. Se trata, básicamente, de que los sistemas conexionistas no pueden ex- 21 Smolensky, op. cit., p. 401. Bechtel y Abrahamsen, op. cit. 23 J. Fodor y Z.Pylyshyn, op. cit. Dado que estas críticas se basan en la teoría representacional de la mente propuesta por Fodor, bueno será comentar brevemente en que consiste dicha teoría. De la lectura de los trabajos de Fodor en estos temas se extrae de forma inmediata la conclusión de que en ellos se defiende una visión logicista de la mente cuya mayor preocupación es la de preservar el orden y el rigor formal (que se suponen como algo dado) de nuestro pensamiento en particular y de los procesos mentales en general. Su teoría representacional de la mente, en definitiva, se opone frontalmente al asociacionismo. Las representaciones simbólicas que él propone y def iende presentan una estructura interna y son capaces de recombinarse arbitrariamente con otras representaciones (recordemos que otra de las propuestas más conocidas de Fodor es la hipótesis del lenguaje del pensamiento, según la cual, el pensamiento es un medio representacional semejante al lenguaje). En otro trabajo (J. Fodor, Psychosemantics: The problem of meaning in the philosophy of mind, Cambridge, MA, The MIT Press, 1987, p. 154) insiste Fodor en la idea de que lo verdaderamente relevante para el estudio de la mente es la sistematicidad del pensamiento, «la clave de la naturaleza de la cognición es que los procesos mentales mantienen las propiedades semánticas de los estados mentales... El problema central acerca de la mente cognitiva es entender cómo es esto posible». Así pues, el estudio de la mente, según Fodor, no debe desviarse de su verdadero objetivo: el nivel de la cognición. En consecuencia, no tiene sentido, según esta forma de ver las cosas, prestar atención a niveles más básicos en el estudio de la mente, excepto si el propósito es el de implementar los estados descritos por los modelos simbólicos (Fodor y Pylyshyn, op. cit). 22 15.pmd 242 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 243 plicar las características de composicionalidad, productividad y sistematicidad propias del pensamiento humano. La causa de esto es que, según Fodor y Pylyshyn, las representaciones en los modelos conexionistas son atómicas y por lo tanto no tienen una estructura compuesta. Por ejemplo, en los modelos simbólicos la representación «p» puede ser deducida de la representación «p & q», sin embargo en las modelos conexionistas que ellos critican «p» y «p & q» son representaciones distintas, independientes y atómicas, esto es, no formadas por constituyentes menores. Tenemos que, como la sistematicidad y productividad del pensamiento humano significan que el contenido de éste se explica a partir del contenido de sus partes constituyentes, y los sistemas conexionistas no poseen dichas partes, estos parecen imposibilitados para explicar las características de nuestro pensamiento. Fodor y Pylyshyn concluyen que los modelos conexionistas, debido al carácter atómico de sus representaciones, son puramente asociacionistas, sensibles tan sólo a la estadística y su utilidad es exclusivamente la de implementar el nivel cognitivo que es el verdaderamente importante a la hora de explicar. Aunque ya debe haber quedado claro que las anteriores críticas parten de una interpretación incorrecta de los modelos conexionistas actuales, puede ser interesante atender a las respuestas dadas a dichas críticas por parte de los defensores del Conexionismo. El primero en responder a las críticas de Fodor y Pylyshyn fue Smolensky24. Este autor ideó un método basado en el cálculo vectorial que convertía a las representaciones atómicas en partes constituyentes de vectores que a su vez representan a un estado concreto. El ejemplo que utiliza en su artículo es el de descomponer el estado «taza de café» en sus partes constituyentes (unidades simples tales como «olor a quemado», «líquido caliente», «asa para el dedo», «recipiente vertical», etc.). La solución propuesta es la de representar dicho estado mediante un vector compuesto por los estados de activación de cada una de las unidades implicadas en la representación «taza de café»25. Sin embargo, como señalan Corbí y Prades26, esta solución es meramente instrumental ya que, si bien ofrece una manera de descomponer estados conexionistas complejos en sus partes constituyentes, no da ningún criterio para determinar cómo se realizan físicamente esas partes constituyentes (soluciona el problema trasladándolo a un nivel inferior). La propuesta de Smolensky, por tanto, serviría para ayudar a explicar y predecir el comportamiento del sistema, pero no da cuenta del proceder real del mismo27. 24 Smolensky, op. cit. Aún sería necesario un segundo vector que especificara los diferentes papeles contextuales que podría desempeñar el estado «taza de café» y para los que algunos de sus componentes en el otro vector serían adecuados y otros no. Esta adecuación se calcularía empleando operaciones propias del cálculo vectorial. 26 Corbí y Prades, op. cit., p. 165. 27 Ibíd., p. 165. 25 15.pmd 243 25/02/2013, 8:06 244 DAVID PÉREZ CHICO La propuesta de Smolensky trataba de resolver mediante un modelo conexionista el problema de la composicionalidad en los mismos términos que el problema es planteado por los modelos simbólicos, lo cual le da una imagen de artificialidad a la misma. Otra solución al mismo problema es la propuesta por Tim van Gelder28 que consistía en diferenciar entre varios tipos de composicionalidad. La propia de los sistemas simbólicos sería una composicionalidad concatenativa, que no tendría porque ser la única. Él propone un tipo de composicionalidad funcional que como requisitos exige un mecanismo que garantice la producción de representaciones complejas a partir de sus partes constituyentes y viceversa29. Quiere esto decir que para que la composicionalidad se dé no es necesario que sea observable directamente, sino que se puede lograr a través de fórmulas, funciones, etc. Clark30 sugiere otra forma de entender el problema de la sistematicidad de nuestro pensamiento. Según este autor no se trata de una característica intrínseca del pensamiento, sino del lenguaje en que se expresa. Así pues, no sería tanto un problema de las características propias de un sistema conexionista, sino más bien ocurre que es la información que dicho sistema adquiere (por ejemplo el lenguaje) la que está sistematizada. Además, Clark opina que se trata de un problema estrechamente relacionado con las estados concientes, por lo que no cree que sea lícito reprocharle a los modelos conexionistas que no sean capaces de abordarlo, cuando la conciencia aún es un gran misterio para nosotros. 3.2 MODELOS CONEXIONISTAS: IMITACIÓN VS. EXPLICACIÓN En directa relación con las limitaciones debidas a la falta de composicionalidad nos encontramos con que en los modelos conexionistas, la información y el conocimiento que estos poseen no pueden ser utilizados para otras tareas distintas de aquellas para las que fueron entrenados. Para una nueva y diferente utilización de la información sería necesario un nuevo proceso de entrenamiento. Se trata de un problema de diseño, pero que nos muestra claramente el estado actual tan limitado de estos modelos. Tan sólo hay que detenerse a pensar que en nuestro cerebro existen unas mil clases diferentes de neuronas y que cada neurona individual puede llegar a establecer unas diez mil conexiones, tal complejidad es lo que explica nuestro asombroso y peculiar comportamiento cognitivo. Imitar semejante estructura nerviosa es algo imposible de realizar en la actualidad. 28 T. Van Gelder, «Compositionality: A Connectionist Variation on a Classical Theme», Cognitive Science, 14, 1990, pp. 355-384. 29 Van Gelder propone como ejemplo la posibilidad de asociar a cada fórmula lógica de primer orden un número de Gödel. De forma que sabiendo el número de una fórmula podemos hallar el de sus partes constituyentes y viceversa (Ibíd.). 30 Clark, op. cit. 15.pmd 244 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 245 Lo expuesto en el anterior párrafo nos lleva a una diferenciación fundamental. Podemos considerar a los modelos conexionistas de dos formas: o bien como meras imitaciones de nuestro cerebro, o como modelos que pretenden explicarla cognición (sus causas, funcionamiento, etc). Para el campo de la Filosofía de la mente lo primero no interesa, pues lo único que se consigue a través de imitaciones es reproducir el problema: obtendríamos otros «cerebros», pero seguiríamos sin saber cómo y por qué aparecen la cognición a partir de su funcionamiento. Aún admitiendo que en campo de la Inteligencia Artificial se consiguen resultados asombrosos, seguimos, en la mayoría de los casos, sin saber explicar cómo se obtienen dichos resultados a partir del procesamiento dinámico propio de los sistemas conexionistas. Sirva como ilustración de lo anterior un ejemplo citado por Clark31: una red conexionista fue entrenada para detectar la presencia de tanques en fotografías. Después del proceso de entrenamiento la red era capaz de responder afirmativamente a la presencia de tanques incluso en fotografías en las que aparecían parcialmente cubiertos e incluso en aquellas que no habían formado parte de la muestra utilizada para el entrenamiento. En un posterior test de comprobación se probó con nuevas fotos (distintas a las utilizadas para el entrenamiento de la red), en este caso el resultado fue un completo fracaso. Posteriormente se descubrió que la red había aprendido a distinguir entre las diferencias de luz y densidad entre las fotos en las que sólo aparecían tanques y aquellas en las que no aparecían tanques, con el agravante de que todas las fotos en las que sí aparecían tanques habían sido realizadas por la mañana mientras que las otras lo habían sido por la tarde, con la consiguiente diferencia de luminosidad entre unas y otras. Este ejemplo muestra claramente la dificultad enorme que implica explicar el comportamiento dinámico de los modelos conexionistas y como, al tratar de explicarlo desde la perspectiva global que ofrecen sus resultados, perdemos ese dinamismo y ofrecemos interpretaciones estáticas que para nada se corresponden con el verdadero proceder del sistema; además, cualquier explicación o interpretación del mismo es puramente ad hoc, esto es, es posible interpretar semánticamente el resultado global del sistema, pero estas interpretaciones no pueden ser realizados a nivel de unidades y conexiones. Pero entonces, si no podemos abordar la complejidad de los modelos existentes ¿cómo podemos esperar conseguirlo de otros más realistas y por tanto más complejos aún? Lo que necesitamos son explicaciones de cómo emergen las propiedades cognitivas en nuestro cerebro y no una reproducción a escala de esa emergencia, lo cual, una vez más, es muy útil para diseñar inteligencias artificiales, pero no para explicar la nuestra. 31 15.pmd Ibíd. 245 25/02/2013, 8:06 246 DAVID PÉREZ CHICO 4. CONEXIONISMO RECONSIDERADO Hasta ahora, y olvidándonos por un momento de cuestiones técnicas y de diseño, le hemos reconocido al Conexionismo ciertos méritos32, al mismo tiempo que señalábamos ciertas carencias y dificultades, la mayor de ellas como hemos visto es la imposibilidad de explicar cómo emergen las propiedades mentales o psicológicas superiores a partir del nivel de implementación33; y también que apelar por el Conexionismo es equivalente a renunciar a las regularidades en la cognición que sí nos proporciona el formalismo simbólico34. Estas limitaciones pueden provocar que el debate filosófico que trata de dilucidar si el Conexionismo se ofrece como una alternativa a los modelos simbólicos de la mente no se decante tan favorablemente hacia el lado del Conexionismo35 y que la imagen sintáctica de la mente sobreviva más tiempo del que quizás debiera. ¿Qué pueden contestar los defensores del Conexionismo a todo lo anterior? Hemos visto que un intento ha sido el de mostrar que los modelos conexionistas también tienen algún tipo de estructura y que, en consecuencia, pueden dar cuenta de la supuesta sistematicidad, composicionalidad y demás propiedades que desde la imagen sintáctica se señalan como las definitorias de los estados mentales36. Personalmente opino que esta estrategia no es del todo satisfactoria y, sobre todo, que no hace justicia a las características propias de los modelos conexionistas que son las que los diferencian de los modelos simbólicos y las que los convierten en una alternativa a la que merece prestar atención. Opino también que esta manera de proceder claudica ante una imagen de la naturaleza de nuestro cerebro/mente que quizás no sea correcta, pero que es generalmente aceptada porque es muy cómodo que el objeto de estudio sea compatible con teorías logicistas y formales, amén de otras causas más de tipo moral que tienen que ver con una determinada visión de los seres humanos. De lo que me ocuparé en el resto del trabajo es de argumentar en favor de una concepción de los seres humanos en general y de lo mental en particular diametralmente opuesta a la que está a la base de la imagen sintáctica de la mente. Esta argumentación me servirá de justificación para la propuesta siguiente: un campo en el que 32 Apuntar al dinamismo de nuestra vida mental mediante la propuesta de las representaciones distribuidas, atender a las demandas de la psicología evolutiva al haber señalado la importancia de la evolución ontogenética para el desarrollo de la mente, etc. 33 Quiero volver a señalar que esta observación está dirigida hacia el papel que los modelos conexionistas puedan desempeñar en el campo de la filosofía de la mente, pero para nada compromete su importancia en las investigaciones de la Inteligencia Artificial. 34 Fodor y Pylyshyn, op. cit.; también D. Kirsh («Paying the price for cognition», The southern Journal of Philosophy, 26, 1988) se ha echo eco de la gran dificultad que supone obtener las regularidades que la imagen simbólica de la mente sí proporciona. 35 Corbí y Prades, op. cit. 36 Cfr. apartado 3, arriba (respuestas de Smolensky, van Gelder y Clark). 15.pmd 246 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 247 los modelos conexionistas pueden ser aprovechados al máximo de sus posibilidades y en el que no es del todo utópico plantear modelos conexionistas ambiciosos es en el del estudio de la memoria37. Después de todo «la memoria no es un dominio en el que la sistematicidad o la regularidad sean siempre aparentes».38 4.1 MODELOS CONEXIONISTAS Y MODELOS DE MEMORIA «La ciencia se ocupa de lo universal», nos parece imposible hacer ciencia de lo particular, quizás por eso sea tan difícil superar las afirmaciones apriorísticas del orden y la unidad cognitiva que se hallan a la base de la visión logicista de la mente39. Se supone que los seres 37 Por supuesto, existen propuestas que abogan porque los modelos conexionistas sean capaces de ofrecer una teoría de la cognición en general, sin que haya que de limitar su marco de estudio de la manera en que yo voy a sugerir. Ebdon por ejemplo (M. Ebdon,«Is the cerebral neocortex a uniform cognitive architecture?». Mind & Language, vol. 8, nº 3, Autumn 1993, pp. 388-369) escribe acerca de la posibilidad de elaborar una teoría general de la cognición basada en la posible uniformidad estructural del neocortex. En este sentido Ebdon comenta la posibilidad de elaboraruna teoría general de la cognición basada en la posible uniformidad estructural del neocortex. Según la evidencia mencionada en su artículo, el neocortex es una arquitectura uniforme, por ello una teoría general de la «circuitería» cortical sería posible. Además, es muy probable que se trate de una arquitectura conexionista, sin que ello sea incompatible con la existencia de teorías específicas de más alto nivel. 38 Sutton, op. cit., p. 278. Cfr. F. Bartlett, Remembering an study in experimental and social psychology, Londres, Cambridge University Press, 1932 (trad. esp. Recordar, Madrid, Alianza, 1995). En el estudio de la memoria puede observarse una situación similar a la existente entre los modelos simbólicos y los modelos conexionistas de la mente: existe una oposición clara entre los modelos almacén de memoria (para los que las memorias serían una imagen literal de lo que las motivó) y los modelos reconstructivos o dinámicos de memoria (Cfr. A. Koriat y M. Goldsmith, «Memory metaphors and the real life/laboratory controversy: Correspondence versus storehouse conceptions of memory», Behavioral and Brain Sciences, 19, 1996, 167-228). Esta distinción estaba ya presente en el trabajo de Bartlett cuando critica el método experimental de Ebbinghaus de estudiar las funciones y capacidades psicológicas aisladamente. Lo que Bartlett proponía era tener en cuenta las relaciones entre esas capacidades y funciones, así como con la experiencia previa. En lo que al acto de recordar se refiere, Bartlett se oponía claramente al las teorías de la reproducción literal por no poder éstas dar cuenta del papel que la experiencia, así como las relaciones entre las distintas huellas de memorias, desempeñan en el almacenamiento y recuperación, «el recuerdo resulta ser mucho más una cuestión de construcción que una cuestión de mera reproducción» (op. cit., p. 273). 39 Fodor, por ejemplo, al proponer su hipótesis de la modularidad mental persigue el objetivo, a su entender exigible a toda ciencia cognitiva, de garantizar una humaneidad común, independiente de cualquier teoría del sujeto y de las influencias contextuales (J. Fodor, Modularity of Mind, op. cit.). 15.pmd 247 25/02/2013, 8:06 248 DAVID PÉREZ CHICO humanos compartimos una Racionalidad, que de nuestro estados mentales es posible hacer ciencia porque son coherentes, estructurados y sistemáticos. Además, se trata de estados perfectamente almacenados en nuestra memoria esperando, incorruptos y sin noticia de que exista un mundo exterior, el momento de ser utilizados para obedecer el comando de nuestra voluntad. Sin embargo, esta pretensión de cientificidad no debería servir de excusa para convertir los comportamientos que contradicen esta pretensión en la excepción a la regla. Seguramente todos los que lean estas líneas podrían citar ejemplos de malentendidos, de errores de interpretación, confusiones derivadas de una mala memoria, o interferencias entre nuestros recuerdos y la imaginación, situaciones en las que, sin saber por qué, unos recuerdos nos llevan a otros con los que en principio no están relacionados, etc. En este punto me veo obligado a enunciar una serie de obviedades que, quizás por ser tales, no siempre se tienen en cuenta: los seres humanos no somos seres aislados. Existe un mundo natural ahí afuera y otro mundo, éste social, conformado por todos los que son como nosotros. Ambos mundos se interrelacionan a través de nosotros, los seres humanos, y estos a su vez lo hacen entre ellos. El resultado de estas interrelaciones es que los seres humanos aprendemos cosas:aprendemos normas, formas de comportamiento, alteramos nuestros hábitos, etc.; pero también el mundo natural sufre cambios derivados de nuestras actuaciones que a su vez repercuten en su relación con los seres humanos, estos, a su vez, se ven afectados por esos cambios, y así hasta el infinito40. Parece, por tanto, que los seres humanos vivimos en un mundo en el que lo único que no hay que suponer como dado es el orden o la estabilidad (no se puede dudar de que hay orden en nuestro mundo o en la cognición, pero no es el orden lo que hay que explicar, sino más bien cómo es posible semejante orden, de dónde proviene, cuáles son sus causas, etc.). No se debe criticar a los modelos conexionistas el que no puedan convertirse en una buena teoría de los fenómenos cognitivos tan sólo por el hecho de que no son capaces de dar cuenta de ellos en los términos que exige la supuesta ciencia cognitiva formalista. De hecho, como hemos visto al repasar las características de los modelos conexionistas y volveremos a ver más abajo, las supuestas irregularidades del comportamiento humano, así como las propiedades que denotan flexibilidad y capacidad de adaptación al entorno, son abordables con más garantías de éxito desde los modelos conexionistas. 4.1.1 ¿Por qué la memoria? Al finalizar la introducción a este cuarto apartado cité a Sutton con respecto a la falta de sistematicidad de la memoria. En los ejemplos de fenómenos «irregulares» en 40 «Los sistemas cognitivos dinámicos coevolucionan con los sistemas fisiológicos, medioambientales y sociales en los que se hayan situados», T. Van Gelder y R. Port, «Its about time: an overview of the dynamical approach to cognition», en R. Port y T. Van Gelder (eds.), Mind as Motion: Explorations in the Dynamics of Cognition, Cambridge, MA, The MIT Press, 1995, pp. 1-43 (citado en Sutton, op. cit., p. 1). 15.pmd 248 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 249 el apartado anterior también la memoria aparecía en casi todos ellos. Es la memoria, no lo olvidemos, donde se encuentran nuestros conocimientos (tanto los semánticos, como los procedimentales) y todo aquello que nos otorga una personalidad. Desde el punto de vista de los modelos dinámicos no poseemos todos estos contenidos en nuestra memoria, sino que esos contenidos nos conforman, son parte de lo que somos, en ellos se entremezclan recuerdos, saberes, experiencias, afectos, inclinaciones, etc. Sin que sepamos cómo, y sin que participemos en ello, esos contenidos se organizan de alguna forma que nos hace ser a cada uno de la manera que somos. Por ello, la memoria es un excelente campo de pruebas «para entender las múltiples coacciones o represiones del cuerpo y la cultura, los cuales nos convierten en incapaces de alterar nuestro ser a voluntad»41. Para lograrlo, entre los modelos conexionistas o los simbólicos, los modelos conexionistas ofrecen mejores perspectivas. 4.1.2 ¿Por qué los modelos conexionistas? Al comienzo del trabajo cité el libro de Sutton42 para señalar que en él se analizan algunos de los precursores de los actuales modelos conexionistas. El que recibe más atención por parte de Sutton es el modelo dinámico de memoria propuesto por Descartes, pero también se menciona a Malebranche, a Locke, Hartley, y otros. Además de compartir su interés por la memoria ¿qué otras características presentaban estos modelos? En general todos estos modelos compartían entre sí su manera de entender la memoria como un conjunto de patrones activos/dinámicos, antes que como un almacén de archivos estáticos. Esos patrones se definen como rastros o huellas (traces) fragmentarias que han de ser reconstruidas, por lo que no hay lugar en ellos para la recuperación literal. Lo que diferencia a estos modelos de los actuales modelos conexionistas es que los autores de los siglos XVII y XVIII creían que las memoria eran el resultado de la actividad de fluidos o de espíritus animales que recorrían los poros del cerebro. Los actuales modelos conexionistas han sustituido a los espíritus animales por los patrones de activación a lo largo de vastas redes neuronales, en las que se condensan y comprimen innumerables trayectorias posibles43. Por otra parte, ambos modelos comparten importantes propiedades. La más destacada es que postulan memorias distribuidas a lo largo del sistema que las acoge. Como ya he indicado, este tipo de representaciones provoca que todas estén relacionadas originando un tipo de causalidad holista. Así mismo, al estar las representaciones distribuidas a lo largo de los componentes del sistema ocurrirá que al 41 Sutton, op. cit., p. 279. Ibíd. (Cfr. nota 2, arriba). 43 Ibíd. p, 1. 42 15.pmd 249 25/02/2013, 8:06 250 DAVID PÉREZ CHICO cambiar estos también cambiarán las representaciones, esto es, en los sistemas distribuidos no existe una distinción nítida entre la información y el procesamiento de dicha información. Esto quiere decir también, que las leyes de computación postuladas son leyes causales físicas, y así mismo, que el método de computación depende de la arquitectura (que a su vez determina la organización de los contenidos de la memoria). Consecuencia crucial que se extrae de estas propiedades: no es necesaria la actuación de una instancia que tome desiciones y que manipule los contenidos de la memoria según su voluntad44. Además de las anteriores propiedades, los modelos conexionistas presentan una serie de características que los hacen especialmente atractivos para el estudio de la memoria humana: direccionabilidad por contenido, reorganización dinámica de los contenidos, capacidad de generalización, extracción automática de prototipos, juicios de tipicidad, etc. Ahora bien, una cosa es que los modelos conexionistas presenten unas características que puedan parecer atractivas, y otra cosa muy distinta es que la evidencia existente sea compatible con dichas características. No haré un repaso exhaustivo de los conocimiento sobre la memoria, no obstante, citaré algunos datos aceptados en neurología relevantes para este trabajo45. Esta evidencia muestra a la memoria como un sistema jerárquicamente estructurado en subsistemas de memoria diferenciables unos de otros, pero a la vez interrelacionados anatómicamente. Cada sistema de memoria está formado por redes de neuronas interconectadas en las que cada representación se halla distribuida compartiendo algunas redes con otras representaciones. La jerarquía de los diferentes sistemas de memoria iría desde las más simples y antiguas filogenéticamente (memoria episódica) hasta las más complejas y recientes (memoria conceptual). Las últimas en aparecer se construyen sobre las anteriores, implicando un mayor complejidad estructural. En cuanto a la implementación de estos sistemas, no es muy difícil imaginarse cómo la compaginación de distintas redes conexionistas puede ser útil para modelar un sistema de estas características. Diferentes redes pueden realizar las funciones de los sistemas básicos, la interrelación de estos sistemas modulares básicos más alguna adición darán lugar a sistemas más complejos (esto gracias a las representaciones distribuidas y a la causación holista), a la vez que los más simples seguirían desempeñando su función original. 44 Esta es una consecuencia compartida por la mayoría de los modelos dinámicos de la memoria y de la mente. Por ejemplo, Bartlett, en sus investigaciones sobre la acción de recordar, afirmaba que no puede hablarse de un «yo», sino que lo único que es cierto es la existencia de un mecanismo de organización de esquemas dependientes de la acción recíproca de apetitos, instintos, intereses e ideales peculiares a un sujeto dado (op. cit., p. 281) 45 Los datos comentados en este párrafo los he tomado del libro de Fuster, Memory in the cerebral neocortex, Cambridge, MA, The MIT Press, 1995 15.pmd 250 25/02/2013, 8:06 VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS... 251 Como hemos visto, se puede obtener un modelo conexionista no tan complejo como uno que tratase de teorizar la mente en su totalidad, y, no obstante, significaría un paso importantísimo para la deseada teorización de la cognición humana. Por supuesto los problemas que quedan por resolver son muchos46, y la complejidad del modelo, aunque menor como decía anteriormente, no deja de ser grande. Aún así, lo relevante no es tanto simular una memoria humana con todos sus contenidos, como diseñar una organización de memoria plausible (por aquello de que la arquitectura del sistema es la que determina el comportamiento del mismo), lo cual aleja esta tarea de terrenos utópicos y la acerca a los dominios de lo realizable. 5. RECAPITULACIÓN Y CONCLUSIONES He tratado de mostrar algunas de las razones por las que, en mi opinión y en su estado actual, el Conexionismo no representa una alternativa válida para la explicación de la mente en su conjunto (tampoco lo es la imagen sintáctica de la mente) si lo que se pretende es imitar la complejidad de nuestros sistemas nerviosos. No obstante, a nivel teórico sí que ofrecen bastantes posibilidades que los convierten en la opción más aconsejable y prometedora. Es en éste nivel en el que sí sería de gran utilidad diseñar modelos de organización de memoria que nos acercaran al entendimiento de la cognición. Estos modelos estarían en sintonía con el carácter interdisciplinar de cualquier estudio que quiera afrontar la complejidad de nuestro objeto de estudio, porque nos ayudarían a comprendernos como el resultado de un proceso de socialización en el que todos participamos y tras el cual quedamos constituidos como sujetos con una historia personal e intransferible, con unas tendencias e intereses particulares, y todo, absolutamente todo, relacionado con todo los demás en la memoria de cada sujeto. Es éste (dar cuenta del orden que surge en un medio en el que sus elementos se organizan de forma holista), sin duda alguna, uno de los problemas más difíciles de teorizar con el que se encuentra el Conexionismo y cualquier otra teoría sobre la men- 46 Los problemas se derivan, en su mayoría, de las propiedades que hacen tan atractivos a los modelos conexionistas. Por ejemplo, si afirmamos, como hiciera Locke, que la memoria es la base de nuestra personalidad, y a continuación decimos que la memoria es un sistema dinámico, conformado por representaciones distribuidas relacionadas de forma holista, cuyo contenido cambia con el tiempo y las interacciones con otras sistemas (fisiológicos, físicos, sociales, culturales...) las exponen al fenómeno del olvido catastrófico... lo verdaderamente extraño es que no padezcamos de personalidad múltiple. Sin duda, este problema representa uno de los mayores retos con los que se han de enfrentar los modelos conexionistas. Sin embargo, de lo que se trataría a la hora de teorizar la cognición, lo vuelvo a repetir, es de explicar cómo aparece el orden y la unidad en nuestro sistema cognitivo y no suponerlos como algo dado. 15.pmd 251 25/02/2013, 8:06 252 DAVID PÉREZ CHICO te. La mejor manera de abordarlo no es una estrategia de ensayo y error, en la que se diseñen sistemas conexionistas y se compruebe a posteriori su comportamiento a ver si ha habido suerte. La solución es otra bien distinta que respeta los procedimientos tanto de los que se dedican a investigar en el nivel de implementación como de los que se centran en niveles de abstracción superiores: tratar de explicar en el nivel de implementación, o de reducir propiedades mentales al nivel de implementación debe ser tarea de las neurociencias. Nuestro trabajo desde la Filosofía, una vez aceptada la estrecha relación que existe entre información y procesos en los modelos conexionistas, debería ser el de aportar propuestas y posibles soluciones a los diferentes problemas que se planteen en un nivel superior de abstracción, pero siempre con la vista puesta en el nivel inferior, esto es, teniendo en cuenta las propiedades y características que ofrecen los sistemas conexionistas (principalmente la de la causación holista) y con ello su forma de concebir a los seres humanos. 15.pmd 252 25/02/2013, 8:06