David Pérez Chico

Anuncio
VIRTUDES Y DEFECTOS DE LOS MODELOS
CONEXIONISTAS EN FILOSOFÍA DE LA MENTE*
David Pérez Chico
1. INTRODUCCIÓN
En este trabajo se hablará, principalmente, sobre los actuales modelos conexionistas, de sus virtudes y sus limitaciones en el marco de la Filosofía de la Mente. En
todo caso, no se trata de una muestra de adhesión inquebrantable ni de una exaltación
de sus limitaciones. Más bien he optado una postura constructiva y realista en la tarea
de relacionar los modelos conexionistas con los modelos de memoria. Para cumplir
finalmente con este objetivo antes será conveniente aclarar tres cuestiones. Son las
siguientes:
A. Quiero mostrar que la utilización de los actuales modelos conexionistas para
implementar fenómenos cognitivos abstractos tiene escaso interés en Filosofía de la
mente. Entendidos de esta manera no pasan de ser una mera imitación de lo que tenemos que explicar y, si bien puede que en Inteligencia Artificial baste con imitaciones,
no debería ser así en Filosofía de la Mente.
B. Sin embargo, el Conexionismo contiene en su seno una gran cantidad de herramientas teóricas que permitirían la instauración de un nuevo paradigma en el estudio de la cognición humana. No obstante, para hacer de esta posibilidad una realidad
es necesario que esta corriente se emancipe de los muchos supuestos que aún comparte con la tradición computacionalista simbólica y formal.
C. Con el cumplimiento de esta última condición nos encontraríamos con que es
posible dar cuenta de la complejidad, la flexibilidad y el dinamismo de nuestro sistema cognitivo. Es una concepción a todas luces más difícil de teorizar que la que habitualmente se supone en las ciencias cognitivas, pero probablemente sea una concepción más realista del verdadero objeto de estudio: el nivel holista y dinámico de donde
emerge el orden y la unidad cognitivas.
* Este trabajo es una versión revisada, actualizada y ampliada de la comunicación que con el
título de «Horizontes en Filosofía de la Mente: Conexionismo vs. sistemismo» fue presentada
en el XXXIV Congreso de Filósofos Jóvenes en Santiago de Compostela en Abril de 1997.
Laguna, Revista de Filosofía, nº 5 (1998), pp. 233-252
15.pmd
233
25/02/2013, 8:06
234
DAVID PÉREZ CHICO
1.1 UN POCO DE HISTORIA
Para encontrar la primera fecha importante en el desarrollo de los modelos
conexionistas debemos remontarnos al año 19431 cuando McCulloch y Pitts2 proponen un modelo de unidades computacionales similares a las neuronas y, además, de-
1
Pese a su aparente juventud, los modelos conexionistas pueden ser vistos, y de hecho muchos lo
hacen, como la evolución lógica de los modelos asociacionistas. Esto, que en sí mismo no debería
ser problema alguno, ha sido aprovechado por muchos críticos de los modelos conexionistas para
imputarles a estos las mismas críticas dirigidas contra los modelos asociacionistas decimonónicos
(véase más adelante en este mismo trabajo, el apartado dedicado a las críticas realizadas por
Fodor). Algunas de estas críticas son: 1) que se trata de modelos reduccionistas o atomistas en los
que los elementos complejos pueden ser descompuestos en otros elementos más simples; 2) que
esos elementos simples no son sino sensaciones; 3) que los elementos se asocian mecánicamente
en virtud de unas relaciones de asociación definidas y determinadas por la experiencia; y 4) la
existencia de leyes de asociación (principios mecánicos) (J. Sutton, Philosophy and memory traces,
Cambridge, Cambridge University Press, 1998, pp. 240-2).
Estas críticas han recibido cumplida respuesta por parte de los defensores del Conexionismo, quienes
no por ello dejan de reconocer sus raíces, por ejemplo Bechtel y Abrahamsen comentan que si bien el
Conexionismo dista mucho de ser un regreso al asociacionismo clásico sí es cierto que su más directo
antepasado es de hecho el asociacionismo (W. Bechtel y A. Abrahamsen, Connectionism and the mind,
Oxford, Basil Blackwell, 1991, p. 102). Las diferencias entre ambas corriente son según Bechtel y
Abrahamsen que: los modelos presentan una serie de características como la existencia de unidades
ocultas, modelos matemáticos de la dinámica del aprendizaje y algunos otros mecanismos de aprendizaje
específicos que son totalmente novedosos (Ibíd., p. 102) En una misma línea se sitúa Clark cuando
comenta que las funciones computacionales no lineales diferencian claramente al Conexionismo de
asociacionismo clásico (A. Clark, Associative engines: Connectionism, concepts and representational
change, Cambridge, MA, The MIT Press, 1993, p. 233).
Aparte de esta relación de familiaridad hasta cierto punto obvia, existe otra que no lo es tanto y que
John Sutton se ha encargado de sacar a la luz en su último trabajo (Sutton, op. cit.). Según Sutton,
muchos de las características de los modelos conexionistas actuales estaban ya presentes en los
modelos dinámicos de memoria de los siglos XVII y XVIII, concretamente en los de Descartes y
Malebranche y algunos otros. Sutton lleva a cabo una exposición histórica de estos modelos, de sus
características, de las motivaciones que causaron su nacimiento y de las críticas que recibieron, y
enlaza todo ello con los modelos conexionistas actuales y las críticas que también éstos reciben. En
su opinión estas dos clases de modelos comparten su rechazo a los modelos estáticos y localistas de
memoria (modelos basados en la metáfora del almacén), asícomo su defensa en favor de las
representaciones distribuidas con todas las consecuencias que conllevan y que nombraremos a lo
largo de este trabajo (almacenamiento superpuesto, causación holista, etc.).
2
W.S. McCulloch y W. Pitts, «A logical calculus of the ideas inmanent in nervous activity»,
Bulletin of Mathematical Biophysics, 5, 1943, 115-33.
15.pmd
234
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
235
mostraron cómo estas unidades podían llevar a cabo operaciones lógicas. Se trataba
de unidades binarias que podían estar activadas o desactivadas, y ello dependía del
input que recibían de otras unidades con las que se hallaban conectadas. Los primeros
estos modelos podían desempeñar funciones lógicas del tipo AND, OR y NOT. A
partir de esos primeros resultados esperanzadores fueron apareciendo diferentes modelos que imitaban el comportamiento de las neuronas. En 1958 Rosenblatt3 diseñó el
Perceptrón, un sistema capaz de aprender a clasificar rasgos haciendo uso solamente
de principios simples para el cambio de la fuerza de las conexiones entre neuronas.
Este diseño estaba basado en el trabajo de Hebb de 1949 sobre la actuación de la
memoria4. Según Hebb las conexiones entre dos neuronas son plásticas, cambiando
en proporción a la correlación activa de las células pre- y postsinápticas. Los primeros
diseños conexionistas, como por ejemplo el Perceptrón, eran muy simples, constaban
tan sólo de dos capas de unidades, una de entrada y otra de salida, resultando en un
tipo de sistemas conocidos como «redes de flujo directo» de una sola dirección (desde
la entrada hasta la salida). Esta simpleza provocó las críticas de Minsky y Papert en su
libro Perceptrons de 19695. Según estos dos autores los modelos conexionistas difícilmente podrían llegar a simular algún día habilidades cognitivas mínimamente complejas. Estas críticas tuvieron consecuencias nefastas para el paradigma conexionista,
como por ejemplo: la retirada de las subvenciones a las investigaciones sobre modelos
conexionistas; o la pérdida de interés por parte de universidades y laboratorios en
apoyar cualquier proyecto relacionado con el Conexionismo. Todo ello contribuyó a
sumir en un olvido casi total a la corriente conexionista. Sin embargo, a principios de
los años ochenta resurge el interés por estos modelos gracias, en gran parte, a los
trabajos de Hopfield. A partir de ese momento fue posible diseñar arquitecturas recurrentes y de múltiples capas, ya que se disponía de un algoritmo de aprendizaje para
estas nuevas redes multicapa. Se trataba del algoritmo de retropropagación de errores
que Paul Werbos diseñó para su tesis doctoral en 1975. Este resurgimiento también
fue debido al desengaño sufrido por muchos investigadores ante las crecientes limitaciones de los modelos computacionales formales y simbólicos en el campo de la Inteligencia Artificial6, de ahí que su principal oponente sean los modelos basados en una
3
F. Rosenblat, F., «Two theorems of separability in the perceptron», Mechanisation of Thought
Processes: Procedings of a Symposium Held at the National Physical Laboratory. November,
1958, vol. 1, HMSO, London, pp. 451-56.
4
D.O. Hebb, The organization of behavior. John Wiley & Sons: New York, 1949 (trad. esp.
Organización de la conducta. Madrid, Debate, 1985).
5
M.A. Minsky y S. Papert, Perceptrons, Cambridge, Mass, The MIT Press, 1969.
6
J.L. Tienson, «An introduction to connectionism», The Southern Journal of Philosophy, 126,
1987, pp. 1-16 (trad. Esp., «Una introducción al Conexionismo» en E. Rabossi (Comp.) Filosofía
de la mente y ciencia cognitiva, Barcelona, Paidós, 1995, pp. 359-380), se refiere a este hecho
en términos de crisis kuhniana de la Inteligencia Artificial clásica.
15.pmd
235
25/02/2013, 8:06
236
DAVID PÉREZ CHICO
visión formalista y simbólica de la mente7. En su afán por sustituir a la concepción
vigente la mayoría de los primeros modelos conexionistas trataron de demostrar que
eran capaces de triunfar allí donde los modelos simbólicos habían fracasado. Dado
este ambiente de rivalidad extrema, no es descabellado pensar que para los responsables de las investigaciones conexionistas era casi más importante superar a los modelos simbólicos que crear un nuevo paradigma que partiera de nuevos presupuestos en
el estudio de la mente humana que ofreciera nuevas perspectivas y vías de investigación8. Por esto mismo, muchos de los fracasos de algunos modelos conexionistas se
deben principalmente a que siguen adoptando presupuestos de la corriente simbólica
y tratando de resolver los problemas planteados desde ésta en sus mismos términos.
La consecuencia inmediata es que algunos diseñadores de modelos conexionistas se
han visto forzados a inventarse formas totalmente artificiosas de solucionar problemas como el de la composicionalidad de nuestro pensamiento, cuando quizás no fuese
necesario tal esfuerzo. Volveré sobre este punto más adelante.
En cualquier caso, observando la situación actual en el campo de las ciencias
cognitivas nos encontramos con dos corrientes enfrentadas, cada una más apropiada
para según qué cosas. El auge inicial del Conexionismo se debió a la facilidad con la
que solucionaba problemas irresolubles por la corriente sintáctica, pero actualmente
nos encontramos en un momento en el que la atención a los problemas propios de los
modelos conexionistas los han colocado en una situación de estancamiento (en lo que
se refiere a la explicación de lo mental y a la posibilidad de predecir con fiabilidad)
semejante a la que sus defensores denunciaron con respecto a los modelos simbólicos.
Actualmente, las perspectivas que ofrece el paradigma conexionista incluye algunas buenas noticias, otras no tan buenas y sobre todo una gran cantidad de promesas para el futuro. Lo que en los siguientes apartados trataré de mostrar es que en lo
que respecta al modelado de algunos rasgos cognitivos y al diseño de sistemas artifi-
7
La Imagen Simbólica o Sintáctica de la mente se basa, principalmente en lo que se ha dado en
llamar la metáfora del ordenador. Se afirma desde esta corriente que, en el nivel cognitivo, la
mente se compone de signos sintácticos definidos, estáticos e independientes del contexto
cuya recombinación a base de reglas determina los fenómenos propios del pensamiento
estructurado, esto es, su productividad, composicionalidad y sistematicidad. La aportación
paradigmática de esta corriente es la hipótesis del lenguaje del pensamiento propuesta por
Fodor (Cfr. J. Fodor, The language of thought, NY, Thomas Crowell, 1976, y J. Fodor, The
modularity of mind, Cambridge, MA , The Mit Press, 1983).
8
Es necesario aclarar que, aún en estos casos, los modelos conexionistas sí suponen una
innovación en tanto que plantean una nueva forma de entender cómo lleva a cabo el cerebro el
procesamiento de la información, así como en lo que se refiere al punto de partida en el que se
sitúan sus investigaciones: a diferencia de Fodor, que representa paradigmáticamente a los que
opinan que lo verdaderamente relevante es el nivel abstracto de procesamiento racional, las
investigaciones conexionistas se ocupan del nivel conocido como el de implementación.
15.pmd
236
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
237
ciales inteligentes el Conexionismo es probablemente la apuesta más segura, pero si
lo que queremos es obtener una teoría completa de la cognición alternativa a la
sintáctica, el conexionismo, a menos que libere todo su potencial de algunas cadenas
autoimpuestas, no es la solución. Argumentaré que para beneficiarnos de las virtudes
de los modelos conexionistas es necesario que nos replanteemos algunos supuestos
aceptados en base a una determinada concepción del ser humano. De las conclusiones
de esta argumentación espero poder ofrecer un ámbito de investigación y de aplicación más realista para los modelos conexionistas (4). Con anterioridad analizaré las
características de los modelos conexionistas (2) y algunas de sus limitaciones más
importantes (3).
2. CARACTERÍSTICAS DE LOS MODELOS CONEXIONISTAS
La característica definitoria de cualquier modelo conexionista es su semejanza
con el cerebro humano. Por supuesto, no estoy afirmando que dicha semejanza sea
total, pues ya se sabe que el conocimiento que tenemos del cerebro es mas bien escaso
y de difícil aplicación. En todo caso, los modelos conexionistas tratan de imitar la
estructura sináptica del cerebro de donde, se supone, surge la cognición. Es importante resaltar que se trata de una imitación, pues más adelante volveremos sobre ello para
destacar las limitaciones de estos modelos a la hora de explicar el proceder cognitivo
humano. Antes comentaré algunas de las características esenciales de los modelos
conexionistas.
La semejanza entre lo que se conoce del cerebro y los modelos conexionistas es,
de nuevo, parcial, es, en todo caso, una semejanza que se aprecia en que en los modelos conexionistas: 1) la actividad de las unidades, al igual que la de las neuronas, es el
resultado de procesos dinámicos no-lineales; 2) dado el procesamiento local, el papel
que juega cada unidad con respecto a latotalidad del sistema es insignificante, por lo
que la tolerancia al error de una o varias de estas unidades es muy alto; 3) pueden
«tomar» decisiones en situaciones de información incompleta o incluso contradictoria; 4) el procesamiento de la información se lleva a cabo masivamente en paralelo; 5)
son sistemas que pueden aprender de la experiencia y adaptarse a su entorno; 6) pueden, así mismo, generalizar a partir de ejemplos previos; y 7) son capaces de abstraer
características esenciales de inputs que no contienen información relevante.
En lo que se refiere a su diseño, un sistema conexionista está formado por unidades simples colocadas en distintas «capas». Existen unidades de entrada, de salida y
ocultas; cada una de estas unidades se conecta con varias de las unidades de otras
capas. El número de conexiones (la conectividad del sistema) dependerá del diseño.
Las unidades pueden estar activadas o desactivadas en función de la fuerza global de
los inputs procedentes de otras unidades conectadas con ella. La «fuerza» de las conexiones entre unidades se denomina peso. Un detalle más cercano a lo filosófico de
estos sistemas es que no es necesario para su correcto funcionamiento algo así como
un ejecutor central (que según el contexto podrá denominarse: homúnculo, alma, etc),
15.pmd
237
25/02/2013, 8:06
238
DAVID PÉREZ CHICO
sino que todas las conexiones son locales, con lo que se consigue que cada unidad
tenga información solamente de las unidades con las que está conectada, pero no sabe
lo que ocurre en el sistema considerado como globalidad. Por tanto, el comportamiento de cada unidad estará determinado por su estado actual y su input total, por lo que
estos modelos muestran un procesamiento local, distribuido por todo el sistema.
Un aspecto que no podemos olvidar es que se trata de sistemas que surgen como
oposición al los modelos sintácticos de procesamiento de información. Clark9 enumera una serie de características básicas de los modelos conexionistas por oposición a las
características definitorias de los modelos simbólicos. Afirma Clark, que los modelos
simbólicos no atienden a la psicología evolucionista; que tienen una concepción
sintáctica de la mente; y que se orientan hacia la psicología popular. Por el contrario,
los modelos conexionistas son, según Clark, «genuinamente» evolucionistas; atienden antes a los procesos que se llevan a cabo en el sistema que a los datos (símbolos)
o reglas; y son independientes de la psicología popular.
Las anteriores propiedades y características podrían ser denominadas como reaccionarias. Sin embargo, hay otras, aquí las dividiré en tres (más sus consecuencias),
que se identifican más y mejor con la naturaleza intrínseca del Conexionismo. Estas
tres características son a su vez la base sobre las que surgen otras muchas propiedades
importantes en términos filosóficos. Se trata de: 1) almacenamiento superpuesto de
información; 2) sensibilidad al contexto; y 3) cambio progresivo de representaciones.
1) Almacenamiento superpuesto de la información: esencialmente quiere esto
decir que la misma estructura puede ser utilizada para representar diferentes items de
información. Tan sólo es necesario variar los pesos que caracterizan cada representación. Según Clark, «dos representaciones se superponen si los recursos empleados
para representar a la primera son coextensivos con los recursos empleados para representar a la segunda».10 Así pues, representaciones semejantes compartirán muchas de
estas unidades11, de forma que cuando un número apreciable de unidades son compar-
9
Clark, op. cit., p. 3.
Ibíd., p. 17.
11
Lo que aquí vengo denominando con la expresión nuevos modelos conexionistas se caracterizan
por representar la información de forma distribuida. Quiere esto decir que cada representación
«está distribuida a lo largo de muchas conexiones diferentes, y cada conexión está presente en
muchas representaciones diferentes» (J.L. McClelland y D.E. Rumelhart, «A Distributed Model
of Human Learning and Memory», en J.L. McClelland y D.E. Rumelhart (eds.), Parallel
Distributed Processing: Explorations in the Microstructure of Cognition, vol II: Psychological
and biological Models, Cambridge, MA, The MIT Press, 1986, p. 176). Son un tipo de
representaciones no identificables por una dirección de memoria constante y sí por el contenido;
no están almacenadas explícita ni discretamente sino implícita y potencialmente. A modo de
ejemplo, (aunque para el mejor entendimiento del ejemplo se asuma lo contrario, las redes
10
15.pmd
238
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
239
tidas por muchas representaciones podemos hablar de representaciones prototipo12,
esto permite llevar a cabo generalizaciones con las que se obtiene nuevo conocimiento
a partir de su semejanza con los prototipos, la extracción automática de prototipos,
hacer juicios de tipicidad13 y otorga al sistema un comportamiento de gran flexibilidad. Otras consecuencias de este tipo de almacenamiento son que ninguna representación es arbitraria, y, lo que es más importante, es posible diseñar memorias direccionables por el contenido14.
conexionistas no operan necesariamente con representaciones atómicas), en un sistema que
represente las letras del abecedario por medio de los símbolos: «_», «__» y «|», la representación
de la letra «E» compartirá un mayor número de unidades activadas con la representación de la
letra «F» que con la de la letra «A».
Una consecuencia de la existencia de representaciones distribuidas es la causación holista:
todas las representaciones en un mismo sistema están automáticamente implicadas causalmente
en el comportamiento del sistema. Esto quiere decir también que ningún sistema con estas
características puede ser considerado independientemente de su historia.
Estas características serán recuperadas en la última parte de este trabajo en donde se incidirá en
su importancia para los objetivos de este trabajo. Pero es necesario señalar también que otras
de las consecuencias que muchos críticos de los modelos conexionistas han extraído de la
causación mental son la confusión y las interferencias entre representaciones, así como la
inestabilidad de las mismas (Sutton, op. cit.). Esto no deja de ser una conclusión lógica y obvia
de la definición dada para la causación holista, aunque si ocurre que nuestro sistema nervioso
se comporta de esa forma caótica ¿estaríamos justificados a negarlo simplemente por mantener
el rigor, la coherencia y la formalidad de los modelos cognitivos al uso?
Sutton señala que este tipo de críticas fueron realizadas contra el modelo dinámico de memoria
propuesto por Descartes y todos aquellos que adoptaron su misma línea de pensamiento en
estos temas. A la base de estas críticas se hallaban siempre preocupaciones de carácter moral y
normativo de todos aquellos que defendían modelos esencialistas en los que el alma u otro tipo
de ente privilegiado garantizaban el orden y la coherencia en el funcionamiento de nuestra
mente. Es de suponer que no existe una clara respuesta que convenza definitivamente a los
defensores de una y otra opción: donde unos ven caos los otros ven creatividad, donde unos ven
automatismo (actuar en respuesta pura y exclusivamente de los estímulos recibidos) los otros
ven flexibilidad...
12
Se trata de las tendencias estadísticas centrales de los diferentes rasgos de los ejemplos
suministrados al sistema. Estas tendencias proporcionan a las representaciones distribuidas
una estructura que los críticos les niegan (Cfr. Apartado 3, abajo).
13
Por ejemplo: la representación del item «canario» tendrá más rasgos en común con la
representación del item «pájaro» que la del item «pingüino».
14
En los sistemas conexionistas la información que no esté activa en un momento determinado
no puede ser hallada en ningún lugar del sistema. La información inactiva se encuentra en el
sistema de forma potencial o implícita (a diferencia de las representaciones explícitas postuladas
15.pmd
239
25/02/2013, 8:06
240
DAVID PÉREZ CHICO
2) Sensibilidad al contexto: a diferencia de los modelos simbólicos en los que los
símbolos son estáticos e independientes del contexto, en los sistemas conexionistas
los mismos pesos codifican múltiples inputs y conocimiento en general: un mismo
sistema, con las mismas unidades y conexiones, se comportará de distinta forma dependiendo de su entorno. Sólo así es posible que las diferentes ocurrencias de un
mismo item se clasifiquen de diferentes formas (aunque muy próximas dada sus semejanzas), siempre según el contexto. Además, este comportamiento puede ser interpretado semánticamente al observar el resultado de la actividad global de todo el sistema, pero en el nivel de procesamiento (unidades, pesos, ecuaciones de activación,
etc.) no puede realizarse ninguna interpretación semántica.
3) Cambio progresivo de representaciones: esta característica tiene que ver con
la evolución que sufren nuestras representaciones desde nuestra infancia hasta que
somos adultos. Los modelos simbólicos por lo general no se preocupan, ni pueden
dar cuenta, de este problema, pero desde la perspectiva conexionista el problema sí
puede ser abordado y además con bastantes garantías de éxito. Esto es así en primer
lugar porque no se opera con signos estáticos e independientes del contexto, y en
segundo lugar porque no se hace una diferenciación clara entre procesos y datos15. Por
tanto, los cambios en los procesos y en la información que tienen el sistema evolucionan conjuntamente. Cambios en la información disponible o la adquisición de nueva
información modifican los procesos que a su vez originan cambios en la información
disponible y así sucesivamente, todo lo cual, repercute en una reorganización del sistema original que ha de ser plástico16.
3. ALGUNAS CRÍTICAS: PROBLEMAS Y LIMITACIONES
DE LOS MODELOS CONEXIONISTAS
Veíamos anteriormente que el resurgir del Conexionismo se debió en gran parte
a la disponibilidad de nuevas herramientas teóricas que posibilitaron incrementar la
complejidad de los modelos existentes y, por tanto, responder así a las críticas realizadas por Minsky y Papert a los primeros modelos conexionistas. También comentamos
que a los primeros investigadores y autores comprometidos con el Conexionismo les
por los modelos simbólicos que poseen una dirección de memoria fija e independiente del
contenido). Esto es así porque la información se representa como un patrón de activación.
15
Al encontrarse la información distribuida por todos los elementos del sistema, cualquier
cambio en estos elementos modifica también a la información representada por ellos. A esto es
a lo que nos referimos cuando decimos que un sistema conexionista es plástico: información y
procesamiento se combinan para explicar los cambios cualitativos en la actuación del sistema.
16
Clark, op. cit.
15.pmd
240
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
241
movía lo que podemos denominar un ánimo de revancha hacia los modelos simbólicos y por ello, en un primer momento, se centraron en resolver los problemas en los
que la corriente rival fracasaba estrepitosamente. La mayor capacidad de los modelos
conexionistas para enfrentarse a una serie de problemas que se resistían a ser resueltos, como por ejemplo el problema del marco17. Esto provocó una situación de euforia
inicial. Sin embargo, esta situación de euforia ha dado paso o otra de equilibrio en la
que cada corriente presume ser mejor para según qué cosas a la vez que critica las
debilidades de su oponente.
Me gustaría comenzar señalando que a pesar de sus muchas diferencias, existen
también algunas similitudes entre los modelos conexionistas y los simbólicos. Después de todo, los nuevos modelos conexionistas nacen dentro de la tradición computacionalista de la mente. En consecuencia, se trata en ambos casos de modelos algorítmicos (quiere esto decir que implican alguna forma de secuenciación temporal), y de
modelos computacionales (en un caso se trata de reglas aplicadas a símbolos y en otro
de procesos causales por las que unas unidades activan o desactivan a otras). Por otra
parte, si aceptáramos el carácter asociacionista y atomista de los modelos conexionistas que algunos críticos apuntan18, podría extraerse la conclusión de que los modelos
conexionistas no son más que una réplica de la posible implementación neurofisiológica
de los procesos simbólicos19, propuesta que ejemplifica el punto de vista según el cual
las diferencias existentes entre ambas concepciones responden a que se sitúan en diferentes niveles de abstracción. Las dificultades para decidirse por una de las dos alternativas y eliminar la otra, han dado lugar a diversas propuestas de modelos híbridos
que tratan de aprovechar conjuntamente las bondades que cada uno de los dos paradigmas presenta por separado. Dennett, por ejemplo, habla de una máquina virtual en
serie, la conciencia (con características propias de un modelo simbólico) que emerge
del procesamiento en paralelo (un sistema conexionista) propio de un nivel inferior20.
Smolensky propone el «principio de correspondencia cognitiva» según el cual «cuan-
17
Este problema se refiere en concreto a la «habilidad de los seres humanos (y de otros animales)
para seleccionar, en un lapso muy breve de tiempo, los aspectos relevantes de una situación
para el desarrollo de la actitud que se desea emprender» (J.E. Corbí y J.L. Pradés, «El
Conexionismo y su impacto en la filosofía de la mente», en F. Broncano (ed.) La mente humana,
Madrid, Trotta, p. 159). Se trata, por tanto, de un problema cuya resolución requiere una gran
flexibilidad y rapidez, características estas que no presentan los excesivamente rígidos modelos
simbólicos.
18
Cfr. nota 2, arriba.
19
Es el caso de Fodor y Pylyshyn («Connectionism and Cognitive Architecture: a Critical
Analysis», Cognition, 28, 1988, pp. 3-71) al proponer que los defensores del Conexionismo
deben centrar todos sus esfuerzos en implementar las características formales y simbólicas de
los procesos mentales.
20
Dennett, Consciousness Explained, Little, Brown, 1991.
15.pmd
241
25/02/2013, 8:06
242
DAVID PÉREZ CHICO
do los sistemas conexionistas son analizados en niveles superiores, los elementos de
la computación simbólica aparecen como propiedades emergentes»21. Bechtel y
Abrahamsen reconocen las virtudes de cada paradigma y apuestan por una investigación autónoma dentro de cada paradigma aunque, desde cada uno de ellos, se debería
prestar atención a los resultados del otro22.
Las críticas que he seleccionado y que expondré en el siguiente apartado muestran algunos de los malentendidos provocados por este, digamos, «aire de familia»,
además de alguna que otra mala intepretación de lo que son realmente los modelos
conexionistas. El apartado se cierra con lo que en mi opinión son graves limitaciones
de la corriente conexionista que persigue la imitación antes que la explicación para
convertirse en el paradigma explicativo de la mente.
3.1 FODOR Y PYLYSHYN: LA SISTEMATICIDAD, COMPOSICIONALIDAD Y PRODUCTIVIDAD DE LOS
ESTADOS MENTALES
Las críticas quizás más comentadas en la bibliografía son las realizadas por Fodor
y Pylyshyn23. Se trata, básicamente, de que los sistemas conexionistas no pueden ex-
21
Smolensky, op. cit., p. 401.
Bechtel y Abrahamsen, op. cit.
23
J. Fodor y Z.Pylyshyn, op. cit.
Dado que estas críticas se basan en la teoría representacional de la mente propuesta por Fodor,
bueno será comentar brevemente en que consiste dicha teoría.
De la lectura de los trabajos de Fodor en estos temas se extrae de forma inmediata la conclusión
de que en ellos se defiende una visión logicista de la mente cuya mayor preocupación es la de
preservar el orden y el rigor formal (que se suponen como algo dado) de nuestro pensamiento
en particular y de los procesos mentales en general. Su teoría representacional de la mente, en
definitiva, se opone frontalmente al asociacionismo. Las representaciones simbólicas que él
propone y def iende presentan una estructura interna y son capaces de recombinarse
arbitrariamente con otras representaciones (recordemos que otra de las propuestas más conocidas
de Fodor es la hipótesis del lenguaje del pensamiento, según la cual, el pensamiento es un
medio representacional semejante al lenguaje). En otro trabajo (J. Fodor, Psychosemantics:
The problem of meaning in the philosophy of mind, Cambridge, MA, The MIT Press, 1987, p.
154) insiste Fodor en la idea de que lo verdaderamente relevante para el estudio de la mente es
la sistematicidad del pensamiento, «la clave de la naturaleza de la cognición es que los procesos
mentales mantienen las propiedades semánticas de los estados mentales... El problema central
acerca de la mente cognitiva es entender cómo es esto posible».
Así pues, el estudio de la mente, según Fodor, no debe desviarse de su verdadero objetivo: el
nivel de la cognición. En consecuencia, no tiene sentido, según esta forma de ver las cosas,
prestar atención a niveles más básicos en el estudio de la mente, excepto si el propósito es el de
implementar los estados descritos por los modelos simbólicos (Fodor y Pylyshyn, op. cit).
22
15.pmd
242
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
243
plicar las características de composicionalidad, productividad y sistematicidad propias del pensamiento humano. La causa de esto es que, según Fodor y Pylyshyn, las
representaciones en los modelos conexionistas son atómicas y por lo tanto no tienen
una estructura compuesta. Por ejemplo, en los modelos simbólicos la representación
«p» puede ser deducida de la representación «p & q», sin embargo en las modelos
conexionistas que ellos critican «p» y «p & q» son representaciones distintas, independientes y atómicas, esto es, no formadas por constituyentes menores.
Tenemos que, como la sistematicidad y productividad del pensamiento humano
significan que el contenido de éste se explica a partir del contenido de sus partes
constituyentes, y los sistemas conexionistas no poseen dichas partes, estos parecen
imposibilitados para explicar las características de nuestro pensamiento. Fodor y
Pylyshyn concluyen que los modelos conexionistas, debido al carácter atómico de sus
representaciones, son puramente asociacionistas, sensibles tan sólo a la estadística y
su utilidad es exclusivamente la de implementar el nivel cognitivo que es el verdaderamente importante a la hora de explicar.
Aunque ya debe haber quedado claro que las anteriores críticas parten de una
interpretación incorrecta de los modelos conexionistas actuales, puede ser interesante
atender a las respuestas dadas a dichas críticas por parte de los defensores del Conexionismo.
El primero en responder a las críticas de Fodor y Pylyshyn fue Smolensky24. Este
autor ideó un método basado en el cálculo vectorial que convertía a las representaciones atómicas en partes constituyentes de vectores que a su vez representan a un estado
concreto. El ejemplo que utiliza en su artículo es el de descomponer el estado «taza de
café» en sus partes constituyentes (unidades simples tales como «olor a quemado»,
«líquido caliente», «asa para el dedo», «recipiente vertical», etc.). La solución propuesta es la de representar dicho estado mediante un vector compuesto por los estados
de activación de cada una de las unidades implicadas en la representación «taza de
café»25. Sin embargo, como señalan Corbí y Prades26, esta solución es meramente
instrumental ya que, si bien ofrece una manera de descomponer estados conexionistas
complejos en sus partes constituyentes, no da ningún criterio para determinar cómo se
realizan físicamente esas partes constituyentes (soluciona el problema trasladándolo a
un nivel inferior). La propuesta de Smolensky, por tanto, serviría para ayudar a explicar y predecir el comportamiento del sistema, pero no da cuenta del proceder real del
mismo27.
24
Smolensky, op. cit.
Aún sería necesario un segundo vector que especificara los diferentes papeles contextuales
que podría desempeñar el estado «taza de café» y para los que algunos de sus componentes en
el otro vector serían adecuados y otros no. Esta adecuación se calcularía empleando operaciones
propias del cálculo vectorial.
26
Corbí y Prades, op. cit., p. 165.
27
Ibíd., p. 165.
25
15.pmd
243
25/02/2013, 8:06
244
DAVID PÉREZ CHICO
La propuesta de Smolensky trataba de resolver mediante un modelo conexionista
el problema de la composicionalidad en los mismos términos que el problema es planteado por los modelos simbólicos, lo cual le da una imagen de artificialidad a la misma. Otra solución al mismo problema es la propuesta por Tim van Gelder28 que consistía en diferenciar entre varios tipos de composicionalidad. La propia de los sistemas simbólicos sería una composicionalidad concatenativa, que no tendría porque ser
la única. Él propone un tipo de composicionalidad funcional que como requisitos
exige un mecanismo que garantice la producción de representaciones complejas a
partir de sus partes constituyentes y viceversa29. Quiere esto decir que para que la
composicionalidad se dé no es necesario que sea observable directamente, sino que se
puede lograr a través de fórmulas, funciones, etc.
Clark30 sugiere otra forma de entender el problema de la sistematicidad de nuestro pensamiento. Según este autor no se trata de una característica intrínseca del pensamiento, sino del lenguaje en que se expresa. Así pues, no sería tanto un problema de
las características propias de un sistema conexionista, sino más bien ocurre que es la
información que dicho sistema adquiere (por ejemplo el lenguaje) la que está sistematizada. Además, Clark opina que se trata de un problema estrechamente relacionado
con las estados concientes, por lo que no cree que sea lícito reprocharle a los modelos
conexionistas que no sean capaces de abordarlo, cuando la conciencia aún es un gran
misterio para nosotros.
3.2 MODELOS
CONEXIONISTAS: IMITACIÓN VS. EXPLICACIÓN
En directa relación con las limitaciones debidas a la falta de composicionalidad
nos encontramos con que en los modelos conexionistas, la información y el conocimiento que estos poseen no pueden ser utilizados para otras tareas distintas de aquellas para las que fueron entrenados. Para una nueva y diferente utilización de la información sería necesario un nuevo proceso de entrenamiento. Se trata de un problema
de diseño, pero que nos muestra claramente el estado actual tan limitado de estos
modelos. Tan sólo hay que detenerse a pensar que en nuestro cerebro existen unas mil
clases diferentes de neuronas y que cada neurona individual puede llegar a establecer
unas diez mil conexiones, tal complejidad es lo que explica nuestro asombroso y peculiar comportamiento cognitivo. Imitar semejante estructura nerviosa es algo imposible de realizar en la actualidad.
28
T. Van Gelder, «Compositionality: A Connectionist Variation on a Classical Theme», Cognitive
Science, 14, 1990, pp. 355-384.
29
Van Gelder propone como ejemplo la posibilidad de asociar a cada fórmula lógica de primer
orden un número de Gödel. De forma que sabiendo el número de una fórmula podemos hallar
el de sus partes constituyentes y viceversa (Ibíd.).
30
Clark, op. cit.
15.pmd
244
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
245
Lo expuesto en el anterior párrafo nos lleva a una diferenciación fundamental.
Podemos considerar a los modelos conexionistas de dos formas: o bien como meras
imitaciones de nuestro cerebro, o como modelos que pretenden explicarla cognición
(sus causas, funcionamiento, etc). Para el campo de la Filosofía de la mente lo primero no interesa, pues lo único que se consigue a través de imitaciones es reproducir el problema: obtendríamos otros «cerebros», pero seguiríamos sin saber cómo y
por qué aparecen la cognición a partir de su funcionamiento. Aún admitiendo que en
campo de la Inteligencia Artificial se consiguen resultados asombrosos, seguimos,
en la mayoría de los casos, sin saber explicar cómo se obtienen dichos resultados a
partir del procesamiento dinámico propio de los sistemas conexionistas. Sirva como
ilustración de lo anterior un ejemplo citado por Clark31: una red conexionista fue
entrenada para detectar la presencia de tanques en fotografías. Después del proceso
de entrenamiento la red era capaz de responder afirmativamente a la presencia de
tanques incluso en fotografías en las que aparecían parcialmente cubiertos e incluso
en aquellas que no habían formado parte de la muestra utilizada para el entrenamiento. En un posterior test de comprobación se probó con nuevas fotos (distintas a
las utilizadas para el entrenamiento de la red), en este caso el resultado fue un completo fracaso. Posteriormente se descubrió que la red había aprendido a distinguir
entre las diferencias de luz y densidad entre las fotos en las que sólo aparecían
tanques y aquellas en las que no aparecían tanques, con el agravante de que todas las
fotos en las que sí aparecían tanques habían sido realizadas por la mañana mientras
que las otras lo habían sido por la tarde, con la consiguiente diferencia de luminosidad entre unas y otras.
Este ejemplo muestra claramente la dificultad enorme que implica explicar el
comportamiento dinámico de los modelos conexionistas y como, al tratar de explicarlo desde la perspectiva global que ofrecen sus resultados, perdemos ese dinamismo y
ofrecemos interpretaciones estáticas que para nada se corresponden con el verdadero
proceder del sistema; además, cualquier explicación o interpretación del mismo es
puramente ad hoc, esto es, es posible interpretar semánticamente el resultado global
del sistema, pero estas interpretaciones no pueden ser realizados a nivel de unidades y
conexiones. Pero entonces, si no podemos abordar la complejidad de los modelos
existentes ¿cómo podemos esperar conseguirlo de otros más realistas y por tanto más
complejos aún? Lo que necesitamos son explicaciones de cómo emergen las propiedades cognitivas en nuestro cerebro y no una reproducción a escala de esa emergencia, lo cual, una vez más, es muy útil para diseñar inteligencias artificiales, pero no
para explicar la nuestra.
31
15.pmd
Ibíd.
245
25/02/2013, 8:06
246
DAVID PÉREZ CHICO
4. CONEXIONISMO RECONSIDERADO
Hasta ahora, y olvidándonos por un momento de cuestiones técnicas y de diseño, le
hemos reconocido al Conexionismo ciertos méritos32, al mismo tiempo que señalábamos ciertas carencias y dificultades, la mayor de ellas como hemos visto es la imposibilidad de explicar cómo emergen las propiedades mentales o psicológicas superiores a
partir del nivel de implementación33; y también que apelar por el Conexionismo es equivalente a renunciar a las regularidades en la cognición que sí nos proporciona el formalismo simbólico34. Estas limitaciones pueden provocar que el debate filosófico que trata
de dilucidar si el Conexionismo se ofrece como una alternativa a los modelos simbólicos de la mente no se decante tan favorablemente hacia el lado del Conexionismo35 y
que la imagen sintáctica de la mente sobreviva más tiempo del que quizás debiera.
¿Qué pueden contestar los defensores del Conexionismo a todo lo anterior? Hemos visto que un intento ha sido el de mostrar que los modelos conexionistas también
tienen algún tipo de estructura y que, en consecuencia, pueden dar cuenta de la supuesta sistematicidad, composicionalidad y demás propiedades que desde la imagen
sintáctica se señalan como las definitorias de los estados mentales36. Personalmente
opino que esta estrategia no es del todo satisfactoria y, sobre todo, que no hace justicia
a las características propias de los modelos conexionistas que son las que los diferencian de los modelos simbólicos y las que los convierten en una alternativa a la que
merece prestar atención. Opino también que esta manera de proceder claudica ante
una imagen de la naturaleza de nuestro cerebro/mente que quizás no sea correcta, pero
que es generalmente aceptada porque es muy cómodo que el objeto de estudio sea
compatible con teorías logicistas y formales, amén de otras causas más de tipo moral
que tienen que ver con una determinada visión de los seres humanos.
De lo que me ocuparé en el resto del trabajo es de argumentar en favor de una
concepción de los seres humanos en general y de lo mental en particular diametralmente opuesta a la que está a la base de la imagen sintáctica de la mente. Esta argumentación me servirá de justificación para la propuesta siguiente: un campo en el que
32
Apuntar al dinamismo de nuestra vida mental mediante la propuesta de las representaciones
distribuidas, atender a las demandas de la psicología evolutiva al haber señalado la importancia
de la evolución ontogenética para el desarrollo de la mente, etc.
33
Quiero volver a señalar que esta observación está dirigida hacia el papel que los modelos
conexionistas puedan desempeñar en el campo de la filosofía de la mente, pero para nada
compromete su importancia en las investigaciones de la Inteligencia Artificial.
34
Fodor y Pylyshyn, op. cit.; también D. Kirsh («Paying the price for cognition», The southern
Journal of Philosophy, 26, 1988) se ha echo eco de la gran dificultad que supone obtener las
regularidades que la imagen simbólica de la mente sí proporciona.
35
Corbí y Prades, op. cit.
36
Cfr. apartado 3, arriba (respuestas de Smolensky, van Gelder y Clark).
15.pmd
246
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
247
los modelos conexionistas pueden ser aprovechados al máximo de sus posibilidades y
en el que no es del todo utópico plantear modelos conexionistas ambiciosos es en el
del estudio de la memoria37. Después de todo «la memoria no es un dominio en el que
la sistematicidad o la regularidad sean siempre aparentes».38
4.1 MODELOS CONEXIONISTAS Y MODELOS DE MEMORIA
«La ciencia se ocupa de lo universal», nos parece imposible hacer ciencia de lo particular, quizás por eso sea tan difícil superar las afirmaciones apriorísticas del orden y la unidad
cognitiva que se hallan a la base de la visión logicista de la mente39. Se supone que los seres
37
Por supuesto, existen propuestas que abogan porque los modelos conexionistas sean capaces
de ofrecer una teoría de la cognición en general, sin que haya que de limitar su marco de
estudio de la manera en que yo voy a sugerir. Ebdon por ejemplo (M. Ebdon,«Is the cerebral
neocortex a uniform cognitive architecture?». Mind & Language, vol. 8, nº 3, Autumn 1993,
pp. 388-369) escribe acerca de la posibilidad de elaborar una teoría general de la cognición
basada en la posible uniformidad estructural del neocortex. En este sentido Ebdon comenta la
posibilidad de elaboraruna teoría general de la cognición basada en la posible uniformidad
estructural del neocortex. Según la evidencia mencionada en su artículo, el neocortex es una
arquitectura uniforme, por ello una teoría general de la «circuitería» cortical sería posible.
Además, es muy probable que se trate de una arquitectura conexionista, sin que ello sea
incompatible con la existencia de teorías específicas de más alto nivel.
38
Sutton, op. cit., p. 278. Cfr. F. Bartlett, Remembering an study in experimental and social
psychology, Londres, Cambridge University Press, 1932 (trad. esp. Recordar, Madrid, Alianza,
1995). En el estudio de la memoria puede observarse una situación similar a la existente entre
los modelos simbólicos y los modelos conexionistas de la mente: existe una oposición clara
entre los modelos almacén de memoria (para los que las memorias serían una imagen literal de
lo que las motivó) y los modelos reconstructivos o dinámicos de memoria (Cfr. A. Koriat y M.
Goldsmith, «Memory metaphors and the real life/laboratory controversy: Correspondence versus
storehouse conceptions of memory», Behavioral and Brain Sciences, 19, 1996, 167-228). Esta
distinción estaba ya presente en el trabajo de Bartlett cuando critica el método experimental de
Ebbinghaus de estudiar las funciones y capacidades psicológicas aisladamente. Lo que Bartlett
proponía era tener en cuenta las relaciones entre esas capacidades y funciones, así como con la
experiencia previa. En lo que al acto de recordar se refiere, Bartlett se oponía claramente al las
teorías de la reproducción literal por no poder éstas dar cuenta del papel que la experiencia, así
como las relaciones entre las distintas huellas de memorias, desempeñan en el almacenamiento
y recuperación, «el recuerdo resulta ser mucho más una cuestión de construcción que una
cuestión de mera reproducción» (op. cit., p. 273).
39
Fodor, por ejemplo, al proponer su hipótesis de la modularidad mental persigue el objetivo, a su
entender exigible a toda ciencia cognitiva, de garantizar una humaneidad común, independiente de
cualquier teoría del sujeto y de las influencias contextuales (J. Fodor, Modularity of Mind, op. cit.).
15.pmd
247
25/02/2013, 8:06
248
DAVID PÉREZ CHICO
humanos compartimos una Racionalidad, que de nuestro estados mentales es posible hacer
ciencia porque son coherentes, estructurados y sistemáticos. Además, se trata de estados
perfectamente almacenados en nuestra memoria esperando, incorruptos y sin noticia de que
exista un mundo exterior, el momento de ser utilizados para obedecer el comando de nuestra
voluntad. Sin embargo, esta pretensión de cientificidad no debería servir de excusa para
convertir los comportamientos que contradicen esta pretensión en la excepción a la regla.
Seguramente todos los que lean estas líneas podrían citar ejemplos de malentendidos, de
errores de interpretación, confusiones derivadas de una mala memoria, o interferencias entre
nuestros recuerdos y la imaginación, situaciones en las que, sin saber por qué, unos recuerdos
nos llevan a otros con los que en principio no están relacionados, etc.
En este punto me veo obligado a enunciar una serie de obviedades que, quizás por ser
tales, no siempre se tienen en cuenta: los seres humanos no somos seres aislados. Existe un
mundo natural ahí afuera y otro mundo, éste social, conformado por todos los que son
como nosotros. Ambos mundos se interrelacionan a través de nosotros, los seres humanos,
y estos a su vez lo hacen entre ellos. El resultado de estas interrelaciones es que los seres
humanos aprendemos cosas:aprendemos normas, formas de comportamiento, alteramos
nuestros hábitos, etc.; pero también el mundo natural sufre cambios derivados de nuestras
actuaciones que a su vez repercuten en su relación con los seres humanos, estos, a su vez,
se ven afectados por esos cambios, y así hasta el infinito40. Parece, por tanto, que los seres
humanos vivimos en un mundo en el que lo único que no hay que suponer como dado es
el orden o la estabilidad (no se puede dudar de que hay orden en nuestro mundo o en la
cognición, pero no es el orden lo que hay que explicar, sino más bien cómo es posible
semejante orden, de dónde proviene, cuáles son sus causas, etc.). No se debe criticar a los
modelos conexionistas el que no puedan convertirse en una buena teoría de los fenómenos
cognitivos tan sólo por el hecho de que no son capaces de dar cuenta de ellos en los
términos que exige la supuesta ciencia cognitiva formalista. De hecho, como hemos visto
al repasar las características de los modelos conexionistas y volveremos a ver más abajo,
las supuestas irregularidades del comportamiento humano, así como las propiedades que
denotan flexibilidad y capacidad de adaptación al entorno, son abordables con más garantías de éxito desde los modelos conexionistas.
4.1.1 ¿Por qué la memoria?
Al finalizar la introducción a este cuarto apartado cité a Sutton con respecto a la
falta de sistematicidad de la memoria. En los ejemplos de fenómenos «irregulares» en
40
«Los sistemas cognitivos dinámicos coevolucionan con los sistemas fisiológicos, medioambientales y sociales en los que se hayan situados», T. Van Gelder y R. Port, «Its about time:
an overview of the dynamical approach to cognition», en R. Port y T. Van Gelder (eds.), Mind
as Motion: Explorations in the Dynamics of Cognition, Cambridge, MA, The MIT Press, 1995,
pp. 1-43 (citado en Sutton, op. cit., p. 1).
15.pmd
248
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
249
el apartado anterior también la memoria aparecía en casi todos ellos. Es la memoria,
no lo olvidemos, donde se encuentran nuestros conocimientos (tanto los semánticos,
como los procedimentales) y todo aquello que nos otorga una personalidad. Desde el
punto de vista de los modelos dinámicos no poseemos todos estos contenidos en nuestra memoria, sino que esos contenidos nos conforman, son parte de lo que somos, en
ellos se entremezclan recuerdos, saberes, experiencias, afectos, inclinaciones, etc. Sin
que sepamos cómo, y sin que participemos en ello, esos contenidos se organizan de
alguna forma que nos hace ser a cada uno de la manera que somos. Por ello, la memoria es un excelente campo de pruebas «para entender las múltiples coacciones o represiones del cuerpo y la cultura, los cuales nos convierten en incapaces de alterar nuestro ser a voluntad»41. Para lograrlo, entre los modelos conexionistas o los simbólicos,
los modelos conexionistas ofrecen mejores perspectivas.
4.1.2 ¿Por qué los modelos conexionistas?
Al comienzo del trabajo cité el libro de Sutton42 para señalar que en él se analizan
algunos de los precursores de los actuales modelos conexionistas. El que recibe más
atención por parte de Sutton es el modelo dinámico de memoria propuesto por Descartes, pero también se menciona a Malebranche, a Locke, Hartley, y otros. Además
de compartir su interés por la memoria ¿qué otras características presentaban estos
modelos?
En general todos estos modelos compartían entre sí su manera de entender la
memoria como un conjunto de patrones activos/dinámicos, antes que como un almacén de archivos estáticos. Esos patrones se definen como rastros o huellas (traces)
fragmentarias que han de ser reconstruidas, por lo que no hay lugar en ellos para la
recuperación literal. Lo que diferencia a estos modelos de los actuales modelos
conexionistas es que los autores de los siglos XVII y XVIII creían que las memoria
eran el resultado de la actividad de fluidos o de espíritus animales que recorrían los
poros del cerebro. Los actuales modelos conexionistas han sustituido a los espíritus
animales por los patrones de activación a lo largo de vastas redes neuronales, en las
que se condensan y comprimen innumerables trayectorias posibles43.
Por otra parte, ambos modelos comparten importantes propiedades. La más
destacada es que postulan memorias distribuidas a lo largo del sistema que las acoge. Como ya he indicado, este tipo de representaciones provoca que todas estén
relacionadas originando un tipo de causalidad holista. Así mismo, al estar las representaciones distribuidas a lo largo de los componentes del sistema ocurrirá que al
41
Sutton, op. cit., p. 279.
Ibíd. (Cfr. nota 2, arriba).
43
Ibíd. p, 1.
42
15.pmd
249
25/02/2013, 8:06
250
DAVID PÉREZ CHICO
cambiar estos también cambiarán las representaciones, esto es, en los sistemas distribuidos no existe una distinción nítida entre la información y el procesamiento de
dicha información. Esto quiere decir también, que las leyes de computación postuladas son leyes causales físicas, y así mismo, que el método de computación depende de la arquitectura (que a su vez determina la organización de los contenidos de la
memoria). Consecuencia crucial que se extrae de estas propiedades: no es necesaria
la actuación de una instancia que tome desiciones y que manipule los contenidos de
la memoria según su voluntad44.
Además de las anteriores propiedades, los modelos conexionistas presentan una
serie de características que los hacen especialmente atractivos para el estudio de la
memoria humana: direccionabilidad por contenido, reorganización dinámica de los
contenidos, capacidad de generalización, extracción automática de prototipos, juicios
de tipicidad, etc.
Ahora bien, una cosa es que los modelos conexionistas presenten unas características que puedan parecer atractivas, y otra cosa muy distinta es que la evidencia
existente sea compatible con dichas características. No haré un repaso exhaustivo de
los conocimiento sobre la memoria, no obstante, citaré algunos datos aceptados en
neurología relevantes para este trabajo45. Esta evidencia muestra a la memoria como
un sistema jerárquicamente estructurado en subsistemas de memoria diferenciables
unos de otros, pero a la vez interrelacionados anatómicamente. Cada sistema de memoria está formado por redes de neuronas interconectadas en las que cada representación se halla distribuida compartiendo algunas redes con otras representaciones.
La jerarquía de los diferentes sistemas de memoria iría desde las más simples y
antiguas filogenéticamente (memoria episódica) hasta las más complejas y recientes
(memoria conceptual). Las últimas en aparecer se construyen sobre las anteriores,
implicando un mayor complejidad estructural.
En cuanto a la implementación de estos sistemas, no es muy difícil imaginarse
cómo la compaginación de distintas redes conexionistas puede ser útil para modelar
un sistema de estas características. Diferentes redes pueden realizar las funciones de
los sistemas básicos, la interrelación de estos sistemas modulares básicos más alguna
adición darán lugar a sistemas más complejos (esto gracias a las representaciones
distribuidas y a la causación holista), a la vez que los más simples seguirían desempeñando su función original.
44
Esta es una consecuencia compartida por la mayoría de los modelos dinámicos de la memoria
y de la mente. Por ejemplo, Bartlett, en sus investigaciones sobre la acción de recordar, afirmaba
que no puede hablarse de un «yo», sino que lo único que es cierto es la existencia de un
mecanismo de organización de esquemas dependientes de la acción recíproca de apetitos,
instintos, intereses e ideales peculiares a un sujeto dado (op. cit., p. 281)
45
Los datos comentados en este párrafo los he tomado del libro de Fuster, Memory in the
cerebral neocortex, Cambridge, MA, The MIT Press, 1995
15.pmd
250
25/02/2013, 8:06
VIRTUDES Y DEFECTOS DE LOS MODELOS CONEXIONISTAS...
251
Como hemos visto, se puede obtener un modelo conexionista no tan complejo
como uno que tratase de teorizar la mente en su totalidad, y, no obstante, significaría
un paso importantísimo para la deseada teorización de la cognición humana. Por
supuesto los problemas que quedan por resolver son muchos46, y la complejidad del
modelo, aunque menor como decía anteriormente, no deja de ser grande. Aún así, lo
relevante no es tanto simular una memoria humana con todos sus contenidos, como
diseñar una organización de memoria plausible (por aquello de que la arquitectura del
sistema es la que determina el comportamiento del mismo), lo cual aleja esta tarea de
terrenos utópicos y la acerca a los dominios de lo realizable.
5. RECAPITULACIÓN Y CONCLUSIONES
He tratado de mostrar algunas de las razones por las que, en mi opinión y en su
estado actual, el Conexionismo no representa una alternativa válida para la explicación de la mente en su conjunto (tampoco lo es la imagen sintáctica de la mente) si lo
que se pretende es imitar la complejidad de nuestros sistemas nerviosos. No obstante,
a nivel teórico sí que ofrecen bastantes posibilidades que los convierten en la opción
más aconsejable y prometedora. Es en éste nivel en el que sí sería de gran utilidad
diseñar modelos de organización de memoria que nos acercaran al entendimiento de
la cognición. Estos modelos estarían en sintonía con el carácter interdisciplinar de
cualquier estudio que quiera afrontar la complejidad de nuestro objeto de estudio,
porque nos ayudarían a comprendernos como el resultado de un proceso de socialización en el que todos participamos y tras el cual quedamos constituidos como sujetos
con una historia personal e intransferible, con unas tendencias e intereses particulares,
y todo, absolutamente todo, relacionado con todo los demás en la memoria de cada
sujeto. Es éste (dar cuenta del orden que surge en un medio en el que sus elementos se
organizan de forma holista), sin duda alguna, uno de los problemas más difíciles de
teorizar con el que se encuentra el Conexionismo y cualquier otra teoría sobre la men-
46
Los problemas se derivan, en su mayoría, de las propiedades que hacen tan atractivos a los
modelos conexionistas. Por ejemplo, si afirmamos, como hiciera Locke, que la memoria es la
base de nuestra personalidad, y a continuación decimos que la memoria es un sistema dinámico,
conformado por representaciones distribuidas relacionadas de forma holista, cuyo contenido
cambia con el tiempo y las interacciones con otras sistemas (fisiológicos, físicos, sociales,
culturales...) las exponen al fenómeno del olvido catastrófico... lo verdaderamente extraño es
que no padezcamos de personalidad múltiple. Sin duda, este problema representa uno de los
mayores retos con los que se han de enfrentar los modelos conexionistas. Sin embargo, de lo
que se trataría a la hora de teorizar la cognición, lo vuelvo a repetir, es de explicar cómo
aparece el orden y la unidad en nuestro sistema cognitivo y no suponerlos como algo dado.
15.pmd
251
25/02/2013, 8:06
252
DAVID PÉREZ CHICO
te. La mejor manera de abordarlo no es una estrategia de ensayo y error, en la que se
diseñen sistemas conexionistas y se compruebe a posteriori su comportamiento a ver
si ha habido suerte. La solución es otra bien distinta que respeta los procedimientos
tanto de los que se dedican a investigar en el nivel de implementación como de los que
se centran en niveles de abstracción superiores: tratar de explicar en el nivel de implementación, o de reducir propiedades mentales al nivel de implementación debe ser
tarea de las neurociencias. Nuestro trabajo desde la Filosofía, una vez aceptada la
estrecha relación que existe entre información y procesos en los modelos conexionistas,
debería ser el de aportar propuestas y posibles soluciones a los diferentes problemas
que se planteen en un nivel superior de abstracción, pero siempre con la vista puesta
en el nivel inferior, esto es, teniendo en cuenta las propiedades y características que
ofrecen los sistemas conexionistas (principalmente la de la causación holista) y con
ello su forma de concebir a los seres humanos.
15.pmd
252
25/02/2013, 8:06
Descargar