LA POLEMICA SOBRE PROGRAMAS DE REFORZAMIENTO EN HUMANOS La polémica se origina cuando a través de la sección de preguntas y respuestas se recibe la siguiente pregunta a la que responde Luis Valero: Pregunta: ejemplos de tipos de reforzamiento: razón continuo / intervalo continuo / razón intermitente / intervalo intermitente. Respuesta (Luis Valero): En otra pregunta sobre programas de reforzamiento de esta pagina, encontraras mas explicaciones sobre este tema. Revisa la nomenclatura o traducción de tus textos. Aunque los programas de reforzamiento surgieron en un contexto experimental de laboratorio, se han aplicado extensamente al comportamiento humano, y pueden ser la explicación en algunos comportamientos cotidianos. Aquí van unos ejemplos: 1.- Razón fija (no razón continuo), supone la aparición del reforzador cada numero de respuestas especificas. Por ejemplo, cada 5 cuentas que el niño hace bien, la maestra le pone una buena nota. Cada 10 clientes nuevos que consigue un vendedor, el jefe le da una prima económica. 2.- Razón variable (no razón intermitente), el reforzador aparece cada numero variable de respuestas de una ocasión a otra. Por ejemplo, el vendedor a domicilio consigue vender una enciclopedia cuando visita 8, 6, 14, 2, 18... domicilios. En el aprendizaje de la lectura, la maestra refuerza al niño al terminar cada frase, lo que supone 2, 10, 8, 4, 6... palabras por frase. 3.- Intervalo fijo (no intervalo continuo), supone que el reforzador estará disponible en la primera respuesta después de superado un tiempo siempre fijo. Por ejemplo, la película se interrumpe y estará disponible de nuevo en la TV después de 6 min. de anuncios (por eso se hace zapping en los anuncios). Todos los exámenes suelen tener un intervalo fijo de tiempo (Febrero y Junio), por eso se estudia mas los días inmediatamente antes del examen. 4.- Intervalo variable (no intervalo intermitente), implica que el reforzador estará disponible en la primera respuesta después de un tiempo variable de una ocasión a la siguiente. Por ejemplo, una persona pidiendo limosna en una acera, recibirá unas monedas a los 3, 15, 6, 8, 24, 4... minutos. Viendo un partido de futbol, el gol puede aparecer a los 2, 8, 40, 32, 6, 25... minutos. Tras esta respuesta Julio Varela muestra su desacuerdo y responde de la siguiente manera: Respuesta (Julio Varela): Desde mi punto de vista, la "aplicación" de los programas de reforzamiento al comportamiento humano, en general carece de fundamento teórico y empírico. Se justifica sobre argumentaciones muy debatibles. Tomemos como base los ejemplos proporcionados anteriormente. Se comenta que "aunque los programas de reforzamiento surgieron en un contexto experimental de laboratorio, se han aplicado extensamente al comportamiento humano, y pueden ser la explicación en algunos comportamientos 'cotidianos' ". 1 Se reconoce implícitamente que el conocimiento generado en el laboratorio puede ser diferente al que puede generarse fuera de él. Si a esto aunamos que Skinner escribió "La conducta de los organismos" (1938), teniendo en consideración EXCLUSIVAMENTE la conducta de la rata, dentro de un ambiente que NO es natural de la rata, habría que considerar con mucho cuidado cómo es que dichos programas de reforzamiento se hayan aplicado extensamente al comportamiento humano. En consecuencia, en la aplicación se asumen, al menos dos aspectos: a) El conocimiento generado en un ambiente experimental de laboratorio es válido para situaciones no experimentales fuera del laboratorio y, b) El ser humano se comporta cotidianamente de la misma manera que las ratas en ambientes no naturales. Difícilmente estos aspectos pueden sostenerse por sí mismos. Los ejemplos proporcionados para ilustrar la aplicación de los programas de reforzamiento son poco defendibles si se les analiza con cuidado. En el primer ejemplo se dice que un programa de "Razón fija, supone la aparición del reforzador cada número de respuestas específicas. Por ejemplo, cada 5 cuentas que el niño hace bien, la maestra le pone una buena nota. Cada 10 clientes nuevos que consigue un vendedor, el jefe le da una prima económica". Existen abismales diferencias entre estos ejemplos y la forma en que se conceptúa y trabaja con los programas de reforzamiento en el laboratorio. En la situación experimental de laboratorio, a) la rata está privada de alimento; b) ante los mismos estímulos siempre efectúa la misma respuesta discreta y simple (apretar una palanca); c) no se establece relación alguna entre la rata y el experimentador; y d) el reforzador (alimento) reduce el estado de privación específica. Al asumirse que el conocimiento se puede extrapolar, en el caso del niño implicaría que las 5 cuentas SON LA MISMA RESPUESTA y que en cada caso se presenta una sola respuesta que, a su vez, es discreta y simple. ¿Las cinco cuentas son las mismas? El profesor que ponga la misma cuenta 5 veces para evaluar a su alumno, puede empezar a empacar sus maletas. En este caso, ¿"la misma respuesta" se refiere a "sumar"? Esto marca una gran diferencia ya que se está considerando a la respuesta como si fuera una categoría genérica (sumar). ¿De qué está privado el niño? La rata está privada de alimento y el reforzamiento decrementa ese estado de privación. El ejemplo asume que la buena nota es el reforzamiento para el niño ¿la buena nota decrementa su privación de buenas notas? Por último, damos por hecho que entre el maestro y el alumno existe una relación social que no puede ser descartada. Los 10 clientes nuevos. ¿Esto querría decir que nuestro vendedor estrella, ante los clientes, dio siempre la misma respuesta? ¿Dio UNA sola respuesta para conseguir a cada uno de los clientes? Parafraseando, de acuerdo al conocimiento experimental del laboratorio, ¿podríamos entonces decir que siempre apretó la palanca ante los mismos estímulos y que su estado de privación fue reforzado? Imaginemos que el profesor y el jefe de ventas está de malas. ¿El reforzador -la nota y la prima económica- actuarán a pesar de que el "reforzamiento" se presente de mala manera? Con esto queremos enfatizar que entre el sujeto y el "experimentador" existe una relación que no ocurre en la investigación de laboratorio con animales y reto a cualquier psicólogo a que en su trabajo ignore la relación que establece con las personas a quienes trata profesionalmente. Ante el caso de que el "reforzador" se dé de mala manera, podríamos preguntar: ¿es el reforzador per se el que afecta al individuo o es el reforzador y las circunstancias en que éste se presenta? Esta pregunta puede parecer un sin sentido pero una investigación reciente demuestra que no es así. Ribes, Torres y Carbajal (2002) hicieron la misma pregunta. Experimentalmente, en el laboratorio, con ratas macho, ante un programa de reforzamiento IF, el reforzamiento se presentó SIN luz del alimentador y se redujeron al máximo los sonidos del alimentador para facilitar su entrega. El reforzador empleado fue agua. ¿Los resultados? ¡Sorpresa! En las primeras 44 horas de experimentación Ribes y colaboradores NO encontraron el famoso festón 2 en ninguno de los sujetos. A partir de la sesión 45, algunos registros mostraron algo que, con muchas reservas, podría calificarse como el patrón de pausa-carrera, típico del IF. El segundo ejemplo se refiere al programa de razón variable (RV) que se describe como el programa en el que "el reforzador aparece cada número variable de respuestas de una ocasión a otra. Por ejemplo, el vendedor a domicilio consigue vender una enciclopedia cuando visita 8, 6, 14, 2, 18... domicilios. En el aprendizaje de la lectura, la maestra refuerza al niño al terminar cada frase, lo que supone 2, 10, 8, 4, 6... palabras por frase". Hacemos las mismas preguntas que en el caso anterior. Afirmar que en estos ejemplos se aplica un programa de reforzamiento RV, lleva implícito que el vendedor efectúa UNA sola respuesta, que siempre es la misma y que los domicilios son la misma situación de estímulo. Esto, sinceramente, va mucho más allá del concepto de "clase de respuesta y de estímulo". Si esto puede mantenerse en una discusión, entonces los planetas son de la misma clase de estímulos que las habichuelas en tanto que ambos "son estímulos". En la caja de Skinner (bautizada así por Clark L. Hull), los estímulos, la palanca, la respuesta, las luces, el comedero, siempre SON LOS MISMOS. No varían, lo cual es una máxima de la metodología empleada: mantener todas las cosas iguales excepto la condición de la variable independiente. ¿No resulta difícil mantener que el niño y el vendedor están ante un programa RV?. Bajo la lógica del AEC, leer la oración: "Mi mamá me pegó ayer", equivale a leer "John Wayne mató un bandolero". Es lo mismo, dado que las dos oraciones tienen el mismo número de palabras (cinco). Pero, ocurre que cada una de las palabras es totalmente diferente a todas las demás. ¡Cómo se explica esto en el AEC? Pues no lo explica. ¿Es equivalente decir Mi que John?, ¿Por qué no tomamos en cuenta el número de letras leídas para reforzar? Si esto se hiciera, 16 letras (de la primer oración) es un número diferente de 24 letras (segunda oración). No es claro porqué hay que considerar a las palabras y no a las letras, las oraciones, los párrafos o las páginas. Sin embargo, hay infinidad de trabajos que emplean una de estas medidas para reportar su "tasa de respuestas" pero sin justificar porqué una respuesta equivale a una palabra, a una letra, a una oración, etc. ¡Uy! Esto se opone cada vez más al conocimiento generado en el laboratorio. El ejemplo proporcionado en el tercer caso, dice que el programa de Intervalo fijo, supone que el reforzador estará disponible en la primera respuesta después de superado un tiempo siempre fijo. Por ejemplo, la película se interrumpe y estará disponible de nuevo en la TV después de 6 min. de anuncios (por eso se hace zapping en los anuncios). Todos los exámenes suelen tener un intervalo fijo de tiempo (Febrero y Junio), por eso se estudia mas los días inmediatamente antes del examen. Veamos. La investigación que se ha generado en el laboratorio sobre el programa de intervalo fijo lleva nada más 60 años. Se ha efectuado en ratas, pichones, monos, niños con síndrome down, en autistas y con sujetos con diversas perturbaciones conductuales. ¿Alguien sabe algo más de lo que se sabía hace 60 años? La investigación de Ribes y colaboradores (2002) pone de manifiesto que algunas preguntas experimentales han sido equivocadas en el AEC. En otras palabras, la ejecución de festón ante el IF parece ocurrir por los arreglos prefijados por la experimentación y con base en el tipo de equipo usado. Sin lugar a dudas me atrevo a afirmar que esto es lo que sucede. Es un efecto de la operación misma. No es ningún principio básico. Como se sugiere generalmente, pareciera que es "natural" (que forma parte de un principio conductual) el que cuando se define un criterio temporal los organismos (sean personas o animales) "esperen hasta el último momento para responder". ¡Ah caray! En los ejemplos, ¿cuál es el reforzamiento del que están privados los telespectadores y los estudiantes? ¿Cuáles son las respuestas pausa-carrera al efectuar el zapping? ¿Cuál es la respuesta que se emite a manera de festón al ver la TV? Resulta muy intrincado determinar cuál es el reforzamiento ya que si éste es ver el programa deseado, entonces ¿se trata de un reforzamiento continuo, mientras se observa el programa deseado? La "pausa" del zapping sólo complica más las cosas ya que pudiera interpretarse por algunos como conducta adjuntiva ( 3 habría que aclarar si el zapping también está bajo un programa IF). Si ver TV está bajo un IF, al igual que el zapping, entonces ¿estamos hablando de un programa de reforzamiento compuesto? ¿El zapping no calificaría más como una respuesta de evitación? Muchas preguntas se podrían derivar de esto. Sin duda, esto es terriblemente complicado de explicar y justificar teniendo como base el conocimiento obtenido en la investigación básica con animales. Por otro lado, si los estudiantes están privados de notas, entonces la solución debiera ser que se les den notas más frecuentemente. Pero ¿cuál es el reforzamiento para qué estado de privación del telespectador?. Mantener esta argumentación de la ejecución ante el IF (pausa-carrera) conduce a considerar que el ser humano y los animales por naturaleza (PRINCIPIO BASICO) dejan al último las cosas que tienen que hacer cuando se da un límite. NO lo puedo aceptar. Y hay que tener cuidado porque esto justifica muchas de las prácticas y políticas empresariales y educativas neoliberales que ven a los trabajadores y alumnos como sujetos indolentes. Si esto es cierto, sería válido para los gerentes de las empresas y profesores, en tanto que se trata de un principio básico. ¡Cuidado¡. En el cuarto ejemplo relativo al programa de Intervalo variable, se dice que "implica que el reforzador estará disponible en la primera respuesta después de un tiempo variable de una ocasión a la siguiente. Por ejemplo, una persona pidiendo limosna en una acera, recibirá unas monedas a los 3, 15, 6, 8, 24, 4... minutos. Viendo un partido de fútbol, el gol puede aparecer a los 2, 8, 40, 32, 6, 25... minutos". Las mismas preguntas anteriores además de las que siguen. Si esto es cierto, ¿cualquier limosnero debiera aprender que está bajo un programa de IV? o bien, ¿que los jugadores de fútbol podrán hacer un gol bajo un programa de IV? ¿Quién puso el programa para el limosnero o para el futbolista? En el caso del futbolista, de manera simplista se podría decir que para lograr el gol (reforzamiento), se emitió [término injustificable en un conductismo radical ya que parece indicar que el organismo "saca" una respuesta. ¿De dónde la saca?] siempre la misma respuesta: patear una pelota (lo que se parece a apretar la palanca). En el caso del limosnero podríamos conceder éste hace lo mismo (Una limosnita, por el amor de Dios), sólo que puede haber una diferencia ya que en ocasiones le pueden dar un duro (perdón, un eu-duro), 100 pelas, 20 pelas, 200 pelas. ¡Híjole! La misma respuesta es reforzada con densidad diferente. Esto se ha investigado en el laboratorio y los efectos son diferentes que cuando se emplea siempre la misma cantidad de reforzamiento (un pelet o tres segundos de acceso al bebedero, por ejemplo). En el laboratorio se sabe que el Experimentador (aunque esto no forme parte del reporte público, que conocemos como "publicación") es quien determina el programa de reforzamiento a usarse. ¿Puede argumentarse que la naturaleza es la responsable de los programas de reforzamiento?. Entre muchas otras cosas, pareciera que en el trabajo "aplicado" se pretende emular el trabajo experimental del laboratorio con lo que ocurre en el mundo cotidiano. Yo mantengo que eso es una falacia mayor al área de Asia (para mantenerme en el juego de las analogías). Es difícil concluir que la respuesta que se da, siempre es la misma, que es discreta y que es una sola; que no tienen nunca contacto con el "programador"; que se desempeñan de igual manera que una rata en el laboratorio. Definitivamente, no estoy de acuerdo con este tipo de tesis sean experimentales y del laboratorio y que pretenden aplicarse de manera laxa o acrítica para "programar" y explicar el comportamiento humano. Nunca he escuchado que una rata me hable; nunca he visto un cartel de protesta de ningún pichón; nunca he leído que el chimpancé, los gorilas y los monos rehsus aprendan a sumar; nunca he tenido conocimiento de que los delfines mejoren su sintaxis "comunicativa"; nunca he sabido que los corderos toquen a fanfarria cuando llega su líder o toquen a retirada cuando aparece el depredador; sigo observando que las abejas "reina" nacen y mueren siendo reina mientras que las abejas peón nacen y mueren con la misma categoría. Los animales no generan muchas de las habilidades que el humano sí puede aprender. Veo que los niños cometen más errores de ortografía; juegan en la Internet de manera sostenida en lugares y juegos muy diversos; escuchan menos a sus padres; algunos consumen drogas mediante convenios monetarios; hablan un idioma cada vez más estereotipado que ellos 4 generan; escriben horrores en su "chateo" con los amigos; reclaman cada vez más derechos; leen con deficiencias más materiales excitantes; los adultos gobiernan con muchas más mañas, presiones y se auxilian de los "formadores de imagen"; venden más productos innecesarios; realizan películas más tediosas; escriben novelas efímeras que son producto de su imaginación; crean, cantan y venden por miles canciones pa'l verano (no relacionar con las Ketchap); inventan formas más seguras para clonar tarjetas de crédito; etc., etc. ¿Y esto que hacen los humanos se explica con base en el conocimiento de los programas de reforzamiento, generado en la investigación básica con animales?. La explicación del comportamiento humano con base en los programas de reforzamiento no es sostenible. Supongamos (simplificando, como lo hace la interpretación de los programas de reforzamiento aplicada al comportamiento humano) que el mensaje anterior fue UN estimulo. Mi respuesta es ésta (respuesta = ¿una?). ¿Cuál es mi reforzamiento? ¿De qué estoy privado? [Cuidado con interpretaciones psicoanalíticas]. Y sobre todo: ¿BAJO QUE PROGRAMA DE REFORZAMIENTO ESTOY? O, por psicólogo y pertenecer a ConTextos, ¿no estoy bajo ningún programa?. Siguiendo la lógica lineal y unicista de los skinnerianos, podría argumentarse que al responder estoy bajo un programa: 1) De razón variable. Esto implica que he enviado mensajes antes de éste, con relación a este tema. Cierto, contesté a Chema que este tema me interesaba. Una sola respuesta, ante estímulos diferentes y sin que pueda definir cual es mi privación (Vosotros diréis). 2) De tiempo variable. Cierto es que a veces respondo, a veces no. ¿es esto un programa? Vamos, invito a cualquiera que me explique y justifique esto. 3) De tiempo fijo. Puede ser que los lunes responda más prolijamente pero esto (desde mi particular consideración) no se debe a que esté bajo un programa de tiempo fijo, CREO que se debe a que los fines de semana tengo más tiempo en casa, para responder). 4) De razón fija. Si queréis mi participación, cuando haya recibido 20 mensajes, irremediablemente, para conseguir el reforzador que Vosotros proporcionáis, enviaré un mensaje (no importa su contenido, dado que cumplirá con el requisito de que sea "mensaje". Esto cumple con la clase genérica de estímulos y respuestas, ¿no?). Referencia Ribes E., Torres C. y Carbajal Y. (2002). El arte del FI. Presentación en Coloquio Interno del Centro de Estudios e Investigaciones en Comportamiento. 20 de octubre. La réplica de Luis Valero fue la siguiente: Respuesta (Luis Valero): Vamos a la discusión, porque ninguno de tus argumentos me ha convencido de que no existan programas de reforzamiento en la vida cotidiana. Lo que si puede ocurrir es que algunos de los ejemplos puedan ser un poco forzados, o bien que puedan ser explicados también por otras variables simultáneamente, y no sólo por programas de reforzamiento. Y, desde luego, no en todas las conductas tiene que haber programas de reforzamiento. Las condiciones fundamentales para poder hacer esa generalizacion de los programas de reforzamiento a la vida codiana sería: (1) una respuestas repetida, de alta frecuencia, y (2) una contingencia de reforzamiento positivo que aparece de forma intermitente, algunas respuestas reciben reforzamiento y otras de la misma clase no lo tienen. Si ambas se dan, es una cuestión empírica comprobar que al cambiar el programa de reforzamiento cambia también la conducta, y en los ejemplos que puse se da así. Pero, respecto a tu respuesta lo que creo mas grave, es que criticas la posibilidad de generalización de los hallazgos en la experimentación animal a la vida cotidiana de los 5 humanos.. El contexto experimental es solo una manipulación del investigador de la situación para aislar variables importantes en el fenómeno que estudia y neutralizar otras variables que puedan no ser relevantes o necesarias para ese fenómeno. Que ese contexto se le llame natural o no es un concepto diferente, porque el único contexto natural del hombre seria el campo, las cuevas y la caza de animales. Si el contexto natural de la rata es la alcantarilla o la caja Skinner es una cuestión de evolución histórica. Tan natural puede ser apretar una tecla en el ordenador en un experimento, como pulsar la tecla de la maquina tragaperras, como escribir unos números en un papel, o este mismo mensaje electrónico. Cuando se hace una generalización del laboratorio al comportamiento diario de las personas, se hace una extensión de ese fenómeno a otro diferente, pero cuya naturaleza o función son similares. Esa generalización, en principio, debe hacerse también experimental mediante replicaciones, y creo que los programas de reforzamiento están mas que comprobados en humanos. La mayoría de los artículos de JEAB no parecen tener otro objetivos en sus laboratorios. Lo que sí es un error es la generalización puramente formal, de topografía. Creer que las respuestas en el laboratorio y en la vida cotidiana deben ser las mismas para poder generalizar entre ellas. Precisamente, lo que se trata es una generalización funcional, es decir, la relación funcional que cumplen esas respuestas. Si vamos al detalle, tampoco la rata da la misma respuesta ante la tecla: da con el hocico, con la boca, con el lateral, con mas intensidad o con menos, da en el centro de la tecla, en un lateral, rozándola, con la parta, con el rabo, etc. (Estuve dos años moldeando pollos en caja Skinner, y apliqué muchos programas de reforzamiento, simples y compuestos). En la disposición de un experimento, se definen todas ellas como una única clase de respuestas (pulsar la tecla), aunque su forma sea diferente, y todas ellas obtienen el reforzador, que también puede durar mas o menos segundos, estar mas o menos húmedo o seco, estar mas molido o menos, etc. En los ejemplos que puse, definimos como una misma clase de respuestas, por ejemplo, hacer una cuenta de sumar, y esa respuesta se repite una y otra vez si consideramos el tiempo total de clase o los semestres completos de un curso. Y habitualmente la maestra/o alaba la corrección de las operaciones, lo bonito de los números, lo limpia que le ha quedado la libreta, o solo dice "muy bien". Esa unidad puede considerarse, sin lugar a dudas, como una misma clase de respuestas y recibe reforzamiento positivo de la profesora. Igualmente se puede considerar desde un punto de vista funcional la respuesta "vender una enciclopedia", cuando el vendedor llama a la puerta, saluda, ofrece los libros, y obtiene una contestación del ama de cada que le abre la puerta. Si ese vendedor durante varios días, acude puerta tras puerta, perfectamente puedo considerarse una misma clase de respuesta, y analizar el posible programa de reforzamiento que la mantiene; precisamente porque a veces consigue reforzamiento y a veces no. Si las conductas de hacer cuentas y vender libros no pueden considerarse una clase de respuestas, tampoco la de la rata pulsando la tecla, porque la topografía de cada respuesta es diferente. De igual forma, se suele considerar la "palabra escrita" como unidad de medición del lenguaje (hablado y escrito), también como una clase de respuesta, en este caso, "leer en voz alta". Se pueden hacer análisis mas finos o mas gruesos, y tomar unidades mas pequeñas (fonemas, sonidos, movimientos bucales) y mas gruesas (párrafos, frases, páginas, discursos). En ese ejemplo, y cuando la maestra está enseñando la lectura habitualmente refuerza al final de cada frase, y si está mal alguna le hace repetir la palabra (como unidad). Además entre los objetivos educativos que marca el propio Ministerio de Educación, Cultura y Deportes (en España), por ejemplo, el objetivo es conseguir que el niño con 10 años lea correctamente con una velocidad de 100 palabras por minuto. Por tanto, la unidad necesariamente es la palabra, que a veces será reforzada y a veces no, luego puede estar bajo algún programa de reforzamiento. Por ultimo, también, es una generalización funcional asumir que la acción, el drama o el chismorreo que aparece en un programa de TV es reforzador para el espectador. No hay 6 ningún parecido formal entre un pellet y una película de TV. Pero asumiendo precisamente esa generalización desde el laboratorio a la vida cotidiana, asumimos que los personajes y la acción de una película son un reforzador, y la clase de respuesta es "mirar la TV", aunque su topografía pueda cambiar y hacerse desde un sillón, desde el sofá, la cama, de pie, en el suelo, de lado, tras el cristal de un escaparate, etc. Todas ellas las consideramos una misma clase de respuestas, si ese es el fenómeno que queremos estudiar, y el reforzador serán las imágenes de la tele. Si esa respuesta se da continuamente (media 4 horas/persona/día), puedo considerar -sin temor a equivocarme- que es una conducta mantenida bajo un programa de reforzamiento. Aunque no me atreva a adivinar cual es la "privación" en este caso. Y, ¿es igual la privación de comida durante un día en una rata, que la privación de una semana de TV porque se ha roto el aparato?. Lo que sí llevas razón, es que quizás el zapping sea una respuesta de evitación. Pero ahí te he pillado, porque ahora eres tú quien esta generalizando gratuitamente que los anuncios son aversivos, y la respuesta sobre el mando a distancia elimina esa estimulación visual. Hay programas dedicados exclusivamente a lo anuncios, o sea que también pueden ser reforzadores. Nota: respecto a la experimentación que mencionas (Ribos, Torres y Carbajal , 2002): Sin conocer mas del procedimiento de ese experimento, podría interpretar simplemente que no aparecen festones de IF porque no hay reforzadores condicionados evidentes respecto al agua, y por tanto, confirma una de las hipótesis explicativas sobre por qué funcionan los programas de reforzamiento, y es que la misma respuesta se mantiene aun sin reforzamiento explícito, porque esta recibiendo algún tipo de reforzador condicionado. Y la cosa no queda ahí...Julio responde de nuevo y avanza la siguiente línea de debate... Respuesta (Julio Varela): Con base en tu respuesta, me parece que cometí omisiones (no es un oxímoron*) y no fui lo suficientemente explícito en mi mensaje anterior. Teniendo esto en cuenta, por el momento no contesto a tus argumentos, necesito más tiempo para no perdernos en aspectos secundarios pero, para contribuir a la discusión recomiendo las siguientes referencias: Ribes E. Relationship among behavior theory, experimental research, and behavior modification techniques. Psychological Record, 1977, 2, 417-24. Varela J. Crítica a algunos conceptos y procedimientos del análisis experimental aplicado a la educación. Presentado en el IV Congreso Mexicano de Análisis de Conducta. Monterrey, México, 1978. En estos artículos se posiblemente se fundamente con mayor detalle mis reparos a la interpretación (¿generalización?, ¿extrapolación?) de los programas de reforzamiento a partir de la investigación con animales. No estoy en contra de la investigación con animales (creo que es imprescindible como parte de la psicología comparada). Estoy en contra de que los resultados se usen de manera acrítica y laxa para explicar el comportamiento humano. En tu mensaje hay material para largas y productivas discusiones. * oximoron. Se le llama a la combinación de palabras contradictorias e incongruentes como puede ser bondad despiadada. 7 En este momento del debate Jorge Campo ha decido intervenir y aporta la siguiente reflexión: Respuesta (Jorge Campo): He leído el artículo de Julio que nos ha enviado en su segunda entrega y me encuentro con una duda que ya ha sido señalada en parte por Luis en su respuesta. Se trata del concepto de ambiente "natural". Tal como lo veo, no me resulta un término preciso si no más bien arbitrario y no sujeto a ninguna parametrización. Mediante el ejemplo, voy a intentar ofrecer las razones por la que dicho término, entiendo no debiera ser usado. Julio por ejemplo, señala que: "Los observadores siempre son otra variable interviniente en la situación. Su actividad la pueden realizar por medio del análisis de filmación o mediante espejos unidireccionales, pero el alto costo o la inexistencia del equipo o instalación, hace que generalmente se realice en forma directa e interviniendo en el "hábitat" de los sujetos observados". Si no entiendo mal, estos observadores inciden en la, llamemosle "artificialidad" de las observaciones. Igualmente se señalan factores sociales, otros elementos situables por mí y a grosso modo, bajo el paraguas de "economías abiertas", etc. Mi entendimiento entonces es que la concepción de Julio sobre "naturalidad" no es más que el conjunto de todas las circunstancias intervinientes en el segmento de conducta objeto de estudio, y que entiendo que el AEC obvia. En este sentido, estaría de acuerdo en que sin estos ámbitos, estaríamos dejando muy cojo cualquier acercamiento a nuestro objeto de estudio. Y estaría de acuerdo en la idea de: "Situar a la investigación con humanos en ambientes naturales no como la aplicación de algo, pues en realidad esto ha conducido a una situación pragmática". Ahora bien, si el concepto de "ambiente natural" significa además aquellas situaciones en las que no se dan las constricciones del laboratorio, me temo que no estaría de acuerdo ya que no encuentro forma de distinguir qué circunstancias representan lo natural y cuáles no, tal como señala Luis. Si lo "natural" representara algo más que lo dejado pragmáticamente a un lado por el AEC, entonces habría que explicar qué exactamente, qué lo diferencia tanto de lo escogido por el AEC , como de lo no escogido y además por qué es diferente. Mi punto entonces es que si por "ambientes naturales" señalamos al conjunto de características, variables, etc., dejadas a una lado por el AEC, entonces estaré de acuerdo. Si por el contrario, "natural" se conceptúa con respecto a su antónimo "artificial", entonces me temo que no podré estar de acuerdo al no entender qué exactamente los diferencia. Claves como el confinamiento o el control experimental, entiendo que no son válidas, precisamente porque estamos interesados en la conducta de nuestros sujetos experimentales. Y bautizar nuestros arreglos, muchos o pocos, como "naturales" o "artificiales" y opacamente en relación al sujeto, pueden resultar un sinsentido por no formar parte como tales, de dicho estudio...aunque puedan y deban ser conceptuados como condicionantes de nuestro experimento, pero no al nivel de ser tildados de tal o cual característica. 8 Así pues y resumiendo mi postura, es que dichos condicionantes deben ser tenidos en cuenta (no lo han sido por el AEC), pero a la vez, no deben ser tildados de "naturales" o "artificiales". Concluyo señalando que no estoy seguro de que la postura de Julio sea esta exactamente y que a primera vista, me parece que mi opinión está a medio camino entre la de Julio y la de Luis y que tal vez mis precisiones puedan dar lugar a un cierto entendimiento entre las dos posiciones (caso de que sean dos o no sea ya que simplemente no han sido más que ligeramente esbozadas y por lo tanto están pendientes de explicitación). A pesar de lo escrito, mis reflexiones son de nuevo en voz alta y sujetas a cambio dependiendo de vuestras intervenciones. Luis aparece de nuevo para precisar algunas cosas y aportar algunas referencias: Respuesta (Luis Valero): Los programas de reforzamiento surgieron como un hallazgo experimental, y se publicaron por primera vez en el libro de Skinner "La conducta de los organismos" (1966/79), pronto apareció un primer texto programado (educativo) para enseñar esos programas de reforzamiento (Thompson y Grabowski, 1972/78). Ahí aparecen ya ejemplos humanos, extraídos de experimentos de laboratorio, en los que se comprueban las características de estos programas también en sujetos humanos. Muchos de esos ejemplos son de instrucción programada, discriminación visual en niños, efectos motivacionales con luces y fichas, pero también su uso con habilidades de la vida diaria en niños con retraso (barrer y hacer la habitación, control en el retrete). Y el libro de Honig (1966/75) define explícitamente las características de todos los programas de reforzamiento y les da los nombres con que actualmente los conocemos, incluyendo programas de reforzamiento diferencial y programas complejos. Los tomos sobre "control de la conducta humana" de Ulrich, Stachnik y Mabry (1970/77) son una recopilación de todas las extensiones que se hicieron de los hallazgos de laboratorio a la conducta humana, incluyendo programas de reforzamiento y técnicas de fichas, que suponen precisamente la utilización de programas de razón. Todos estos estudios iniciales suponen una generalización directa de los programas de reforzamiento en laboratorio a su aplicación en contextos humanos, aunque muchas veces también de laboratorio. En todos los casos, los hallazgos son similares a los encontrados en animales, y muestran una gran utilidad para aumentar y mantener de forma constante conductas escolares o habilidades de la vida diaria, especialmente útiles los programas de razón variable. Los programas de economía de fichas de Ayllon y Azrin (1968/74) son también una aplicación directa de esos programas de reforzamiento, y donde más se ha experimentado la variedad de usos de programas de reforzamiento. Esta se puede considerar unas de las generalizaciones mas "geniales" a la vida cotidiana. De hecho, no falta supermercado, banco o gasolinera que no ofrezca reforzadores variados por un numero especifico de puntos, conseguidos según un número fijo de conductas de consumo (compras). Su uso tan general, no solo muestra que funcionan y dan mayores beneficios a las empresas que los utilizan, sino que también son aceptados como algo cotidiano por todo el mundo. Una extensión inmediata de los programas de reforzamiento fue hacia el estudio de la conducta en las máquinas tragaperras (lo mas parecido en su forma a una caja Skinner). El libro educativo de Whaley y Malott (1971/78) muestra ejemplos de esos comportamientos gobernados por la máquina (leer la narración de "luna de miel para tres") y el uso de programas de reforzamiento con niños o personas con alcoholismo ("el bar de Coral Gables"). 9 Se puede permitir una fácil generalización a los programas de reforzamiento utilizados por los fabricantes de tragamonedas para mantener su negocio. Como práctica de la asignatura de evaluación, mis alumnos han de realizar una observación directa, con todos sus parámetros y características, del comportamiento de una o varias personas ante la máquina tragaperras. Según los datos obtenidos en múltiples trabajos de esos alumnos, aparece casi siempre un programa RV-8 manteniendo la conducta de meter moneda tras moneda. No es un programa muy elevado, pero la mantiene largo tiempo y de forma bastante efectiva. Textos de modificación de conducta más actuales también presentan esa utilización de los programas de reforzamiento en la vida cotidiana. Así el texto de Martin y Pear (1999) dedica un capítulo completo a cómo aumentar comportamientos mediante programas de reforzamiento, y muestra fotos y otros ejemplos, además de los que yo pude describir en otras respuestas anteriores. Muchos de esos ejemplos están sacados de experimentos ya publicados. Algo similar ocurre en el texto de Kazdin (1984/96), donde expone varios ejemplos del uso de programas de reforzamiento, para mantener la atención de los alumnos, conductas de participación, habilidades sociales, o el uso de loterías para mantener la conducta de grupos. Y el texto de Domjan (1999) también dedica un capítulo a explicar los programas de reforzamiento y su utilización, incluyendo un ejemplo (obtenido del experimento de George y Hopkins, 1989) sobre el incremento en la productividad de unos camareros reforzados según un programa de razón fija por clientes, además de su sueldo habitual. Por último, mencionar que en la revista JABA dedicada a la experimentación más aplicada sobre conducta, pueden encontrarse 6 artículos en 2001 específicos sobre el estudio de los cambios en programas de reforzamiento y sus efectos sobre comportamiento humano, en su mayoría niños con problemas; además de una revisión sobre las relaciones entre contingencias de reforzamiento en laboratorio y en el entorno social, entre la investigación básica y aplicada (Vollmer y Hackenberg, 2001). La generalización de los programas de reforzamiento a la vida cotidiana, pues, ha seguido una progresión desde el laboratorio con animales, al estudio también en laboratorio con humanos, al uso en contextos institucionales o escolares, al uso en otros problemas clínicos e incluso su extensión social y comunitaria. En suma, la generalización no es sólo mía, no es gratuita, ni demasiado atrevida. Referencias: • • • • • • • • • • Ayllon, T. Y Azrin, N. (1968/74). Economía de fichas. México: Trillas. Domjan, M. (1999). Principios de aprendizaje y conducta. Mexico: Thomson. George, J.T. y Hopkins, B.L.(1989). Multiple effects of performancecontingent pay for waitpersons. Journal of Applied Behavior Analysis, 22, 131-141. Honig, K. (1966/75). Conducta operante. Mexico: Trillas. Kazdin, A.E. (1984/96). Modificación de la conducta y sus aplicaciones prácticas. Mexico: Manual Moderno. Martin, G. Y Pear, J. (1999). Modificación de conducta. Qué es y cómo aplicarla. Madrid: Prentice Hall. Skinner, B.F. (1966/79). La conducta de los organismos. Barcelona: Fontanella. Thompson, T. y Grabowski, J.G. (1972/78). Programas de reforzamiento y análisis multioperante. Mexico: Trillas. Ulrich, R., Stachnik, T. Y Mabry, J. (1970/77). Control de la conducta humana (3 tomos). Mexico: Trillas. Vollmer, T.R. y Hackenberg, T.D. (2001). Reinforcement contingencies and social reinforcement: some reciprocal relations between basic and applied research. Journal of Applied Behavior Analysis, 34, 241-253. 10 • Whaley, D.L. y Malott, R.W. (1971/78). Psicología del comportamiento. Barcelona: Fontanella. Ahora es Julio el que retoma el tema y va a centrar un poco el debate... Respuesta (Julio Varela): Mi intención en este debate-plática es ofrecer argumentos que pongan bajo la crítica algunos conceptos y procedimientos que se han presentado desde hace mucho tiempo como inmutables, como parte del credo, como suficientemente probados por medios experimentales, pero que desde mi perspectiva adolecen en su fundamento conceptual. Además, para mí, otro objetivo de esta plática-debate es arribar a conclusiones claras, sean de acuerdo o desacuerdo. Con el ánimo anterior, y habiéndome pertrechado durante el tiempo invernal, propongo 10 aspectos a debatir que cubren los aspectos críticos expuestos por ti y por Jorge. Pretendo que discutamos uno a la vez. LOS 10 PUNTOS A DEBATIR 1. Posibilidad de que la aplicación de los programas explique el grueso de la conducta humana. 2. ¿Qué es una situación natural? 3. Definición de programa de reforzamiento. 4. Los ejemplos de programa de reforzamiento, dados como indiscutibles, son los de las máquinas tragaperras. 5. ¿Qué se aprende bajo un programa de reforzamiento? 6. El concepto de clase en el análisis operante. 7. Generalización de los resultados del laboratorio relativos a la conducta de un animal = la conducta de un sujeto humano. ¿Por qué no al revés? 8. ¿Conducta del individuo = conducta del grupo? 9. ¿Y dónde quedó la necesaria privación? 10. Los estudios sobre programas de reforzamiento usualmente se por el tipo de respuesta, el tipo de sujetos empleados, y el tipo de reforzadores. caracterizan Descritos los puntos anteriores, procedo a abordar El Primer Punto. 1. No critico la posibilidad de aplicar el procedimiento de un programa de reforzamiento. Critico la ligereza de su "aplicación" (extensión, generalización, transpolación) acrítica y ateórica para considerar al grueso de la conducta humana. En este punto, sólo quiero preguntar si dicho procedimiento puede dar cuenta de la mayor parte (o totalidad) de conducta humana. Espero respuestas, comentarios, críticas o cualquier nota humorística. Pero ... ¡tened cuidado en vuestras respuestas! 11 ¡¡Bien, Luis vuelve a la carga!!...con el punto 1, claro... Respuesta (Luis Valero): Pues, muy de acuerdo, vamos a discutir ese punto. Seguro que al final encontramos muchos más aspectos de consenso que de separación. En ese primer punto, pues, NO creo que los programas de reforzamiento puedan explicar "el grueso de la conducta humana", sino que pueden explicar como y porque se mantienen con gran probabilidad y a largo plazo comportamientos en los que el reforzamiento es intermitente. Si se dan esas dos características: alta probabilidad de respuesta y aparición intermitente de consecuencias reforzantes, podría afirmarse que esa respuesta está bajo un programa de reforzamiento. NO creo que sea excesiva ni gratuita la generalización que se ha hecho de los programas de reforzamiento. Precisamente, los ejemplos que mostré en el otro texto -alguno son míos y otros de publicaciones- son bastante moderados en esa generalización. El paso de un programa de reforzamiento en una situación experimental a una situación en la vida cotidiana -en esos ejemplos- es casi inmediata. Sólo se trata buscar una respuesta de alta probabilidad y averiguar el reforzador intermitente que la mantiene. Por último, es una cuestión empírica comprobar si esas conductas de la vida cotidiana se mantienen o no bajo programa de reforzamiento. Basta con hacer un experimento y cambiarlo. Por ejemplo, en la máquina tragaperras el RV8 por IF15'; o en la tarea de lectura el RV10 por IF10'; o en el pescador el IV30' por otro de RF5 y veríamos los cambios. Julio responde...y esto continua: Respuesta (Julio Varela): Con mucho interés he leído tu respuesta. Gracias. Primer punto de acuerdo: los programas de reforzamiento NO pueden explicar el "grueso de la conducta humana". Siendo así, pregunto, ¿podemos considerar que los programas de reforzamiento podrían explicar lo "delgado de la conducta humana"? Si los programas no explican el grueso de la conducta ¿vale la pena tanto esfuerzo e investigación en el estudio y argumentación basada en ellos? Sé que algunos dirán que sí, yo opino que se ha gastado demasiado tiempo y no ha representado gran ventaja para el entendimiento del comportamiento humano complejo. Segundo, posible, punto de acuerdo: señalas que los programas pueden explicar porqué y cómo algunos comportamientos se mantienen. Si con esto te refieres a los procedimientos empleados, estamos de acuerdo. Si es alguna otra arista, debiéramos hacerla explícita, antes de poder declarar esto como acuerdo. Los demás aspectos de tu respuesta (generalización, paso de una situación experimental a una de la vida cotidiana, tipos de programas y las máquinas tragaperras), me gustaría abordarlos más adelante, en diferentes puntos de los que te planteé. ¿Tenemos dos acuerdos? ¿Sólo uno? 12 Y aquí vuelve Luis: Respuesta (Luis Valero): Tenemos dos puntos de acuerdo. Los programas de reforzamiento pueden explicar esa característica ("delgada") del comportamiento que es que resulta más probable cuando no siempre tiene reforzamiento. Y lo explica por el procedimiento, por la manipulación y forma en que se presentan los reforzadores, no por otras propiedades abstractas. Estoy de acuerdo en que se le ha dedicado muchísima experimentación de laboratorio, quizás en exceso en comparación con otras áreas. Quizás sea debido más al entorno cultural y motivacional de los "científicos de laboratorio" en USA, puesto que es una investigación muy estructurada, muy programada y sin grandes complicaciones. Los aparatos lo hacen casi todo. Y además la revista oficial (JEAB) parece que es lo único que le interesa. Entre nosotros, también los investigadores cognitivos llevan décadas haciendo experimentos sobre el "efecto stroop", con cientos de variaciones, y no pasan de ahí. O sea que... Quizás en este tema, no ha habido grandes descubrimientos después de los de Estes y Skinner, pero si se pueden señalar los distintos "programas complejos", la "ley de igualación", y el "análisis probabilístico" en la predicción de la conducta en un momento determinado de programa. Aunque es difícil ver la aplicación de estos hallazgos a la vida cotidiana humana. Un nuevo participante entra en acción...y Esteve Freixa i Baqué comenta Respuesta (Esteve Freixa i Baqué): El nombre de estos dos cómicos geniales de mi niñez (yo no soy de la generación esa de la que Chema nos ha mandado la carta nostálgica) me ha venido (aunque no estoy seguro de haberlos escrito bien) a la memoria al intentar hacer un par de comentarios sobre el debate de los programas de refuerzo, pues he visto que se esta debatiendo del "grueso" de la conducta y del "flaco" de la conducta, y eso me ha recordado "el gordo y el flaco" de antaño". Yo no pretendo participar al debate al nivel ejemplar al que lo están llevando Julio y Luis, pues no tengo ni la fineza y rigor teórico del primero ni las horas de laboratorio del segundo. Se trata pues de un simple comentario sin pretensiones. La verdad es que me sorprendió mucho descubrir la posición de Julio, tan estricta y rigurosa, que me da la impresión de que, si se aplica a la letra, ninguna generalización, extrapolación, transposición no seria posible. Es cierto que hay diferencias entre un experimento bien controlado en laboratorio y la vida cotidiana, pero también las hay entre la mosca del vinagre (la famosa drosofila) i nosotros, y sin embargo la casi totalidad de la investigación en genética se ha realizado y se realiza con la mosca esa para aplicarse luego a seres tan distintos de ella como Julio, Luis i yo, por ejemplo. O sea que, quizás de una manera algo primaria, intuitiva y ligera, pero me siento mucho mas próximo de la posición de Luis que de la de Julio. 13 Me pregunto: si no se puede extrapolar, para qué investigamos con animales? Nuestra vocación no es (en todo caso la mía no es) llegar a ser especialistas de condicionar animales, domadores de bichos de circo. Ya cuando Skinner entreno dos palomas a jugar al ping pong, sus opositores le criticaron diciendo que eso era lo único a lo que podía servir el conductismo: a montar números de circo. Pero no me da la impresión que ese fuese el propósito de Skinner... Como lo digo por boca de la rata de Skinner de mi cuento filosófico (Elucubraciones: Memorias de una rata de laboratorio): ""No me quiso decir cómo lo había logrado, pero me dio a entender que había descubierto lo que hacen ELLOS con los “gráficos”, los “datos” y toda su retahíla de aparatos. Estudian las leyes de la conducta para predecirla y controlarla. Yo soy más bien escéptico al respecto, por la sencilla razón de que ya ejercen un control total sobre nosotros (a pesar del episodio de Brot). Pero Pestanya me decía que no es en absoluto para controlarnos a nosotros que hacen todo esto; que nosotros, al fin y al cabo, no les importamos ni un pepino (la cual cosa, tengo que reconocerlo, concuerda perfectamente con lo que estaba diciendo hace un momento respecto al desprecio que nos demuestran). Se trata, según Pestanya, de controlarse entre ELLOS, es decir, unos ELLOS a otros ELLOS. Parece ser que a esto le llaman “Psicología”. Así pues, detrás de la última puerta, el “más allá” que para nosotros representa la libertad y la dignidad, (su mundo de ELLOS, en suma), ¿sería una especie de inmensa jaula en la que ciertos ELLOS obligarían a darle a la palanca a otros ELLOS? Pero, ¿para obtener qué? ¿Nuevos “gráficos”? Esto es lo que no logro entender. ¿Qué coño harían con esos nuevos “gráficos”? Realmente, cuantas más cosas sabemos, más interrogantes nuevos se nos presentan. Pero, si Pestanya tuviese razón, ello significaría que ELLOS también están bajo control, bajo control de otros ELLOS como ELLOS. Es más: incluso estos otros ELLOS deben estar sujetos a las leyes de la conducta, si es cierto que, como lo pretende Pestanya, tales leyes existen."" Copyright@Conducta.org Grupo Contextos -­‐ 2001 14