1. TEMAS INTRODUCTORIOS • Aproximación al concepto de Aprendizaje. • Definición de Aprendizaje. 2.1 Análisis de la definición. 2.2 Aprendizaje y ejecución. 2.3 Comentarios de la definición. • Procesos relacionados con aprendizaje. 3.1 En relación a relativamente permanente vs. transitorio: fatiga, habituación y sensibilización. 3.2 En relación con el efecto (o no efecto) de la práctica: maduración, instintos y reflejos. • Aprendiz, tarea y contexto. • Algunas cuestiones clave en las posiciones teóricas sobre aprendizaje. • RESUMEN • APROXIMACIÓN AL CONCEPTO DE APRENDIZAJE Definición diccionario: Aprendizaje− Adquirir el conocimiento de alguna cosa por medio del estudio o la experiencia. ⋅ El aprendizaje implica cambio. Diccionario etimológico: Aprender viene del latín prendere. (Coger o retener). ⋅ El aprendizaje es el proceso, no el resultado final. ⋅ El aprendizaje se refiere tanto a cosas positivas como negativas. • DEFINICIÓN DE APRENDIZAJE Hilgard y Marquis (1940) Conditioning and learning: Se entiende por APRENDIZAJE el cambio conductual relativamente permanente que resulta de la práctica. Kimble (1961) reedición del Conditioning and learning: Se entiende por APRENDIZAJE un cambio relativamente permanente en la potencialidad de la conducta que ocurre como resultado de la práctica forzada. 1961: En lo relativo a las definiciones fácticas siempre ha existido un acuerdo general entre las autoridades en 1 la materia de que se entiende por Aprendizaje ... 1967: Sería posible decir que hay un acuerdo general, aunque ocasionalmente este acuerdo sea con poca disposición ente los psicólogos del Aprendizaje de que es término puede ser definido como ... 1985: El fenómeno del aprendizaje es tan variado y diverso que no puede garantizarse su inclusión en una sola categoría. Aunque la definición es útil, todavía deja problemas sin resolver. 1995: Anderson Learning and memory: ....: Se entiende por APRENDIZAJE: proceso por el que los cambios relativamente permanentes ocurren en el potencial conductual como resultado de la experiencia. • ANÁLISIS DE LA DEFINICIÓN PROCESO INFERIDO (o variable interviniente) A Variable independiente Variable Dependiente • APRENDIZAJE Y EJECUCIÓN ⋅ La ejecución se puede ver afectada por diversos factores: motivación, fatiga .... ⋅ La ejecución nunca puede ser superior al aprendizaje. ⋅ La exactitud de la ejecución como índice del aprendizaje depende de la medida en que conozcamos estos hechos o factores y controlemos sus efectos. ⋅ La práctica tiene que considerarse en sentido amplio para dar cabida a todos esos factores del aprendizaje que no requieren que se ensaye por completo la respuesta a ejecutar. ⋅ Hay un inicio conductual de la adquisición. • APRENDIZAJE Y PROCESOS RELACIONADOS • EN RELACIÓN A RELATIVAMENTE PERMANENTE VS. TRANSITORIO: FATIGA, HABITUACIÓN Y SENSIBILIZACIÓN ! Cambios conductuales debidos a la práctica que no manifiestan permanencia: • Habituación. • Sensibilización. 2 • Fatiga. (R.O.! Respuesta de orientación. Primera respuesta de orientación ante un estímulo). HABITUACIÓN • Es una SENSIBILIZACIÓN disminución en la disposición a responder ante un estímulo específico debido a la experiencia repetida. • Refleja cambios en la R1 ante un estímulo específico. • Cambios en las propiedades del estímulo específico. • Algunas veces no es transitoria. • Es un incremento en la reacción ante los estímulos ambientales. • Aumento no específico de la respuesta a responder a cualquier estímulo. • Intensidad y frecuencia del estímulo afecta a la sensibilización. • Siempre transitoria. FATIGA Cuando una respuesta motora se repite con rapidez se hace progresivamente más lenta y débil en amplitud hasta que deja de producirse. • EN RELACIÓN CON EL EFECTO (O NO EFECTO) DE LA PRÁCTICA: MADURACIÓN, INSTINTOS Y REFLEJOS ! Cambios conductuales no atribuibles a la práctica, que manifiestan permanencia: • Maduración. • Conducta específica de la especie. • Instintos y reflejos. INSTINTOS Y REFLEJOS, CONDUCTA TÍPICA DE LA ESPECIE 3 Instinto− Designa complejas acciones vitales de origen predominantemente innato que se expresan en cambios conductuales donde la práctica juega un papel secundario. Notas características que comparten estas acciones: ⋅ Desarrollarse de acuerdo a unas pautas fijas en su forma y su orden de ejecución. ⋅ Ser compartidas por todos los miembros de una especie. ⋅ Tendencia a consumarse una vez desencadenadas. ⋅ Tener un valor funcional de supervivencia para el sujeto que las ejecuta y/o para su especie. La generalidad de estas características se matiza según el nivel filogenético (de evolución de la especie) del que estemos hablando. Conductas puramente innatas hay muy pocas. En general el patrón de acción fija que comporta un instinto se ajusta a los detalles exactos del ambiente. La especifidad de la conducta instintiva ofrece ciertas variantes entre los miembros de una misma especie. El carácter de tendencia a la consumación se aplica mejor a conductas más simples y fijas que a acciones más complejas como la agresión y la reproducción. Reflejos.− Es una reacción determinada del organismo ante un agente definido. Pavlov − El instinto es una cadena de reflejos. • APRENDIZ, TAREA Y CONTEXTO Elementos básicos en un procedimiento de aprendizaje. CONTEXTO SITUACIONAL (Instrucciones, situación física, ...) MOTIVACIÓN.− Si el sujeto no está motivado no comenzará el proceso de aprendizaje. Con una motivación baja, le costará más el proceso de aprendizaje. • Hay una fase previa de preentrenamiento. • Entrenamiento: fase en la que el sujeto se enfrenta a la tarea y comienza su proceso adquisitivo. • Los tipos de medida que se utilizan para verificar que se están produciendo cambios son muy variados. Ejemplos: • Medir el número de errores que comete. • Medir las respuestas correctas. • Medir la intensidad de la respuesta. • Medir la latencia de respuesta (tiempo que transcurre desde que se presenta el estímulo hasta que se produce la respuesta). • Fase postentrenamiento. Se evalúa los efectos de haber estado expuesto a la práctica. Con las instrucciones se puede modificar la forma de afrontar la tarea. 5. ALGUNAS CUESTIONES CLAVE EN LAS POSICIONES TEÓRICAS SOBRE APRENDIZAJE 4 EL CONTENIDO DEL APRENDIZAJE ¿Cuáles son las unidades del aprendizaje? Unos dicen que son las ideas o cogniciones. Otros, los conexionistas dicen que las unidades son nuevas conexiones entre un hecho ambiental, que denominaremos estímulo y otro hecho ambiental que llamamos estímulo o respuesta. MECANISMO POR EL QUE SE CONECTAN LOS ELEMENTOS Unos hablan de la contigüidad, proximidad o asociación estrecha entre los elementos. Otros dicen que se conecta por las consecuencias agradables o desagradables; están relacionados con las teorías del hedonismo, y los efectos que el dolor y el placer tienen sobre el comportamiento humano. Se les llama teóricos del refuerzo. DEBATE HERENCIA / AMBIENTE Los asociacionistas tienden a primar el ambiente, y a considerar el cerebro como una tábula rasa, mientras que los más biologistas tienden a primar las predisposiciones del organismo para ciertas tareas y ciertos aprendizajes. CONTINUIDAD / DISCONTINUIDAD DEL PROCESO DE APRENDIZAJE Para la mayoría de los conductistas el aprendizaje de las conexiones es un proceso gradual y continuo, y la fuerza de la conexión aumenta según la práctica. Para la mayoría de los cognitivos una conexión o una cognición acerca de las relaciones entre elementos puede presentarse súbitamente (aprendizaje de un solo ensayo). GENERALIZABILIDAD DE LAS LEYES DEL APRENDIZAJE ¿Rigen las mismas leyes para todos? ¿Se trata de diferencias cualitativas o cuantitativas? Hay quien señala que las pautas de la evolución han generado algunas diferencias en como las leyes del aprendizaje se aplican a las distintas especies. 2. CONDICIONAMIENTO CLÁSICO • INTRODUCCIÓN Problema científico que plantea. Método y técnica. Resultados. • DEFINICIÓN Y CONCEPTO • ADQUISICIÓN DE LA RESPUESTA CONDICIONADA (RC) • EL PROCEDIMIENTO DE CONDICIONAMIENTO CLÁSICO Componentes básicos Técnicas de medida de la RC 5 Técnica de anticipación Técnica del ensayo de prueba • PARADIGMAS PRINCIPALES DEL CONDICIONAMIENTO CLÁSICO Condicionamiento demorado Condicionamiento de huella Condicionamiento simultáneo Condicionamiento retrógrado Condicionamiento temporal • FACTORES QUE DETERMINAN LA ADQUISICIÓN DE RC TRAS LOS EMPAREJAMIENTOS La contigüidad temporal La intensidad del EC y del EI El papel de la saliencia del estímulo El valor informativo de los estímulos • EXTINCIÓN DE LA RESPUESTA CONDICIONADA • PROCEDIMIENTOS DE EXTINCIÓN • FACTORES QUE AFECTAN A LA EXTINCIÓN La fuerza de la RC El porcentaje de ensayos EC − EI Duración de la exposición al EC en la extinción • DESARROLLOS DEL CC • AVANCES DEL PERIODO SOVIÉTICO Condicionamiento interoceptivo Condicionamiento semántico y verbal • DESARROLLOS ESTADOUNIDENSES La respuesta emocional condicionada (REC) Precondicionamiento sensorial Sombreado y bloqueo • NATURALEZA DEL CC 6 • UNA PROPUESTA: EL MODELO ASOCIATIVO DE RESCORLA Y WAGNER Supuestos Aplicación al fenómeno del bloqueo • RESUMEN • INTRODUCCIÓN Condicionamiento clásico o pavloviano. IVAN PETROVICH PAVLOV 1849 − 1936 Reflejos condicionados, condicionales según Pavlov. Era hijo de un sacerdote ortodoxo. Recibió una beca para la universidad, donde se graduó en ciencias naturales. Tras trabajar en fisiología se graduó en medicina. 1890− Organiza y dirige el instituto de ÇÇÇÇÇÇ experimental. Premio nobel en medicina por sus investigaciones sobre la digestión. Problema científico que plantea La actividad nerviosa de un animal superior está representada en primer lugar por reflejos innatos. Reflejos innatos (desde Descartes)− Conexiones determinadas entre acciones fijas a agentes definidos. Los agentes externos definidos son pocos, están en las inmediaciones del organismo y tienen carácter general. La supervivencia del organismo se garantiza hasta cierto punto por los reflejos innatos, pero cada vez se garantiza menos, cuanto más ascendemos en la escala filogenética. Un animal que sólo dispone de reflejos innatos moriría, porque la vida diaria exige relaciones más flexibles y especializadas, ya que el medio varía y estas relaciones se establecen gracias a la corteza cerebral (según Pavlov, los grandes hemisferios). Hay muchos y variados agentes del mundo exterior que señalan de manera temporal y oscilante los factores fundamentales que provocan los reflejos incondicionados. Así se asegura el equilibrio entre organismo y medio. Por tanto, la actividad fundamental de los grandes hemisferios es la señalizadora, porque señala al organismo todas las oscilaciones del medio a través de múltiples señales. Método y técnica ¿Sobre qué órgano y con qué procedimiento? Sobre cualquier reflejo. Pavlov escoge el reflejo alimentario, estudiar la salivación de los perros ante determinados estímulos, siempre en condiciones controladas por él. • DEFINICIÓN Y CONCEPTO 7 Se llama CC al proceso adquisitivo por el que un estímulo originariamente neutro en relación a una respuesta, llega a poderla provocar gracias a la conexión asociativa de este estímulo con el estímulo que normalmente la provoca. • ADQUISICIÓN DE LA RESPUESTA CONDICIONADA (RC) • EL PROCEDIMIENTO DE CONDICIONAMIENTO CLÁSICO Componentes básicos Reflejo innato: EI − RI EI− regular, no aprendida y uniforme EC − RC EC − EI − RI ( sonido) ( comida ) ( respuesta ) EC − RC TÉCNICAS DE MEDIDA DE LA RC • Técnica de anticipación. Presentas la campanilla (EC), mides la salivación (RC) y a continuación presentas la comida (EI). • Técnica de ensayo de prueba. En uno de los ensayos sólo se presenta el EC, sin el EI, y medimos la RC. • PARADIGMAS PRINCIPALES DEL CONDICIONAMIENTO CLÁSICO EI SIMULTÁNEO EC DEMORADO EC DE HUELLA EC HACIA ATRÁS EC CONDICIONAMIENTO TEMPORAL.− No hay EC distintivo • FACTORES QUE DETERMINAN LA ADQUISICIÓN DE RC TRAS LOS EMPAREJAMIENTOS • El emparejamiento del EC y el EI no asegura automáticamente la adquisición de la RC. • Contigüidad. Que el EC preceda al EI. • Hay intervalos óptimos para el condicionamiento entre el EC y el EI, según el sistema de respuesta que se utilice. 8 No obstante hay algunos procedimientos por los cuales se puede condicionar aunque no exista contigüidad, introduciendo otro EC entre los dos primeros (puente). Hay una excepción, el efecto García. Se refiere a la aversión gustativa condicionada (o aprendizaje de aversión al sabor). Los animales y las personas son capaces de asociar un sabor (EC) con una experiencia de malestar (EI) producida varias horas después de la ingesta. Se trata de un caso de aprendizaje demorado. Intensidad del EC Los primeros estudios indicaban que la intensidad de la EC no afectaba. Pero a través de las nuevas experimentaciones se ha descubierto que la intensidad del EC si que puede afectar a la magnitud de la RC, cuando el sujeto tiene experiencia con dos estímulos condicionados de manera que si tu utilizas dos Ecs, uno más intenso y otro más débil, el intenso consigue un mayor condicionamiento. Intensidad del EI Generalmente se asume que la magnitud de la RC se incrementa con la intensidad del EI. ( !EI !RC ). Saliencia Según la especie a la que pertenece el individuo hay más o menos preparación para asociar algunos estímulos con un EI. Si tenemos dos EC's con un EI, se va a condicionar el EC más saliente para la especie. El más intenso interfiere al más débil, de manera que el menos saliente queda ensombrecido. Hay veces que un estímulo no saliente produce una RC más fuerte de la que sería de esperar si ese estímulo se emparejara con un EI él solo. Valor informativo del estímulo La contigüidad por si sola no es suficiente, tiene que haber también una relación por la cual la señal (EC) prediga fiablemente la aparición del EI. Si esta predicción no es sistemática, no se producirá la RC. Cuando se presentan dos o más estímulos con el EI, solamente se asociará con el EI aquel que prediga más fiablemente su aparición. EC SI EI SI SI SI : NO : SI NO SI : EC SI : EI SI SI SI 9 : SI : NO SI NO : : En ninguno de estos dos casos se produciría el condicionamiento, porque no hay una relación constante. Redundancia Ejemplo: El castigo de un padre. Podría ser que a un niño no le hiciese falta una amenaza de castigo, porque la figura del padre ya puede recordarle al castigo. • EXTINCIÓN DE LA RC La extinción es un método para eliminar RCs. • PROCEDIMIENTO DE EXTINCIÓN Se produce cuando se presenta el estímulo condicionado sin ir seguido del estímulo incondicionado. La fuerza de la RC disminuye al incrementar el número de presentaciones del EC solo hasta que finalmente el EC no provoca la RC. • FACTORES QUE AFECTAN A LA EXTINCIÓN • Fuerza de la RC. • Influencia del valor informativo. • Duración de la exposición al EC durante el proceso de extinción. • Fuerza de la RC. Fuerza de la RC. Consecuencia más importante: La extinción difiere de la adquisición, no es una imagen en espejo. Se pensaba que cuanto más fuerte era la RC más difícil era la extinción (más lenta). Sin embargo, hay discrepancias sobre el hecho de que adquisición y resistencia a la extinción correlacionen punto por punto. Una de las explicaciones es que el nivel motivacional del sujeto cambia del proceso de adquisición al proceso de extinción. Influencia del valor informativo. Grupo 1: 48: EC−EI Grupo 2: 96: EC−EI 48: EC−X Grupo 3: 48: EC−EI ¿En cuál de los tres grupos resultaría más difícil la extinción? En el grupo 1 se produce una mayor resistencia a la extinción, ya que durante los ensayos, ya estaban acostumbrados a que unas veces el EI seguía al EC y otras no, luego es más fácil que conserven la esperanza de que el EI vuelva a aparecer alguna vez. 10 Duración de la exposición al EC en el proceso de extinción Al incrementar el grado de experiencia con el EC solo, la magnitud de la RC disminuye. Sin embargo hay estudios que demuestran que la tasa de extinción está determinada por la duración de la exposición el EC solo, y no por el número de ensayos de extinción. G1 G2 Tono EC 25'' 100'' 200'' 8 ensayos 2 ensayos 400'' 16 ensayos 4 ensayos 800'' 32 ensayos 8 ensayos Lo que afecta a la extinción es la duración total de la exposición. Al aumentar la duración de la exposición al EC se debilita la fuerza de la RC. NATURALEZA DE LA EXTINCIÓN Pavlov consideraba que la extinción se debe a la inhibición de la RC. Esta inhibición se desarrolla como consecuencia de la activación de un estado inhibitorio central que se produce al presentar el EC sin el EI. La presentación repetida del EC sin el EI intensifica este estado inhibitorio e impide la aparición de la RC. La presentación de un EC solo activa un estado inhibitorio central (inhibición interna). La exposición al EC masiva produce una mejor extinción que la exposición espaciada. Es probable que en la extinción intervenga más de un proceso. Al menos uno de los procesos de la extinción es la inhibición, y juega un papel importante. • DESARROLLOS DEL CONDICIONAMIENTO CLÁSICO • AVANCES DEL PERIODO SOVIÉTICO Condicionamiento interoceptivo. Es aquel condicionamiento clásico en que el EC o el EI se aplica directamente sobre alguna mucosa de un órgano Tres tipos: TIPO 1 EC INT EI INT TIPO 2 EXT INT TIPO 3 INT EXT Por mucho tiempo la psicología occidental consideró que las vísceras no eran accesibles al S.N.C., pero si que lo son. Aplicaciones para comprender algunos de los desarrollos de los problemas psicosomáticos. Con este tipo de estudios se muestra el control que el S.N.C. ejerce sobre las vísceras. Condicionamiento semántico y verbal. Los psicólogos rusos nunca excluyeron como tema de investigación el lenguaje y la conciencia, mientras que para los estadounidenses no se podía estudiar la conciencia. 11 Los rusos se centraron en el significado de las palabras como ECs para una variedad de respuestas externas e internas. 1er. sistema de señales: todos los estímulos que no tienen que ver con el lenguaje. 2º sistema de señales: el lenguaje. También se centraban en el uso de la instrucción verbal y la función directiva que tiene el lenguaje sobre la conducta. Condicionamiento semántico. Condicionamiento efectivo de un reflejo a una palabra u oración en cuanto a su significado independientemente del aspecto visual o del sonido. En los estudios se condicionaba el significado, ya que cuando se nombraba algún sinónimo la salivación también se producía, pero con palabras homónimas no se producía la salivación. Pavlov afirmaba que se podía condicionar con el 1er. y 2º sistema de señales, y los estudios han demostrado que estaba en lo cierto. El condicionamiento con el 1er. sistema de señales es más rápido que con el 2º. El condicionamiento basado en el significado tiene una limitación temporal, y sólo se da a partir de la edad escolar. Para niños muy pequeños (0 a 8 años) el condicionamiento se basa en estímulos físicos. Hay un proceso desde el nacimiento hasta la edad adulta según el cual cada vez nos vamos fijando más en aspectos de significado y cada vez menos en lo físico. Cuando se emplean palabras como ECs se condicionan características del estímulo, tanto físicas como de significado. El condicionamiento del significado se llama condicionamiento semántico y la intensidad relativa del condicionamiento de este tipo aumenta con la edad, el número de ensayos y la ausencia de drogas que interfieran con las funciones corticales superiores. RAZRAN examinó la generalización de una respuesta de salivación condicionada a palabras como style (estilo) y urn (tetera) después de emparejar las palabras entrenadas con estímulos tales como pretzels (galleta) y candy (bombón). Razran comprobó que las palabras sinónimas y homófonas a los estímulos entrenados producían también la respuesta de salivación y que la cantidad de generalización aumentaba con el grado de semejanza semántica. • DESARROLLOS ESTADOUNIDENSES Respuesta emocional condicionada (REC). Se utiliza como una técnica de medida de la RC. Lo desarrollan Estes y Skinner. Hipoactividad prolongada o respuesta de paralización ante un EC emparejado con un estímulo doloroso. Pasos para provocar una REC: 1º MOLDEAMIENTO (shaping). Hace falta coger la respuesta que quieres conseguir y fragmentarla en pequeños pasos o componentes. Ir administrando una consecuencia positiva hasta que se de la respuesta deseada. 12 2º TONO − SHOCK (EC) (EI) 3º DISMINUYE TASA de oprimir la palanca cuando suena el tono. Hasta que suceda el shock, después vuelve a presionar la palanca. El SREC o procedimiento de supresión condicionada mide los decrementos de las tasas de respuesta instrumental en presencia de un EC − EI adverso en relación con las tasas de respuesta dadas en ausencia del EC. Precondicionamiento sensorial. Brodgen obtuvo el fenómeno por primera vez en 1939. Utiliza un paradigma pavloviano, pero con el método de Betcherev (tono − shock pata − flexión de la pata). Luz − sonido Luz ! shock (EI) ! flexión (RI) EC2 EC 1 RC Ejemplo de precondicionamiento sensorial: un vecino tiene un perro, que un día te ataca. Tras el suceso, la simple visión del vecino (sin el perro) provoca nerviosismo. Consiste en aparear dos señales durante varios ensayos. Una de ellas, después se aparea a un EI; se comprueba posteriormente que la respuesta condicionada también se da al segundo estímulo. Una explicación es que al presentar luz y sonido juntos, ambos funcionan como un solo estímulo compuesto. Este condicionamiento se da mejor cuando el EC2 precede en varios segundos al EC1, y cuando este par se presenta en un número reducido de ensayos. El mecanismo que parece que está operando ahí es un mecanismo de mediación, porque cuando se extingue la RC a una de las señales, también se extingue en la otra. Sombreado y bloqueo. Aunque en laboratorio manejamos estímulos aislados, en el mundo real el condicionamiento clásico mayoritariamente se produce por estímulos compuestos. Por eso también en laboratorio una de las cosas que se ha estudiado es el papel relativo que tienen los integrantes de los estímulos compuestos. Se ha comprobado que en los estímulos compuestos los componentes dinámicos o intermitentes (destellos luminosos, sonidos penetrantes) sobresalen más (tienen más poder) para provocar RCs que los estímulos estáticos. El sombreado es cuando un estímulo más saliente se condiciona más que otro no saliente que se presenta a la vez. Las señales verbales son más fuertes que las de otro tipo, de tal manera que la señal verbal en un estímulo compuesto ensombrece los componentes no verbales. El bloqueo es un sombreado provocado por un condicionamiento previo. KAMIN: Hizo un experimento que utilizaba una REC (respuesta emocional condicionada). Quería demostrar que el 13 sombreado se podía manipular. 1º) Presión palanca − alimento 2º) luz − descarga (G1) EC EI 3º) Divide el grupo en dos: G1a. Luz − tono − descarga. G1b. Tono − descarga. 4º) G1a. El tono queda ensombrecido y no provoca RC. Sólo la luz provoca RC. G1b. La luz provoca RC. Con el experimento demostró que se podían ensombrecer estímulos mediante la manipulación. Factor sorpresa: Mackintosh explica el fenómeno del sombreado por el efecto sorpresa. • Presión palanca − comida • EC1 EI EI (G1) • (G1A) EC1 EC2 EI ; (G1B) EC1 EC2 EI EI • (G1A) EC2 si RC; (G1B) EC2 bloqueado, no RC En el grupo G1A ha habido un cambio (un elemento sorpresivo), la supresión de uno de los 2 EI, por lo cual ha habido factor sorpresa y si que ha condicionado el EC2 OTROS ASPECTOS DEL CONDICIONAMIENTO CLÁSICO • Condicionamiento de orden superior. • Generalización. • Condicionamiento vicario. Condicionamiento de orden superior Una vez se ha asociado un EC con un EI, la presentación del EC junto con otro estímulo neutro (EC2), dota a este último estímulo con la capacidad de provocar la RC. Este tipo de condicionamiento de orden superior se denomina de segundo orden. La RC producida por el EC2 es más débil (la mitad, aproximadamente). La de tercer orden aún es más débil. Es muy difícil conseguir el condicionamiento de orden superior. Rescorla lo explica diciendo que durante el emparejamiento EC1 − EC2, también se condiciona la inhibición de la respuesta, ya que se presentan los EC con ausencia de EI. Generalización La generalización hace que respondamos con una RC ante estímulos similares al EC, aunque no totalmente iguales. Por ejemplo: condicionamos un tono de unos determinados db. Presentamos otro tono con otras 14 características diferentes, para ver si también produce RC. Cuanto más se alejan las características del tono presentado a las del tono condicionado, menos RC se produce, creando un gráfico llamado gradiente de generalización. Condicionamiento vicario Una persona puede aprender a responder ante un estímulo como consecuencia de la observación de las experiencias de otras personas. La adquisición a través de la observación de la capacidad de un EC para provocar la RC se denomina condicionamiento vicario. No siempre adquirimos una RC después de observar las experiencias de otras personas. Para que se produzca el condicionamiento vicario tenemos que responder emocionalmente ante la escena que presenciamos. Tenemos que encontrarnos en un estado de activación (tampoco demasiado alto) para adquirir respuesta condicionada a través de la observación de las experiencias de otras personas. • NATURALEZA DEL CONDICIONAMIENTO CLÁSICO • MODELO ASOCIATIVO DE RESCORLA Y WAGNER Es una de las propuestas para explicar el mecanismo por el cual el valor informativo del estímulo afecta al CC. • Hay una fuerza asociativa máxima (fasoc) que puede desarrollarse entre un EC y un EI. Cada EI aporta diferentes niveles máximos de condicionamiento. • Aunque la fuerza asociativa aumenta en cada ensayo de condicionamiento, la cantidad de fuerza asociativa adquirida en un ensayo de entrenamiento particular está determinada por el nivel de entrenamiento previo. Se acumulará más fuerza asociativa en los primeros ensayos de entrenamiento que en los posteriores. El incremento disminuye con los emparejamientos EC − EI. • La tasa de condicionamiento varía dependiendo del EC y del EI utilizados. Algunos estímulos acumulan rápidamente fuerza asociativa, otros la adquieren lentamente. Algunos EIs producen un aprendizaje más rápido que otros. • El nivel de condicionamiento en un ensayo particular está determinado no sólo por la cantidad de condicionamiento previo de ese estímulo, sino también por el nivel de condicionamiento previo de otros estímulos asociados con el mismo EI. Un EI particular puede aportar solamente una cierta cantidad de condicionamiento aun cuando se empareje más de un estímulo con ese EI. Cuando se presentan dos o más estímulos, éstos deben compartir la fuerza asociativa que aporta el EI. Ecuación matemática de Rescorla y Wagner Cambio producido en la fuerza asociativa en un ensayo determinado EC − EI: VA = K ( − VAX) • VA ! Cambio producido en la fuerza asociativa entre el ECa y el EI. • K ! La tasa de condicionamiento que está determinada por la naturaleza del EC y por la intensidad del EI. El valor de K puede descomponerse en: ♦ = poder del ECA y = intensidad del EI. • ! nivel máximo de condicionamiento que puede aportar el EI. • VAX ! nivel de condicionamiento que ha acumulado conjuntamente el EC y demás estímulos presentes durante el condicionamiento. (Por tanto Vax = Va + Vx). Ejemplo del modelo aplicado al fenómeno del bloqueo. 15 • Sea K = 0.50. • Sea = 90 • Sea Va = 0 • Ensayo 1: Va = 0.50 (90 − 0) = 45 • Ensayo 2: Va = 0.50 (90 − 45) = 22.5 • Ensayo 3: Va = 0.50 (90 − 67.5) = 11.3 • Ensayo 4: Va = 0.50 (90 − 78.8) = 5.6 • Ensayo 5: Va = 0.50 (90 − 84.4) = 2.8 • = 87.2 Tras 5 ensayos sólo restan 2.8 unidades asociativas. Es como si se fuera sustrayendo fuerza asociativa. ANOTACIONES RESPECTO A LA NATURALEZA DEL CONDICIONAMIENTO Las teorías más tradicionales asumen que el nivel de aprendizaje se mantiene constante después del entrenamiento. Sobre este presupuesto están Rescorla, Wagner, Mackintosh. Se les ha llamado también teorías basadas en el input. Esto es suponer que el aprendizaje es una representación estática del grado de correlación entre los estímulos. Hay otra perspectiva acerca del tema, que viene a decir que el nivel de condicionamiento de un EC puede cambiar aunque no haya más emparejamientos EC − EI. Esta teoría asume que se puede producir procesamiento retroactivo, es decir, que aparezca nueva información que hace que el sujeto reevalúe la experiencia pasada y se forme una nueva representación de la relación entre el EC y el EI. 3. EL CONDICIONAMIENTO OPERANTE • NOCIONES INTRODUCTORIAS • INTRODUCCIÓN El aprendizaje por las consecuencias. Antecedentes. La ley del efecto de Thorndike. Skinner y la noción de probabilidad de respuesta. Método y técnica de moldeamiento. • DEFINICIÓN Y CONCEPTO • Términos básicos. Operante. Refuerzos: tipos. • Relación entre respuestas y refuerzo. Relaciones de contingencia. Paradigmas de Condicionamiento Operante. 16 • Programas de Refuerzo. Según criterios de frecuencia de respuesta. Según criterios temporales. • CONDICIONAMIENTO DE RECOMPENSA • FACTORES QUE INFLUYEN EN LA ADQUISICIÓN DE LA CONDUCTA INSTRUMENTAL La demora de recompensa. La magnitud de la recompensa. • EL PRINCIPIO DE PREMACK Y LA NATURALEZA DEL REFORZAMIENTO • LA EXTINCIÓN Y LOS FACTORES QUE CONTRIBUYEN A LA RESISTENCIA A LA EXTINCIÓN La magnitud de la recompensa durante la adquisición. La demora de la recompensa durante la adquisición. La consistencia del reforzamiento durante la adquisición. • CONDICIONAMIENTO DE ESCAPE • FACTORES QUE AFECTAN A LA EFICACIA DE LA CONDUCTA DE ESCAPE La intensidad del estímulo aversivo. La magnitud de la recompensa. Demora de la recompensa. • EXTINCIÓN Por supresión del Refuerzo Negativo. Por ausencia del estímulo aversivo. • CONDICIONAMIENTO DE EVITACIÓN • CARACTERÍSTICAS • FACTORES QUE AFECTAN LA EXTINCIÓN Intensidad del estímulo aversivo. Intervalo entre estímulos. • CASTIGO • EL CASTIGO Y SUS TIPOS • FACTORES QUE AFECTAN A LA EFICACIA DEL CASTIGO • EFECTOS DEL CASTIGO • RESUMEN • NOCIONES INTRODUCTORIAS • INTRODUCCIÓN 17 El aprendizaje por las consecuencias Los antecedentes del condicionamiento operante están en Thorndike. Se sitúa en la época en la que se produce el gran impacto de la teoría evolucionista, que coloca a las especies en una escala evolutiva, incluida la especie humana. Thorndike− La caja problema. Utilizaba gatos hambrientos, a los que ponía la comida en el exterior de la caja. Los introducía en la caja, y al final, por ensayo y error, el animal conseguía salir. Trazó una curva con lo que el animal tardaba en salir de la caja en cada ensayo. Al final, el gato salía automáticamente Ley del efecto de Thorndike La asociación E − R se establecía debido a que el gato era recompensado. Thorndike denominó ley del efecto a este fortalecimiento de la asociación debido a un acontecimiento satisfactorio o recompensa. Su complementaria es la ley del ejercicio: cuando a una determinada situación le sigue frecuentemente una cierta respuesta o grupo de respuestas, el vínculo entre el estímulo y la respuesta se fortalece por la práctica. Skinner y la noción de probabilidad de respuesta El trabajo de Skinner se basa en estudios anteriores, como el de Thorndike. Para llegar a las últimas consecuencias de la ley del efecto de Thorndike, necesitamos poner en claro la noción de probabilidad de respuesta, que salva un problema que se da en la ley del efecto de Thorndike. Este último afirma que la respuesta, o se da o no se da. Skinner, con la probabilidad de respuesta, permite que haya una oscilación entre darse y no darse. Basa la probabilidad de respuesta en la frecuencia. CAJA DE SKINNER Moldeamiento− Técnica para la adquisición de una conducta deseada que consiste en seleccionar primero una conducta operante con una tasa alta y posteriormente ir cambiando la contingencia (relación establecida entre una conducta particular y el reforzamiento) hasta que se aprende la conducta deseada. • DEFINICIÓN Y CONCEPTO Skinner no era partidario de utilizar el término respuesta, pero en la actualidad si que se utiliza. Él utilizaba el término operante para denominar a un determinado tipo de respuesta. En el condicionamiento operante fortalecemos una operante, en el sentido de hacer que la respuesta sea más probable o frecuente mediante el refuerzo. En el condicionamiento pavloviano incrementamos la magnitud de la respuesta provocada por el EC y acortamos el tiempo que trascurre entre el estímulo y la respuesta. SKINNER: Hay un gran repertorio de conductas dadas por el equipo biológico, es decir, conductas innatas. Muchas de estas conductas se adquieren porque van seguidas de una consecuencia, que si es positiva, refuerza el comportamiento. El condicionamiento no es sólo los antecedentes y las consecuencias, también influye el orden de las consecuencias, que podemos manipular. No es lo mismo dar una bola de comida por cada picoteo que por cada 10. Fases en el condicionamiento operante 18 • Habituación. • Moldeamiento. Moldear la conducta del animal, para que sepa que si realiza una determinada acción, obtendrá el alimento. • Reforzamiento continuo. Se le da comida cada vez que repite la conducta. Según cual sea el orden de la conducta cambiará también el comportamiento, por ejemplo, si se le da comida cuando ha apretado 50 veces la palanca, apretará muchas más veces que si se le da la comida cada vez que aprieta la palanca. El 4º paso sería la extinción, que consiste en que desaprenda lo aprendido. Este es un proceso más difícil. También depende del orden de consecuencia con que se haya llevado a cabo el aprendizaje. Consecuencia a la emisión de la conducta: PRESENTACIÓN (contingente) Estímulo + (apetitivo) RECOMPENSA (procedimiento de refuerzo positivo) ENTRENAMIENTO EN OMISIÓN RETIRADA (CASTIGO NEGATIVO) (contingente) SUPRESIÓN COSTE RESPUESTA (por ejemplo: una multa) Estímulo − (aversivo) CASTIGO (castigo punitivo) ESCAPE EVITACIÓN (procedimiento de refuerzo negativo) TIEMPO FUERA (por ejemplo: castigar al niño en su cuarto) Condicionamiento de recompensa ! función que define el incremento en la frecuencia o en el vigor de una respuesta por seguirse de ella una contingencia positiva. Condicionamiento de escape ! función que define el incremento o frecuencia o vigor de una respuesta por seguirse de ella desaparición o supresión de estimulación aversiva. Condicionamiento de evitación ! función que define el incremento o frecuencia o vigor de una respuesta por seguirse de ella la evitación de la aparición de estimulación aversiva. Condicionamiento de castigo ! función que define la supresión de una respuesta por seguirse de ella presentación de estimulación aversiva. Castigo negativo, entrenamiento en omisión ! función que define la supresión de una respuesta por seguirse de ella la desaparición o ausencia o disponibilidad del estímulo positivo. PARADIGMAS DE REFORZAMIENTO • Si la conducta aumenta se tratará de recompensa o refuerzo negativo. • Si la conducta disminuye se tratará de castigo u omisión. No se puede determinar a priori lo que es positivo o negativo. Depende del sujeto del que estemos hablando. 19 Reforzamiento: • Continuo. Se da la recompensa cada vez que se produce la conducta. • Intermitente. Sólo se da la recompensa en algunos momentos en los que se da la conducta. Ejemplo: las máquinas tragaperras. Refuerzo negativo: • Evitación. Un estímulo indica que se va a producir una situación aversiva. Ejemplo: un semáforo indica que no puedes pasar. • Escape. El sujeto se encuentra en situación aversiva y mediante su conducta puede hacer que esta cese. Registro acumulativo ! Aparato para determinar la frecuencia de la conducta operante. La tasa de respuesta de la conducta operante depende del tipo de refuerzo y de la contingencia existente (si es fuerte o débil). Condicionamiento operante: • De razón. El refuerzo se presenta en función del número de respuestas. • De intervalo. El refuerzo se produce cuando pasa un determinado intervalo de tiempo ESQUEMA PARA CLARIFICAR LOS PARADIGMAS DE CONDICIONAMIENTO OPERANTE Si la consecuencia a la emisión de la conducta es la PRESENTACIÓN contingente: • De un estímulo +: CONDICIONAMIENTO DE RECOMPENSA O PROCEDIMIENTO DE REFUERZO POSITIVO. • De un estímulo −: CASTIGO (castigo positivo) o CASTIGO PUNITIVO. Si la consecuencia a la emisión de la conducta es la RETIRADA contingente: • De un estímulo + (apetitivo): ENTRENAMIENTO EN OMISIÓN O CASTIGO NEGATIVO (coste de respuesta). • De un estímulo − (aversivo): CONDICIONAMIENTO DE ESCAPE, EVITACIÓN. También llamado refuerzo negativo. Condicionamiento de recompensa: Función que define el incremento en la frecuencia o en el vigor de una respuesta por seguirse de ella una contingencia positiva. Condicionamiento de escape: Función que define el incremento en frecuencia o vigor de una respuesta por seguirse de ella una supresión o desaparición de estimulación aversiva. Condicionamiento de evitación: Función que define el incremento en frecuencia o en vigor de una respuesta por seguirse de ella la evitación de la aparición de estimulación aversiva. Castigo: Función que define la supresión de una respuesta por seguirse de ella presentación de estimulación aversiva. Castigo negativo: Función que define la supresión de una respuesta por seguirse de ella la desaparición, ausencia o disponibilidad del estímulo positivo. Estímulo discriminativo ! indica la disponibilidad del refuerzo. Puede indicar que está disponible o no 20 disponible. El estímulo discriminativo no provoca la respuesta (entonces sería un EC). Sólo muestra la disponibilidad para que la operante se emita o no se emita. Refuerzos positivos ! añaden algo a la situación. Una actividad cuya realización aumenta la frecuencia de la conducta que la precede. Refuerzos negativos ! aquellos cuya supresión refuerza la conducta. La terminación de un estímulo aversivo refuerza la conducta que pone fin a dicho estímulo. Contingencia ! relación establecida entre la conducta y el reforzamiento. Según Skinner, el ambiente determina las contingencias y las personas deben realizar la conducta apropiada para obtener el reforzador. Refuerzo condicionado ! El hecho de que determinados estímulos se asocien con refuerzos positivos primarios. Estos estímulos se transforman en refuerzos positivos secundarios. El refuerzo secundario más importante es el dinero. Diferencia entre condicionamiento operante y aprendizaje instrumental: Lo que distingue al condicionamiento operante del aprendizaje instrumental es que el sujeto tenga control o no sobre la frecuencia de las respuestas. Si no tiene control, es instrumental; si sí que tiene control, es operante. El experimentador limita las posibilidades de la respuesta en el instrumental, mientras que en el operante no las limita. PAUTAS DE PRESENTACIÓN DEL ESTÍMULO PROGRAMAS DE REFORZAMIENTO Simples: CONTÍNUO INTERMITENTE: Criterio frecuencia Razón fija (RF) (programas de razón) Razón variable (RV) Criterio temporal Intervalo fijo (IF) (programas de intervalo) Intervalo variable (IV) Compuestos. Un ejemplo de programa compuesto sería RF 3 IV5. Son combinaciones de los simples. RF: Por ejemplo RF 5: øøøøø!øøøøø! . Como la rata del video, que cada 5 presiones de palanca, le daríamos una bolita de comida RV: RV 5: øøø!øøøøøøø!øøøøøø!øøøø! . El promedio de número de respuestas que se debe dar es 5. IF 1: Durante 1 minuto, el comedero no está disponible. Pasado ese minuto, cuando el animal da la primera respuesta, obtiene la comida. Con este reforzamiento se da el festoneo ( Gráfica de la Pág. 156 del Klein) IV 3: El promedio de tiempo que transcurre el dispositivo bloqueado es 3. En la gráfica: cuanto más perpendicular quede la línea, más número de respuestas hay. • CONDICIONAMIENTO DE RECOMPENSA 21 • Factores que influyen en la adquisición de la conducta instrumental La importancia de la contigüidad. La demora de la recompensa: La contigüidad tiene un efecto importantísimo sobre la conducta instrumental: cuanto más próximos en el tiempo estén la respuesta y la recompensa, mayor es el condicionamiento. El aprendizaje instrumental se deteriora si se demora la recompensa. A mayor demora, menor condicionamiento, y se necesita un mayor número de ensayos. La magnitud de la recompensa: a mayor magnitud de la recompensa, mayor es el nivel de la respuesta instrumental. La probabilidad y la intensidad de una respuesta instrumental dependen de la magnitud de la recompensa. Para comprobar si esto sucede por aprendizaje o por motivación, se sigue unos procedimientos. Primero se comienza con una recompensa baja y la vamos subiendo poco a poco. Otra opción es empezar con una recompensa alta e ir bajando poco a poco. Si se produce un cambio gradual en la respuesta, se trata de aprendizaje. Si el cambio es brusco, hablamos de motivación. Efecto de DEPRESIÓN. Proceso por el cual un cambio en la magnitud de la recompensa de un valor alto a uno bajo produce un nivel de conducta instrumental menor del que sería de esperar si la recompensa siempre hubiese sido baja. Efecto de ELACIÓN. Aumento en la ejecución producido al cambiar la recompensa de baja a alta, en comparación con la producida con una recompensa alta y constante. Ver gráfica Pág. 167. El contraste negativo se explica mediante la frustración, que genera una ansiedad que interfiere en la ejecución de la tarea. Al administrar barbitúricos, esta ansiedad desaparece, y también desaparece el contraste negativo. Para el contraste positivo no hay explicación. • El principio de Premack y la naturaleza del reforzamiento El principio de Premack está encuadrado en todo lo que es estudiar las condiciones bajo las cuales un evento ambiental es reforzante. Skinner nunca habló de la naturaleza del reforzamiento, él era totalmente ateórico. TEORÍA DE LA PROBABILIDAD DIFERENCIAL DE PREMACK El reforzamiento no son cosas, son las actividades las que son reforzantes. Un reforzador es cualquier actividad cuya probabilidad es mayor que la de la conducta reforzada. Premack afirma que el reforzante no es la comida, sino la acción de consumir la comida. Dado que comer es una conducta más probable que presionar la palanca, comer puede reforzar la respuesta de presión de palanca. Este trabajo está dentro del contexto de trabajo de investigación que estudia la naturaleza del reforzamiento, y ha tenido mucha repercusión. Es importante recordar que las actividades pueden ser reforzantes. 22 Este trabajo también se utiliza para reducir conductas no deseadas, como por ejemplo gritar. • LA EXTINCIÓN y los factores que contribuyen a la resistencia a la extinción. La respuesta operante y la instrumental se puede extinguir si el refuerzo deja de darse. Si se suprime el refuerzo, la respuesta poco a poco va perdiendo fuerza hasta que deja de darse. Cuando se interrumpe el reforzamiento por primera vez, la tasa de respuesta aun sigue siendo alta, por tanto es sólo cuando se persiste en no presentar el reforzamiento cuando la respuesta deja de producirse. Recuperación espontánea: En un principio, una inhibición reactiva transitoria (Ir) suprime la respuesta debido a la fatiga producida cuando la conducta no obtiene refuerzo. La conducta instrumental reaparece cuando la fatiga se disipa. Si la conducta continúa sin ser reforzada, se desarrolla una inhibición condicionada permanente. La extinción no tiene como único efecto la inhibición. También existen efectos aversivos, como la frustración. La frustración, como todo lo aversivo, tiende a evitarse. Resistencia a la extinción de una respuesta instrumental 3 factores: • Magnitud de la recompensa durante la adquisición. • Demora de la recompensa durante la adquisición. • Consistencia del reforzamiento durante la adquisición. • Magnitud de la recompensa durante la adquisición. Depende del nivel de entrenamiento: • Si entrenamiento mínimo, a mayor magnitud, mayor resistencia. • Si entrenamiento prolongado, a más magnitud, menor resistencia. Explicación del fenómeno: Cuando estamos con la recompensa pequeña, durante la adquisición, un mecanismo que se llama respuesta anticipatoria de meta se desarrolla lentamente. Cuando llega el momento de la extinción, como la recompensa ha sido pequeña, hay muy poca frustración, y así, cuanto más ensayos de adquisición, más resistencia. Cuando estamos con la recompensa grande, al comenzar la extinción, el sujeto experimenta una gran frustración, que ayuda a la extinción. • Demora de la recompensa durante la adquisición. Cuando el tiempo de demora es variable, la resistencia a la extinción es mayor, pues el sujeto está acostumbrado a que la recompensa a veces tarda un poco más, y se queda esperando. Si la demora está entre 20−30 segundos, la extinción es más difícil, aunque también depende de la especie, la recompensa... • La consistencia del reforzamiento. 23 El refuerzo intermitente o parcial, provoca una mayor resistencia a la extinción, que cuando se trata de un refuerzo continuo. A eso se le llama efecto del refuerzo parcial. Pág. 183. RESUMEN La frecuencia e intensidad de la respuesta instrumental se incrementa durante la adquisición y disminuye durante la extinción. La ausencia del refuerzo lleva a una inhibición de la respuesta instrumental, y además también da lugar a frustración. La frustración se relaciona con conductas de escape y evitación ante estímulos asociados con la situación de ausencia de refuerzo. Hay 3 factores que afectan a la ausencia de la extinción: • Recompensa. Su efecto depende del nivel de entrenamiento. • Demora variable. Más resistencia a la extinción. • El refuerzo intermitente o parcial, más resistencia a la extinción. CONDICIONAMIENTO AVERSIVO La recompensa consiste en la eliminación del estímulo aversivo. El condicionamiento aversivo consiste básicamente en escapar de un estímulo aversivo, es decir, el sujeto aprende que haciendo una tarea evita el estímulo aversivo que se proporciona como recompensa. Ejemplo: cuando en un lugar te ocurre algo malo, después evitar pasar por allí, porque ese sitio te provoca ansiedad. La fobia es un miedo adquirido. Los estímulos que lo rodean son como señales de que viene el estímulo fóbico, es decir, que el individuo buscará conductas de evitación. Desensibilización sistemática. Relajación del sujeto mientras se imagina escenas que producen ansiedad. Inundación. Mantiene al sujeto expuesto al estímulo aversivo para que se de cuenta de que no pasa nada, de que no debe tener miedo. Finalmente, se extingue el miedo. En el condicionamiento aversivo se pueden dar dos tipos de situación: • Situación de escape. • Situación de evitación. ** Mucho cuidado en no confundir refuerzo negativo con aplicación de la estimulación aversiva. El refuerzo negativo está indicando que se elimina, se quita una conducta. El refuerzo negativo es una recompensa. Factores que afectan a la adquisición de la respuesta de escape 3 factores: • Intensidad del estímulo aversivo. • Mayor reducción de estimulación aversiva (en relación con intensidad). 24 • Demora en la terminación del aversivo. • Intensidad del estímulo aversivo. Yo puedo manipular la intensidad del estímulo aversivo, y así comprobar como afecta al comportamiento. A mayor intensidad del estimulo aversivo, más rápido se adquiere la respuesta de escape. • Mayor reducción de la intensidad del aversivo. Esto es equivalente a una mayor recompensa. Si eliminas una descarga de 300, esto es percibido como una recompensa mayor que si eliminas uno de 150. • Demora en la terminación del aversivo. A más demora, la adquisición es más lenta. La demora no afecta cuando hay claves secundarias que indican que viene la recompensa. Los refuerzos secundarios tienen un papel muy importante en neutralizar los efectos de la demora del refuerzo primario. Extinción de la respuesta de escape. Existen 2 vías para la extinción: • Supresión del reforzamiento negativo o supresión de la recompensa. Consiste en mantener la intensidad del estímulo aversivo; entonces la respuesta de escape deja de ser funcional para reducir o eliminar la estimulación aversiva. A mayor número de entrenamientos, mayor número de respuestas en la fase de extinción. • Ausencia del estímulo aversivo. Aunque desaparezca el estímulo aversivo, la respuesta de escape seguirá dándose durante algún tiempo. Esto se debe al miedo condicionado (respuesta anticipatoria de dolor). EVITACIÓN Lo que se suele hacer es evitar la estimulación aversiva cuando se sabe que ésta se va a producir. 2 tipos de evitación: • Activa. Hacer algo para evitar algo. Ejemplo: las excusas. • Pasiva. Dejar de hacer algo para evitar. Ejemplo: no presentarse a un examen. El condicionamiento aversivo se puede producir con un solo ensayo. Teoría bifactorial de Mowrer Afirma que la conducta de evitación no está motivada para prevenir un acontecimiento aversivo. En realidad escapan de un estímulo que provoca miedo. Su conducta es una respuesta de escape ante un estímulo que produce miedo y no una respuesta para evitar un acontecimiento aversivo. Viene a decir que no es una conducta de escapar de algo, sino que es una conducta para evitar el miedo que le produce un estímulo. Este miedo se produce por condicionamiento clásico; la segunda parte de la respuesta, es 25 decir, la conducta de evitación, se produce por condicionamiento operante. 2 factores: • Se condiciona como una respuesta de miedo. • Escapar de la estimulación aversiva. Ejemplo: condicionas luz como EC, como si fuera un estímulo aversivo, como una descarga eléctrica. El animal evitará la luz para evitar la situación de miedo que le produce la descarga eléctrica. 4 problemas surgidos de esta teoría: • Los experimentos demuestran que aunque el EC deje de ser seguido de la estimulación aversiva, es muy difícil la extinción de lo aprendido. En realidad, lo lógico sería que una vez descondicionado el EC a la situación aversiva, desapareciese la conducta de evitación o de escape del miedo; pero esto no es lo que ocurre. • Ausencia aparente de miedo cuando la respuesta de evitación está bien establecida. En este nivel ¿cómo funcionan? Aquí ya no responden al condicionamiento de evitación porque escapen del miedo. • Paradigma de evitación de Sidman. Sidman quería saber como conseguir un condicionamiento de evitación sin que hay señal (EC). 2 factores a tener en cuenta para conseguir esto: ♦ La distancia o intervalo entre estímulos. ♦ El intervalo de tiempo fijado que tiene que transcurrir después de que la rata de respuesta por 1ª vez a un estímulo. El animal recibe exposiciones periódicas al acontecimiento aversivo, a no ser que la rata responda impidiendo su presentación. La respuesta hace que se demore la aparición del siguiente estímulo aversivo durante un periodo de tiempo determinado. El intervalo entre las presentaciones del acontecimiento aversivo se denomina E−E, y el tiempo durante el cual se demora el estímulo aversivo sería el intervalo R−E. Si el animal responde consistentemente antes de que finalice el intervalo R−E, no experimentará el estímulo aversivo. En este procedimiento no se presenta ningún estímulo condicionado que provoque miedo antes de la respuesta de evitación, lo cual se supone que impediría el aprendizaje de evitación. No obstante, se ha observado que los animales aprenden bajo estas circunstancias. • Trabajo de Kamin. Tiene 4 grupos: • Evitación tono−shock. Interrupción EC, impedía aparición EI. • Hace que la conducta del sujeto pare el tono, pero el shock persiste. Paran EC, pero persiste EI. • La conducta para el shock, pero el tono persiste. Desaparece EI, pero persiste EC. • Condicionamiento clásico EC−EI. (tono−shock). Al contrario de lo que predice la teoría de Mowrer, el grupo que mostró una mayor conducta de evitación fue el 3 (evitación del EI, persistencia EC). Con este trabajo estudió el papel que tiene la señal y el papel del estímulo aversivo. Vio que estos 2 factores también son importantes, además del miedo y la evitación del miedo. Factores que afectan a la adquisición de la respuesta de evitación • Intensidad del estímulo aversivo. 26 Conducta de evitación pasiva. Cuanto más intensa es la estimulación aversiva, más rápido se produce la adquisición. Conducta de evitación activa de un sentido. Al incrementar intensidad, más rápida es la adquisición y el nivel de ejecución es mayor. Conducta de evitación activa de dos sentidos. Adquisición y ejecución se deterioran cuando aumenta la intensidad del estímulo aversivo; se produce un conflicto de intereses entre alejarse del estímulo que provoca el miedo y dirigirse al lugar donde se presentó el estímulo aversivo • Intervalo de demora entre el EC y el EI. El nivel de condicionamiento del miedo depende del intervalo EC−EI; cuanto más largo es el intervalo, menor es el condicionamiento de la respuesta de miedo. La adquisición de la conducta de evitación es más lenta cuanto más largo es el intervalo EC−EI. Aplicación. Extinción de las fobias. Watson sugirió que las fobias son conductas de evitación aprendidas. En las fobias, los estímulos que rodean al sujeto son como señales que anuncian el estímulo fóbico; por eso el sujeto realizará conductas de evitación. Por ello, cabe suponer que las técnicas de extinción de la respuesta de evitación son válidas para tratar las fobias. Existen dos tratamientos diferentes para las fobias: desensibilización sistemática (consiste en el condicionamiento de una respuesta de relajación ante estímulos que están provocando la ansiedad) y la técnica de inundación. La inundación mantiene al sujeto en contacto con el estímulo fóbico para que establezca la conexión de que no pasa nada. La eficacia de la inundación aumenta al incrementar el tiempo de exposición al estímulo de miedo. Es más eficaz que el procedimiento de extinción. La extinción de la respuesta de miedo no es por completo responsable de la eficacia del procedimiento, ya que se puede extinguir una respuesta de evitación, aunque no aparezca una reducción del miedo. La extinción de la contingencia de evitación puede producirse sin la extinción del condicionamiento pavloviano del miedo. CASTIGO Dos tipos de castigo: castigo positivo o punitivo y castigo negativo (tiempo fuera o coste de respuesta). En el castigo positivo se refiere a la utilización de un evento físico o psicológicamente doloroso como castigo. En el castigo negativo el reforzamiento se pierde o no está disponible como consecuencia de la realización de una conducta inapropiada (también llamado entrenamiento de omisión). Existen dos tipos: coste de respuesta y tiempo fuera. Coste de respuesta: la respuesta no deseada hace que se retire o que no se pueda obtener el reforzamiento. Ejemplo: un empleado pierde su empleo por llegar tarde. Tiempo fuera: tras la respuesta no deseada, se produce un período de tiempo durante el cual el reforzamiento no está disponible. Ejemplo: un soldado que es enviado al calabozo por ausentarse del cuartel. La eficacia del castigo ha sido muy cuestionada 27 Factores que afectan al castigo Intensidad. Cuanto más intenso es el castigo, más intensa es la supresión. También es importante para determinar si la supresión de la conducta será permanente o temporal. Consistencia. Un castigo no producirá la supresión de la conducta por intenso que sea si a su vez no es consistente. Para que el castigo elimine eficazmente la conducta inapropiada, esta se debe castigar cada vez que ocurra. Demora. El castigo es menos eficaz cuanto mayor es la demora entre conducta inapropiada y castigo. Consecuencias del castigo Agresión inducida por el dolor. Al recibir el castigo, los sujetos experimentan dolor. Este dolor puede producir una emoción de ira, que a su vez activa una conducta de agresión. La condición agresiva subsecuente reduce el nivel de activación. El castigo no siempre produce agresión. Cuando a ese mismo sujeto se le ha reforzado por mostrar reacciones no agresivas ante la estimulación aversiva o cuando han sido previamente castigados por mostrar respuestas agresivas. Todas las personas no reaccionan emocionalmente igual ante estímulos aversivos. Modelado de la agresión. Los niños imitan las conductas que ven. Por ello, un niño castigado también puede aplicar el castigo que él ha recibido a otros niños. También existen estudios que demuestran una relación entre el uso del castigo por parte de los padres y el nivel de conducta agresiva de sus hijos. Propiedades aversivas del que administra el castigo. El niño puede adquirir un miedo condicionado a la persona que le castiga, lo que le lleva a mostrar conductas de evitación. Esto se ve reducido si la misma persona que administra el castigo reparte recompensas cuando el niño muestra una conducta positiva. Otros efectos del castigo. Los efectos supresores del castigo pueden generalizarse a otras conductas que no son tan indeseables. Si el sujeto no relaciona la conducta con el castigo (por ejemplo, con la demora), se crea un estado de indefensión, y conducir a un estado depresivo, si el sujeto no percibe que tenga control. Aplicación del castigo Castigo punitivo. Se ha utilizado con eficacia para suprimir una amplia variedad de conductas no deseadas (vómitos, ideación obsesiva, alucinaciones, automutilación y rabieta en niños autistas y retrasados...). Coste de respuesta. Ha eliminado conductas como fumar, comer de forma excesiva, tartamudeo, habla psicótica, agresividad, tardanza, habla perseverante, ansiedad y conductas depresivas e hiperactivas. Tiempo fuera. Pérdida del reforzamiento durante un periodo de tiempo. Elimina sólo conductas que provocan la retirada del reforzamiento. Empleo ético de castigo. El castigo corporal tiene riesgo de desviarse y llegar a ser un abuso físico. Existen numerosos estudios para delimitar qué es abuso físico y que no. 28 El castigo punitivo (pegar) ha creado numerosos debates éticos. TEMA 4. CONTROL CONDUCTUAL • CONTROL CONDUCTUAL POR EL ESTIMULO GENERALIZACIÓN Responder ante estímulos similares al presentado durante el entrenamiento. En algunos casos es deseable (por ejemplo, afición a los libros), y otros indeseable (ejemplo: racismo) Gradientes de generalización Representación gráfica de la fuerza de la respuesta producida por distintos estímulos que varían en cuanto a su grado de semejanza con el estímulo presentado durante el entrenamiento. Muestran el nivel de generalización producido ante estímulos similares al presentado durante el condicionamiento. Un gradiente de generalización inclinado indica que el sujeto sólo responde a los estímulos que son muy similares al estímulo presentado en el entrenamiento. Un gradiente de generalización plano muestra que la respuesta se produce incluso ante estímulos que son muy diferentes al condicionado. Hay dos tipos de generalización: Excitatoria: Estímulos que se asocian con la presencia del estímulo ! RESPONDER Inhibitoria: Estímulos que se asocian con la no presencia del estímulo!NO RESPOND. La naturaleza del proceso de generalización Según Lashley y Wade, los animales y las personas responden ante estímulos diferentes al del entrenamiento debido a que no logran distinguir entre el estímulo presentado durante la prueba de generalización y el estímulo condicionado. La generalización del estímulo se debe a una incapacidad para discriminar entre los dos estímulos. 4 evidencias sostienen la afirmación: • Cuando no hay reforzamiento diferencial y sólo se utiliza un estímulo de entrenamiento hay generalización a cualquier estímulo. Gradiente de generalización plano. • Cuando hay reforzamiento diferencial, y por tanto entrenamiento en discriminación, entonces se produce generalización sólo ante estímulos muy próximos al estímulo de entrenamiento. (Gradiente de generalización más agudo) • Cuando la discriminación es fácil entre el estímulo que está indicando disponibilidad y el que no está indicando disponibilidad, la generalización es muy poca o ninguna. (Gradiente de generalización agudo) • Los niveles de experiencia perceptiva afectan a la generalización. Baja experiencia perceptiva ! baja discriminación ! mayor generalización. DISCRIMINACIÓN Se trata de aprender a discriminar los estímulos que indican disponibilidad y los que no indican 29 disponibilidad. 3 tipos de discriminación: • Con 2 alternativas: se están utilizando 2 estímulos de la misma modalidad sensorial. Ejemplo: discriminar entre dos colores. Al principio la tasa de respuesta ante cada color es semejante, pero poco a poco va aumentando la discriminación. Fenómeno de contraste conductual. Un niño se porta mal en su casa y en la escuela. El maestro comienza a castigar su mala conducta, y el niño se porta bien en el colegio. Pero entonces, como en casa no le castigan, se porta todavía peor allí. Al dejar de portarse mal en clase, empieza a portarse aun peor que antes en casa. • Condicional: No hay un estímulo específico que siempre señala disponibilidad. Hay una condición para que el estímulo señale disponibilidad. Ejemplo: un niño que sabe que sus padres sólo le dan dinero si lo pide delante de algún otro familiar. Discriminación irresoluble Pavlov observó que si primero enseñaba a sus perros a discriminar entre dos estímulos diferentes (círculo, indica disponibilidad; elipse, no disponibilidad), y después hacía que estos dos estímulos fuesen tan parecidos que el animal no pudiese distinguir entre ellos, el perro caía en un estado de ansiedad. Pavlov llamó a este estado provocado por la incapacidad para discriminar neurosis experimental. También puede ocurrir cuando el animal percibe la diferencia entre los 2 estímulos, pero la recompensa se asocia aleatoriamente con uno de ellos. Cuando una tarea es irresoluble, el sujeto queda fijado en este molde, y es incapaz de resolver la tarea, incluso cuando esta se convierte en resoluble. Esto indica la importancia del valor informativo de los estímulos para la discriminación. Hay necesidad informativa, y cuando esta no se produce, se producen grandes trastornos, debidos únicamente a la incertidumbre, sin que existe dolor físico. Fases de la discriminación: • Diferenciación del estímulo. • Atención selectiva. Tienen que atender a las dimensiones relevantes de los estímulos. • Selección por el estímulo. Los estímulos discriminativos tienen que ganar control sobre la conducta de los sujetos. • CONTROL DE LA CONDUCTA POR LA COGNICIÓN Cognición: conocimiento que un sujeto tiene sobre el ambiente y su estructura. Estos conocimientos gobiernan nuestra conducta. TOLMAN Y EL CONDUCTISMO PROPOSITIVO Dice que hay determinantes comportamentales de las respuestas, y que estos determinantes son el propósito y las cogniciones. La conducta está motivada por propósitos y expectativas. Para inferir propósito en la conducta, debemos observar que existe: 30 • Persistencia (observar que hay insistencia). • Docilidad (flexibilidad en seleccionar los mejores medios). Infiere cogniciones por las conexiones que establece el sujeto entre medios y fines (mapa cognitivo). También infiere las cogniciones por las expectativas. A un organismo le impulsa la necesidad, pero el comportamiento propositivo (persistente y flexible) es guiado por las cogniciones (relaciones medio−fin) y los incentivos. 3 bloques de experimentos para demostrar esto: • Aprendizaje de lugar. • Aprendizaje latente. • Mostrar las expectativas. • Estudios sobre aprendizaje de lugar. Experimentos con laberintos en T. En uno de los estudios se intentaba diferenciar entre la conducta basada por los hábitos y la basada por la localización espacial. El grupo de la condición aprendizaje de respuesta, recibía la recompensa si giraba hacia una dirección específica, independientemente del lugar (ejemplo: recompensa sólo cuando gira a la izquierda, independientemente del punto de partida). El grupo de aprendizaje de lugar, la recompensa siempre estaba en el mismo lugar, y la rata debía girar a un lado u otro dependiendo del punto de partida. El grupo de aprendizaje de respuesta obtuvo malos resultados; tardaron mucho en aprender, y aun después de haber contestado correctamente, seguían cometiendo errores. Cuando existen claves extralaberínticas, se produce el aprendizaje de lugar. La conducta bien aprendida se rige habitualmente por procesos mecánicos y no por procesos cognitivos. (Se automatiza la conducta). También llamado sobreaprendizaje. • Aprendizaje latente. Tolman pensaba que no era necesaria la recompensa para aprender. De la simple exploración del ambiente se aprende, con ausencia de recompensa, pero que es la recompensa lo que motiva que la conducta se lleve a cabo. Aprender sin darse cuenta. El concepto de expectativa. Una expectativa es una representación mental de las contingencias entre acontecimientos ambientales. Esta representación contiene información tanto de las relaciones entre los estímulos experimentados previamente como de las relaciones entre la conducta y sus consecuencias. Dickinson. Hay dos tipos de conocimiento declarativo en una expectativa: ♦ Expectativa de una conexión asociativa. Permite que uno de los estímulos excite o inhiba la representación del otro estímulo. 31 ♦ Representación de la creencia conductual. Representaciones proposicionales como creencias según las cuales la acción A causa el resultado B. Creencia de que una acción causa un efecto. Conclusión: La conducta está controlada tanto por hábitos como por expectativas. Ejemplo: conducir al principio está controlado por la cognición, pero luego se automatiza y es controlado por hábitos. 5. APRENDIZAJE SOCIAL • INTRODUCCIÓN El aprendizaje social vicario o por observación. Imitación, identificación y modelado. • EFECTOS DEL MODELADO PSICOSOCIAL • Instructor • Inhibidor y desinhibidor. • Facilitación de la respuesta. • Incremento de la estimulación ambiental. • Activación emocional. • EL APRENDIZAJE POR OBSERVACIÓN Y SUS PROCESOS CONSTITUYENTES • Procesos de atención. • Procesos de retención. • Procesos de producción. • Procesos de motivación. • EL MODELADO ABSTRACTO Y LA ADQUISICIÓN DE REGLAS DE CONDUCTA • EL APRENDIZAJE POR EJECUCIÓN DESDE LA TEORÍA COGNITIVA • La influencia de las creencias sobre las consecuencias. • Las contingencias ilusorias. • RESUMEN • INTRODUCCIÓN APRENDIZAJE SOCIAL Todo lo que aprendemos por estar con los demás. El modelado es un medio muy poderoso. Aquí también entra lo que aprendemos a través de lo que otros han escrito. Se transmiten patrones, valores... Cada generación nueva parte de lo que ha adquirido la anterior; si no, cada generación tendría que partir desde cero, y esto no es así. BANDURA IMITACIÓN Reproducir actos específicos de otro. Proceso por el cual un organismo imite los actos de otro organismo, en un período de tiempo, por lo general corto. MODELADO 32 Se refiere a concepciones y reglas aplicables a un rango amplio. En la adquisición de una habilidad el modelado constituye una regla de aprendizaje, más que un acto imitativo. IDENTIFICACIÓN Según Bandura es la incorporación general de patrones de personalidad. Pero no existe acuerdo acerca de en que consiste la identificación, sino que encontramos varias líneas. IDENTIFICACIÓN IMITACIÓN • Requiere un vínculo con el modelo. • Se mantiene por una motivación intrínseca (similitudes que percibes entre tú y el modelo). • Se producen a veces en ausencia del modelo. • No requiere ningún vínculo con el modelo. • Mantenimiento por recompensas externas. • Imitación en presencia del modelo. Hay autores que dicen que la imitación produce identificación y hay quien dice que la identificación produce imitación. En la realidad empírica estos 2 bloques no están tan diferenciados. Las distinciones están poco apoyadas empíricamente, debido a: • Los factores que intervienen en el aprendizaje observacional son los mismos con conductas específicas que con conjuntos de conductas. • Toda información modelada que haya de retenerse como guía de la conducta tiene que representarse simbólicamente. • La presencia o ausencia de modelo no comporta procesos distintos de aprendizaje. • Si la influencia moderada es lo suficientemente fuerte o poderosa, puede modificar a la vez conductas, pensamientos y respuestas emocionales. Por ello, Bandura dice que llamar a unos cambios identificación y a otros imitación lo único que hace es confundir, ya que no hay base empírica para llegar a esas conclusiones. En la teoría cognitivo−social, el término genérico modelado se utiliza para caracterizar los procesos psicológicos de imitación. Hay varios fenómenos de modelado, cada uno regulado por distintos determinantes y mecanismos operativos. • EFECTOS DEL MODELADO PSICOSOCIAL Efecto instructor Es el caso en el que el modelo está instruyendo al aprendiz. Toda conducta que antes del modelado tenga una probabilidad de aparición nula y después del modelado se incrementa, decimos que es una conducta adquirida por modelado debido al efecto del instructor. Se pueden aprender aspectos cognitivos y conductuales. Para que sea posible el aprendizaje por modelado es necesario un buen aprendiz y un buen modelo. Además de las habilidades componentes, también se adquieren las reglas para organizar la conducta en nuevas estructuras. Efecto inhibidor y desinhibidor 33 No es una cuestión de aprendizaje, es de conductas ya aprendidas. Es el efecto que tiene ver algo sobre una conducta mía que ya sabía; se trata de adquirir algo nuevo de esa conducta. desinhibidor: tu sabes que no debes hablar en clase, pero observas que todo el mundo está hablando. Entonces, ese hecho actúa como efecto desinhibidor de esa conducta ya aprendida (hablar), y empiezas a hablar con los compañeros. Desinhibidor: vas por la autopista conduciendo tu coche. Entonces ves un accidente ocurrido y reduces tu velocidad. Efectos de facilitación de la respuesta Este efecto no conlleva aprendizaje de nada nuevo. Al observar a otros realizar una conducta, nos animamos a llevarla a cabo. Se distingue del efecto desinhibidor en que la conducta que se realiza es aceptada socialmente, aunque no se lleve a cabo. Los tipos de modelos que prevalecen en una sociedad determinarán en parte las cualidades que serán activadas, en lugar de otras. Efectos de incremento de estimulación ambiental La conducta de los modelos no sólo actúa como inductora de comportamientos similares, sino que a su ve dirige la atención del observador hacia objetos o entornos preferidos por éstos. Cuando la conducta del modelo dirige la atención del observador hacia objetos y entornos. El hecho de que el modelo utilice un determinado objeto hace que el sujeto se fije en el objeto que está empleando el modelo. Ejemplo: cuando ves a un compañero comiendo, es posible que tu también quieras comer, porque has centrado tu atención en el plato, el tenedor, incluso la misma comida. Efectos de activación emocional El ver a otros expresar sus emociones te activa emocionalmente. Ejemplo: en una película el estado de ánimo de los personajes principales te afecta y te impacta emocionalmente. Las distintas funciones del modelado pueden funcionar por separado, pero muchas veces operan de forma conjunta, lo cual dificulta la clarificación de conceptos, y provoca que existan dudas sobre si una conducta se produce por un efecto u otro. • EL APRENDIZAJE POR OBSERVACIÓN Y SUS PROCESOS CONSTITUYENTES El aprendizaje por observación está regulado por 4 procesos: procesos de atención, que regulan la exploración y la percepción de las actividades modeladas. Procesos de retención, mediante él, las experiencias transitorias son convertidas por la memoria en conceptos simbólicos que sirven de modelos internos para la emisión de respuestas y de criterios para la corrección de las mismas. Los procesos de producción regulan la organización de las subhabilidades componentes en nuevos patrones de respuesta. Por último, los procesos de motivación determinan que las competencias adquiridas por observación se pongan o no en práctica. 34 • Procesos de atención Propiedades de las actividades modeladas. La rapidez y el nivel de aprendizaje por observación dependen de la saliencia, la discriminabilidad y complejidad de las actividades modeladas. Determinantes del observador. Las competencias cognitivas del observador y las tendencias preceptúales le inclinan a observar unas cosas y no otras, y eso afecta al resultado final de aprendizaje. Cuanto mayores son las habilidades cognitivas y los conocimientos previos, más sutil será la percepción del observador. Como resultado de la familiarización y del entrenamiento, los sujetos experimentados son capaces de reconocer diferencias en la ejecución que un novato no apreciaría. Valor funcional. La atención selectiva se mantiene por varias razones: • Por las expectativas de que el observador tenga que hacer algo semejante. • Los beneficios que se anticipan. • Por las consecuencias que le siguen al modelo. • Por la reputación del modelo. Poder de atracción del modelo. La atención hacia determinados modelos no sólo está determinada por el valor funcional de su conducta, sino también por el grado de atractivo que posean. La atención puede fallar: • Porque hay un déficit en las habilidades cognitivas • Porque el aprendizaje previo es imperfecto. • Porque hay distracciones. • Porque no hay suficientes incentivos. Para mejorar la atención: ♦ Que el modelo acentúe de forma física las características de la ejecución. ♦ Diferenciar claramente lo que está bien de lo que está mal. ♦ Fraccionar la práctica en partes pequeñas para facilitar el aprendizaje y la retroalimentación. ◊ Si se presenta una frecuencia masiva no puedes coger lo esencial, y puedes mezclar instrucciones y acabar realizando algo equivocado. Estructuras sociales y observabilidad de los patrones de conducta. Las personas con las que uno interacciona de forma habitual, delimitan los patrones de conducta que se observarán de forma repetida, y que por tanto, tienen más probabilidad de ser aprendidas, ya que el modelo está más disponible. La forma en que está organizada una sociedad determina en gran parte los tipos de modelos a los que sus 35 miembros tendrán acceso. • Procesos de retención Retención: transformación activa de lo que estás viendo en representaciones cognitivas. Es particularmente importante al principio del aprendizaje, ya que cuando se hace automático las representaciones cognitivas ya no son importantes. Las representaciones cognitivas pueden variar en 3 aspectos: • Modalidad. Puede tratarse de imágenes o de símbolos verbales • Concisión. La concisión puede ser reductora o incluir largas elaboraciones. • Estructura. Puede ser isomórfica (una copia mental de lo que está pasando fuera) o puede ser la estructura subyacente. Si la representación cognitiva que te haces es en imágenes es una construcción de imágenes, que se consideran equivalentes a las percepciones. Cuando se desarrolla la imagen, ya no es necesario que el modelo esté delante para que se haga la acción; la imagen se forma para retener la información. La representación cognitiva con símbolos verbales predomina sobre el de las imágenes y consiste en codificar la acción de la actividad con palabras. Los mejores son los que hacen representaciones cognitivas con representaciones verbales concisas e imágenes vívidas. (Las mejores son las representaciones con significado, si no son con significado no funcionan bien). Las representaciones cognitivas tienen que ir acompañadas de práctica, sino no sirven de nada. Otro de los factores que influyen para adquirir un nuevo patrón más eficazmente es tener familiaridad con los elementos del nuevo patrón. En el aprendizaje observacional, lo nuevo se relaciona con lo ya existente. La práctica La práctica aumenta el aprendizaje y la retención. 2 tipos de práctica: • Práctica real: ejecución de la conducta; proporciona la oportunidad para organizar y comprobar los propios conocimientos. También ayuda a canalizar la atención a los puntos más conflictivos para perfeccionar la representación simbólica. • Práctica cognitiva: Cuando lo repasas mentalmente (repasar mentalmente los acontecimientos modelados). Puede darse de dos formas: • Sin procesamientos adicionales (mera repetición). • Con procesamiento adicional (Elaborar más, y de esa manera retienes). Muy recomendable para habilidades deportivas, físicas y cognitivas, porque facilita la retención de habilidades motoras aprendidas. Lo mejor es combinar ambas prácticas, ya que da los mejores resultados. La práctica cognitiva fortalece la organización psiconeurológica del patrón de conducta. Esto quiere decir que 36 con la práctica cognitiva aunque no te menees estás impulsando eléctricamente los músculos implicados en la acción. La práctica física real proporciona retroalimentación informativa, por eso complementa a la práctica cognitiva. Se necesita una buena organización de la conducta modelada, y práctica real y cognitiva para obtener buenos resultados en el aprendizaje observacional. • Procesos de producción Hay que convertir las representaciones simbólicas en las acciones adecuadas. Para esto hay que conocer los mecanismos conceptuales y motores. Cuando la conducta se lleva a cabo, se tiene que organizar espacial y temporalmente. Para la teoría cognitivo−social el proceso de aprendizaje observacional se produce a nivel central. Cuando finalmente se da la reproducción de la representación cognitiva de la acción son necesarios una serie de pasos: • Organización cognitiva de patrones de respuesta. • Iniciar la acción guiada por esto. • Observación de la ejecución de la respuesta. • Comparar la acción que estás produciendo con la idea que tienes de ello, lo que te permite hacer correcciones. Si hay déficits motores hay que hacer un buen análisis del problema. Esquema del análisis: • Si el problema está en las habilidades componentes hay que fraccionar en elementos sencillos y ampliarlos gradualmente. • Si el problema está en la secuencia hay que coordinar las acciones según cual sea específicamente el problema. Hay problemas que son de tipo estructural (falta de crecimiento para desarrollar una acción). Cuando ejecutamos la actividad, la retroalimentación puede ser de dos tipos: • Intrínseca, cuando tu mismo percibes tus propias acciones. • Extrínseca, cuando alguien te observa desde fuera y te dice como lo estás haciendo. Con la retroalimentación el observador va a mejorar su ejecución. Según Bandura el aprendizaje por observación se puede medir con distintos indicadores: • Por producción verbal, describiéndolo. • Por pruebas de reconocimiento. • Cuando el observador manifiesta las reglas subyacentes de la actividad modelada. • Pruebas de potencia (eliminando todas las restricciones para diferenciar entre aprendizaje y ejecución) 37 La producción de conducta se ve favorecida por dos cosas: ♦ La adquisición de la representación mental de la actividad. ♦ La retroalimentación que se produce de observar las propias actuaciones. El sujeto no depende de la retroalimentación simultánea, la necesitan para ir perfeccionando la actividad, pero no es totalmente necesaria para que el sujeto haga la actividad. Cuanto más informativa es esta retroalimentación, mejor es el resultado final del aprendizaje. Pasos para enseñar a alguien mediante observación: • Segmentar la actividad. • Modelar los aspectos problemáticos. • Los observadores tienen que repetir esas subhabilidades hasta que lleguen a dominarlas. • Finalmente hace falta retroalimentación para fortalecer el dominio de los componentes. • Procesos de motivación Distinguir entre aprendizaje y ejecución. Los procesos motivacionales son más evidentes cuando la conducta que se aprende tiene poco valor funcional o bien tiene un alto riesgo de castigo. Si hay un buen incentivo ejecutas la conducta, y si no lo hay, no la ejecutas. 3 tipos de incentivos para la motivación: ♦ Directos. Incentivos que recibe el aprendiz. Resultados que se obtienen por aprender lo que hace el modelo. ♦ Vicarios. Incentivos que recibe el modelo. El aprendiz ve que el modelo obtiene resultados y por eso él hace lo mismo. ♦ Autoproducidos. El propio sujeto los genera para sí mismo. Criterios personales de autoevaluación. La conducta está regulada principalmente por las consecuencias anticipadas de los actos futuros (en el aprendizaje por observación). LOS MEDIOS DE TRANSMISIÓN DE INFORMACIÓN • Modelado conductual. El que se da en vivo y en el que se hace una representación física de cómo se hace. Ejemplo: los gestos. • Modelado verbal. Se hace una descripción verbal, que puede ser escrita. • Modelado simbólico. Todo lo que se hace por los medios de comunicación. Tiene mucho poder porque un solo modelo retransmite a muchos espectadores. Lo que se enseña básicamente son actitudes, patrones de pensamiento y estilos de conducta. Esto hace que tu puedas saber de una cosa a través de la experiencia de otro. Cuanto más depende la imagen que el individuo tiene de la realidad del entorno simbólico creado por los medios, mayor será el impacto social de éstos. • Automodelado computerizado de ejecuciones óptimas. Ejemplo: te graban una secuencia entera de cómo nadas y un experto casa de esa secuencia todos los fragmentos donde tu actividad estaba bien hecha, y te montan una secuencia perfecta, y trabajas sobre eso. Tiene gran potencial a nivel terapéutico. • Modelado cinestésico. Lo que estás modelando son respuestas musculares que a veces sólo son observables por el tacto. Para personas sordas, por ejemplo, que tienen que modelar el habla a través de tocar los movimientos de los músculos de la laringe, para poder repetir esos movimientos con su laringe. 38 • MODELADO ABSTRACTO Y LA ADQUISICIÓN DE REGLAS DE CONDUCTA Mediante el modelado abstracto, los observadores extraen las reglas que subyacen a las ejecuciones específicas para generar una conducta que trasciende lo que han visto u oído. Las habilidades de enjuiciamiento y las reglas generalizables se aprenden por observación. Se comprueba el aprendizaje de las reglas por parte de los observadores en unas condiciones en las que su comportamiento puede ser conceptual y estilísticamente similar al del modelo, pero que son lo suficientemente nuevas y desconocidas como para obligarle a emitir unas respuestas que no pueden reproducir de una forma simplemente mimética a respuesta específicas previamente observadas. La adquisición de reglas comprende 3 procesos: • Extraer las características relevantes a partir de los ejemplos sociales. • Integrar la información en una regla compuesta. • Utilizar la regla para producir nuevos ejemplos de conducta. Cuando para el modelo, únicamente las respuestas que se ciñen a esas reglas comportan al éxito, los aspectos comunes a estos ejemplos resultan mucho más evidentes para el observador. Cuando el observador actúa en base a lo aprendido, la retroalimentación informativa también le ayuda a perfeccionar las reglas y a aplicarlas correctamente en las situaciones nuevas. Las reglas complejas han de descomponerse en reglas subordinadas y han de dominarse en primer lugar con la ayuda de referencias concretas. Los observadores no sólo han de extraer los factores relevantes a partir de los acontecimientos modelados sino que también han de combinarlos para dar lugar a una regla funcional compuesta. Generalmente, el modelado combinado con la verbalización de las reglas suele ser más eficaz que cualquiera de los dos procedimientos por separado para suscitar una conducta regulada por una regla. Conocer una regla no asegura que la ejecución vaya a ser correcta. • EL APRENDIZAJE POR EJECUCIÓN DESDE LA TEORÍA COGNITIVA • La influencia de las creencias sobre las consecuencias. Los estudios tratan de averiguar si lo cognitivo puede influir o modificar la conducta. Si los resultados influyen en la conducta; papel de lo cognitivo en eso. Para ponerlo de manifiesto hace falta contrastar como influyen las creencias en las consecuencias realmente experimentadas. Estas creencias pueden ser acerca de la frecuencia que se supone o con la que se supone que se va a recibir la recompensa; también pueden ser creencias sobre el significado de la consecuencia. Los estudios muestran que las creencias sobre la relación entre resultados y acciones debilitan, distorsionan e incluso anulan los efectos de las consecuencias sobre las respuestas. RESPUESTAS CONSECUENCIAS CREENCIAS (respecto a la frecuencia). Pueden llegar a anular o modificar la relación. 39 Experimento: 3 grupos. Se les informaba: IV 1´ IF 1´ RV 150 65 6 259 En realidad todos los grupos estaban bajo el mismo programa. X es el número de respuestas emitidas. Si el refuerzo se administra con IF, pero no se le informa, el sujeto puede pensar que se le recompensa por el logro, y el sujeto produce 4 veces más de respuestas que si piensa que la recompensa viene a IF. El sujeto regula el nivel de sus esfuerzos según los efectos que espera que produzcan sus acciones. Otro aspecto de la influencia de las creencias es que si el sujeto cree que el resultado (aunque sea aversivo), viene dado porque lo ha hecho bien, el sujeto incrementa la acción, cuando teóricamente debería cesar. Eso es porque el significado de la conducta es positivo. Según la expectativa que tu generes, guías tu conducta. • Contingencias ilusorias. Para la adaptación es necesario realizar inferencias sobre las consecuencias de los propios actos. Los sujetos buscamos regularidades en los acontecimientos. Esto es muy difícil; hay una tendencia a percibir regularidades incluso cuando no las hay. En ello hay muchos aspectos a analizar. Tenemos una tendencia a recordar los casos confirmatorios, y a ignorar las veces en que no se cumple la relación. A veces hay casualidades que elevamos a la categoría de causalidades. Las contingencias ilusorias pueden llegar a ser tan eficaces como las reales, y pueden llegar a crear patrones de conducta. Si alguien desarrolla una creencia ilusoria sobre su eficacia causal, desarrollan una gran confianza en sí mismos, confianza en sus habilidades, y por ello es más probable que tengan un éxito real. Por tanto, el control ilusorio, en parte, se puede convertir en control conductual del resultado. También existe una faceta negativa: las profecías autocumplidas. Cuando una persona cree que su conducta no puede cambiar nada, y que todo le sale mal, al final, por su propia falta de motivación acaba cumpliéndose. Además, el sujeto suele estar esperando a que pase algo malo, y cualquier cosa sin importancia le parece horrible. Condiciones por las que acontecimientos fortuitos tienen más probabilidad de asociarse a causalidad: • Acontecimientos muy frecuentes. • Acontecimientos muy potentes (sobre todo los dolorosos). • Acontecimientos que tienen características que los hacen llamativos y excepcionales. Aprendizaje PRÁCTICA 40 CAMBIO Relativamente permanente en la potencialidad de la conducta Sujeto: Motivación Probabilidad percibida • de éxito / fracaso • de autosuficiencia • de dificultad Hábitos previos Disposición física Tarea: Grado real de dificultad Distribución ensayos Presentación material Semejante a la RI Originariamente neutro Tras muchas presentaciones 41