APRENDIZAJE Prof. Eddie Marrero PSIC 3001 Depto. Ciencias Sociales UPR,Mayaguez Introducción El aprendizaje tiene que ver con: cómo adquirimos y mantenemos de forma relativamente estable determinadas conductas y pensamientos. Introducción Hay dos definiciones principales de aprendizaje que se diferencian según el enfoque. Versión Conductista - aprendizaje es un cambio relativamente permanente en la conducta que resulta de la experiencia Versión Cognoscitivista - aprendizaje es un cambio relativamente permanente en la forma en que el organismo representa su ambiente y responde al mismo; este cambio es producto de la experiencia. Introducción Nótese que el cambio es resultado de la experiencia, por lo que el aprendizaje se opone a: Los reflejos – respuesta motora simple, automática e innata (ej. toser) Aunque el reflejo es innato, como veremos, algunas respuestas reflejas se pueden aprender Los instintos – patrón de conductas complejas, innatas y característicos de los miembros de una especie (ej instinto de cazar de los gatos) Se dice que el ser humano no posee no instintos Introducción (cont…) Estudiaremos tres enfoques teóricos sobre cómo ocurre el aprendizaje condicionamiento clásico condicionamiento operante por observación o social cognoscitivo Aprendizaje por Condicionamiento Clásico (CC) Introducción Pavlov: estudia el proceso de salivación como parte de la digestión Experimentos fisiológicos con mediciones y control sistemático Resultados inesperados De problema a empresa investigativa y formulación teórica: es posible aprender a emitir respuestas reflejas ante estímulos no naturales Conceptos Básicos Repuesta refleja natural o incondicionada - es una respuesta automática, no aprendida (natural) que se emite ante estímulos naturales específicos. Ej. comida en la boca – salivar En este caso se dice que la respuesta de salivar es natural ante el estímulo de la comida, a sea, que esa respuesta no es aprendida. Conceptos Básicos (cont.) Según la teoría, lo que se puede es aprender a salivar ante estímulos no naturales. Ej. El sonido de una campana Esto es posible pareando el estímulo no natural (o condicionado) con el estímulo natural o incondicionado (Ej. parear sonido de la campana y comida). Con el tiempo, se saliva solo de oír la campana. En este caso se dice que la respuesta de salivar es una respuesta condicionada o sea, aprendida Tipos de pareos entre EI - EC Demorado – el EC se presenta ligeramente antes que el EI; por un momento coinciden y luego se deja de mostrar el EC. Este es el tipo de pareo más efectivo porque el EC se convierte en un anticipador del EI. EC EI=====>RI Tipos de pareos entre EI - EC Simultáneo - se presentan simultáneamente el EC y el EI. Este tipo de pareo es menos efectivo que el demorado. La fuerza del EC es menor porque queda opacado por el EI. Al ser simultáneos el EC no sirve para predecir el EI. EC EI ====> RI Tipos de pareos entre EI - EC de huella - En este se presenta el EC primero y luego el EI. Entre el primero y el segundo se deja pasar algún tiempo, de manera que no coincidan. Este tipo de pareamiento tiene muy poco efecto EC EI =====> RI Tipos de pareos entre EI - EC Retrospectivo - La presentación del EC se hace después del EI. Con este tipo de pareo no se logra aprendizaje alguno. EI =======> RI EC Otros conceptos relacionados Generalización - La respuesta condicionada se emite ante estímulos que se parecen al EC (Ej. campana timbre) Discriminación - La respuesta condicionada se emite ante ciertos estímulos pero no ante otros (Ej. elipses vs. Círculos y neurosis experimental) Extinción - La respuesta condicionada desaparece por razón de que cesa el pareamiento entre el EC y el EI. Hay técnicas para lograr la extinción que se aplican en psicoterapia Otros conceptos relacionados Recuperación espontánea - Luego de haberse logrado la extinción es posible que la repuesta condicionada reaparezca. Si por casualidad esa reaparición esta acompañada del EI la extinción se hace posteriormente más difícil. Condicionamiento de segundo orden: Es cuando un EC sirve de base para una nueva respuesta condicionada. Ej. El perro puede aprender a salivar ante el sonido de la campana y hasta de solo ver la campana. Aversión Gustativa Es una situación de condicionamiento clásico particular en la que un solo evento resulta suficiente para producir la RC. La respuesta es una de nauseas, mareos y vómitos ante una comida que puede haber estado dañada o que no es compatible con el organismo. Luego, la reacción aversiva puede surgir de solo ver, oler, probar o imaginar la comida en cuestión. Presentar ejemplos Las Fobias La demostración de Watson con el pequeño Albert Adquisición de una respuesta condicionada Ejemplos de generalización Las Fobias Las Fobias El trabajo de extinción de Mary Cover Jones Contra-condicionamiento (dos reacciones antagónicas no pueden ocurrir a la vez) Desensibilización sistemática - aplicación controlada del concepto de extinción. Se expone el sujeto a una jerarquía de situaciones acercándolo a la situación fóbica sistemáticamente y sin que el cuerpo este emitiendo la respuesta condicionada Ejemplos y Aplicaciones perro... ladrido... miedo; luego miedo a los perros... en ciertas situaciones y no en otras Persona trabaja en depósito de libros y desarrollo reacción alérgica porque hay hongos. Luego cualquier acumulación de libros suscita la misma reacción alérgica. Ha asociado (condicionado) el olor de los libros con los hongos y la reacción alérgica. Ejemplos y Aplicaciones Experiencias de bochorno al hablar, reprimenda de los padres, persona que de adulto le da temor hablar en público. jefe - tensión... trabajo tensión.... lunes por la mañana.... tensión inyección... dolor... miedo; inyección miedo; enfermera, inyección miedo; hospital, alcohol, enfermera.... miedo; Aprendizaje por Condicionamiento Operante (CO) Introducción No todas nuestras conductas se basan en respuestas reflejas como es la base del condicionamiento clásico. De hecho, la mayor parte de nuestras conductas parecen ser producto de nuestra voluntad (Ej. levantarnos para ir a la universidad, tomar o no un taxi que nos lleve, copiar o no lo que se dice en clase, por mencionar solo algunos ejemplos sencillos). La pregunta fundamental es: ¿cómo adquirimos y mantenemos los diferentes patrones de conductas que llevamos a cabo día a día? Para los llamados “conductistas” adquirimos y preservamos todas nuestras conductas como resultado de las consecuencias ambientales de los mismos. Examinemos esta idea. Trasfondo histórico: Experimentos de Thorndike Trasfondo histórico: Experimentos de Thorndike Explicar sus experimentos con gatos: el concepto de jaula – problema los comportamientos exitosos tienden a repetirse el gato pasa más tiempo cerca de la salida presiona en diferentes lugares con su pata a ver que efecto tiene luego de varios días su conducta dentro de la jaula se limita a aquellas acciones más efectivas para salir de la misma La ley del efecto En un determinado ambiente, aquellas conductas o respuestas que sean seguidas de consecuencias beneficiosas tenderán a repetirse, mientras que aquellas respuestas que no tengan consecuencias alguna o consecuencias desfavorables tenderán a no repetirse. El conductismo según expuesto por B.F. Skinner: Conceptos fundamentales Respuesta (Re)- Cualquier conducta que lleva a cabo un organismo en un determinado ambiente ya sea por casualidad o inducido a hacerlo Refuerzo (Rf)- Cualquier evento ambiental que aumenta la probabilidad de que una conducta se repita Estimulo discriminativo (Ed)- Cualquier evento ambiental que este dentro de las capacidades preceptúales de un organismo y que le sirve de señal para emitir una conducta. Respuesta operante (Ro) - Cualquier conducta cuya expresión ha quedado bajo el control de un estimulo por causa de un refuerzo Conceptos fundamentales De lo anterior se puede construir el siguiente algoritmo: Ed -------> Ro Rf el cual puede ser leída de la siguiente forma: nuestras conductas se producen ante determinados estímulos por causa de un refuerzo. O dicho de otra forma, todos nuestros comportamientos consistentes se expresan ante determinadas señales porque han sido reforzados. Conceptos fundamentales Lo más importante del algoritmo señalado es que permite: explicar, predecir y controlar. Por ejemplo, permite decir que una determinada conducta se expresa en un determinado momento por causa de un refuerzo. Además, si quiero controlar la expresión de la conducta debo presentar el estimulo discriminativo; si esta presente el estimulo discriminativo puedo predecir la aparición de la respuesta. También, si tengo control del refuerzo puedo controlar la conducta ya sea para que se manifieste o para eliminarla (eliminando el refuerzo). Parece complicado… y lo es! Conceptos fundamentales Al modelo de condicionamiento operante también aplican los conceptos de: generalización discriminación extinción recuperación espontánea Explicar estos conceptos con el ejemplo clásico de la caja de Skinner Refuerzo inmediato y retrasado inmediato - se da inmediatamente después de que ocurre la conducta deseada retrasado - se da posteriormente, el tiempo que puede transcurrir es variable y puede ir de horas a días, meses o años El refuerzo es mas efectivo cuando es inmediato, pero a partir de refuerzos inmediatos se pueden construir programas de refuerzo retrasado o demorado. Por ejemplo, condicionar buenos hábitos de estudio en un niño a partir de refuerzos inmediatos (una hora de video juegos por media hora de estudios); luego de adulto utilizo refuerzos demorados como un viaje a Epcot Center si pasas todas las clases del semestre con C o mas y 25 dólares de bono por cada clase en que saque B y 35 por cada clase en que saque A (50 si la clase es de especialidad… es solo un ejemplo!) Programas de refuerzo Se refiere a la manera en que se puede administrar el refuerzo respecto a la conducta deseada. Los programas de refuerzo se dividen a base de tiempo (intervalo) o de cantidad (razón) y si son fijos o variables. La combinación de cada categoría da como resultado cuatro programas de refuerzo Intervalo Razon Fijo x x Variable x x Programas de refuerzo Intervalo fijo - aquí el refuerzo se da luego de transcurrido un tiempo fijo tras emitir la respuesta. Por ejemplo: 2.5 horas de trabajo, 15 minutos de receso. Otro ejemplo: 2 horas de estudio, 2 horas de descanso (incluyendo juego o TV). Intervalo variable - El refuerzo se da tras espacios variables de tiempo luego de manifestarse la conducta. Por ejemplo: 15 minutos de estudio, media hora de juego; otro día, media hora de estudio, media hora de descanso (la cantidad de tiempo de estudio se refuerza de manera variable) Programas de refuerzo razón fija - El refuerzo se da luego de ocurrir la conducta un número fijo de veces. Por ejemplo: 12 piezas terminadas, se paga por las mismas. Otro ejemplo: aprendizaje asistido por computadoras: se refuerza cada vez que el aprendiz conteste correctamente. razón variable - El refuerzo se da luego de ocurrir la conducta un número variable de veces. Por ejemplo: las tragamonedas: el refuerzo (ganar) se produce luego de un numero variable de veces de repetirse la conducta (jugar), a veces gana a los 3 intentos, luego a los diez, luego a los 2, luego a los 15, luego a los 30, luego a los 2 y así variablemente. Programas de refuerzo Cada programa de refuerzo resulta mas practico para distintas circunstancias. Sin embargo, en términos generales podemos decir que los programas variables producen conductas mas difíciles de extinguir ya que suscitan el fenómeno "expectativa", esto es, continuar repitiendo la conducta esperando que “en algún momento” el refuerzo aparezca Refuerzo Primario y Secundario Refuerzo primario - Es aquel que adquiere su capacidad de actuar como refuerzo por estar directamente relacionado a la satisfacción de las necesidades naturales del organismo (ej. alimento, contacto, afecto) Refuerzo secundario - Es aquel que adquiere su capacidad de fungir como refuerzo porque el organismo lo ha relacionado con la adquisición de refuerzos primarios. Por ejemplo: el dinero. Refuerzo negativo En términos básicos, se define el refuerzo negativo como aquella situación en que la remoción de algo aumenta la probabilidad de que ocurra una conducta. Por ejemplo: una “campana” suena y no cesa hasta que se pone el cinturon digamos que un profesor establece que la evaluación de un curso se hará basado en la calificación obtenida en 4 exámenes de los cuales 3 son parciales y uno es final general. Luego, establece la siguiente condición: si al momento del final su promedio en la clase es de sobre 90%, pues esta eximido de tomar el final. Así, la potencial remoción del final aumentara la probabilidad de que ocurra la conducta de “estudiar intensamente”. Pague antes del 15 de abril y evite recargos y penalidades Refuerzo negativo El refuerzo negativo se diferencia del refuerzo positivo en que en el refuerzo positivo se da algo mientras que en el negativo se quita algo. Sin embargo, en ambos casos lo que se da o lo que se quita, tiene como consecuencia aumentar la probabilidad de que una determinada conducta se repita. Esto diferencia al refuerzo negativo del castigo. El castigo En términos generales podemos decir que el castigo reviste dos cualidades principales (que a su vez lo diferencian del refuerzo positivo y del negativo). Primero - El castigo es en si un evento que resulta desagradable (doloroso, lastimoso) a quien lo recibe. Segundo - El propósito fundamental del castigo es evitar que una conducta se repita; o sea que, el castigo no incentiva conductas sino que quiere reprimirlas. El castigo Dentro del condicionamiento operante (básicamente skinneriano) no se recomienda el castigo como estrategia de modificación de conducta porque el mismo puede tener efectos secundarios no deseados; entre ellos: No siempre queda claro cual es la conducta que se quiere reprimir. Como resultado de lo anterior puede suceder que se repriman otras conductas que no son supuestamente las deseadas (Ej. un padre castiga a su hijo porque interrumpe sus conversaciones, como resultado el hijo se desarrolla como una persona poco comunicativa). No necesariamente deja claro cuales son las conductas alternas que se quieren promover (pues las mismas no se están reforzando). Puede promover la conducta violenta y agresiva. La conducta se evita solo en presencia de quien castiga Aprendizaje por observación o social cognoscitivo Introducción A pesar de que el condicionamiento operante representa una evolución respecto al condicionamiento clásico, algunos plantean que limitar la explicación del aprendizaje al ambiente y a las conductas, resulta limitado. Algunos investigadores, en diferentes momentos, propusieron categorías y procedimientos sobre el aprendizaje que requerían ir más allá del ambiente y del comportamiento manifiesto. Específicamente, requerían ir al ámbito de lo mental (o cognoscitivos) para poder explicar determinados fenómenos. En esta sección exploraremos algunos de los pioneros en esa dirección y algunos de sus señalamientos más importantes. W. Kholer y el concepto del “insight” Explicar los experimentos de Kholer con los chimpancés y como se demuestra un aprendizaje que va más allá del refuerzo inmediato y que requiere el uso de categorías mentales como la reorganización espontánea de los estímulos ambientales que ocurre en el insight. E. Tolman y los conceptos de: mapas cognoscitivos y aprendizaje latente Explicar los experimentos de Tolman con diferentes grupos de ratas y como los mismos demuestran que el organismo puede hacer una representación interna de su ambiente (mapas cognoscitivos) y como el aprendizaje puede darse en ausencia de refuerzos y que puede haber aprendizaje aunque de momento no se manifieste (aprendizaje latente). A. Bandura y el aprendizaje por observación Explicar el experimento de Bandura y como el mismo demuestra que puede haber aprendizaje sin refuerzo, basado en la observación de la conducta y las consecuencias en otros. Además, cuan importante es el modelo en cuestion.