aprendizaje

Anuncio
APRENDIZAJE
Prof. Eddie Marrero
PSIC 3001
Depto. Ciencias Sociales
UPR,Mayaguez
Introducción
El aprendizaje tiene que ver con:
cómo adquirimos y mantenemos
de forma relativamente estable
determinadas conductas y pensamientos.
Introducción
Hay dos definiciones principales de aprendizaje que
se diferencian según el enfoque.
Versión Conductista - aprendizaje es un cambio
relativamente permanente en la conducta que
resulta de la experiencia
Versión Cognoscitivista - aprendizaje es un
cambio relativamente permanente en la forma en
que el organismo representa su ambiente y
responde al mismo; este cambio es producto de la
experiencia.
Introducción
Nótese que el cambio es resultado de la experiencia,
por lo que el aprendizaje se opone a:
Los reflejos – respuesta motora simple,
automática e innata (ej. toser)
Aunque el reflejo es innato, como veremos, algunas
respuestas reflejas se pueden aprender
Los instintos – patrón de conductas complejas,
innatas y característicos de los miembros de una
especie (ej instinto de cazar de los gatos)
Se dice que el ser humano no posee no instintos
Introducción (cont…)
Estudiaremos tres enfoques teóricos
sobre cómo ocurre el aprendizaje
condicionamiento clásico
condicionamiento operante
por observación o social cognoscitivo
Aprendizaje por
Condicionamiento Clásico (CC)
Introducción
Pavlov: estudia el proceso de salivación
como parte de la digestión
Experimentos fisiológicos con mediciones
y control sistemático
Resultados inesperados
De problema a empresa investigativa y
formulación teórica: es posible aprender a
emitir respuestas reflejas ante estímulos
no naturales
Conceptos Básicos
Repuesta refleja natural o incondicionada - es una
respuesta automática, no aprendida (natural) que se
emite ante estímulos naturales específicos.
Ej. comida en la boca – salivar
En este caso se dice que la respuesta de salivar es
natural ante el estímulo de la comida, a sea, que esa
respuesta no es aprendida.
Conceptos Básicos (cont.)
Según la teoría, lo que se puede es aprender a salivar ante
estímulos no naturales.
Ej. El sonido de una campana
Esto es posible pareando el estímulo no natural (o
condicionado) con el estímulo natural o incondicionado (Ej.
parear sonido de la campana y comida).
Con el tiempo, se saliva solo de oír la campana. En este caso
se dice que la respuesta de salivar es una respuesta
condicionada o sea, aprendida
Tipos de pareos entre EI - EC
Demorado – el EC se presenta ligeramente
antes que el EI; por un momento coinciden y
luego se deja de mostrar el EC.
Este es el tipo de pareo más efectivo porque
el EC se convierte en un anticipador del EI.
EC
EI=====>RI
Tipos de pareos entre EI - EC
Simultáneo - se presentan simultáneamente el EC y
el EI.
Este tipo de pareo es menos efectivo que el
demorado.
La fuerza del EC es menor porque queda opacado
por el EI.
Al ser simultáneos el EC no sirve para predecir el EI.
EC
EI ====> RI
Tipos de pareos entre EI - EC
de huella - En este se presenta el EC
primero y luego el EI.
Entre el primero y el segundo se deja pasar
algún tiempo, de manera que no coincidan.
Este tipo de pareamiento tiene muy poco
efecto
EC
EI =====> RI
Tipos de pareos entre EI - EC
Retrospectivo - La presentación del EC se
hace después del EI.
Con este tipo de pareo no se logra
aprendizaje alguno.
EI =======> RI
EC
Otros conceptos relacionados
Generalización - La respuesta condicionada se emite
ante estímulos que se parecen al EC (Ej. campana timbre)
Discriminación - La respuesta condicionada se emite
ante ciertos estímulos pero no ante otros (Ej. elipses
vs. Círculos y neurosis experimental)
Extinción - La respuesta condicionada desaparece
por razón de que cesa el pareamiento entre el EC y
el EI. Hay técnicas para lograr la extinción que se
aplican en psicoterapia
Otros conceptos relacionados
Recuperación espontánea - Luego de haberse
logrado la extinción es posible que la repuesta
condicionada reaparezca.
Si por casualidad esa reaparición esta acompañada del EI la
extinción se hace posteriormente más difícil.
Condicionamiento de segundo orden: Es cuando un
EC sirve de base para una nueva respuesta
condicionada.
Ej. El perro puede aprender a salivar ante el sonido de la
campana y hasta de solo ver la campana.
Aversión Gustativa
Es una situación de condicionamiento clásico
particular en la que un solo evento resulta suficiente
para producir la RC.
La respuesta es una de nauseas, mareos y vómitos
ante una comida que puede haber estado dañada o
que no es compatible con el organismo.
Luego, la reacción aversiva puede surgir de solo ver,
oler, probar o imaginar la comida en cuestión.
Presentar ejemplos
Las Fobias
La demostración de Watson con el
pequeño Albert
Adquisición de una respuesta
condicionada
Ejemplos de generalización
Las Fobias
Las Fobias
El trabajo de extinción de Mary Cover
Jones
Contra-condicionamiento (dos reacciones
antagónicas no pueden ocurrir a la vez)
Desensibilización sistemática - aplicación
controlada del concepto de extinción. Se
expone el sujeto a una jerarquía de situaciones
acercándolo a la situación fóbica
sistemáticamente y sin que el cuerpo este
emitiendo la respuesta condicionada
Ejemplos y Aplicaciones
perro... ladrido... miedo; luego miedo a los
perros... en ciertas situaciones y no en otras
Persona trabaja en depósito de libros y
desarrollo reacción alérgica porque hay
hongos. Luego cualquier acumulación de
libros suscita la misma reacción alérgica. Ha
asociado (condicionado) el olor de los libros
con los hongos y la reacción alérgica.
Ejemplos y Aplicaciones
Experiencias de bochorno al hablar,
reprimenda de los padres, persona que
de adulto le da temor hablar en público.
jefe - tensión... trabajo tensión.... lunes
por la mañana.... tensión
inyección... dolor... miedo; inyección miedo; enfermera, inyección miedo;
hospital, alcohol, enfermera.... miedo;
Aprendizaje por Condicionamiento
Operante (CO)
Introducción
No todas nuestras conductas se basan en respuestas reflejas
como es la base del condicionamiento clásico.
De hecho, la mayor parte de nuestras conductas parecen ser
producto de nuestra voluntad (Ej. levantarnos para ir a la
universidad, tomar o no un taxi que nos lleve, copiar o no lo que
se dice en clase, por mencionar solo algunos ejemplos
sencillos).
La pregunta fundamental es: ¿cómo adquirimos y mantenemos
los diferentes patrones de conductas que llevamos a cabo día a
día?
Para los llamados “conductistas” adquirimos y preservamos
todas nuestras conductas como resultado de las consecuencias
ambientales de los mismos. Examinemos esta idea.
Trasfondo histórico:
Experimentos de Thorndike
Trasfondo histórico:
Experimentos de Thorndike
Explicar sus experimentos con gatos:
el concepto de jaula – problema
los comportamientos exitosos tienden a repetirse
el gato pasa más tiempo cerca de la salida
presiona en diferentes lugares con su pata a ver
que efecto tiene
luego de varios días su conducta dentro de la
jaula se limita a aquellas acciones más efectivas
para salir de la misma
La ley del efecto
En un determinado ambiente, aquellas
conductas o respuestas que sean
seguidas de consecuencias
beneficiosas tenderán a repetirse,
mientras que aquellas respuestas que
no tengan consecuencias alguna o
consecuencias desfavorables tenderán
a no repetirse.
El conductismo según
expuesto por B.F. Skinner:
Conceptos fundamentales
Respuesta (Re)- Cualquier conducta que lleva a cabo un
organismo en un determinado ambiente ya sea por casualidad o
inducido a hacerlo
Refuerzo (Rf)- Cualquier evento ambiental que aumenta la
probabilidad de que una conducta se repita
Estimulo discriminativo (Ed)- Cualquier evento ambiental que
este dentro de las capacidades preceptúales de un organismo y
que le sirve de señal para emitir una conducta.
Respuesta operante (Ro) - Cualquier conducta cuya expresión
ha quedado bajo el control de un estimulo por causa de un
refuerzo
Conceptos fundamentales
De lo anterior se puede construir el siguiente
algoritmo:
Ed -------> Ro
Rf
el cual puede ser leída de la siguiente forma:
nuestras conductas se producen ante determinados
estímulos por causa de un refuerzo. O dicho de otra
forma, todos nuestros comportamientos consistentes
se expresan ante determinadas señales porque han
sido reforzados.
Conceptos fundamentales
Lo más importante del algoritmo señalado es que
permite: explicar, predecir y controlar. Por ejemplo,
permite decir que una determinada conducta se
expresa en un determinado momento por causa de
un refuerzo. Además, si quiero controlar la expresión
de la conducta debo presentar el estimulo
discriminativo; si esta presente el estimulo
discriminativo puedo predecir la aparición de la
respuesta. También, si tengo control del refuerzo
puedo controlar la conducta ya sea para que se
manifieste o para eliminarla (eliminando el refuerzo).
Parece complicado… y lo es!
Conceptos fundamentales
Al modelo de condicionamiento operante
también aplican los conceptos de:
generalización
discriminación
extinción
recuperación espontánea
Explicar estos conceptos con el ejemplo
clásico de la caja de Skinner
Refuerzo inmediato y retrasado
inmediato - se da inmediatamente después de que ocurre la
conducta deseada
retrasado - se da posteriormente, el tiempo que puede
transcurrir es variable y puede ir de horas a días, meses o años
El refuerzo es mas efectivo cuando es inmediato, pero a partir
de refuerzos inmediatos se pueden construir programas de
refuerzo retrasado o demorado. Por ejemplo, condicionar
buenos hábitos de estudio en un niño a partir de refuerzos
inmediatos (una hora de video juegos por media hora de
estudios); luego de adulto utilizo refuerzos demorados como un
viaje a Epcot Center si pasas todas las clases del semestre con
C o mas y 25 dólares de bono por cada clase en que saque B y
35 por cada clase en que saque A (50 si la clase es de
especialidad… es solo un ejemplo!)
Programas de refuerzo
Se refiere a la manera en que se puede administrar el refuerzo
respecto a la conducta deseada.
Los programas de refuerzo se dividen a base de tiempo
(intervalo) o de cantidad (razón) y si son fijos o variables. La
combinación de cada categoría da como resultado cuatro
programas de refuerzo
Intervalo
Razon
Fijo
x
x
Variable
x
x
Programas de refuerzo
Intervalo fijo - aquí el refuerzo se da luego de transcurrido un
tiempo fijo tras emitir la respuesta. Por ejemplo:
2.5 horas de trabajo, 15 minutos de receso.
Otro ejemplo: 2 horas de estudio, 2 horas de descanso
(incluyendo juego o TV).
Intervalo variable - El refuerzo se da tras espacios variables de
tiempo luego de manifestarse la conducta. Por ejemplo:
15 minutos de estudio, media hora de juego; otro día, media
hora de estudio, media hora de descanso (la cantidad de
tiempo de estudio se refuerza de manera variable)
Programas de refuerzo
razón fija - El refuerzo se da luego de ocurrir la conducta un
número fijo de veces. Por ejemplo:
12 piezas terminadas, se paga por las mismas.
Otro ejemplo: aprendizaje asistido por computadoras: se
refuerza cada vez que el aprendiz conteste correctamente.
razón variable - El refuerzo se da luego de ocurrir la conducta
un número variable de veces. Por ejemplo:
las tragamonedas: el refuerzo (ganar) se produce luego de
un numero variable de veces de repetirse la conducta
(jugar), a veces gana a los 3 intentos, luego a los diez, luego
a los 2, luego a los 15, luego a los 30, luego a los 2 y así
variablemente.
Programas de refuerzo
Cada programa de refuerzo resulta mas
practico para distintas circunstancias. Sin
embargo, en términos generales podemos
decir que los programas variables producen
conductas mas difíciles de extinguir ya que
suscitan el fenómeno "expectativa", esto es,
continuar repitiendo la conducta esperando
que “en algún momento” el refuerzo aparezca
Refuerzo Primario y Secundario
Refuerzo primario - Es aquel que adquiere su
capacidad de actuar como refuerzo por estar
directamente relacionado a la satisfacción de
las necesidades naturales del organismo (ej.
alimento, contacto, afecto)
Refuerzo secundario - Es aquel que adquiere
su capacidad de fungir como refuerzo porque
el organismo lo ha relacionado con la
adquisición de refuerzos primarios. Por
ejemplo: el dinero.
Refuerzo negativo
En términos básicos, se define el refuerzo negativo
como aquella situación en que la remoción de algo
aumenta la probabilidad de que ocurra una
conducta. Por ejemplo:
una “campana” suena y no cesa hasta que se pone el cinturon
digamos que un profesor establece que la evaluación de un
curso se hará basado en la calificación obtenida en 4
exámenes de los cuales 3 son parciales y uno es final
general. Luego, establece la siguiente condición: si al
momento del final su promedio en la clase es de sobre 90%,
pues esta eximido de tomar el final. Así, la potencial remoción
del final aumentara la probabilidad de que ocurra la conducta
de “estudiar intensamente”.
Pague antes del 15 de abril y evite recargos y penalidades
Refuerzo negativo
El refuerzo negativo se diferencia del
refuerzo positivo en que en el refuerzo
positivo se da algo mientras que en el
negativo se quita algo. Sin embargo, en
ambos casos lo que se da o lo que se quita,
tiene como consecuencia aumentar la
probabilidad de que una determinada
conducta se repita.
Esto diferencia al refuerzo negativo del
castigo.
El castigo
En términos generales podemos decir que el castigo
reviste dos cualidades principales (que a su vez lo
diferencian del refuerzo positivo y del negativo).
Primero - El castigo es en si un evento que resulta
desagradable (doloroso, lastimoso) a quien lo
recibe.
Segundo - El propósito fundamental del castigo es
evitar que una conducta se repita; o sea que, el
castigo no incentiva conductas sino que quiere
reprimirlas.
El castigo
Dentro del condicionamiento operante (básicamente
skinneriano) no se recomienda el castigo como estrategia de
modificación de conducta porque el mismo puede tener efectos
secundarios no deseados; entre ellos:
No siempre queda claro cual es la conducta que se quiere
reprimir.
Como resultado de lo anterior puede suceder que se
repriman otras conductas que no son supuestamente las
deseadas (Ej. un padre castiga a su hijo porque interrumpe
sus conversaciones, como resultado el hijo se desarrolla
como una persona poco comunicativa).
No necesariamente deja claro cuales son las conductas
alternas que se quieren promover (pues las mismas no se
están reforzando).
Puede promover la conducta violenta y agresiva.
La conducta se evita solo en presencia de quien castiga
Aprendizaje por
observación o social cognoscitivo
Introducción
A pesar de que el condicionamiento operante representa una
evolución respecto al condicionamiento clásico, algunos
plantean que limitar la explicación del aprendizaje al ambiente y
a las conductas, resulta limitado.
Algunos investigadores, en diferentes momentos, propusieron
categorías y procedimientos sobre el aprendizaje que requerían
ir más allá del ambiente y del comportamiento
manifiesto. Específicamente, requerían ir al ámbito de lo mental
(o cognoscitivos) para poder explicar determinados fenómenos.
En esta sección exploraremos algunos de los pioneros en esa
dirección y algunos de sus señalamientos más importantes.
W. Kholer y el concepto del
“insight”
Explicar los experimentos de Kholer con
los chimpancés y como se demuestra
un aprendizaje que va más allá del
refuerzo inmediato y que requiere el
uso de categorías mentales como la
reorganización espontánea de los
estímulos ambientales que ocurre en el
insight.
E. Tolman y los conceptos de:
mapas cognoscitivos y aprendizaje
latente
Explicar los experimentos de Tolman con
diferentes grupos de ratas y como los
mismos demuestran que el organismo puede
hacer una representación interna de su
ambiente (mapas cognoscitivos) y como el
aprendizaje puede darse en ausencia de
refuerzos y que puede haber aprendizaje
aunque de momento no se manifieste
(aprendizaje latente).
A. Bandura y el aprendizaje
por observación
Explicar el experimento de Bandura y
como el mismo demuestra que puede
haber aprendizaje sin refuerzo, basado
en la observación de la conducta y las
consecuencias en otros. Además, cuan
importante es el modelo en cuestion.
Descargar