Tema 3.- Aprendizaje.

Anuncio
Tema 3.- Aprendizaje.
3.1.- Cuestiones preliminares
Definición
Medición
3.2.- Condicionamiento Clásico
Principios y aplicaciones.
Limitaciones:
El aprendizaje de aversión al
sabor.
Ley de Rescorla.
3.3.- Condicionamiento Operante
Principios y aplicaciones.
Reforzamiento.
Moldeamiento.
Castigo.
La indefensión aprendida de
Seligman.
Limitaciones: la relevancia
causal.
3.5.- Aprendizaje por observación.
Cómo
aprendemos
por
observación
¿Quién imita a quién?
3.1.- Cuestiones preliminares
Definición.
Podemos definir el aprendizaje como cambio relativamente duradero de
conducta causado por la experiencia. Generalmente medimos lo que un organismo
hace para hacernos una idea de su aprendizaje. Pero aprender es una actividad
interna que no puede observarse directamente.
Debemos tener en cuenta que los cambios de conducta no siempre se pueden
atribuir a la experiencia. La fatiga, los fármacos, los motivos, las emociones y la
maduración alteran también nuestros comportamientos. En contraste, los efectos de
la fatiga, fármacos, motivos y emociones tienden a ser breves en el tiempo, frente a los
efectos más duraderos del aprendizaje. Por el contrario, los efectos de la
MADURACIÓN también son duraderos. El crecimiento del cuerpo y del sistema
Tema 3.- Página 1 de 15
nervioso propician también cambios estables de conducta. Las respuestas que
dependen de la maduración aparecen, por lo general, en los momentos en que
evolutivamente se esperan y no requieren de ningún entrenamiento especial, en estos
casos estaríamos hablando de conductas instintivas o de patrones de acción fijos.
Sonreír, reír o llorar son conductas que no se aprenden, de hecho se observan incluso
en niños ciegos de nacimiento que no han podido observar estas conductas.
Medición.
El aprendizaje suele medirse observando los cambios de conducta
(Rendimiento). Obviamente, ésta no parece ser una buena medida del aprendizaje:
1. Hay muchas cosas que se aprenden sin que éste se manifieste con
respuestas observables. Es decir, muchos aprendizajes son latentes (no
visibles) y sólo se hacen evidentes cuando se ponen en práctica.
2. El rendimiento o actuación es una medida problemática ya que éste no puede
reflejar de forma exacta lo aprendido. Pensemos en una situación de Examen.
En definitiva, el rendimiento depende de muchos factores además del
aprendizaje, p.e. ansiedad, fatiga, motivación. En resumen, el rendimiento como
única medida del aprendizaje parece cuanto menos insatisfactorio.
3.2.- Condicionamiento Clásico o Pavloviano
Todos los animales estamos programados por herencia genética con una serie
de conductas reflejas (o respondientes) y, por tanto, no aprendidas. Al atragantarnos
sentimos nauseas y vómitos. Con un disparo sentimos miedo o al menos un susto. Una
luz intensa hace que la pupila se contraiga. Las conductas reflejas incluyen reflejos
esqueléticos (susto, retracción de la mano, flexión de la rodilla con un golpe, etc.),
reacciones emocionales inmediatas (p.e. ira, temor, júbilo, etc.), y otras reacciones que
controla el sistema nervioso autónomo (p.e. náusea, salivación, etc.).
Este tipo de condicionamiento también se denomina respondiente porque en él
se produce una asociación entre un estímulo neutro (En) y una respondiente (o
conducta refleja). Pero, ¿qué es una respondiente?
Las características definitorias de las conductas reflejas o respondientes son:
1. Son involuntarias.
2. Están controladas por estímulos disparadores que las preceden
inmediatamente.
3. No son conductas aprendidas. Aparecen los mismos reflejos en todos los
individuos de la misma especie.
Tema 3.- Página 2 de 15
Principios y aplicaciones.
Modelo del condicionamiento clásico: Cuando un estímulo nuevo y neutro
adquiere la capacidad para provocar una respondiente podemos decir que se produce
un condicionamiento clásico. En este tipo de condicionamiento participan
fundamentalmente 4 elementos, los siguientes (ver la figura 5-2, capítulo 5, pág 161):
1.- Estímulo incondicionado (Ei): es un estímulo que provoca una respondiente
de forma automática. P.e. un foco de luz (Ei) contrae nuestra pupila
(respondiente)
2.- Respuesta incondicionada (Ri): es la respondiente propiamente, es
provocada por el Ei, en el ejemplo anterior sería la contracción de la pupila.
3.- Estímulo neutro (En): es un estímulo que no provoca la respondiente, en
principio (por ello se denomina neutro). En una experiencia de
condicionamiento clásico se emparejan el En con el Ei. P.e. antes del haz de luz
(Ei), hacemos que suene un pitido (En).
4.- Respuesta condicionada (Rc) y Estímulo Condicionado (Ec). Cuando el En
se ha asociado con el Ei, puede llegar a provocar una reacción similar a la Ri,
denominada Respuesta condicionada (Rc). La Rc es generalmente más
moderada que la Ri. Después de haberse producido la asociación entre el En
y el Ei, el En pasa a denominarse Ec (estímulo condicionado).
Volviendo a nuestro ejemplo anterior (contracción de la pupila ante un foco de
luz intensa). Podemos establecer que si el haz de luz (Ei) siempre aparece después
de un sonido determinado (En al principio y después Ec), podemos esperar con el
tiempo que la sola aparición de ese sonido determinado (Ec) va a provocar la
contracción de la pupila (Rc).
Los aspectos medibles de la respuesta condicionada son:
Magnitud: tamaño o cantidad.
Latencia: lo que tarda en aparecer la respuesta después del estímulo
condicionado.
Confiabilidad: el porcentaje de ensayos de prueba en que se produce la
respuesta.
Adquisición: el uso del fortalecimiento
El emparejamiento del E.C. con el E.I. hasta que aparece la R.C. se denomina
adquisición o entrenamiento para la adquisición. A mayor número de emparejamientos
mayor fortalecimiento de la asociación establecida. El entrenamiento para la
adquisición puede ser directo o indirecto.
Tema 3.- Página 3 de 15
Extinción y recuperación espontanea.
Una vez que se adquiere una asociación entre un E.C. y un E.I., se da por
supuesto que persistirá en el tiempo. Si solamente presentamos el E.C., la respuesta
condicionada dejará de fortalecerse y probablemente vaya disminuyendo su tasa hasta
igualarse con la tasa de respuesta antes del condicionamiento (EXTINCIÓN). La
rapidez de extinción depende del animal, de la respuesta, de los estímulos y de la
periodicidad de los ensayos de condicionamiento. Algunas respuestas condicionadas
disminuyen lentamente o permanecen intactas durante muchos años, aún cuando no
se las fortalezca. Aunque la R.C. desaparezca con el tiempo, no parece que ésta se
"borre" totalmente. De hecho, los perros de Pavlov después de una Extinción y un
período relativamente largo de descanso, al presentarles el E.C. manifestaban la R.C..
Generalización y discriminación
El paso de una respuesta condicionada a sucesos similares al estímulo
condicionado y a los aspectos de la situación en los que la respuesta se condicionó
inicialmente, se conoce como GENERALIZACIÓN del estímulo. LA DISCRIMINACIÓN
sería el proceso inverso, es decir, se puede responder a uno o más estímulos
presentes durante el condicionamiento, pero no a estímulos similares.
Contracondicionamiento
Cuando se emparejan R.C. incompatibles como Relajación y Ansiedad, se utiliza
para contrarrestar los efectos negativos de su condicionamiento previo. Así, en el
Contracondicionamiento respondiente, una respuesta específica condicionada se
reemplaza por una nueva respuesta condicionada incompatible con la primera.
Relajación y ansiedad son respuestas incompartibles, lo mismo que alegría y tristeza.
P.e., si tenemos un niño que siente miedo (ansiedad) ante la presencia de
pequeños animales domésticos, podemos establecer un nuevo condicionamiento
(Contracondicionamiento), para ello se lleva a cabo un segundo conjunto de ensayos
de entrenamiento de adquisición. El estímulo condicionado que evoca la respuesta
condicionada inapropiada que debemos reemplazar se trata como un estímulo neutro,
y se asocia con un estímulo incondicionado que provoca una respuesta incompatible
incondicionada. En términos más sencillos, se buscan nuevos estímulos
incondicionados (comer, jugar, etc.) que provocan respuestas incondicionadas
incompatibles con la ansiedad (sentimientos felices, relajación, etc.) y que acompañan
al estímulo condicionado (un gato, conejo, etc.). Con el tiempo el estímulo
condicionado (el gato) se asocia con una reacción emocional agradable, o lo que es
lo mismo, con una conducta condicionada nueva.
Tema 3.- Página 4 de 15
Limitaciones
El aprendizaje de aversión al sabor (AAS) y la ley de Rescorla (que veremos a
continuación) son un ejemplo de las aportaciones al campo del aprendizaje que se
hacen desde la Psicología Cognitiva. Desde esta perspectiva, lo primero que hay que
destacar es que los organismos no aprenden simplemente asociaciones. Es decir, la
función fundamental del aprendizaje no será el mero establecimiento de asociaciones
entre estímulos, sino, que el organismo adquiera conocimiento sobre las relaciones
causales que hay en el ambiente. Por ello debemos pensar que el aprendizaje
proporciona a los organismos el comportarse adaptativamente sobre la base del
conocimiento de las relaciones causales de su ambiente, por ello, el aprendizaje tiene
que cumplir las dos características fundamentales de toda relación causal:
1.- Todo efecto tiene su causa.
2.- La causa tiene que anteceder al efecto.
Tanto el AAS como la ley de Rescorla nos proporciona información relevante
sobre como funciona la causalidad. Y para estudiar esto, lo primero que tenemos que
hacer es repasar rápidamente en que se basa el condicionamiento.
Tanto Pavlov como Skinner decían que el aprendizaje consiste en que los
organismos aprendan asociaciones entre eventos, y para ello se establecen dos
condiciones fundamentales:
1.- Contigüidad temporal. Los estímulos (EC e EI) tienen que darse juntos en el
tiempo.
2.- Repetición y emparejamientos. El EC y el EI no sólo tienen que presentarse
juntos, sino que también deben repetirse, osea, aparecer juntos repetidas
veces.
Desde la Psicología Cognitiva se demuestra que estas dos condiciones no son
suficientes para que se dé un aprendizaje, siendo uno de sus argumentos el AAS, que
veremos a continuación y el otro la ley de Rescorla, que veremos después.
Condicionamiento de aversión al sabor.
García, en la década de los 60, descubrió, trabajando con ratas, un fenómeno
que denominó aprendizaje de aversión condicionada al sabor, consistente en que
cuando damos a beber un sabor nuevo a las ratas, y posteriormente les producimos
un malestar gastrointestinal, la rata aprende a rechazar ese nuevo sabor en
situaciones futuras, y por muy sedienta que se encuentre no vuelve a probar ese
sabor. El experimento de García consistió en lo siguiente:
Tomó dos grupos de ratas y a ambos grupos se les dio de beber sacarosa (un
Tema 3.- Página 5 de 15
sabor nuevo para ellas y que además les encanta). A un grupo después de la bebida
se les inyecto una solución de cloruro de litio, que provoca en las ratas malestar
gastrointestinal. Al otro grupo se les inyecto una solución salina inocua. Pues bien, en
una nueva experiencia, el primer grupo rechaza la sacarosa, mientras que el segundo
grupo la sigue bebiendo.
Este tipo de aprendizaje tiene dos características fundamentales:
1.- Los animales son capaces de aprender este emparejamiento con un solo
ensayo. No es necesario que se produzca la repetición de emparejamientos que
postulan Pavlov y Skinner.
2.- Los emparejamientos entre el EC y el EI se producen incluso en intervalos
de hasta 3 horas. Es decir, si a las ratas que beben sacarosa les administramos
la inyección de cloruro de litio tres horas más tarde, también se produce ese
condicionamiento. Por lo que no es necesario que EC e EI se den juntos en el
tiempo.
La Ley de Rescorla.
La ley de Rescorla da una explicación de como los organismos son capaces de
detectar y aprender relaciones causales. Según Rescorla la condición necesaria para
que se dé aprendizaje es que exista correlación entre eventos. Matemáticamente se
define:
o lo que es lo mismo
... donde:
P1 ó P (EC / EI) ? es la probabilidad de que se dé el EI en presencia del EC.
P2 ó P (¬EC / EI) ? es la probabilidad de que se dé el EI en ausencia del EC.
Por tanto, el aprendizaje dependerá de la diferencia existente entre estas dos
probabilidades. Al ser una resta sencilla pueden darse tres posibilidades totalmente
distintas, las siguientes:
1.- P 1 > P2. El condicionamiento resultante es excitatorio. Significa que el EC
predice la presencia del EI, o lo que es lo mismo, hay una relación positiva
entre ambos estímulos. El organismo aprende que ante la presentación del EC
se sigue la aparición del EI. Un ejemplo de este tipo de aprendizaje es la
relación que se establece entre el rayo y el trueno, ya que todos sabemos que
a continuación del rayo sigue el trueno. La primera probabilidad (P1) sería la
máxima, es decir, el EC siempre predice la aparición del EI, mientras que la
segunda probabilidad sería 0 (P2=0), ya que no puede aparecer un trueno sin
un rayo antes.
Tema 3.- Página 6 de 15
2.- P1 < P2. Se de un proceso de condicionamiento inhibitorio. Significa que el
EC predice la ausencia del EI. El organismo aprende que después de la
presentación de EC no sigue la aparición del EI.
3.- P1 = P2. Se da aprendizaje de independencia. Consiste en que el EC no le
sirve al organismo para nada, ni predice la presencia, ni la ausencia del EI. No
existe correlación entre EC e EI, ambos son independientes. La indefensión
aprendida es un ejemplo de aprendizaje de independencia.
3.3.- Condicionamiento Operante.
En este tipo de condicionamiento las operantes son fundamentales, pero, ¿qué
se entiende por operantes?.
Las conductas operantes son acciones que los propios animales inician. Son
operantes: caminar, bailar, sonreír, jugar, etc. Aunque las operantes dan la impresión
de ser espontáneas y de estar solamente bajo el control del animal, en realidad, sus
consecuencias influyen enormemente en ellas.
El condicionamiento operante o instrumental ocurre cuando la frecuencia de una
respuesta se ve modificada (incrementada o disminuida) por las consecuencias de la
misma. Si las consecuencias de una respuesta son siempre agradables, se puede
decir que la probabilidad de que utilicemos dichas respuesta en una situación similar
se incrementará y, obviamente, viceversa. Imaginaos que habláis de futbol con un
nuevo amigo, este puede entrar inmediatamente en la conversación, compartiendo
nuestros intereses, por tanto, cada vez que veamos a esa persona sabremos que el
futbol puede ser un buen tema de conversación. Por el contrario, si no le gusta el futbol
y cuando sacamos el tema no muestra interés, puede que en el futuro la probabilidad
de hablar de futbol con esa persona disminuirá. En definitiva, podemos estar ante una
conducta modificada por sus consecuencias.
Principios y aplicaciones
Extinción y Recuperación espontánea.
Cuando se retira el reforzamiento para alguna respuesta particular, dicha
conducta disminuye su frecuencia gradualmente hasta que sólo ocurre con la misma
frecuencia que antes del condicionamiento, osea, se extingue. En la vida real, con
frecuencia aprendemos operantes que luego se extinguen por falta de reforzamiento.
Aveces, durante la extinción de operantes, las condiciones por lo general empeoran
antes de mejorar. Inmediatamente después de retirar los reforzadores se puede
advertir un incremento en la cantidad de respuesta, así como en la conducta
emocional, antes de que empiece la disminución. Además, al igual que el
condicionamiento clásico, las operaciones que se han conseguido extinguir vuelven
a aparecer algunas veces, es decir, se produce una recuperación espontánea.
Tema 3.- Página 7 de 15
Generalización y Discriminación.
Las respuestas fortalecidas mediante procedimientos operantes en unas
circunstancias determinadas tienden a extenderse o a generalizarse en situaciones
similares. Cuanto más parecidos sean dos contextos, más probable es la
generalización. Por otro lado, la discriminación surge al reforzarse las respuestas en
una situación, pero, no en otra, lo que permite discriminar correctamente entre unas
situaciones y otras.
Reforzamiento.
El reforzamiento o reforzador, siempre, SIEMPRE, incrementa la probabilidad
de cierta conducta. En este sentido podemos hablar de dos tipos de reforzadores, el
positivo y el negativo.
Reforzador Positivo: se produce siempre que la presencia de un suceso
después de una operante (o conducta) aumente la probabilidad de que dicha operante
ocurra en situaciones similares. Se denomina reforzador positivo porque implica que
el suceso (las consecuencias) están presentes, otra forma de denominarlo es premio.
P.e. si el niño hace los deberes le damos un bollo de merienda. En este caso
consideramos que el bollo en un reforzador positivo, si con él conseguimos que
aumente la probabilidad de que el niño haga los deberes.
Reforzador negativo: siempre que la eliminación de un suceso específico
posterior a la conducta (u operante) aumenta la probabilidad de dicha conducta en
situaciones similares. Se llama también reforzador negativo porque se elimina o quita
algo especialmente molesto. Este reforzador fortalece todas las conductas que nos
liberan de situaciones desagradables. Hay dos tipos de reforzadores negativos:
Comparación de los diversos tipos de reforzamiento
Refuerzo
Si ante una conducta...
Efecto de la consecuencia
Si se suspende el
entrenamiento
Positivo
Se presenta el
reforzador
Negativo
se suspende el castigo Se pospone el castigo
(ESCAPE)
(EVITACIÓN)
Se fortalece la conducta
Se extingue la respuesta reforzada
(puede ocurrir recuperación espontanea)
Condicionamiento de Escape: en el que la frecuencia de una operante
aumenta en circunstancias similares porque pone fin a un suceso en
marcha. P.e. colgar el teléfono para cortar una conversación
desagradable.
Condicionamiento de Evitación: La frecuencia de una operante
aumenta en condiciones similares porque pospone o evita las
consecuencias de la conducta. P.e. respetar las normas de circulación
para evitar una multa, u obedecer a los padres para evitar una regañina.
Tema 3.- Página 8 de 15
Variedad de los reforzadores
Afortunada o desafortunadamente no debemos perder de vista que "lo que
refuerza" varía de un individuo a otro. Por consiguiente, toda consecuencia
determinada tiene que tenerse por "reforzador potencial" hasta que no se establezca
con claridad sus efectos sobre un determinado individuo.
Los reforzadores pueden ser extrínsecos e intrínsecos. Un reforzador se
considera intrínseco cuando la conducta a fortalecer es reforzante por sí misma (comer
con hambre, etc.). Un reforzador extrínseco aporta el premio o la gratificación que no
está presente en la conducta a reforzar. Se pueden establecer tres tipos de
reforzadores extrínsecos:
a) Reforzadores primarios o no aprendidos: nadie necesita aprender lo que le
gusta comer o beber.
b) Reforzadores sociales: los provenientes de otras personas (afecto, atención,
el reconocimiento, etc.).
c) Reforzadores secundarios o condicionados: adquieren su fuerza mediante
condicionamiento clásico: el dinero.
En la vida real, las "diversas recompensas" intrínsecas y extrínsecas se
encuentran mezcladas en un mismo suceso reforzante.
Programación del reforzamiento.
PROGRAMA CONTINUO: El reforzamiento sigue a cada una de las respuestas.
Es el mejor para condicionar inicialmente una conducta.
PROGRAMA PARCIAL: No se refuerzan todas las conductas, sino sólo algunas.
Es la continuidad natural del programa continuo. Tiene dos versiones distintas Razón
(sobre la base del número de respuestas necesarias para obtener un reforzador) o
Intervalo (en función de un lapso de tiempo). Y a su vez éstos pueden ser fijos o
variables. El fijo es cuando se establece de forma estable las condiciones para obtener
la recompensa. Y el variable cuando las condiciones para obtener el reforzador son
variables. Basándose en esto podemos establecer los siguientes programas de
reforzamiento:
RAZÓN FIJA: un número fijo de Respuesta.
INTERVALO FIJO un período de tiempo determinado.
RAZÓN VARIABLE: se presenta el reforzador después de un número variable
de Respuestas.
INTERVALO VARIABLE: el intervalo de tiempo entre reforzadores varía al azar.
Tema 3.- Página 9 de 15
En los casos de razón o intervalo variable, la variación al azar se hace en base
a un valor promedio. En la vida real e investigación, ambos tipos de programas se
combinan. P.e. Cuando entrenamos animales conviene empezar por un programa de
razón fija, para luego pasar a uno de razón variable, estos tipos de programas son los
mejores para la adquisición de respuestas nuevas. Con posterioridad, pasaremos a los
programas de intervalo, primero el fijo y luego el variable (realmente el programa de
intervalo fijo podríamos prescindir de él), este en fundamental para explicar el
mantenimiento de conductas previamente aprendidas, incluso de aquellas conductas
donde la relación entre la conducta y las consecuencias está especialmente
difuminada (conductas supersticiosas).
Moldeamiento.
También se puede denominar aproximaciones sucesivas. Sirve para aprender
nuevas operantes, siendo su proceder el que se describe a continuación.
Al principio, se refuerza una conducta ya existente en el organismo que se
parezca ligeramente a la conducta deseada, con el fortalecimiento de esta conducta,
el proceso se vuelve más selectivo y se pasa a reforzar sólo aquellas respuestas que
se parezcan más a la conducta deseada o buscada. Cuado la conducta nueva vuelve
a consolidarse, volvemos a ser más selectivos en el reforzamiento, y pasamos a
reforzar las conductas que se parezcan aun más a la conducta deseada, y así
sucesivamente hasta que logramos implantar la conducta deseada.
Cuando un niño comienza a comer sólo, lo padres festejan (reforzador social)
la capacidad del niño, aunque los resultados sean pobres, es decir, tire más comida
de la que se lleva a la boca. Según se va fortaleciendo una conducta, los padres
dejaran de festejarla, y reforzarán un avance en la misma por ligero que sea, hasta
llegar un momento en el que el niño será perfectamente capaz de comer sólo y sin
recibir un sólo reforzador (aparte de reforzamiento intrínseco y primario que supone
la comida).
Castigo
El CASTIGO sería lo contrario al Reforzador. Así, el castigo hace que disminuya
la frecuencia de una conducta. Paralelamente podemos hablar de:
CASTIGO POSITIVO: cuando la presencia de un suceso disminuye la
frecuencia de una conducta.
CASTIGO NEGATIVO: cuando la ausencia de un suceso disminuye la
frecuencia de una conducta. Al igual que con el reforzador negativo también
podemos establecer dos tipos de castigo negativo: el costo de respuesta y el
entrenamiento de omisión. En el primero eliminamos un reforzador positivo y en
el segundo se retrasa o pospone el reforzador positivo. Hay dos tipos de castigo
negativo:
Tema 3.- Página 10 de 15
Costo de Respuesta: cuando el castigo consiste en la perdida de un
reforzador. P.e. después de una multa por exceso de velocidad. Somo
especialmente cuidadosos de no superar los límites legales de
velocidad.
Entrenamiento de omisión: aplazamiento del reforzador cada vez que
se inicia la acción que pretendemos eliminar. P.e. recibir 1000pts por
cada día sin fumar, si fumamos, dejamos de ganar las 1000pts.
Comparación de los diversos tipos de castigo
Castigo
Si ante una conducta...
Efecto de la consecuencia
Si se suspende...
Positivo
Se presenta el
castigo
Negativo
Se elimina reforzador Se pospone reforzador
(Costo de respuesta)
(OMISIÓN)
Se debilita la conducta
Se recupera la respuesta castigada
La variedad en los tipos de castigo son las mismas que cuando hablábamos de
reforzadores, obviamente cambiando Reforzador por Castigo. Entonces podríamos
hablar de castigos primarios, secundarios, sociales, etc.
La indefensión aprendida de Seligman.
Es un tipo de aprendizaje instrumental, en términos de la ley de Rescorla, es un
tipo de aprendizaje donde P1 = P2, es decir, la probabilidad de que una respuesta le
sigan unas consecuencias, es la misma, exactamente la misma, que la probabilidad
de que esas consecuencias se den en ausencia de una determinada respuesta. Es por
tanto un claro ejemplo de aprendizaje de independencia.
Seligman trabajo, en la década de los 60, con perros, y demostró como se les
podía enseñar a percibir que no podían tener el control de la situación, o lo que es lo
mismo, no tenían ninguna posibilidad de incidir sobre sus condiciones de "vida". En
uno de sus experimentos más típicos utilizo tres grupos diferentes de perros (un grupo
de escape, otro de acoplado y un tercero de control) y dos fases experimentales
diferentes.
FASE 1.- Se coloca al perro en el arnés y ...
al grupo 1 (escape) se le administran descargas eléctricas, pero se les
proporciona una palanca (situada cerca del hocico) y, si la aprietan puede
interrumpir la administración de la descarga.
al grupo 2 (acoplado) está acoplado al grupo 1, en el sentido de que reciben
la misma secuencia de descargas, con la misma intensidad y duración, pero, a
Tema 3.- Página 11 de 15
este grupo no se le permite evitar la descarga (no disponen de palanca). Dicho
de otra manera, hagan lo que hagan, no pueden evitar las descargas eléctricas.
al grupo 3 (control) no se les administra ninguna descarga, ni ninguna otra
cosa, es decir, no se les hace nada.
Fase 2.- En esta fase a todos los perros de todos los grupos se les introduce en
una caja de evitación o de vaivén. Esta caja consta de dos compartimentos
separados por una valla, y en cada uno de ellos hay una rejilla (en el suelo)
para administrar descargas eléctricas. Se mete al perro en un compartimento
y se le administran descargas, para evitar las descargas, el perro debe saltar
de un compartimento a otro.
Los perros de los grupos control y escape, aprendieron rápidamente a
evitar las descargas, saltando de un compartimento a otro. En cambio, el grupo
acoplado manifestó un comportamiento distinto, con una pauta muy
característica. Los perros se quedaban acurrucados en una esquina soportando
estoicamente las descargas eléctricas, sin hacer absolutamente nada por
evitarlas. Seligman afirma que los perros de este grupo (acoplado) aprendieron
a estar indefensos. Hay que recordar que los perros del grupo acoplado habían
recibido descargas y no podían hacer nada para evitarlas, por tanto, podemos
decir que aprendieron que la administración de las descargas era totalmente
independiente de sus respuestas, o lo que es lo mismo, que las descargas eran
incontrolables para ellos, ya que no disponían de ninguna respuesta efectiva
para escapar de ellas.
Es fácil establecer un simil entre la indefensión aprendida y la depresión en
humanos. Según Seligman, los humanos deprimidos actúan igual que los perro del
grupo acoplado. En este sentido, las depresiones suelen producirse por algún
acontecimiento vital muy fuerte ante el cual estamos indefensos, es decir,
acontecimientos que no podemos controlar, no podemos hacer nada para evitarlos.
Los sujetos deprimidos generalizan estos a todos los acontecimientos de su vida y
aprenden que no pueden hacer nada para evitar los problemas (al igual que los
perros).
Las depresiones en humanos tienen un curso temporal, es decir, generalmente
las depresiones desaparecen con el tiempo. Lo mismo sucede con los perros del grupo
acoplado, si después del experimento se deja pasar un tiempo y después se les vuelve
a meter en la caja de evitación, se observa que sí daban respuestas de evitación de
las descargas. Ante esto, Seligman, sometió a los perros del grupo acoplado a 20
sesiones (anteriormente habían tenido un par de ellas) e incluso más, y lo que ocurría
es que los perros no levantaban cabeza en mucho tiempo, ya no emitían ninguna
respuesta para evitar las descargas. En la depresión humana cuando las conductas
encaminadas a evitarla no producen ningún efecto, el sujeto puede llegar a tener una
depresión de larga duración. En este sentido, los humanos (y también los perros),
necesitamos saber que tenemos el control sobre el ambiente, cuando nos damos
cuenta de que no tenemos ese control, quedamos indefensos. La solución a esto,
Tema 3.- Página 12 de 15
según Seligman, era obligar a los perros a dar respuestas. Los cogía por el collar en
la caja de evitación y los obligaba a saltar, tan sólo después de 4 ó 5 veces, los perros
volvían a emitir rápidamente respuestas de escape.
Limitaciones: La relevancia Causal.
El principio de relevancia causal se opone frontalmente al de
equipotencialidad. Este concepto era mantenido por los postulados tradicionales del
Condicionamiento (Pavlov, Skinner, etc.), y viene a decir lo siguiente:
Cuando se dan las condiciones de contigüidad y repetición de los
emparejamientos, cualquier estímulo es igualmente asociable (en
condicionamiento clásico) con cualquier Ei (estímulo incondicionado), del
mismo modo, cualquier respuesta es igualmente asociable con cualquier
reforzador (en condicionamiento operante).
La AAS, nos puede proporcionar un ejemplo muy sencillo sobre relevancia
causal. Imaginemos que comemos algo por primera vez en un restaurante nuevo. En
el local hay muchos estímulos ambientales, mesas, cuadros, el color de los manteles,
de las paredes, etc. Pues bien, si después de la comida (no necesariamente al
terminar de comer) sentimos malestar, éste se lo atribuimos a la comida y nunca al
color de las paredes, por ejemplo.
Tomado como punto de partida este ejemplo, la relevancia causal nos dice que
hay estímulos (y respuestas) que son más fácilmente asociables, bien con
respondientes, bien con operantes.
Vamos, a continuación a aplicar la relevancia causal a un caso de
condicionamiento instrumental (asociación entre respuestas y reforzadores), realizado
con un tipo de peces muy territoriales. Éstos, cuando llega la época de apareamiento
marcan el territorio dónde cazarán, atraerán a la hembra, etc. Se les intento enseñar
dos tipos de respuestas, asociadas a su correspondiente reforzador, las siguientes:
1.- morder una palanca.
2.- pasar por el aro.
Lo más particular de este experimento eran los reforzadores, cada vez que el
pez emitía una de esas dos respuestas tenia acceso al correspondiente reforzador
(acceso a una hembra o a un macho con el que pelear).
Los resultados obtenidos fueron los siguientes:
1.- Con la respuesta de morder la palanca. Se observó que esta respuesta se
incrementaba cuando daba lugar a tener acceso a otro macho para entablar una pelea.
Cuando se pretendían enseñarle a utilizar el morder la palanca para tener acceso a
una hembra, simplemente no aprendía.
Tema 3.- Página 13 de 15
2.- Pasar por el aro: el resultado de esta respuesta es totalmente contrario al
obtenido con la conducta de morder la palanca. Es decir, pasar por el aro lo podían
aprender cuado el reforzador era una hembra, pero, no aprendían cuando pasar por
el aro les proporcionaba acceso a un contrincante.
Hay respuestas que son más fácilmente asociables a distintos estímulos. El pez
asocia la respuesta de morder más fácilmente a la pelea con un macho y la respuesta
de pasar por el aro se asocia más fácilmente con el acceso a una hembra. Según lo
visto podemos afirmar que el reforzador tiene mucho que ver con las respuestas de los
sujetos.
3.5.- APRENDIZAJE POR OBSERVACIÓN
Cuando una persona cambia de una manera relativamente duradera como
resultado de observar las acciones de otra persona. Bandura afirma que el aprendizaje
vicario puede sustituir al condicionamiento. Aprender por observación abrevia el
proceso de aprendizaje. Si tuviéramos que basarnos exclusivamente en las propias
acciones para aprender, la mayoría de nosotros no completaríamos nunca el proceso
de aprendizaje. Hablar de aprendizaje de imitación no nos permite reducirlo a simple
copia o remedo. En muchos casos, las personas deducen reglas o principios generales
sobre la conducta que les permite ir más allá de lo que ven o escuchan.
Observándonos unos a otros, adquirimos un vasto número de respuestas, incluyendo
palabras para nuestro vocabulario, modales sociales, etc.
Cómo aprendemos por imitación.
Podemos suponer la intervención de los siguientes procesos:
1. ADQUISICIÓN: El que aprende observa un modelo que se comporta de una
manera determinada y reconoce las características distintivas de la conducta
del modelo.
2. RETENCIÓN: Las respuestas del modelo se almacenan activamente en la
memoria del que aprende.
3. EJECUCIÓN: Cuando la conducta del modelo se acepta como apropiada
para el que aprende y con probabilidad de conducir a consecuencias positivas,
adquiere grandes probabilidades de ser reproducida.
4. CONSECUENCIAS: La conducta del que aprende tropieza ahora con
consecuencias que aumentan o disminuyen su frecuencia. En otras palabras,
tiene lugar un condicionamiento operante.
Podemos considerar que el Aprendizaje Vicario es mucho más complicado que
un mero condicionamiento, ya que este proceso lleva pareja la incorporación de
actividades cognoscitivas y, con frecuencia tardanzas muy considerables.
Tema 3.- Página 14 de 15
¿Quién imita a quién?
Las personas que tienen éxito en la vida, o que tienen el subjetivo don del
encanto, o que gozan de un status alto, etc. suelen ser mucho más imitables e imitadas
que otras. Los humanos relativamente poderosos, incluyendo a los padres, que
controlan recursos tan importantes como la TV, los dulces, la hora de ir a la cama y los
juguetes, suelen convertirse en modelos atractivos. Los individuos con los que nos
identificamos suelen ser del mismo sexo, o de la misma edad, y compartir con nosotros
status socio-económico, temperamento, educación, valores, etc.
El estado emocional y el estilo de vida del que aprende, influyen mucho en su
permeabilidad al poder o atractivo de un modelo determinado. La activación emocional
moderada, ya sea el miedo, la ira, o la alegría, parece intensificar la sensibilidad hacia
el aprendizaje por observación (y hacia otro tipo de aprendizaje). Además, somos más
propensos a imitar las conductas que encuadran bien en nuestro propio estilo de vida,
e imitar, incluso, conductas que encajan, no ya en nuestro estilo de vida, sino, en la
concepción que podemos tener sobre nuestro estilo de vida.
Bibliografía Fundamental:
Davidoff, L. (1980). Introducción a la Psicología. México: McGraw Hill. Capítulo 5.
Bibliografía Complementaria:
Almaraz, J., Fernández, P. y Giménez, A. (1995). Prácticas de Psicología Cognitiva:
Aprender. Madrid: McGraw Hill.
Fernández Castro, J. (1995). Aprendizaje operante. En Aníbal Puente (coord.).
Psicología Básica. Madrid: Pirámide. Capítulo 5.
Lindsay P.H. y Norman, D.A. (1986). Introducción a la Psicología Cognitiva. Madrid:
Tecnos. Capítulo 13: Aprendizaje y desarrollo Cognitivo.
Santoro, E. (1995). Aprendizaje respondiente. En Aníbal Puente (coord.). Psicología
Básica. Madrid: Pirámide. Capítulo 5.
Suengas, A. (1995). Aprendizaje cognitivo. En Aníbal Puente (coord.). Psicología
Básica. Madrid: Pirámide. Capítulo 5.
Lectura recomendada:
Skinner, B.F.: Walden Dos. Barcelona: Martínez Roca.
Tema 3.- Página 15 de 15
Documentos relacionados
Descargar