Tema 3.- Aprendizaje. 3.1.- Cuestiones preliminares Definición Medición 3.2.- Condicionamiento Clásico Principios y aplicaciones. Limitaciones: El aprendizaje de aversión al sabor. Ley de Rescorla. 3.3.- Condicionamiento Operante Principios y aplicaciones. Reforzamiento. Moldeamiento. Castigo. La indefensión aprendida de Seligman. Limitaciones: la relevancia causal. 3.5.- Aprendizaje por observación. Cómo aprendemos por observación ¿Quién imita a quién? 3.1.- Cuestiones preliminares Definición. Podemos definir el aprendizaje como cambio relativamente duradero de conducta causado por la experiencia. Generalmente medimos lo que un organismo hace para hacernos una idea de su aprendizaje. Pero aprender es una actividad interna que no puede observarse directamente. Debemos tener en cuenta que los cambios de conducta no siempre se pueden atribuir a la experiencia. La fatiga, los fármacos, los motivos, las emociones y la maduración alteran también nuestros comportamientos. En contraste, los efectos de la fatiga, fármacos, motivos y emociones tienden a ser breves en el tiempo, frente a los efectos más duraderos del aprendizaje. Por el contrario, los efectos de la MADURACIÓN también son duraderos. El crecimiento del cuerpo y del sistema Tema 3.- Página 1 de 15 nervioso propician también cambios estables de conducta. Las respuestas que dependen de la maduración aparecen, por lo general, en los momentos en que evolutivamente se esperan y no requieren de ningún entrenamiento especial, en estos casos estaríamos hablando de conductas instintivas o de patrones de acción fijos. Sonreír, reír o llorar son conductas que no se aprenden, de hecho se observan incluso en niños ciegos de nacimiento que no han podido observar estas conductas. Medición. El aprendizaje suele medirse observando los cambios de conducta (Rendimiento). Obviamente, ésta no parece ser una buena medida del aprendizaje: 1. Hay muchas cosas que se aprenden sin que éste se manifieste con respuestas observables. Es decir, muchos aprendizajes son latentes (no visibles) y sólo se hacen evidentes cuando se ponen en práctica. 2. El rendimiento o actuación es una medida problemática ya que éste no puede reflejar de forma exacta lo aprendido. Pensemos en una situación de Examen. En definitiva, el rendimiento depende de muchos factores además del aprendizaje, p.e. ansiedad, fatiga, motivación. En resumen, el rendimiento como única medida del aprendizaje parece cuanto menos insatisfactorio. 3.2.- Condicionamiento Clásico o Pavloviano Todos los animales estamos programados por herencia genética con una serie de conductas reflejas (o respondientes) y, por tanto, no aprendidas. Al atragantarnos sentimos nauseas y vómitos. Con un disparo sentimos miedo o al menos un susto. Una luz intensa hace que la pupila se contraiga. Las conductas reflejas incluyen reflejos esqueléticos (susto, retracción de la mano, flexión de la rodilla con un golpe, etc.), reacciones emocionales inmediatas (p.e. ira, temor, júbilo, etc.), y otras reacciones que controla el sistema nervioso autónomo (p.e. náusea, salivación, etc.). Este tipo de condicionamiento también se denomina respondiente porque en él se produce una asociación entre un estímulo neutro (En) y una respondiente (o conducta refleja). Pero, ¿qué es una respondiente? Las características definitorias de las conductas reflejas o respondientes son: 1. Son involuntarias. 2. Están controladas por estímulos disparadores que las preceden inmediatamente. 3. No son conductas aprendidas. Aparecen los mismos reflejos en todos los individuos de la misma especie. Tema 3.- Página 2 de 15 Principios y aplicaciones. Modelo del condicionamiento clásico: Cuando un estímulo nuevo y neutro adquiere la capacidad para provocar una respondiente podemos decir que se produce un condicionamiento clásico. En este tipo de condicionamiento participan fundamentalmente 4 elementos, los siguientes (ver la figura 5-2, capítulo 5, pág 161): 1.- Estímulo incondicionado (Ei): es un estímulo que provoca una respondiente de forma automática. P.e. un foco de luz (Ei) contrae nuestra pupila (respondiente) 2.- Respuesta incondicionada (Ri): es la respondiente propiamente, es provocada por el Ei, en el ejemplo anterior sería la contracción de la pupila. 3.- Estímulo neutro (En): es un estímulo que no provoca la respondiente, en principio (por ello se denomina neutro). En una experiencia de condicionamiento clásico se emparejan el En con el Ei. P.e. antes del haz de luz (Ei), hacemos que suene un pitido (En). 4.- Respuesta condicionada (Rc) y Estímulo Condicionado (Ec). Cuando el En se ha asociado con el Ei, puede llegar a provocar una reacción similar a la Ri, denominada Respuesta condicionada (Rc). La Rc es generalmente más moderada que la Ri. Después de haberse producido la asociación entre el En y el Ei, el En pasa a denominarse Ec (estímulo condicionado). Volviendo a nuestro ejemplo anterior (contracción de la pupila ante un foco de luz intensa). Podemos establecer que si el haz de luz (Ei) siempre aparece después de un sonido determinado (En al principio y después Ec), podemos esperar con el tiempo que la sola aparición de ese sonido determinado (Ec) va a provocar la contracción de la pupila (Rc). Los aspectos medibles de la respuesta condicionada son: Magnitud: tamaño o cantidad. Latencia: lo que tarda en aparecer la respuesta después del estímulo condicionado. Confiabilidad: el porcentaje de ensayos de prueba en que se produce la respuesta. Adquisición: el uso del fortalecimiento El emparejamiento del E.C. con el E.I. hasta que aparece la R.C. se denomina adquisición o entrenamiento para la adquisición. A mayor número de emparejamientos mayor fortalecimiento de la asociación establecida. El entrenamiento para la adquisición puede ser directo o indirecto. Tema 3.- Página 3 de 15 Extinción y recuperación espontanea. Una vez que se adquiere una asociación entre un E.C. y un E.I., se da por supuesto que persistirá en el tiempo. Si solamente presentamos el E.C., la respuesta condicionada dejará de fortalecerse y probablemente vaya disminuyendo su tasa hasta igualarse con la tasa de respuesta antes del condicionamiento (EXTINCIÓN). La rapidez de extinción depende del animal, de la respuesta, de los estímulos y de la periodicidad de los ensayos de condicionamiento. Algunas respuestas condicionadas disminuyen lentamente o permanecen intactas durante muchos años, aún cuando no se las fortalezca. Aunque la R.C. desaparezca con el tiempo, no parece que ésta se "borre" totalmente. De hecho, los perros de Pavlov después de una Extinción y un período relativamente largo de descanso, al presentarles el E.C. manifestaban la R.C.. Generalización y discriminación El paso de una respuesta condicionada a sucesos similares al estímulo condicionado y a los aspectos de la situación en los que la respuesta se condicionó inicialmente, se conoce como GENERALIZACIÓN del estímulo. LA DISCRIMINACIÓN sería el proceso inverso, es decir, se puede responder a uno o más estímulos presentes durante el condicionamiento, pero no a estímulos similares. Contracondicionamiento Cuando se emparejan R.C. incompatibles como Relajación y Ansiedad, se utiliza para contrarrestar los efectos negativos de su condicionamiento previo. Así, en el Contracondicionamiento respondiente, una respuesta específica condicionada se reemplaza por una nueva respuesta condicionada incompatible con la primera. Relajación y ansiedad son respuestas incompartibles, lo mismo que alegría y tristeza. P.e., si tenemos un niño que siente miedo (ansiedad) ante la presencia de pequeños animales domésticos, podemos establecer un nuevo condicionamiento (Contracondicionamiento), para ello se lleva a cabo un segundo conjunto de ensayos de entrenamiento de adquisición. El estímulo condicionado que evoca la respuesta condicionada inapropiada que debemos reemplazar se trata como un estímulo neutro, y se asocia con un estímulo incondicionado que provoca una respuesta incompatible incondicionada. En términos más sencillos, se buscan nuevos estímulos incondicionados (comer, jugar, etc.) que provocan respuestas incondicionadas incompatibles con la ansiedad (sentimientos felices, relajación, etc.) y que acompañan al estímulo condicionado (un gato, conejo, etc.). Con el tiempo el estímulo condicionado (el gato) se asocia con una reacción emocional agradable, o lo que es lo mismo, con una conducta condicionada nueva. Tema 3.- Página 4 de 15 Limitaciones El aprendizaje de aversión al sabor (AAS) y la ley de Rescorla (que veremos a continuación) son un ejemplo de las aportaciones al campo del aprendizaje que se hacen desde la Psicología Cognitiva. Desde esta perspectiva, lo primero que hay que destacar es que los organismos no aprenden simplemente asociaciones. Es decir, la función fundamental del aprendizaje no será el mero establecimiento de asociaciones entre estímulos, sino, que el organismo adquiera conocimiento sobre las relaciones causales que hay en el ambiente. Por ello debemos pensar que el aprendizaje proporciona a los organismos el comportarse adaptativamente sobre la base del conocimiento de las relaciones causales de su ambiente, por ello, el aprendizaje tiene que cumplir las dos características fundamentales de toda relación causal: 1.- Todo efecto tiene su causa. 2.- La causa tiene que anteceder al efecto. Tanto el AAS como la ley de Rescorla nos proporciona información relevante sobre como funciona la causalidad. Y para estudiar esto, lo primero que tenemos que hacer es repasar rápidamente en que se basa el condicionamiento. Tanto Pavlov como Skinner decían que el aprendizaje consiste en que los organismos aprendan asociaciones entre eventos, y para ello se establecen dos condiciones fundamentales: 1.- Contigüidad temporal. Los estímulos (EC e EI) tienen que darse juntos en el tiempo. 2.- Repetición y emparejamientos. El EC y el EI no sólo tienen que presentarse juntos, sino que también deben repetirse, osea, aparecer juntos repetidas veces. Desde la Psicología Cognitiva se demuestra que estas dos condiciones no son suficientes para que se dé un aprendizaje, siendo uno de sus argumentos el AAS, que veremos a continuación y el otro la ley de Rescorla, que veremos después. Condicionamiento de aversión al sabor. García, en la década de los 60, descubrió, trabajando con ratas, un fenómeno que denominó aprendizaje de aversión condicionada al sabor, consistente en que cuando damos a beber un sabor nuevo a las ratas, y posteriormente les producimos un malestar gastrointestinal, la rata aprende a rechazar ese nuevo sabor en situaciones futuras, y por muy sedienta que se encuentre no vuelve a probar ese sabor. El experimento de García consistió en lo siguiente: Tomó dos grupos de ratas y a ambos grupos se les dio de beber sacarosa (un Tema 3.- Página 5 de 15 sabor nuevo para ellas y que además les encanta). A un grupo después de la bebida se les inyecto una solución de cloruro de litio, que provoca en las ratas malestar gastrointestinal. Al otro grupo se les inyecto una solución salina inocua. Pues bien, en una nueva experiencia, el primer grupo rechaza la sacarosa, mientras que el segundo grupo la sigue bebiendo. Este tipo de aprendizaje tiene dos características fundamentales: 1.- Los animales son capaces de aprender este emparejamiento con un solo ensayo. No es necesario que se produzca la repetición de emparejamientos que postulan Pavlov y Skinner. 2.- Los emparejamientos entre el EC y el EI se producen incluso en intervalos de hasta 3 horas. Es decir, si a las ratas que beben sacarosa les administramos la inyección de cloruro de litio tres horas más tarde, también se produce ese condicionamiento. Por lo que no es necesario que EC e EI se den juntos en el tiempo. La Ley de Rescorla. La ley de Rescorla da una explicación de como los organismos son capaces de detectar y aprender relaciones causales. Según Rescorla la condición necesaria para que se dé aprendizaje es que exista correlación entre eventos. Matemáticamente se define: o lo que es lo mismo ... donde: P1 ó P (EC / EI) ? es la probabilidad de que se dé el EI en presencia del EC. P2 ó P (¬EC / EI) ? es la probabilidad de que se dé el EI en ausencia del EC. Por tanto, el aprendizaje dependerá de la diferencia existente entre estas dos probabilidades. Al ser una resta sencilla pueden darse tres posibilidades totalmente distintas, las siguientes: 1.- P 1 > P2. El condicionamiento resultante es excitatorio. Significa que el EC predice la presencia del EI, o lo que es lo mismo, hay una relación positiva entre ambos estímulos. El organismo aprende que ante la presentación del EC se sigue la aparición del EI. Un ejemplo de este tipo de aprendizaje es la relación que se establece entre el rayo y el trueno, ya que todos sabemos que a continuación del rayo sigue el trueno. La primera probabilidad (P1) sería la máxima, es decir, el EC siempre predice la aparición del EI, mientras que la segunda probabilidad sería 0 (P2=0), ya que no puede aparecer un trueno sin un rayo antes. Tema 3.- Página 6 de 15 2.- P1 < P2. Se de un proceso de condicionamiento inhibitorio. Significa que el EC predice la ausencia del EI. El organismo aprende que después de la presentación de EC no sigue la aparición del EI. 3.- P1 = P2. Se da aprendizaje de independencia. Consiste en que el EC no le sirve al organismo para nada, ni predice la presencia, ni la ausencia del EI. No existe correlación entre EC e EI, ambos son independientes. La indefensión aprendida es un ejemplo de aprendizaje de independencia. 3.3.- Condicionamiento Operante. En este tipo de condicionamiento las operantes son fundamentales, pero, ¿qué se entiende por operantes?. Las conductas operantes son acciones que los propios animales inician. Son operantes: caminar, bailar, sonreír, jugar, etc. Aunque las operantes dan la impresión de ser espontáneas y de estar solamente bajo el control del animal, en realidad, sus consecuencias influyen enormemente en ellas. El condicionamiento operante o instrumental ocurre cuando la frecuencia de una respuesta se ve modificada (incrementada o disminuida) por las consecuencias de la misma. Si las consecuencias de una respuesta son siempre agradables, se puede decir que la probabilidad de que utilicemos dichas respuesta en una situación similar se incrementará y, obviamente, viceversa. Imaginaos que habláis de futbol con un nuevo amigo, este puede entrar inmediatamente en la conversación, compartiendo nuestros intereses, por tanto, cada vez que veamos a esa persona sabremos que el futbol puede ser un buen tema de conversación. Por el contrario, si no le gusta el futbol y cuando sacamos el tema no muestra interés, puede que en el futuro la probabilidad de hablar de futbol con esa persona disminuirá. En definitiva, podemos estar ante una conducta modificada por sus consecuencias. Principios y aplicaciones Extinción y Recuperación espontánea. Cuando se retira el reforzamiento para alguna respuesta particular, dicha conducta disminuye su frecuencia gradualmente hasta que sólo ocurre con la misma frecuencia que antes del condicionamiento, osea, se extingue. En la vida real, con frecuencia aprendemos operantes que luego se extinguen por falta de reforzamiento. Aveces, durante la extinción de operantes, las condiciones por lo general empeoran antes de mejorar. Inmediatamente después de retirar los reforzadores se puede advertir un incremento en la cantidad de respuesta, así como en la conducta emocional, antes de que empiece la disminución. Además, al igual que el condicionamiento clásico, las operaciones que se han conseguido extinguir vuelven a aparecer algunas veces, es decir, se produce una recuperación espontánea. Tema 3.- Página 7 de 15 Generalización y Discriminación. Las respuestas fortalecidas mediante procedimientos operantes en unas circunstancias determinadas tienden a extenderse o a generalizarse en situaciones similares. Cuanto más parecidos sean dos contextos, más probable es la generalización. Por otro lado, la discriminación surge al reforzarse las respuestas en una situación, pero, no en otra, lo que permite discriminar correctamente entre unas situaciones y otras. Reforzamiento. El reforzamiento o reforzador, siempre, SIEMPRE, incrementa la probabilidad de cierta conducta. En este sentido podemos hablar de dos tipos de reforzadores, el positivo y el negativo. Reforzador Positivo: se produce siempre que la presencia de un suceso después de una operante (o conducta) aumente la probabilidad de que dicha operante ocurra en situaciones similares. Se denomina reforzador positivo porque implica que el suceso (las consecuencias) están presentes, otra forma de denominarlo es premio. P.e. si el niño hace los deberes le damos un bollo de merienda. En este caso consideramos que el bollo en un reforzador positivo, si con él conseguimos que aumente la probabilidad de que el niño haga los deberes. Reforzador negativo: siempre que la eliminación de un suceso específico posterior a la conducta (u operante) aumenta la probabilidad de dicha conducta en situaciones similares. Se llama también reforzador negativo porque se elimina o quita algo especialmente molesto. Este reforzador fortalece todas las conductas que nos liberan de situaciones desagradables. Hay dos tipos de reforzadores negativos: Comparación de los diversos tipos de reforzamiento Refuerzo Si ante una conducta... Efecto de la consecuencia Si se suspende el entrenamiento Positivo Se presenta el reforzador Negativo se suspende el castigo Se pospone el castigo (ESCAPE) (EVITACIÓN) Se fortalece la conducta Se extingue la respuesta reforzada (puede ocurrir recuperación espontanea) Condicionamiento de Escape: en el que la frecuencia de una operante aumenta en circunstancias similares porque pone fin a un suceso en marcha. P.e. colgar el teléfono para cortar una conversación desagradable. Condicionamiento de Evitación: La frecuencia de una operante aumenta en condiciones similares porque pospone o evita las consecuencias de la conducta. P.e. respetar las normas de circulación para evitar una multa, u obedecer a los padres para evitar una regañina. Tema 3.- Página 8 de 15 Variedad de los reforzadores Afortunada o desafortunadamente no debemos perder de vista que "lo que refuerza" varía de un individuo a otro. Por consiguiente, toda consecuencia determinada tiene que tenerse por "reforzador potencial" hasta que no se establezca con claridad sus efectos sobre un determinado individuo. Los reforzadores pueden ser extrínsecos e intrínsecos. Un reforzador se considera intrínseco cuando la conducta a fortalecer es reforzante por sí misma (comer con hambre, etc.). Un reforzador extrínseco aporta el premio o la gratificación que no está presente en la conducta a reforzar. Se pueden establecer tres tipos de reforzadores extrínsecos: a) Reforzadores primarios o no aprendidos: nadie necesita aprender lo que le gusta comer o beber. b) Reforzadores sociales: los provenientes de otras personas (afecto, atención, el reconocimiento, etc.). c) Reforzadores secundarios o condicionados: adquieren su fuerza mediante condicionamiento clásico: el dinero. En la vida real, las "diversas recompensas" intrínsecas y extrínsecas se encuentran mezcladas en un mismo suceso reforzante. Programación del reforzamiento. PROGRAMA CONTINUO: El reforzamiento sigue a cada una de las respuestas. Es el mejor para condicionar inicialmente una conducta. PROGRAMA PARCIAL: No se refuerzan todas las conductas, sino sólo algunas. Es la continuidad natural del programa continuo. Tiene dos versiones distintas Razón (sobre la base del número de respuestas necesarias para obtener un reforzador) o Intervalo (en función de un lapso de tiempo). Y a su vez éstos pueden ser fijos o variables. El fijo es cuando se establece de forma estable las condiciones para obtener la recompensa. Y el variable cuando las condiciones para obtener el reforzador son variables. Basándose en esto podemos establecer los siguientes programas de reforzamiento: RAZÓN FIJA: un número fijo de Respuesta. INTERVALO FIJO un período de tiempo determinado. RAZÓN VARIABLE: se presenta el reforzador después de un número variable de Respuestas. INTERVALO VARIABLE: el intervalo de tiempo entre reforzadores varía al azar. Tema 3.- Página 9 de 15 En los casos de razón o intervalo variable, la variación al azar se hace en base a un valor promedio. En la vida real e investigación, ambos tipos de programas se combinan. P.e. Cuando entrenamos animales conviene empezar por un programa de razón fija, para luego pasar a uno de razón variable, estos tipos de programas son los mejores para la adquisición de respuestas nuevas. Con posterioridad, pasaremos a los programas de intervalo, primero el fijo y luego el variable (realmente el programa de intervalo fijo podríamos prescindir de él), este en fundamental para explicar el mantenimiento de conductas previamente aprendidas, incluso de aquellas conductas donde la relación entre la conducta y las consecuencias está especialmente difuminada (conductas supersticiosas). Moldeamiento. También se puede denominar aproximaciones sucesivas. Sirve para aprender nuevas operantes, siendo su proceder el que se describe a continuación. Al principio, se refuerza una conducta ya existente en el organismo que se parezca ligeramente a la conducta deseada, con el fortalecimiento de esta conducta, el proceso se vuelve más selectivo y se pasa a reforzar sólo aquellas respuestas que se parezcan más a la conducta deseada o buscada. Cuado la conducta nueva vuelve a consolidarse, volvemos a ser más selectivos en el reforzamiento, y pasamos a reforzar las conductas que se parezcan aun más a la conducta deseada, y así sucesivamente hasta que logramos implantar la conducta deseada. Cuando un niño comienza a comer sólo, lo padres festejan (reforzador social) la capacidad del niño, aunque los resultados sean pobres, es decir, tire más comida de la que se lleva a la boca. Según se va fortaleciendo una conducta, los padres dejaran de festejarla, y reforzarán un avance en la misma por ligero que sea, hasta llegar un momento en el que el niño será perfectamente capaz de comer sólo y sin recibir un sólo reforzador (aparte de reforzamiento intrínseco y primario que supone la comida). Castigo El CASTIGO sería lo contrario al Reforzador. Así, el castigo hace que disminuya la frecuencia de una conducta. Paralelamente podemos hablar de: CASTIGO POSITIVO: cuando la presencia de un suceso disminuye la frecuencia de una conducta. CASTIGO NEGATIVO: cuando la ausencia de un suceso disminuye la frecuencia de una conducta. Al igual que con el reforzador negativo también podemos establecer dos tipos de castigo negativo: el costo de respuesta y el entrenamiento de omisión. En el primero eliminamos un reforzador positivo y en el segundo se retrasa o pospone el reforzador positivo. Hay dos tipos de castigo negativo: Tema 3.- Página 10 de 15 Costo de Respuesta: cuando el castigo consiste en la perdida de un reforzador. P.e. después de una multa por exceso de velocidad. Somo especialmente cuidadosos de no superar los límites legales de velocidad. Entrenamiento de omisión: aplazamiento del reforzador cada vez que se inicia la acción que pretendemos eliminar. P.e. recibir 1000pts por cada día sin fumar, si fumamos, dejamos de ganar las 1000pts. Comparación de los diversos tipos de castigo Castigo Si ante una conducta... Efecto de la consecuencia Si se suspende... Positivo Se presenta el castigo Negativo Se elimina reforzador Se pospone reforzador (Costo de respuesta) (OMISIÓN) Se debilita la conducta Se recupera la respuesta castigada La variedad en los tipos de castigo son las mismas que cuando hablábamos de reforzadores, obviamente cambiando Reforzador por Castigo. Entonces podríamos hablar de castigos primarios, secundarios, sociales, etc. La indefensión aprendida de Seligman. Es un tipo de aprendizaje instrumental, en términos de la ley de Rescorla, es un tipo de aprendizaje donde P1 = P2, es decir, la probabilidad de que una respuesta le sigan unas consecuencias, es la misma, exactamente la misma, que la probabilidad de que esas consecuencias se den en ausencia de una determinada respuesta. Es por tanto un claro ejemplo de aprendizaje de independencia. Seligman trabajo, en la década de los 60, con perros, y demostró como se les podía enseñar a percibir que no podían tener el control de la situación, o lo que es lo mismo, no tenían ninguna posibilidad de incidir sobre sus condiciones de "vida". En uno de sus experimentos más típicos utilizo tres grupos diferentes de perros (un grupo de escape, otro de acoplado y un tercero de control) y dos fases experimentales diferentes. FASE 1.- Se coloca al perro en el arnés y ... al grupo 1 (escape) se le administran descargas eléctricas, pero se les proporciona una palanca (situada cerca del hocico) y, si la aprietan puede interrumpir la administración de la descarga. al grupo 2 (acoplado) está acoplado al grupo 1, en el sentido de que reciben la misma secuencia de descargas, con la misma intensidad y duración, pero, a Tema 3.- Página 11 de 15 este grupo no se le permite evitar la descarga (no disponen de palanca). Dicho de otra manera, hagan lo que hagan, no pueden evitar las descargas eléctricas. al grupo 3 (control) no se les administra ninguna descarga, ni ninguna otra cosa, es decir, no se les hace nada. Fase 2.- En esta fase a todos los perros de todos los grupos se les introduce en una caja de evitación o de vaivén. Esta caja consta de dos compartimentos separados por una valla, y en cada uno de ellos hay una rejilla (en el suelo) para administrar descargas eléctricas. Se mete al perro en un compartimento y se le administran descargas, para evitar las descargas, el perro debe saltar de un compartimento a otro. Los perros de los grupos control y escape, aprendieron rápidamente a evitar las descargas, saltando de un compartimento a otro. En cambio, el grupo acoplado manifestó un comportamiento distinto, con una pauta muy característica. Los perros se quedaban acurrucados en una esquina soportando estoicamente las descargas eléctricas, sin hacer absolutamente nada por evitarlas. Seligman afirma que los perros de este grupo (acoplado) aprendieron a estar indefensos. Hay que recordar que los perros del grupo acoplado habían recibido descargas y no podían hacer nada para evitarlas, por tanto, podemos decir que aprendieron que la administración de las descargas era totalmente independiente de sus respuestas, o lo que es lo mismo, que las descargas eran incontrolables para ellos, ya que no disponían de ninguna respuesta efectiva para escapar de ellas. Es fácil establecer un simil entre la indefensión aprendida y la depresión en humanos. Según Seligman, los humanos deprimidos actúan igual que los perro del grupo acoplado. En este sentido, las depresiones suelen producirse por algún acontecimiento vital muy fuerte ante el cual estamos indefensos, es decir, acontecimientos que no podemos controlar, no podemos hacer nada para evitarlos. Los sujetos deprimidos generalizan estos a todos los acontecimientos de su vida y aprenden que no pueden hacer nada para evitar los problemas (al igual que los perros). Las depresiones en humanos tienen un curso temporal, es decir, generalmente las depresiones desaparecen con el tiempo. Lo mismo sucede con los perros del grupo acoplado, si después del experimento se deja pasar un tiempo y después se les vuelve a meter en la caja de evitación, se observa que sí daban respuestas de evitación de las descargas. Ante esto, Seligman, sometió a los perros del grupo acoplado a 20 sesiones (anteriormente habían tenido un par de ellas) e incluso más, y lo que ocurría es que los perros no levantaban cabeza en mucho tiempo, ya no emitían ninguna respuesta para evitar las descargas. En la depresión humana cuando las conductas encaminadas a evitarla no producen ningún efecto, el sujeto puede llegar a tener una depresión de larga duración. En este sentido, los humanos (y también los perros), necesitamos saber que tenemos el control sobre el ambiente, cuando nos damos cuenta de que no tenemos ese control, quedamos indefensos. La solución a esto, Tema 3.- Página 12 de 15 según Seligman, era obligar a los perros a dar respuestas. Los cogía por el collar en la caja de evitación y los obligaba a saltar, tan sólo después de 4 ó 5 veces, los perros volvían a emitir rápidamente respuestas de escape. Limitaciones: La relevancia Causal. El principio de relevancia causal se opone frontalmente al de equipotencialidad. Este concepto era mantenido por los postulados tradicionales del Condicionamiento (Pavlov, Skinner, etc.), y viene a decir lo siguiente: Cuando se dan las condiciones de contigüidad y repetición de los emparejamientos, cualquier estímulo es igualmente asociable (en condicionamiento clásico) con cualquier Ei (estímulo incondicionado), del mismo modo, cualquier respuesta es igualmente asociable con cualquier reforzador (en condicionamiento operante). La AAS, nos puede proporcionar un ejemplo muy sencillo sobre relevancia causal. Imaginemos que comemos algo por primera vez en un restaurante nuevo. En el local hay muchos estímulos ambientales, mesas, cuadros, el color de los manteles, de las paredes, etc. Pues bien, si después de la comida (no necesariamente al terminar de comer) sentimos malestar, éste se lo atribuimos a la comida y nunca al color de las paredes, por ejemplo. Tomado como punto de partida este ejemplo, la relevancia causal nos dice que hay estímulos (y respuestas) que son más fácilmente asociables, bien con respondientes, bien con operantes. Vamos, a continuación a aplicar la relevancia causal a un caso de condicionamiento instrumental (asociación entre respuestas y reforzadores), realizado con un tipo de peces muy territoriales. Éstos, cuando llega la época de apareamiento marcan el territorio dónde cazarán, atraerán a la hembra, etc. Se les intento enseñar dos tipos de respuestas, asociadas a su correspondiente reforzador, las siguientes: 1.- morder una palanca. 2.- pasar por el aro. Lo más particular de este experimento eran los reforzadores, cada vez que el pez emitía una de esas dos respuestas tenia acceso al correspondiente reforzador (acceso a una hembra o a un macho con el que pelear). Los resultados obtenidos fueron los siguientes: 1.- Con la respuesta de morder la palanca. Se observó que esta respuesta se incrementaba cuando daba lugar a tener acceso a otro macho para entablar una pelea. Cuando se pretendían enseñarle a utilizar el morder la palanca para tener acceso a una hembra, simplemente no aprendía. Tema 3.- Página 13 de 15 2.- Pasar por el aro: el resultado de esta respuesta es totalmente contrario al obtenido con la conducta de morder la palanca. Es decir, pasar por el aro lo podían aprender cuado el reforzador era una hembra, pero, no aprendían cuando pasar por el aro les proporcionaba acceso a un contrincante. Hay respuestas que son más fácilmente asociables a distintos estímulos. El pez asocia la respuesta de morder más fácilmente a la pelea con un macho y la respuesta de pasar por el aro se asocia más fácilmente con el acceso a una hembra. Según lo visto podemos afirmar que el reforzador tiene mucho que ver con las respuestas de los sujetos. 3.5.- APRENDIZAJE POR OBSERVACIÓN Cuando una persona cambia de una manera relativamente duradera como resultado de observar las acciones de otra persona. Bandura afirma que el aprendizaje vicario puede sustituir al condicionamiento. Aprender por observación abrevia el proceso de aprendizaje. Si tuviéramos que basarnos exclusivamente en las propias acciones para aprender, la mayoría de nosotros no completaríamos nunca el proceso de aprendizaje. Hablar de aprendizaje de imitación no nos permite reducirlo a simple copia o remedo. En muchos casos, las personas deducen reglas o principios generales sobre la conducta que les permite ir más allá de lo que ven o escuchan. Observándonos unos a otros, adquirimos un vasto número de respuestas, incluyendo palabras para nuestro vocabulario, modales sociales, etc. Cómo aprendemos por imitación. Podemos suponer la intervención de los siguientes procesos: 1. ADQUISICIÓN: El que aprende observa un modelo que se comporta de una manera determinada y reconoce las características distintivas de la conducta del modelo. 2. RETENCIÓN: Las respuestas del modelo se almacenan activamente en la memoria del que aprende. 3. EJECUCIÓN: Cuando la conducta del modelo se acepta como apropiada para el que aprende y con probabilidad de conducir a consecuencias positivas, adquiere grandes probabilidades de ser reproducida. 4. CONSECUENCIAS: La conducta del que aprende tropieza ahora con consecuencias que aumentan o disminuyen su frecuencia. En otras palabras, tiene lugar un condicionamiento operante. Podemos considerar que el Aprendizaje Vicario es mucho más complicado que un mero condicionamiento, ya que este proceso lleva pareja la incorporación de actividades cognoscitivas y, con frecuencia tardanzas muy considerables. Tema 3.- Página 14 de 15 ¿Quién imita a quién? Las personas que tienen éxito en la vida, o que tienen el subjetivo don del encanto, o que gozan de un status alto, etc. suelen ser mucho más imitables e imitadas que otras. Los humanos relativamente poderosos, incluyendo a los padres, que controlan recursos tan importantes como la TV, los dulces, la hora de ir a la cama y los juguetes, suelen convertirse en modelos atractivos. Los individuos con los que nos identificamos suelen ser del mismo sexo, o de la misma edad, y compartir con nosotros status socio-económico, temperamento, educación, valores, etc. El estado emocional y el estilo de vida del que aprende, influyen mucho en su permeabilidad al poder o atractivo de un modelo determinado. La activación emocional moderada, ya sea el miedo, la ira, o la alegría, parece intensificar la sensibilidad hacia el aprendizaje por observación (y hacia otro tipo de aprendizaje). Además, somos más propensos a imitar las conductas que encuadran bien en nuestro propio estilo de vida, e imitar, incluso, conductas que encajan, no ya en nuestro estilo de vida, sino, en la concepción que podemos tener sobre nuestro estilo de vida. Bibliografía Fundamental: Davidoff, L. (1980). Introducción a la Psicología. México: McGraw Hill. Capítulo 5. Bibliografía Complementaria: Almaraz, J., Fernández, P. y Giménez, A. (1995). Prácticas de Psicología Cognitiva: Aprender. Madrid: McGraw Hill. Fernández Castro, J. (1995). Aprendizaje operante. En Aníbal Puente (coord.). Psicología Básica. Madrid: Pirámide. Capítulo 5. Lindsay P.H. y Norman, D.A. (1986). Introducción a la Psicología Cognitiva. Madrid: Tecnos. Capítulo 13: Aprendizaje y desarrollo Cognitivo. Santoro, E. (1995). Aprendizaje respondiente. En Aníbal Puente (coord.). Psicología Básica. Madrid: Pirámide. Capítulo 5. Suengas, A. (1995). Aprendizaje cognitivo. En Aníbal Puente (coord.). Psicología Básica. Madrid: Pirámide. Capítulo 5. Lectura recomendada: Skinner, B.F.: Walden Dos. Barcelona: Martínez Roca. Tema 3.- Página 15 de 15