Aprendizaje Clásico Nota: Esta sección ha sido publicada aunque esta sin terminar, solo con el propósito de que mis estudiantes de Psic 3001 puedan repasar para su examen final. Pido disculpas por los errores que pueda contener. I. Introducción A. Definición: 1. El aprendizaje tiene que ver con como adquirimos y mantenemos de forma relativamente estable determinadas conductas y pensamientos. Hay dos definiciones principales que se diferencian según el enfoque. a. Versión Conductista - aprendizaje es el cambio relativamente permanente en la conducta que resulta de la experiencia (nótese el énfasis en la conducta y en el ambiente) b. Versión Cognoscitivista - aprendizaje es cambio relativamente permanente en la forma en que el organismo representa su ambiente y responde al mismo. 2. Hay tres enfoques teóricos básicos sobre como ocurre el aprendizaje: a. Aprendizaje por condicionamiento clásico b. Aprendizaje por condicionamiento operante c. Aprendizaje por observación o social cognoscitivo II. Aprendizaje por condicionamiento clásico A. Introducción: 1. Pavlov y el estudio del proceso de salivación a. Mediciones y control sistemático b. Resultados inesperados c. De problema a empresa investigativa y formulación teórica: es posible aprender a emitir respuestas reflejas ante determinados estímulos B. Conceptos básicos: 1. Repuesta refleja natural o incondicionada - es un respuesta automática, no aprendida (natural) que se emite ante estímulos naturales específicos. Ej. Comida en la boca - salivar 2. En este caso se dice que la respuesta de salivar es natural ante el estimulo de la comida. No hay que aprender a salivar cuando se pone comida en la boca, esa es una respuesta natural o incondicionada. 3. Lo que si se puede aprender es a salivar ante estímulos no naturales. Ej. El sonido de una campana 4. Esto es posible pareando el estimulo no natural (o condicionado) con el estimulo natural o incondicionado (Ej. parear sonido de la campana con comida). Con el tiempo, entonces, es posible salivar solo de oír la campana. En este caso se dice que la respuesta de salivar es una respuesta condicionada. E.C. E.I. ====> R.I. _______________________ E.C. =====> R.C. 5. Mostrar otro ejemplo con el abridor de latas 6. La relación entre el EI y el EC tiene que darse de una manera particular para que sea efectivo. C. Tipos de pareamiento entre el EI y el EC. 1. demorado - se presenta ligeramente antes el EC y se mantiene hasta que aparece el EI. Por un momento coinciden y luego se deja de mostrar el EC. Este es el pareamiento más efectivo. Así el EC se convierte en un anticipador del EI. EC EI=====>RI 2. simultáneo - se presentan simultáneamente el EC y el EI. Este pareamiento es menos efectivo que el demorado. La fuerza del EC es menor en tanto este queda opacado por el EI. Al ser simultáneos el EC no sirve para predecir el EI. EC EI ====> RI 3. de huella - En este se presenta el EC primero y luego el EI. Entre el primero y el segundo se deja pasar algún tiempo, de manera que no coincidan. Este tipo de pareamiento tiene muy poco efecto EC EI =====> RI 4. Retrospectivo - En el mismo la presentación del EC se hace después del EI. Con este pareamiento no se obtienen resultados de aprendizaje alguno. EI =======> RI EC D. Otros conceptos relacionados: 1. Generalización - La respuesta condicionada se emite ante estímulos que se parecen al EC (Ej. campana - timbre) 2. Discriminación - La respuesta condicionada se emite ante ciertos estímulos pero no ante otros (lo de las elipses y los círculos) 3. Extinción - La respuesta condicionada desaparece por razón de que cesa el pareamiento entre el EC y el EI. Hay técnicas para lograr la extinción que se aplican en psicoterapia y que veremos mas adelante. 4. Recuperación espontánea - Luego de haberse logrado la extinción es posible que la repuesta condicionada reaparezca. Si por casualidad esa reaparición esta acompañada del EI la extinción se hace posteriormente más difícil. 5. Condicionamiento de segundo orden: Es cuando un EC sirve de base para una nueva respuesta condicionada. Ej. El perro puede aprender a salivar ante el sonido de la campana y hasta de solo ver la campana. E. Aversión gustativa - Es una situación de condicionamiento clásico particular en la que un solo evento resulta suficiente para producir la RC. La respuesta es una de nauseas, mareos y vómitos ante una comida que puede haber estado dañada o que no es compatible con el organismo. El asunto es que la reacción aversiva puede surgir de solo ver, oler, probar o imaginar la comida en cuestión. Ej. Lo del helado de coco y la mayonesa F. Las Fobias: Ejemplo particular del condicionamiento clásico 1. La demostración de Watson con el pequeño Albert a. Adquisición de una respuesta condicionada b. Ejemplos de generalización c. El trabajo de extinción de Mary Cover Jones 2. Contra-condicionamiento (dos reacciones antagónicas no pueden ocurrir a la vez) 3. Desensibilización sistemática - aplicación controlada del concepto de extinción. Se expone el sujeto a una jerarquía de situaciones acercándolo a la situación fóbica sistemáticamente y sin que el cuerpo este emitiendo la respuesta condicionada. G. Ejemplos y aplicaciones 1. Persona trabaja en deposito de libros y desarrollo reacción alérgica porque hay hongos. Luego cualquier acumulación de libros suscita la misma reacción alérgica. Ha asociado (condicionado) el olor de los libros con los hongos y la reacción alérgica. 2. Experiencias de bochorno al hablar, reprimenda de los padres, persona que de adulto le da temor hablar en publico. 3. jefe - tensión... trabajo tensión.... lunes por la mañana.... tensión; cual puede ser el EC original. 4. perro... ladrido... miedo; luego miedo a los perros... en ciertas situaciones y no en otras 5. inyección... dolor... miedo; inyección -miedo; enfermera, inyección miedo; hospital, alcohol, enfermera.... miedo; H. Biofeedback training y meditación formas de aprendizaje de respuestas de relajamiento Operante Nota: Esta sección ha sido publicada aunque esta sin terminar, solo con el propósito de que mis estudiantes de Psic 3001 puedan repasar para su examen final. Pido disculpas por los errores que pueda contener. Tema: Aprendizaje por condicionamiento operante I. Introducción: 1. No todas nuestras conductas se basan en respuestas reflejas como es la base del condicionamiento clásico. 2. De hecho, la mayor parte de nuestras conductas parecen ser producto de nuestra voluntad (Ej. levantarnos para ir a la universidad, tomar o no un taxi que nos lleve, copiar o no lo que se dice en clase, por mencionar solo algunos ejemplos sencillos). 3. La pregunta fundamental es: ¿cómo adquirimos y mantenemos los diferentes patrones de conductas que llevamos a cabo día a día? 4. Para los llamados “conductistas” adquirimos y preservamos todas nuestras conductas como resultado de las consecuencias ambientales de los mismos. Examinemos esta idea. II. Trasfondo histórico: Thorndike y la ley del efecto. 1. Explicar sus experimentos con gatos: 1. el concepto de jaula – problema 2. como los comportamientos exitosos tienden a repetirse el gato pasa más tiempo cerca de la salida presiona en diferentes lugares con su pata a ver que efecto tiene 3. luego de varios días su conducta dentro de la jaula se limita a aquellas acciones más efectivas para salir de la misma 2. La ley del efecto: En un determinado ambiente, aquellas conductas o respuestas que sean seguidas de consecuencias beneficiosas tenderán a repetirse, mientras que aquellas respuestas que no tengan consecuencias alguna o consecuencias desfavorables tenderán a no repetirse. III. El conductismo según expuesto por B.F. Skinner: A. Conceptos fundamentales 1. Respuesta (Re)- Cualquier conducta que lleva a cabo un organismo en un determinado ambiente ya sea por casualidad o inducido a hacerlo 2. Refuerzo (Rf)- Cualquier evento ambiental que aumenta la probabilidad de que una conducta se repita 3. Estimulo discriminativo (Ed)- Cualquier evento ambiental que este dentro de las capacidades preceptúales de un organismo y que le sirve de señal para emitir una conducta. 4. Respuesta operante (Ro) - Cualquier conducta cuya expresión ha quedado bajo el control de un estimulo por causa de un refuerzo 5. De lo anterior se puede construir la siguiente formula: Ed -------> Ro Rf La cual puede ser leída de la siguiente forma: nuestras conductas se producen ante determinados estímulos por causa de un refuerzo. O dicho de otra forma, todos nuestros comportamientos consistentes se expresan ante determinadas señales por que han sido reforzados. 6. Lo más importante del algoritmo señalado es que permite: explicar, predecir y controlar. Por ejemplo, permite decir que una determinada conducta se expresa en un determinado momento por causa de un refuerzo. Además, si quiero controlar la expresión de la conducta debo presentar el estimulo discriminativo; si esta presente el estimulo discriminativo puedo predecir la aparición de la respuesta. También, si tengo control del refuerzo puedo controlar la conducta ya sea para que se manifieste o para eliminarla (eliminando el refuerzo). Parece complicado… y lo es! 7. Basado en todo lo anterior puedo lograr respuestas complejas a partir del condicionamiento de respuestas más sencillas. A este proceder se le conoce como “shaping” o en español “moldeamiento” o encadenamiento. 8. Procede aquí explicar todo el ejemplo con la paloma y la caja de Skinner. B. Programas de refuerzo: Se refiere a la manera en que se pueden administrar el refuerzo respecto a la conducta deseada. Los programas de refuerzo se dividen a base de tiempo (intervalo) o de cantidad (razón) y si son fijos o variables. La combinación de cada categoría da como resultado cuatro programas de refuerzo: 1. Intervalo fijo - aquí el refuerzo se da luego de transcurrido un tiempo fijo tras emitir la respuesta. Por ejemplo: 2.5 horas de trabajo, 15 minutos de receso. Otro ejemplo: 2 horas de estudio, 2 horas de descanso (incluyendo juego o TV). 2. Intervalo variable - El refuerzo se da tras espacios variables de tiempo luego de manifestarse la conducta. Por ejemplo: 15 minutos de estudio, media hora de juego; otro día, media hora de estudio, media hora de descanso (la cantidad de tiempo de estudio se refuerza de manera variable) 3. razón fija - El refuerzo se da luego de ocurrir la conducta un número fijo de veces. Por ejemplo: 12 piezas terminadas, se paga por las mismas. Otro ejemplo: aprendizaje asistido por computadoras: se refuerza cada vez que el aprendiz conteste correctamente. 4. razón variable - El refuerzo se da luego de ocurrir la conducta un número variable de veces. Por ejemplo: las tragamonedas: el refuerzo (ganar) se produce luego de un numero variable de veces de repetirse la conducta (jugar), a veces gana a los 3 intentos, luego a los diez, luego a los 2, luego a los 15, luego a los 30, luego a los 2 y así variablemente. Cada programa de refuerzo resulta mas practico para distintas circunstancias. Sin embargo, en términos generales podemos decir que los programas variables producen conductas mas difíciles de extinguir ya que suscitan el fenómeno "expectativa", esto es, continuar repitiendo la conducta esperando en que “en algún momento” el refuerzo ha de aparecer. C. Otros conceptos importantes: 1. Al modelo de condicionamiento operante también aplican los conceptos de: a. b. c. d. generalización discriminación extinción recuperación espontánea 2. Refuerzo inmediato y refuerzo retrasado a. inmediato - se da inmediatamente después de que ocurre la conducta deseada b. retrasado - se da posteriormente, el tiempo que puede transcurrir es variable y puede ir de horas a días, meses o años c. El refuerzo es mas efectivo cuando es inmediato, pero a partir de refuerzos inmediatos se pueden construir programas de refuerzo retrasado o demorado. Por ejemplo, condicionar buenos hábitos de estudio en un niño a partir de refuerzos inmediatos (como una hora de video juegos por media hora de estudios); luego de adulto utilizo refuerzos demorados como un viaje a Epcot Center si pasas todas las clases del semestre con C o mas y 25 dólares de bono por cada clase en que saque B y 35 por cada clase en que saque A (50 si la clase es de especialidad… es solo un ejemplo!) 3. Refuerzo primario y secundario a. Refuerzo primario - Es aquel que adquiere su capacidad de actuar como refuerzo por estar directamente relacionado a la satisfacción de las necesidades naturales del organismo (ej. alimento, contacto, afecto) b. Refuerzo secundario - Es aquel que adquiere su capacidad de fungir como refuerzo porque el organismo lo ha relacionado con la adquisición de refuerzos primarios. Por ejemplo: el dinero. 4. Refuerzo negativo a. En términos básicos, se define el refuerzo negativo como aquella situación en que la remoción de algo aumenta la probabilidad de que ocurra una conducta. Por ejemplo: digamos que un profesor establece que la evaluación de un curso se hará basado en la calificación obtenida en 4 exámenes de los cuales 3 son parciales y uno es final general. Luego, establece la siguiente condición: si al momento del final su promedio en la clase es de sobre 90%, pues esta eximido de tomar el final. Así, la potencial remoción del final aumentara la probabilidad de que ocurra la conducta de “estudiar intensamente”. b. Nótese que el refuerzo negativo se diferencia del refuerzo positivo en que en el refuerzo positivo se da algo mientras que en el negativo se quita algo. Sin embargo, en ambos casos lo que se da o lo que se quita es algo que el organismo lo desea (o sea, le resulta placentero). Además, en ambos casos, el objetivo fundamental es que una respuesta se repita. c. Esto diferencia al refuerzo negativo del castigo que no es lo mismo, como veremos mas adelante. D. Castigo: 1. En términos generales podemos decir que el castigo reviste dos cualidades principales (que a su vez lo diferencian del refuerzo positivo y del negativo). a. Primero - El castigo es en si un evento que resulta desagradable (doloroso, lastimoso) a quien lo recibe. b. Segundo - El propósito fundamental del castigo es evitar que una conducta se repita. c. Nótese entonces que el castigo se diferencia del refuerzo positivo y del negativo en que: 1) El evento no es agradable al organismo. 2) No incentiva conductas sino que quiere reprimirlas. 2. Dentro del condicionamiento operante (básicamente skinneriano) no se recomienda el castigo como estrategia de modificación de conducta porque el mismo puede tener efectos secundarios no deseados; entre ellos: a. No siempre queda claro cual es la conducta que se quiere reprimir. b. Como resultado de lo anterior puede suceder que se repriman otras conductas que no son supuestamente las deseadas (Ej. un padre castiga a su hijo porque interrumpe sus conversaciones, como resultado el hijo se desarrolla como una persona poco comunicativa). c. No necesariamente deja claro cuales son las conductas alternas que se quieren promover (pues las mismas no se están reforzando). d. Puede promover la conducta violenta y agresiva. e. La conducta se evita solo en presencia de quien castiga. Observación Nota: Esta sección ha sido publicada aunque esta sin terminar, solo con el propósito de que mis estudiantes de Psic 3001 puedan repasar para su examen final. Pido disculpas por los errores que pueda contener. Tema: Aprendizaje por observación o social - cognoscitivo I. Introducción: A pesar de que el condicionamiento operante representa una evolución respecto al condicionamiento clásico, algunos plantean que limitar la explicación del aprendizaje al ambiente y a las conductas, resulta limitado. Algunos investigadores, en diferentes momentos, propusieron categorías y procedimientos sobre el aprendizaje que requerían ir más allá del ambiente y del comportamiento manifiesto. Específicamente, requerían ir al ámbito de lo mental (o cognoscitivos) para poder explicar determinados fenómenos. En esta sección exploraremos algunos de los pioneros en esa dirección y algunos de sus señalamientos más importantes. II. W. Kholer y el concepto del “insight” A. Explicar los experimentos de Kholer con los chimpancés y como se demuestra un aprendizaje que va más allá del refuerzo inmediato y que requiere el uso de categorías mentales como la reorganización espontánea de los estímulos ambientales que ocurre en el insight. III. E. Tolman y los conceptos de: mapas cognoscitivos y aprendizaje latente A. Explicar los experimentos de Tolman con diferentes grupos de ratas y como los mismos demuestran que el organismo puede hacer una representación interna de su ambiente (mapas cognoscitivos) y como el aprendizaje puede darse en ausencia de refuerzos y que puede haber aprendizaje aunque de momento no se manifieste (aprendizaje latente). IV. A. Bandura y el aprendizaje por observación A. Explicar el experimento de Bandura y como el mismo demuestra que puede haber aprendizaje sin refuerzo, basado en la observación. Además, cuan importante es el modelo y las consecuencias de su conducta.