ESCUELA DE PSICOLOGÍA UNIDAD III. EL CONDICIONAMIENTO CLÁSICO: FUNDAMENTOS Y MECANÍSMOS Apuntes de clases Uso exclusivo Procesos psicológicos básicos Profesor: Jaime Yáñez Galecio 1. INTRODUCCIÓN. En los capítulos anteriores hemos visto varios aspectos sobre la forma en que estímulos provocan respuestas. Los estudios sobre habituación, sensibilización y condicionamiento clásico se refieren fundamentalmente al análisis de los mecanismos por los cuales los estímulos ponen en funcionamiento las respuestas. Sin embargo se destaca el hecho de que en dichos estudios los organismos no poseen control sobre los estímulos a los que están expuestos. De hecho, en el laboratorio ciertos eventos, como los ECs y los EIs, se introducen en la situación según una pauta determinada por el experimentador. Los procedimientos para estudiar y modificar la conducta elicitada imitan muchas situaciones de la vida humana y animal. Se presentan multitud de ocasiones en las que el organismo no tiene ningún control de los acontecimientos o estímulos con los que se enfrenta. Sin embargo, existen también muchas circunstancias en las que los hechos son el resultado directo de la conducta del individuo, ej. "estudiando mucho el alumno puede aprender adecuadamente una asignatura y sacar buena nota"; "metiendo la llave en el auto un conductor puede poner en marcha el motor"; "introduciendo una moneda en una máquina de bebidas una persona puede conseguir una gaseosa". En estos ejemplos, algún aspecto de la conducta del sujeto sirve de instrumento para provocar la aparición de un estímulo consecutivo, es decir una consecuencia. Así la conducta se desarrolla por las consecuencias que produce. Las respuestas que tienen lugar principalmente porque sirven de instrumento para producir ciertas consecuencias se llaman conducta instrumental. Dado que la conducta instrumental está gobernada principalmente por los hechos que produce se la puede considerar como dirigida a una meta. Las respuestas instrumentales se realizan porque la meta no se alcanzaría sin ellas. La conducta dirigida a meta supone una gran proporción de toda conducta animal y humana. Es un hecho obvio para cualquiera que las consecuencias de una acción pueden determinar la futura repetición de esa misma acción. Si miramos el suelo y nos encontramos por casualidad un billete de $10.000, seguiremos mirando el suelo por algún tiempo. No siempre es tan evidente la forma en que las consecuencias influyen en la conducta futura. Esta unidad está dedicado a mostrar la relación conducta – consecuencia. 2. PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL. Los primeros experimentos de laboratorio sobre la conducta instrumental fueron realizados por Thorndike, y presentados como tesis doctoral en 1898. La idea inicial de Thorndike, influido por la teoría de la evolución de Darwin, era estudiar la inteligencia animal. Para ello Thorndike diseño cajas problema (puzzle-box) para gatos, perros y pollos. En uno de sus clásicos experimentos se encerraba un gato, deprivado de comida, en la caja problema y fuera de ella, a la vista del animal se dejaba un trozo de pescado. El animal podía escaparse de la caja-problema, por ejemplo, corriendo un cerrojo. Entre las múltiples respuestas que puede dar un animal confinado puede dar, éste terminaba realizando el movimiento correcto y salía de la caja. Thorndike lo volvía a poner en la situación experimental y media el tiempo que tardaba el animal en escaparse en cada ensayo. De esta forma encontró una correlación negativa entre el tiempo que el gato tardaba en escaparse y el numero de ensayos realizados con éxito. Es decir, el aumento de ensayos hacia disminuir la latencia de respuesta del animal. Thorndike interpreto los resultados de sus experimentos en función del aprendizaje de una asociación o conexión entre los estímulos de la caja y el movimiento específico de la respuesta de huida. Las consecuencias de la respuesta exitosa (escapar de la caja, comerse el alimento) sólo servían para fortalecer la asociación entre los estímulos de la caja y dicho movimiento. Después de observar diversas especies animales en diferentes cajas- problemas, Thorndike formuló uno de los principios más importantes del aprendizaje, la ley del efecto. Según dicha ley (establecida por Thorndike en 1911 en su obra Animal intelligence), "si una respuesta ejecutada en presencia de un estímulo va seguida de un hecho satisfactorio, la asociación entre el estímulo y la respuesta se fortalece. Si la respuesta va seguida de un hecho molesto, la asociación se debilita". Es importante recalcar que, de acuerdo a la ley del efecto, los animales aprenden una asociación entre la respuesta y los estímulos presentes en el momento de la respuesta. La consecuencia de la respuesta no esta implicada en la asociación. La consecuencia, satisfactoria o molesta, simplemente sirve para fortalecer o debilitar el lazo, o asociación, o conexión, entre la respuesta y la situación estimular. Skinner (1938) critica los aspectos teóricos de la ley del efecto y la reformula como la ley de reforzamiento, concediéndole una importancia capital dentro del condicionamiento operante. 2 3. ASPECTOS BÁSICOS DEL CONDICIONAMIENTO INSTRUMENTAL. 3.1. Paradigma y términos básicos del condicionamiento instrumental. Ed → R → c 1. La respuesta operante (R): Generalmente respuesta o conducta motora escogida, se define en función de los efectos que tiene en el ambiente. De esta forma todas las respuestas que tienen el mismo efecto en el ambiente se consideran ejemplos de la misma operante. 2. La consecuencia (c): Se presenta únicamente después de que se haya emitido la respuesta, o conducta, deseada. Por lo tanto, la presentación de dicho estímulo depende de la emisión de la respuesta operante. En términos técnicos la consecuencia es contingente a la respuesta operante. En términos generales una consecuencia puede se apetitiva o aversiva. Si la consecuencia es apetitiva se llama estímulo reforzador y este puede definirse como todo aquello que aumenta la probabilidad de ocurrencia futura de una respuesta y en específico cuando el estímulo reforzador se agrega a la situación se dice que es un refuerzo positivo (ej. entregar comida, bebida o sexo como reforzadores primarios o cualquier estimulo que se asocie a ellos cuando se realiza una conducta) y cuando se retira de la situación se habla de un refuerzo negativo (ej. Golpes, descargas eléctricas, ruidos molesto o cualquier estímulo desagradable que al ser eliminado aumenta la probabilidad de aparición de la conducta), ambos, como hemos dicho, tienen como efecto un aumento de la probabilidad de ocurrencia de la conducta objetivo. Si la consecuencia es aversiva se llama estímulo punitivo o castigo y este puede definirse como todo aquello que disminuye la probabilidad de ocurrencia futura de una respuesta y en específico, cuando el estimulo aversivo se agrega a la situación se dice que es castigo tipo I o castigo a secas, (ej. Administrar un golpe, descargas eléctricas, ruidos molesto o cualquier estímulo desagradable a alguien producto de haber realizado una conducta determinada) y cuando dicho tipo de estímulo se retira de la situación se habla de castigo tipo II o entrenamiento de omisión (ej. Retirar comida, bebida o sexo como reforzadores primarios o cualquier estimulo que se asocie a ellos por realizar una conducta determinada), ambas situaciones tienen como efecto disminuir la probabilidad de ocurrencia de la conducta objetivo. 3. El estímulo discriminativo (Ed): Estímulos que se encuentran presentes en la situación de aprendizaje, excluido el estímulo consecuencia, ellos señalizan la disponibilidad del reforzador si se ejecuta la conducta instrumental. 3 4. PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL. En todas las situaciones de condicionamiento instrumental (C.I), la conducta del sujeto produce algún tipo de consecuencia en el ambiente. Los procedimientos de C.I pueden clasificarse según la naturaleza del acontecimiento ambiental que es consecuencia de la conducta. El acontecimiento puede ser agradable o desagradable (estímulo apetitivo y estímulo aversivo respectivamente). Otro factor importante en la clasificación de los procedimientos de C.I, es la relación o contingencia entre la respuesta y el acontecimiento ambiental que esta controla (consecuencia) (al igual que en el condicionamiento clásico, donde se produce una correlación entre EC y EI), esto supone que en el futuro una determinada conducta instrumental ocurrirá con mayor o menor probabilidad según las consecuencias que haya tenido en el pasado. De esta forma podemos decir que la conducta operante o instrumental esta controlada, fundamentalmente, por sus consecuencias. La respuesta instrumental puede producir el acontecimiento (contingencia positiva) o eliminarlo (contingencia negativa). Un tercer tipo de contingencia es cuando la consecuencia se presenta independientemente de la conducta (contingencia cero, incontrolabilidad); operacionalmente tenemos: a. Contingencia positiva: P (RF/R) > P (RF/noR) La probabilidad de que el reforzamiento (RF), o consecuencia, siga a una respuesta (R), o conducta, es mayor a la probabilidad de que el reforzamiento o consecuencia ocurra en ausencia de la respuesta o conducta. b. Contingencia negativa: P (RF/R) < P (RF/noR) La probabilidad de que el reforzamiento (RF), o consecuencia, siga a una respuesta (R), o conducta, es menor a la probabilidad de que el reforzamiento o consecuencia ocurra en ausencia de la respuesta o conducta. c. Contingencia cero, incontrolabilidad: P (RF/R) =P (RF/noR) La probabilidad de que el reforzamiento (RF), o consecuencia, siga a una respuesta (R), o conducta, es igual a la probabilidad de que el reforzamiento o consecuencia ocurra en ausencia de la respuesta o conducta. 4 TIPOS BÁSICOS DE C.I. Presentación Estímulo apetitivo Estímulo aversivo Reforzamiento positivo (Recompensa) Castigo (tipo I) Omisión (castigo tipo II) Reforzamiento negativo (Escape o Evitación) Eliminación ∗ Cuando la presentación o eliminación de los estímulos, ya sean estos apetitivos o aversivos es independiente de la conducta se produce lo que se denomina Desamparo Aprendido. ∗ Reforzamiento positivo: Las respuestas producen un estímulo apetitivo. ∗ Castigo: Las respuestas producen un estímulo aversivo. ∗ Reforzamiento negativo: Las respuestas interrumpen o impiden la presentación de un estímulo aversivo. ∗ Omisión: Las respuestas interrumpen o impiden la presentación de un estímulo apetitivo. 5. ELEMENTOS FUNDAMENTALES DEL C.I. 1. La respuesta instrumental. → moldeamiento o shaping: Instauración de conductas en el repertorio conductual del sujeto a través del reforzamiento de aproximaciones sucesivas. 2. El reforzador instrumental. → Cantidad y cualidad del reforzador: * Efecto de contraste conductual positivo. * Efecto de contraste conductual negativo. → Principio de reforzamiento de Premack: Conductas de mayor probabilidad refuerzan conductas de menor probabilidad. 3. La relación respuesta-reforzador. → Contigüidad v/s contingencia. * Reforzadores condicionados. * Conducta supersticiosa. 5 6. PROGRAMAS BÁSICOS DE REFORZAMIENTO. Un programa de reforzamiento es una regla que determina las condiciones en las que la emisión de una respuesta ira seguida por la presentación de un reforzador. En otros términos un programa de reforzamiento especifica las ocasiones en que se reforzaran las respuestas de un organismo. Programas simples o básicos. A. PROGRAMAS DE RAZÓN. La característica fundamental de estos programas es que la presentación de reforzamiento depende sólo del numero de respuestas que da el sujeto. El programa requiere simplemente contar las respuestas y presentar el reforzador cada vez que se alcanza el numero de respuestas preestablecido. Estos programas se clasifican a su vez en programas de razón fija (RF) y programas de razón variable RV. Programas RF. Aquí los sujetos deben completar un numero fijo de respuestas para obtener cada reforzamiento. Ejemplo: RF20; el sujeto debe apretar 20 veces una palanca para que obtenga una bolita de alimento. RF1 significa que por cada conducta se recibe reforzamiento, esta condición es lo que se conoce como programa continuo. Programas RV. Aquí el número de respuestas requeridas para obtener el reforzamiento cambia de una ocasión a otra, oscilando al rededor de un valor medio especificado. Ejemplo: RV5, esto significa que el sujeto recibe, como promedio, un reforzamiento por cada 5 respuestas. B. PROGRAMAS DE INTERVALO. El reforzamiento no siempre depende únicamente de la cantidad de respuestas que de el sujeto. Algunas respuestas solamente se refuerzan si ocurren en unos momentos determinados. Los programas de intervalo ilustran esta situación. Estos se clasifican en programas de intervalo fijo (IF) y programas de intervalo variable (IV). Programas IF. En estos una respuesta se refuerza sólo si se realiza transcurrida una determinada cantidad de tiempo fijo (previamente determinado) a partir de la última presentación del reforzador. Como se ha dicho la cantidad de tiempo es fijo y constante de una ocasión a otra. Ejemplo: IF2, los sujetos expuestos a este programa siempre son reforzados por la primera respuesta que ejecutan transcurridos 2 minutos desde la última recompensa. Programas IV. Aquí el reforzamiento se da a la primera respuesta operante, previamente determinada, que ocurre después de un periodo de tiempo variable desde el anterior reforzamiento. El intervalo entre reforzadores cambia de una ocasión a otra. El IV, Al igual que el RV, se especifica por su valor promedio. 6 Los programas de RV e IV se denominan también programas parciales. Comparación entre los programas de razón e intervalo. (Ver registro acumulativo de los cuatro programas básicos de reforzamiento en Domjan, M. y Burkhard, B. (2004). Principios de Aprendizaje y Conducta. Cap. 6. Dibujo Registro acumulativo de respuestas Patrones de registro acumulativo de presión de palanca. en estos registros, el desplazamiento horizontal indica el paso del tiempo y el desplazamiento vertical las respuestas acumulativas. Las marcas oblicuas indican cuándo se libera el reforzador. 7. TEORIAS DEL REFORZAMIENTO. 7.1. Teorías de regulación biológica. 7.2. Teorías de regulación conductual. 7.3. Teorías biológico-conductuales, de selección de respuesta. 8. EXTINCIÓN. 8.1. Procedimiento. El no reforzamiento de una respuesta que previamente había sido reforzada se llama extinción. Así, en el condicionamiento instrumental, la extinción es la reducción de una respuesta instrumental cuando no va seguida por el reforzador. 8.2. Efectos del procedimiento de extinción. 1. Descenso gradual de la tasa de respuesta instrumental: durante la primera sesión de extinción los sujetos, al principio, pueden responder rápidamente, pero luego decae gradualmente la tasa de respuesta. Posteriormente se observa recuperación espontanea. 7 2. Efectos emocionales intensos y activación conductual (frustración). 8.3. Determinantes de los efectos de la extinción. El factor más importante para determinar la magnitud de los efectos conductuales y emocionales de un procedimiento de extinción es el programa de reforzamiento utilizado con la respuesta instrumental antes de que se introduzca el procedimiento de extinción. Se ha observado que los efectos son de mayor magnitud en programas fijos en comparación con programas parciales. Mecanismos del efecto del reforzamiento parcial sobre la extinción. Hipótesis de discriminación: Los sujetos reforzados con un programa continuo discriminan más fácilmente la ausencia de reforzamiento que aquellos reforzados con un programa parcial. 9. CONTROL DE ESTÍMULOS. 9.1. La generalización y discriminación de estímulos. 9.1.1. La adquisición del control de estímulos. 10. CONTROL AVERSIVO. 10.1. La conducta de evitación. 10.1.1. El procedimiento de evitación discriminada. 10.1.2. La teoría de la evitación de los dos procesos. CONTROL AVERSIVO: LA EVITACION Y EL CASTIGO. La conducta de evitación. * El procedimiento de evitación discriminada. * La teoría de la evitación de los dos procesos de Mowrer. 8