unidad iii. el condicionamiento clásico: fundamentos y mecanísmos

Anuncio
ESCUELA DE PSICOLOGÍA
UNIDAD III. EL CONDICIONAMIENTO CLÁSICO: FUNDAMENTOS Y
MECANÍSMOS
Apuntes de clases
Uso exclusivo Procesos psicológicos básicos
Profesor: Jaime Yáñez Galecio
1. INTRODUCCIÓN.
En los capítulos anteriores hemos visto varios aspectos sobre la forma en que estímulos provocan
respuestas. Los estudios sobre habituación, sensibilización y condicionamiento clásico se refieren
fundamentalmente al análisis de los mecanismos por los cuales los estímulos ponen en
funcionamiento las respuestas. Sin embargo se destaca el hecho de que en dichos estudios los
organismos no poseen control sobre los estímulos a los que están expuestos. De hecho, en el
laboratorio ciertos eventos, como los ECs y los EIs, se introducen en la situación según una pauta
determinada por el experimentador.
Los procedimientos para estudiar y modificar la conducta elicitada imitan muchas situaciones de la
vida humana y animal. Se presentan multitud de ocasiones en las que el organismo no tiene ningún
control de los acontecimientos o estímulos con los que se enfrenta. Sin embargo, existen también
muchas circunstancias en las que los hechos son el resultado directo de la conducta del individuo, ej.
"estudiando mucho el alumno puede aprender adecuadamente una asignatura y sacar buena nota";
"metiendo la llave en el auto un conductor puede poner en marcha el motor"; "introduciendo una
moneda en una máquina de bebidas una persona puede conseguir una gaseosa". En estos ejemplos,
algún aspecto de la conducta del sujeto sirve de instrumento para provocar la aparición de un
estímulo consecutivo, es decir una consecuencia. Así la conducta se desarrolla por las consecuencias
que produce. Las respuestas que tienen lugar principalmente porque sirven de instrumento para
producir ciertas consecuencias se llaman conducta instrumental.
Dado que la conducta instrumental está gobernada principalmente por los hechos que produce se la
puede considerar como dirigida a una meta. Las respuestas instrumentales se realizan porque la
meta no se alcanzaría sin ellas. La conducta dirigida a meta supone una gran proporción de toda
conducta animal y humana.
Es un hecho obvio para cualquiera que las consecuencias de una acción pueden determinar la futura
repetición de esa misma acción. Si miramos el suelo y nos encontramos por casualidad un billete de
$10.000, seguiremos mirando el suelo por algún tiempo. No siempre es tan evidente la forma en que
las consecuencias influyen en la conducta futura. Esta unidad está dedicado a mostrar la relación
conducta – consecuencia.
2. PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL.
Los primeros experimentos de laboratorio sobre la conducta instrumental fueron realizados por
Thorndike, y presentados como tesis doctoral en 1898. La idea inicial de Thorndike, influido por la
teoría de la evolución de Darwin, era estudiar la inteligencia animal. Para ello Thorndike diseño cajas
problema (puzzle-box) para gatos, perros y pollos. En uno de sus clásicos experimentos se encerraba
un gato, deprivado de comida, en la caja problema y fuera de ella, a la vista del animal se dejaba un
trozo de pescado. El animal podía escaparse de la caja-problema, por ejemplo, corriendo un cerrojo.
Entre las múltiples respuestas que puede dar un animal confinado puede dar, éste terminaba
realizando el movimiento correcto y salía de la caja. Thorndike lo volvía a poner en la situación
experimental y media el tiempo que tardaba el animal en escaparse en cada ensayo. De esta forma
encontró una correlación negativa entre el tiempo que el gato tardaba en escaparse y el numero de
ensayos realizados con éxito. Es decir, el aumento de ensayos hacia disminuir la latencia de
respuesta del animal.
Thorndike interpreto los resultados de sus experimentos en función del aprendizaje de una asociación
o conexión entre los estímulos de la caja y el movimiento específico de la respuesta de huida. Las
consecuencias de la respuesta exitosa (escapar de la caja, comerse el alimento) sólo servían para
fortalecer la asociación entre los estímulos de la caja y dicho movimiento. Después de observar
diversas especies animales en diferentes cajas- problemas, Thorndike formuló uno de los principios
más importantes del aprendizaje, la ley del efecto. Según dicha ley (establecida por Thorndike en
1911 en su obra Animal intelligence), "si una respuesta
ejecutada en presencia de un estímulo va seguida de un
hecho satisfactorio, la asociación entre el estímulo y la
respuesta se fortalece. Si la respuesta va seguida de un
hecho molesto, la asociación se debilita". Es importante
recalcar que, de acuerdo a la ley del efecto, los animales
aprenden una asociación entre la respuesta y los estímulos
presentes en el momento de la respuesta. La
consecuencia de la respuesta no esta implicada en la
asociación. La consecuencia, satisfactoria o molesta,
simplemente sirve para fortalecer o debilitar el lazo, o
asociación, o conexión, entre la respuesta y la situación
estimular.
Skinner (1938) critica los aspectos teóricos de la ley del efecto y la reformula como la ley de
reforzamiento, concediéndole una importancia capital dentro del condicionamiento operante.
2
3. ASPECTOS BÁSICOS DEL CONDICIONAMIENTO INSTRUMENTAL.
3.1. Paradigma y términos básicos del condicionamiento instrumental.
Ed → R → c
1. La respuesta operante (R): Generalmente respuesta o conducta motora escogida, se define en
función de los efectos que tiene en el ambiente. De esta forma todas las respuestas que tienen el
mismo efecto en el ambiente se consideran ejemplos de la misma operante.
2. La consecuencia (c): Se presenta únicamente después de que se haya emitido la respuesta, o
conducta, deseada. Por lo tanto, la presentación de dicho estímulo depende de la emisión de la
respuesta operante. En términos técnicos la consecuencia es contingente a la respuesta operante. En
términos generales una consecuencia puede se apetitiva o aversiva. Si la consecuencia es apetitiva
se llama estímulo reforzador y este puede definirse como todo aquello que aumenta la probabilidad
de ocurrencia futura de una respuesta y en específico cuando el estímulo reforzador se agrega a la
situación se dice que es un refuerzo positivo (ej. entregar comida, bebida o sexo como reforzadores
primarios o cualquier estimulo que se asocie a ellos cuando se realiza una conducta) y cuando se
retira de la situación se habla de un refuerzo negativo (ej. Golpes, descargas eléctricas, ruidos
molesto o cualquier estímulo desagradable que al ser eliminado aumenta la probabilidad de aparición
de la conducta), ambos, como hemos dicho, tienen como efecto un aumento de la probabilidad de
ocurrencia de la conducta objetivo. Si la consecuencia es aversiva se llama estímulo punitivo o
castigo y este puede definirse como todo aquello que disminuye la probabilidad de ocurrencia futura
de una respuesta y en específico, cuando el estimulo aversivo se agrega a la situación se dice que es
castigo tipo I o castigo a secas, (ej. Administrar un golpe, descargas eléctricas, ruidos molesto o
cualquier estímulo desagradable a alguien producto de haber realizado una conducta determinada) y
cuando dicho tipo de estímulo se retira de la situación se habla de castigo tipo II o entrenamiento de
omisión (ej. Retirar comida, bebida o sexo como reforzadores primarios o cualquier estimulo que se
asocie a ellos por realizar una conducta determinada), ambas situaciones tienen como efecto
disminuir la probabilidad de ocurrencia de la conducta objetivo.
3. El estímulo discriminativo (Ed): Estímulos que se encuentran presentes en la situación de
aprendizaje, excluido el estímulo consecuencia, ellos señalizan la disponibilidad del reforzador si se
ejecuta la conducta instrumental.
3
4. PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL.
En todas las situaciones de condicionamiento instrumental (C.I), la conducta del sujeto produce algún
tipo de consecuencia en el ambiente. Los procedimientos de C.I pueden clasificarse según la
naturaleza del acontecimiento ambiental que es consecuencia de la conducta. El acontecimiento
puede ser agradable o desagradable (estímulo apetitivo y estímulo aversivo respectivamente). Otro
factor importante en la clasificación de los procedimientos de C.I, es la relación o contingencia entre
la respuesta y el acontecimiento ambiental que esta controla (consecuencia) (al igual que en el
condicionamiento clásico, donde se produce una correlación entre EC y EI), esto supone que en el
futuro una determinada conducta instrumental ocurrirá con mayor o menor probabilidad según las
consecuencias que haya tenido en el pasado. De esta forma podemos decir que la conducta operante
o instrumental esta controlada, fundamentalmente, por sus consecuencias. La respuesta instrumental
puede producir el acontecimiento (contingencia positiva) o eliminarlo (contingencia negativa). Un
tercer tipo de contingencia es cuando la consecuencia se presenta independientemente de la
conducta (contingencia cero, incontrolabilidad); operacionalmente tenemos:
a. Contingencia positiva:
P (RF/R) > P (RF/noR)
La probabilidad de que el reforzamiento (RF), o consecuencia, siga a una respuesta (R), o conducta,
es mayor a la probabilidad de que el reforzamiento o consecuencia ocurra en ausencia de la
respuesta o conducta.
b. Contingencia negativa:
P (RF/R) < P (RF/noR)
La probabilidad de que el reforzamiento (RF), o consecuencia, siga a una respuesta (R), o conducta,
es menor a la probabilidad de que el reforzamiento o consecuencia ocurra en ausencia de la
respuesta o conducta.
c. Contingencia cero, incontrolabilidad:
P (RF/R) =P (RF/noR)
La probabilidad de que el reforzamiento (RF), o consecuencia, siga a una respuesta (R), o conducta,
es igual a la probabilidad de que el reforzamiento o consecuencia ocurra en ausencia de la respuesta
o conducta.
4
TIPOS BÁSICOS DE C.I.
Presentación
Estímulo apetitivo
Estímulo aversivo
Reforzamiento positivo
(Recompensa)
Castigo
(tipo I)
Omisión
(castigo tipo II)
Reforzamiento negativo
(Escape o Evitación)
Eliminación
∗ Cuando la presentación o eliminación de los estímulos, ya sean estos apetitivos o aversivos es
independiente de la conducta se produce lo que se denomina Desamparo Aprendido.
∗ Reforzamiento positivo: Las respuestas producen un estímulo apetitivo.
∗ Castigo: Las respuestas producen un estímulo aversivo.
∗ Reforzamiento negativo: Las respuestas interrumpen o impiden la presentación de un estímulo
aversivo.
∗ Omisión: Las respuestas interrumpen o impiden la presentación de un estímulo apetitivo.
5. ELEMENTOS FUNDAMENTALES DEL C.I.
1. La respuesta instrumental.
→ moldeamiento o shaping: Instauración de conductas en el repertorio conductual del sujeto a
través del reforzamiento de aproximaciones sucesivas.
2. El reforzador instrumental.
→ Cantidad y cualidad del reforzador:
* Efecto de contraste conductual positivo.
* Efecto de contraste conductual negativo.
→ Principio de reforzamiento de Premack: Conductas de mayor probabilidad refuerzan conductas
de menor probabilidad.
3. La relación respuesta-reforzador.
→ Contigüidad v/s contingencia.
* Reforzadores condicionados.
* Conducta supersticiosa.
5
6. PROGRAMAS BÁSICOS DE REFORZAMIENTO.
Un programa de reforzamiento es una regla que determina las condiciones en las que la emisión de
una respuesta ira seguida por la presentación de un reforzador. En otros términos un programa de
reforzamiento especifica las ocasiones en que se reforzaran las respuestas de un organismo.
Programas simples o básicos.
A. PROGRAMAS DE RAZÓN.
La característica fundamental de estos programas es que la presentación de reforzamiento depende
sólo del numero de respuestas que da el sujeto. El programa requiere simplemente contar las
respuestas y presentar el reforzador cada vez que se alcanza el numero de respuestas
preestablecido. Estos programas se clasifican a su vez en programas de razón fija (RF) y programas
de razón variable RV.
Programas RF.
Aquí los sujetos deben completar un numero fijo de respuestas para obtener cada reforzamiento.
Ejemplo: RF20; el sujeto debe apretar 20 veces una palanca para que obtenga una bolita de alimento.
RF1 significa que por cada conducta se recibe reforzamiento, esta condición es lo que se conoce
como programa continuo.
Programas RV.
Aquí el número de respuestas requeridas para obtener el reforzamiento cambia de una ocasión a
otra, oscilando al rededor de un valor medio especificado. Ejemplo: RV5, esto significa que el sujeto
recibe, como promedio, un reforzamiento por cada 5 respuestas.
B. PROGRAMAS DE INTERVALO.
El reforzamiento no siempre depende únicamente de la cantidad de respuestas que de el sujeto.
Algunas respuestas solamente se refuerzan si ocurren en unos momentos determinados. Los
programas de intervalo ilustran esta situación. Estos se clasifican en programas de intervalo fijo (IF) y
programas de intervalo variable (IV).
Programas IF.
En estos una respuesta se refuerza sólo si se realiza transcurrida una determinada cantidad de
tiempo fijo (previamente determinado) a partir de la última presentación del reforzador. Como se ha
dicho la cantidad de tiempo es fijo y constante de una ocasión a otra. Ejemplo: IF2, los sujetos
expuestos a este programa siempre son reforzados por la primera respuesta que ejecutan
transcurridos 2 minutos desde la última recompensa.
Programas IV.
Aquí el reforzamiento se da a la primera respuesta operante, previamente determinada, que ocurre
después de un periodo de tiempo variable desde el anterior reforzamiento. El intervalo entre
reforzadores cambia de una ocasión a otra. El IV, Al igual que el RV, se especifica por su valor
promedio.
6
Los programas de RV e IV se denominan también programas parciales.
Comparación entre los programas de razón e intervalo.
(Ver registro acumulativo de los cuatro programas básicos de reforzamiento en Domjan, M. y
Burkhard, B. (2004). Principios de Aprendizaje y Conducta. Cap. 6.
Dibujo Registro acumulativo de respuestas
Patrones de registro acumulativo de presión de palanca. en estos registros, el desplazamiento
horizontal indica el paso del tiempo y el desplazamiento vertical las respuestas acumulativas. Las
marcas oblicuas indican cuándo se libera el reforzador.
7. TEORIAS DEL REFORZAMIENTO.
7.1. Teorías de regulación biológica.
7.2. Teorías de regulación conductual.
7.3. Teorías biológico-conductuales, de selección de respuesta.
8. EXTINCIÓN.
8.1. Procedimiento.
El no reforzamiento de una respuesta que previamente había sido reforzada se llama extinción. Así,
en el condicionamiento instrumental, la extinción es la reducción de una respuesta instrumental
cuando no va seguida por el reforzador.
8.2. Efectos del procedimiento de extinción.
1. Descenso gradual de la tasa de respuesta instrumental: durante la primera sesión de extinción
los sujetos, al principio, pueden responder rápidamente, pero luego decae gradualmente la tasa
de respuesta. Posteriormente se observa recuperación espontanea.
7
2. Efectos emocionales intensos y activación conductual (frustración).
8.3. Determinantes de los efectos de la extinción.
El factor más importante para determinar la magnitud de los efectos conductuales y emocionales de
un procedimiento de extinción es el programa de reforzamiento utilizado con la respuesta instrumental
antes de que se introduzca el procedimiento de extinción.
Se ha observado que los efectos son de mayor magnitud en programas fijos en comparación con
programas parciales.
Mecanismos del efecto del reforzamiento parcial sobre la extinción.
Hipótesis de discriminación: Los sujetos reforzados con un programa continuo discriminan más
fácilmente la ausencia de reforzamiento que aquellos reforzados con un programa parcial.
9. CONTROL DE ESTÍMULOS.
9.1. La generalización y discriminación de estímulos.
9.1.1. La adquisición del control de estímulos.
10. CONTROL AVERSIVO.
10.1. La conducta de evitación.
10.1.1. El procedimiento de evitación discriminada.
10.1.2. La teoría de la evitación de los dos procesos.
CONTROL AVERSIVO: LA EVITACION Y EL CASTIGO.
La conducta de evitación.
* El procedimiento de evitación discriminada.
* La teoría de la evitación de los dos procesos de Mowrer.
8
Descargar