psicoapuntesjess.wordpress.com TEMA 6 Psicología del Aprendizaje CAPÍTULO 6: PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN 1. INTRODUCCIÓN GENERAL AL CAPÍTULO Un programa de reforzamiento es un programa o regla que determina la forma en que se relacionan las presentaciones del reforzador con las ocurrencias de la respuesta instrumental. Determinan la tasa y el patrón de las respuestas instrumentales. No implica que cada respuesta instrumental lleve asociada la entrega de un reforzador, no existe normalmente esa contingencia perfecta. Un programa de reforzamiento influye en la forma de aprender una respuesta instrumental y en la forma en que se mantiene esa respuesta por el reforzamiento. PROGRAMAS DE RAZÓN: El reforzamiento depende sólo del número de respuestas que el organismo realiza. Se entrega el reforzador cada vez que se alcance el número de respuestas requerido. Se denominan programas de reforzamiento continuo (RFC). No suele suceder nunca fuera del laboratorio, y suele darse de forma ocasional. Las situaciones en las que la respuesta se refuerza sólo alguna vez incluyen un reforzamiento parcial o intermitente. PROGRAMAS DE RAZÓN FIJA (RF) Es necesario un número fijo de respuestas para conseguir el reforzamiento. Los programas de reforzamiento continuo son también programas de razón fija. Tasa constante de respuestas una vez que se ha iniciado la conducta. Instrumento para representar la forma de repetirse una respuesta a lo largo del tiempo. Da una imagen visual de cuándo y con qué frecuencia responde el sujeto durante la sesión. Pausa posreforzamiento: tasa cero de respuesta que se observa justo después del reforzamiento. Carrera de la razón: tasa de respuesta alta y estable que completa cada requerimiento de la razón. Tensión de la razón: efecto que se produce si el requerimiento de la razón sufre un incremento súbito y significativo, es probable que el animal realice una pausa periódica cada vez que complete la razón requerida. 1 PROGRAMAS DE RAZÓN VARIABLE (RV) Procedimiento en el que se necesita un número de respuestas distinto para la entrega de cada recompensa. Las pausas predecibles en la tasa de respuesta son menos probables que con los programas de RF, ya que el número de respuestas necesario para conseguir el reforzamiento no es predecible. psicoapuntesjess.wordpress.com TEMA 6 Psicología del Aprendizaje PROGRAMAS DE INTERVALO Las respuestas son reforzadas sólo si ocurren cuando ha transcurrido cierta cantidad de tiempo y desde la última entrega del reforzador. Programas de intervalo y espera limitada: en los programas de intervalo simples, una vez que está disponible el reforzador, permanece disponible hasta que se realiza la respuesta requerida, no importa cuánto tiempo cueste. Cuando se hace lo mismo fuera de laboratorio, lo común es que los reforzadores estén disponibles sólo durante periodos de tiempo limitados. Esta restricción en el tiempo durante el que permanece disponible el reforzador, se denomina espera limitada. Las restricciones que se pueden añadir a través de la espera limitada se pueden aplicar tanto a los programas de intervalo fijo como a los programas de intervalo variable. PROGRAMAS DE INTERVALO FIJO (IF) PROGRAMAS DE INTERVALO VARIABLE (IV) El tiempo establecido para la entrega del reforzador no varía de una ocasión a la siguiente. Se dan en situaciones en las que se necesita una cantidad fija de tiempo para dispensar el reforzador. Las respuestas se refuerzan sólo si ocurren después de que haya transcurrido una cantidad fija de tiempo desde la administración del reforzador previo, o desde el comienzo del programa. Festón de intervalo fijo: es el patrón de respuesta que se desarrolla con los programas de reforzamiento de IF. Un programa de IF no garantiza que el reforzador se dará en algún momento a lo largo del intervalo de tiempo. Se necesitan respuestas instrumentales para conseguir el reforzador. El intervalo determina cuándo el reforzador está disponible, no cuándo se entrega. Las respuestas se refuerzan si se dan tras haber transcurrido un intervalo variable desde la administración del reforzador previo, o desde el comienzo del programa. 2 El sujeto tiene que realizar la respuesta instrumental para obtener el reforzador. Los reforzadores se dan sólo si el organismo responde tras un intervalo variable. Son programas que mantienen tasas de respuesta constantes y estables sin pausas regulares. psicoapuntesjess.wordpress.com TEMA 6 Psicología del Aprendizaje COMPARACIÓN PROGRAMAS DE RAZÓN Y PROGRAMAS DE INTERVALO RAZÓN FIJA E INTERVALO FIJO: producen una pausa posreforzamiento después de la administración de cada reforzador. RAZÓN FIJA E INTERVALO FIJO: producen tasas altas de respuesta justo antes de la administración del siguiente reforzador. RAZÓN VARIABLE E INTERVALO VARIABLE: mantienen tasas estables de respuesta, sin pausas predecibles. INTERVALO Y RAZÓN: activan diferentes cambios neuroquímicos en el cerebro. INTERVALO: la conducta que mantienen está mediada por el sentido temporal del organismo. RAZÓN: la actuación que provocan no contiene influencia de los mecanismos temporales. PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA. Necesitan de forma específica que el organismo responda a una tasa particular para obtener el reforzador. Los programas de razón producen tasas de respuesta mayores que los programas de intervalo, pero ni el uno ni el otro requieren una tasa específica de respuesta para conseguir el reforzamiento. En Tasas de respuesta el reforzamiento de una respuesta particular depende de cuánto de pronto ocurre la respuesta precedente. Es un procedimiento que fomenta tasas altas de respuesta y se denomina reforzamiento diferencial de tasas altas (RDA). En los RDA una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Se consigue el resultado opuesto si se refuerza una respuesta sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa. Este procedimiento se denomina reforzamiento diferencial de tasas bajas (RDB), y fomenta que los sujetos respondan lentamente. 2. CONDUCTA DE ELECCIÓN: PROGRAMAS CONCURRENTES Incluyen más de una única respuesta reforzable. Elección simple. La situación consta de dos respuestas alternativas, cada una de ellas seguida por un reforzador de acuerdo con su propio programa de reforzamiento. Implica que los dos programas de reforzamiento funcionen al mismo tiempo o concurrentemente, y el sujeto es libre de cambiar de alternativa cada vez. Se denomina programa concurrente. 2.1 MEDIDAS DE LA CONDUCTA DE ELECCIÓN Tasa relativa de respuesta de cada alternativa: se calcula dividiendo la tasa de respuesta a la alternativa correspondiente, entre la tasa total de respuestas en ambas alternativas. Tasa relativa de reforzamiento conseguido para cada alternativa de respuesta: se calcula dividiendo la tasa de reforzamiento de la alternativa correspondiente, entre la tasa total de reforzamiento de ambas alternativas. 2.2 LA LEY DE LA IGUALACIÓN Ley de la conducta establecida por Hernstein, que establece el principio básico de que las tasas relativas de respuesta se igualan con las tasas relativas de reforzamiento. 3 psicoapuntesjess.wordpress.com TEMA 6 Psicología del Aprendizaje INFRAIGUALACIÓN, SUPRAIGUALACIÓN Y SESGO DE RESPUESTA Las Tasas relativas de respuesta no siempre se igualan con las tasas relativas de reforzamiento. Infraigualación Un tipo de desviación de la igualación perfecta, incluye una sensibilidad reducida de la conducta de elección a las tasas relativas de reforzamiento. Supraigualación La tasa relativa de respuestas es más sensible a la tasa relativa de reforzamiento de lo que se predice para una igualación perfecta. Sesgo de respuesta Influyen en la elección cuando las alternativas de respuesta son diferentes, o cuando el reforzador proporcionado para las dos respuestas es diferente. Ley de igualación y valor del reforzador Las características de un reforzador como su cantidad o palatabilidad y demora, pueden considerarse aspectos de su valor general. Ley de igualación y programas simples de reforzamiento incluso las situaciones de respuesta única pueden conllevar una elección, entre realizar la respuesta especificada u ocuparse de otras posibles actividades. En un programa simple el sujeto recibe no sólo reforzamiento explícito por realizar una respuesta operante específica, sino también recompensas intrínsecas de las otras actividades que pueda realizar. 2.3 MECANISMOS DE LA LEY DE LA IGUALACIÓN Maximización molecular Los organismos siempre eligen cualquier alternativa de respuesta con mejores probabilidades de que sea reforzada en ese momento. Maximización molar El organismo distribuye sus respuestas entre las varias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a la larga. Mejoramiento Muchos aspectos de la conducta no son óptimos a largo plazo, en algún momento de la conducta se determinan con nuestras elecciones situaciones futuras. Son elecciones inocentes que trata de caracterizar el mejoramiento. 3. ELECCIÓN CON COMPROMISO El autocontrol influye en las elecciones importantes de la vida, que implican a veces un beneficio pequeño a corto plazo, frente a un beneficio mayor, más a largo plazo. Programas concurrentes encadenados La técnica básica en esta área de investigación es el programa concurrente encadenado de reforzamiento. Involucra al menos dos fases o eslabones, el de elección y el terminal. Implican una elección con compromiso. 4