LA LEY DEL EFECTO: UN ESTUDIO SOBRE LA IGUALACI6N Y LAS INTERACCIONES DE LOS COMPONENTES RELACIONADOS CON LAS VARIACIONES DEL CASTIGO EN UN PROGRAMA MULTIPLE Resumen Este artfculo tiene dos objetivos: en primer lugar actualizar el soporte te6rico existente en relaci6n con la Ley del efecto y en segundo lugar presentar los resultados de una investigaci6n empfrica orientada a la evaluaci6n de las interacciones entre los componentes en un programa multiple con castigo, asf como tambien de los efectos de exponer inicialmente a los sujetos a condiciones de estfmulo diferenciales y no - diferenciales; se diseiiaron dos experimentos cada uno con dos ratas albinas como sujetos. Todos los sujetos obtuvieron una lfnea de base en un programa T de 10 segundos, con una probabilidad 0.2 de refuerzo y donde T=0.90, tD= 9 segundos y 1= 1 segundo. En el experimento 1 se introdujo posteriormente un programa multiple donde los dos componentes tuvieron el mismo programa de refuerzo que el de la lfnea de base. pero habiendoseles superpuesto ademas un programa de castigo en ambos componentes, con identicas especificaciones que el de refuerzo. Posteriormente el castigo se vari6 a traves de 0.2, 0.1 Y 0.0 probabilidades ante el componente A (procedimiento de ida) replicando las probabilidades 0.1 y 0.2 (procedimiento de vuelta). Estos sujetos tuvieron por 10 tanto, inicialmente, condici6n no diferencial. En el experimento 2 el programa multiple se introdujo 10 mismo que en el experimento 1, pero las probabilidades de castigo fueron variadas en el componente A, a traves de 0.0, 0.05, 0.2 y 0.4 (procedimiento de ida) replicandose con 0.4, 0.2 Y 0.0 (procedimiento de vuelta). Esta replicaci6n fue hecha con una duraci6n de dos minutos para cada componente. En el experimento 1 y en el procedimiento de ida del experimento 2 , la duraci6n del componente fue de 30 segundos. Los resultados para el experimento 1 mostraron que una condici6n no - diferencial inicial impidi6 una igualaci6n entre la respuesta y los estfmulos programados que ejemplificara en alguna medida la discriminaci6n. Se encontr6 una inducci6n positiva para los dos sujetos, siendo mas acentuada ante el componente A. Los resultados para el experimento 2 , mostraron una relaci6n ordenada en el procedimiento de ida para ambos sujetos, expresada en terminos de una proporci6n derivada a partir de la ecuaci6n del castigo en programas concurrentes. Sin embargo, utilizando factores de correcci6n no fue posible que la relaci6n se aproximara a la funci6n 1.0 predicha originalmente. Se discuten igualmente los resultados e implicaciones de este estudio. Palabras Clave: Ley de igualaci6n, Ley del efecto, castigo, programas multiples, programas concurrentes, condicionamiento diferencial, condicionamiento no diferencial, condicionamiento inhibitorio. Abstract This article has two objectives: first, it intends to actualize the existent theoretical base related to the effect law. In second place, it intends to present the results of an empiric investigation oriented to the evaluation of interactions between components related to punishment in a multiple program. I Profesor asociado, Universidad EI Bosque. Psic610goegresado de la Universidad de los Andes; M.A. California State University, Sacramento. 2 Psicologa, egresada de la Universidad De Los Andes. 3 Docente, Universidad EI Bosque. Psicologa egresada de la Universidad EI Bosque. Especialista en Docencia Universitaria. 4 Psicologo. egresado de la Universidad De Los Andes. Moreover, this research also pretends to evaluate the consequences of exposing first the subjects to conditions of differential and non differential stimulus. Two experiments were designed. Each one used two albino rats as subjects. All of them got a base line of 10 seconds in a program T, with a reinforcement probability of 0.2 and T= 0.90, TO= 9 seconds and T = 1 second. In experiment 1 a multiple program was introduced afterwards. In that program, the two components shared the same reinforcement program than the one in the base line. However, a punishment program was overlapped in both components. Such as the reinforcement program, the punishment one presented identical specifications. Then, the punishment varied through 0.2, 0.1 and 0.0 probabilities before component A (departure procedure), replying with 0.1 and 0.2 probabilities (return procedure). Thus, these subjects had first non differential condition. In experiment 2, the multiple program was introduced in the same way than in experiment 1. However, the punishment probabilities varied in component A through 0.0, 0.05, 0.2 and 0.4 (departure procedure), replying with 0.4, 0.2 and 0.0 (return procedure). This replying was designed with a duration of two minutes for each component. In experiment 1 and in the departure procedure of experiment 2, the component duration was 30 seconds. The results for experiment 1 showed that an initial non differential condition impeded a equating between the answer and the programmed stimulus, which will exemplify discrimination to a certain extent. A positive induction for both subjects was found. Such induction was more strong before component A. the results for experiment 2 showed an arranged relation in the departure procedure for both subjects. That relation was expressed in terms of a derived proportion through the equation of punishment in concurrent programs. However, by using correction factors it was not possible that the relation approached to function 1.0, which was originally predicted. The results and implications of this research are also discussed. Key Words: equating law, effect law, punishment, multiple programs, concurrent programs, differential conditioning, non differential conditioning, inhibitory conditioning. La postulacion de la Ley del efecto es ampliamente conocida (Wallace y Henle, 1941; Solomon, 1964). En su acepcion mas simple se destacan el principio de fijacion (stamping in) para los eventos placenteros y el principio de debilitamiento (stamping on) para los eventos displacenteros. Thorndike desarrollola ley, basado en una serie de experimentos tanto con animales (Hilgard y Bower, 1966) como con humanos (Nevin, 1974), estableciendola como sigue: "De varias respuestas dadas a una misma situacion, aquellas que esten acompafiadas 0 inmediatamente seguidas por satisfaccion para el animal, seran fijadas mas firmemente a la situacion manteniendo los otros aspectos constantes, de tal forma que cuando el animal vuelve a estar en esa situacion sera mas probable que estas respuestas se repitan; aquellas respuestas que esrnn acompafiadas 0, inmediatamente seguidas por molestia para el animal, se debilitaran en su conexion con la situacion, manteniendo los otros aspectos constantes, de tal forma que cuando el animal vuelve a estar en estas situaciones sera menos probable que estas respuestas se repitan. A mayor satisfaccion 0 molestia, mayor sera la fijacion 0 el debilitamiento de la conexion." (Postman, 1947 pp. 493). Herrnstein (1970) critico la nocion de fijacion considefllndola insuficiente, dado que los animales, afirma , no repiten siempre su primer acto exitoso. Recalca que es necesaria una forma no estatica de la ley para que pueda ser persuadida una teorfa, ya que el caer en el sentido comun de la adaptacion es dar respuestas donde se requieren preguntas. Cuando se habla de fuerza del comportarniento se refiere al principio de fijacion. Segun Hernstein, esto es inapropiado ya que el hablar de fuerza implica hablar de alguna dimension del comportamiento, siendo este problema de la medida un problema empfrico y no conceptual, dado que 10 que se trata es de mostrar, por ejemplo, relaciones ordenadas entre parametros de refuerzo y el parametro establecido en el comportamiento. Es decir, la ley del efecto debe ser expresada en terminos de relaciones cuantitativas. Algunos experimentos dan evidencia contraria al principio de fijaci6n en el sentido de no ejecutarse el comportamiento mas adaptativo. Ferster y Skinner (1957), reportaron que al cambiar un sujeto de un programa de intervalo (I) a uno de raz6n (R), su tasa de respuestas tambien cambiaba; segun el principio de fijaci6n, la tasa deberfa permanecer igual dado que en un programa de raz6n las respuestas tienen igual probabilidad, haciendose innecesario un cambio en la tasa Los autores tambien informaron que algunos sujetos presentaron decrementos en la tasa, 10 cual no es adaptativo, ya que por el contrario el responder mas alto implica mayor numero de refuerzos, siendo la aceleraci6n 10 adaptativo en este caso. En programas conjuntivos (Morse, 1966) se sabe que la tasa encontrada es proporcional al nit exigido. Morse experiment6 con programas conjuntivos de intervalo fijo 15 minutos (IF 15') Yrazones fijas variadas desde cero hasta doscientos cuarenta (RFO - RF240). Aunque los sujetos (palomas)venian respondiendo a raz6n de 300 respuestas por minuto en un IF, requerimientos tan pequefios como de 10 640 respuestas dentro del conjuntivo, produjeron un profundo decremento en la tasa, acentuandose progresivamente con incrementos en el requerimiento. Esto contradice el principio de fijaci6n por que 10 adaptativo serfa el incremento en la tasa proporcional a los incrementos en las razones. Baum (1973), de acuerdo con los hallazgos y planteamientos de Herrstein (1969, 1970) critica la visi6n tradicional de la ley del efecto y ve la necesidad de una descripci6n mas completa de las relaciones ambiente - organismo, incluyendo especificaciones cuantitativas de cada una. "Aunque no hay duda que el comportamiento es afectado por sus consecuencias, la ley del efecto todavia esta expresada cualitativamente, mas que en una relaci6n medible entre variables" (Herrstein, 1970 pp. 244). Baum trata de mostrar que una reinterpretaci6n de la ley implica la comprensi6n que el organismo y su ambiente constituyen un sistema de retroalimentaci6n (feedback). Lo anterior habfa sido ya planteado por Ferster y Skinner (1957 pp. 282): "Cuando un organismo acma sobre el ambiente en el cual vive, este cambia de forma tal que afecta al mismo organismo". No se trata simplemente de que el ambiente afecte el comportamiento del organismo, sino que el organismo tambien afecte el ambiente y este a su vez afectara al organismo, y asi sucesivamente. Segun Baum la importancia de esta relaci6n s610 se via recientemente. Plantea, que ademas de las reglas organfsmicas que son las relaciones funcionales, existen las reglas ambientales que son las funciones de retroalimentaci6n, las cuales expresan la relaci6n cuantitativa que una contingencia impone entre las respuestas y la retroalimentaci6n. "Por ejemplo: una posible funci6n de retroalimentaci6n impuesta por RF5 puede ser, r= O.2B, donde B es la tasa de respuestas y r la tasa de refuerzo. La tasa de refuerzo sera siempre 1/5 de la tasa de respuestas" (Baum, 1973 pp.318). No se aclaran solamente las condiciones necesarias para la ocurrencia de refuerzo como 10 haria el concepto usual de contingencia; la funci6n de retroalimentaci6n especifica una curva de regresi6n, alrededor de la cual, varia la retroalimentaci6n y la respuesta. En esto ultimo se centra su crftica a la ley del efecto original, ya que se dice que la simple contigtiidad entre el refuerzo y la respuesta no es 10unico que cuenta en el comportamiento instrumental: es crucialla relaci6n molar. La ley del efecto establecida en terminos de correlaci6n tiene mayor flexibilidad y simplicidad: "El comportamiento incrementa en frecuencia si el incremento esta correlacionado con un aumento en la tasa de refuerzo 0 decremento en la tasa de estimulaci6n aversiva" (Baum, 1973 pp.321). De la ley del efecto original se ha critic ado basicamente dos ideas, la primera referente a que III el fortalecimiento depende de la cercana contigtiidad entre la respuesta y el refuerzo, y la segunda sobre la concepcion de respuesta y refuerzo como eventos discretos ocurriendo en ciertos momentos del tiempo. Se ha encontrado (Nevin y Reynolds, 1973) que una demora sustancial de refuerzo decrementa la efectividadde un reforzador;pero es importanteanotar que una mayor demora de refuerzo ocasiona una menor tasa de este. "Es posible que todos los efectos de variacionde la contigtiidadsean debidos solamente a la variacion resultante en la buena correlacion. De esta forma aunque la correlacion determina la ejecucion, la contigtiidad retiene un papel como panimetro" (Baum, 1973pp. 320). La correlacionque se establece entre la respuesta y el refuerzo, es dentro de una muestra relativamente amplia de tiempo en el caso del refuerzo demorado; a menor muestra de tiempo la correlacion es mas imprecisa. Al reconocer que se requiere una vision molar y que la contigtiidad no es esencial, desaparece la necesidad de asumir respuestas discretas. Ya que el intercambio entre el organismo y el ambiente es continuo, entonces la medicion se extiende en el tiempo. Ademas, se puede establecer la ley del efecto como una relacion entre tiempo gastado en una actividad y la tasa de refuerzo producida por esta misma. A partir de esta concepcion se pueden desarrollar nociones tales como valor y situacion comportamental conforme veremos mas adelante. Un enfoque del analisis de la ley del efecto negativo 10inicio Premack (1971), cuando propone que el refuerzo positivo tiene lugar cuando la oportunidad de participar en una actividad de mayor valor se hace depender de la ejecucion previa de una actividad de menor valor. De acuerdo a estos planteamientos, la contingencia de castigo invierte esta relacion. En el castigo una actividad de menor valor se hace contingente a la ejecucion de una conducta de mayor valor. La perspectiva de Premack propone que el castigo es similar al refuerzo positivo en cuanto a que impone una restriccion a la que tiene que cefiirse la conducta. La ley del efecto negativo es una afirmacion de la forma en que se modifica la conducta con estas restricciones: una actividad de bajo valor produce una disminucion en la actividad de mayor valor. Las teorias de tendencia economica proponen, como en el caso de refuerzo positiyo, que los organismos responden para maximizar el valor total. El proceso de maximizacion, con procedimientos tanto de refuerzo como de castigo, implica un aumento en la actividad de bajo valor en contraste con una acti vidad de valor elevado (Burkhard, Rachlin y Schrader, 1978). Hasta hoy se sabe que la ley del efecto es un fenomeno solido. Se mantiene para una amplia variedad de especies, reforzadores, respuestas y programas de refuerzo (de Villiers, 1977). Por ejemplo, se sostiene con diferentes tasas (Herrstein, 1970), cantidades (Todorov et aI., 1984),0 demoras en el refuerzo (Catania, 1966); y se sostiene tanto para programas de castigo de castigo como de refuerzo (Baum, 1975). Sin embargo, la ley del efecto no siempre se cumple, y ha sido tema de considerable polemic a (Binmore, 1991; Herrstein, 1990, 1991; Staddon, 1991). Herrstein (1961) estudiola respuesta como una funcion de la frecuencia del refuerzo, tratando de aclarar las propiedades de las frecuencias relativas de respuesta como una variable dependiente. Esto, por que las relaciones de frecuencias absolutas no eran precisas. Para el caso utilizo un program a concurrente en el cual se variaba la frecuencia de refuerzo manteniendo la frecuencia total de estos constante; los sujetos utilizados fueron palomas. Encontro una correspondencia entre las respuestas y el refuerzo en terminos de frecuencias relativas, surgidas de la funcion que relaciona frecuencias absolutas de respuesta y refuerzo. Cuando esta funcion es lineal e intercepta cero, se encuentra igualacion (matching), es decir: D6nde P es el numero de respuestas y R el numero de refuerzos. Los subindices indican la altemativa (v.g. izquierda 0 derecha). Esta correspondencia entre frecuencias relativas de respuesta y refuerzo se rompe cuando se omite el penodo de demora de cambio (D.C). Aunque la igualaci6n no es funci6n de D.C se sabe que este penodo tiene una duraci6n minima para que se obtenga la igualaci6n; mas alla de este valor la igualaci6n siempre se obtiene (Shull y Pliskoff, 1967). Cuando el D.C se alarga, este periodo comienza a interactuar con el programa mismo y a causar una notable reducci6n en la frecuencia de refuerzo. Cuando no hay D.C la distribuci6n de las respuestas tiende a ser 50 - 50 independientemente de la distribuci6n de refuerzos. Findley (1958) observ6 este fen6meno analizando tasas absolutas en un programa concurrente ante el cual, el cambio del programa y de estimulo correspondiente, es realizado por el sujeto, presionando una segunda tecla; los diferentes programas son realizados en una misma tecla. Es decir, las dos altemativas estan representadas por los color~s diferentes de una misma tecla. La segunda tecla se denomina, de cambio. Se encontr6 que las palomas se comportaban igual con teclas separadas 0 unicas. Catania (1963) encontr6 que las palomas en un programa concurrente con el procedimiento de Findley, apareaban su frecuencia relativa de respuestas con la frecuencia relati va de refuerzos, igual que en un concurrente normal. Es decir, encontr6 que se cumplia la ley de la igualaci6n y Clue no s610 igualaban disponibilidades relativas de los dos operando con la tasa relativa de refuerzo. En las situaciones de respuesta simple, cuando una sola respuesta esta siendo reforzada en un solo programa, la ecuaci6n (1) podria quedar asi: ambientes demandan continuamente una escogencia ya sea que el experimentador conozca 0 no cual es la otra altemativa y sus refuerzos. Por 10 tanto la ecuaci6n (2), teniendo en cuenta otras fuentes de refuerzo desconocidas, no describe realmente la situaci6n de una sola respuesta; se puede describir como sigue: p= kR R+Ro F1 = kR1 (3 a) II LR i i=O En la cual el denominador expresa la cantidad total de los refuerzos. En contraste con el numerador R1 ' el denominador jamas se conoce con su valor real. Se sabe por los estudios de contraste realizados en programas multiples que el refuerzo dispersa sus efectos aun hacia aquellos periodos de tiempo en los cuales no puede ocurrir, causando incrementos 0 decrementos en el comportamiento. Este problema del denominador desconocido desaparece en los procedimientos de escogencia (Herrstein, 1970, 1974): (a) ~=~ tR; i..() (4) (b) P2= kR2 Ri t,-4 kR1 II (c) D6nde K sena la asintota de la tasa de respuestas. Sin embargo, anota Herrstein (1970), todos los L~ -.!L= J:+~ i=O kRI kR2 --+-" LRi II L~ R1 R1 +R2 Aqui se deriva la igualacion aplicando la ecuacion (3 a) a cada altemativa. Notese la invarianza de k para cada respuesta, cualquiera que sea el refuerzo. Segun Herrstein (1974) esta invarianza de k es la forma cntica de la ley de la igualacion. k es la asintota de la tasa de respuestas, ademas es una frecuencia de respuestas observadas, PI' y se conocen los refuerzos totales, se encuentra igualacion; final mente, es la cantidad de comportamiento generado por todos los refuerzos que estan operando en el sujeto en un momenta dado. Todo 10 anterior es aplicable siempre que se trate de respuestas mensurabIes. En las ecuaciones anteriores se introdujo un planteamiento importante de Herrstein, como 10 es Ro• El sujeto se esta comportando en un contexto en el cual no solo actuan los refuerzos programados, sino que existen otras fuentes de refuerzo (pueden ser del mismo organismo) las cuales estan necesariamente interactuando con el programa. Los determinantes cnticos de una respuesta son por 10 tanto, el programa especificado y la cantidad de refuerzo de otras fuentes. EI refuerzo tiende a incrementar la respuesta de la cual es dependiente y decrementar otras respuestas. La ecuacion (3 a) ilustra muy bien este fenomeno, ya que al incrementar el denominador decrece la razon. En programas como el concurrente 0 el multiple hay estimulos claros que indican las dos fuentes (sin embargo puede haber otras fuentes que esten afectando y el investigador no las este tomando en cuenta). Catania (1973) da una explicacion diferente a las fuentes de refuerzo no controladas, 0, mejor aun al por que P no es igual a k, hablando de los efectos inhibitorios del refuerzo. Con respecto a los refuerzos producidos por una respuesta, el responder se incrementa como funcion negativamente acelerada al refuerzo. Sin embargo, cuando los refuerzos producidos por la respuesta son mantenidos constantes, el responder decrementa como funcion del refuerzo de otras fuentes; como ejemplo tipico, se nota en un program a concurrente que se produce un decre- mento en las respuestas reforzadas como resultado de reforzar otras. El refuerzo tiene un efecto excitatorio espedfico en la respuesta que 10 produce, pero tambien un efecto inhibitorio que opera en todas las respuestas. Es en este sentido que Catania (1973) dice que el refuerzo es auto-inhibitorio. La formula final que este autor desarrolla es: R1 es la tasa de respuestas por minuto; krl es una constante producida por k, la constante excitatoria y rl el total de refuerzos. M es la constante de interaccion que refleja el grado en el cuallas respuestas en un componente son afectados por el refuerzo en el otro componente. c es la constante de los efectos inhibitorios y rl es el total de los efectos de todas las respuestas. Es de anotar que los efectos inhibitorios del refuerzo pueden disminuir como funcion del control de estimulos en un programa multiple, debido ala relacion existente con diferentes fuentes de refuerzo. Generalmente, la variable dependiente utilizada en la mayona de las investigaciones comportamentales, en el campo del analisis experimental, ha sido la frecuencia de respuestas medida como tasa (por ejemplo, picoteos por minuto). Baum y Rachlin (1969) proponen que la frecuencia de respuestas puede ser medida como tiempo que no gasta respondiendo. Al respecto de esta medida basica del comportamiento obtenida dividiendo por ejemplo, presionadas de palanca (numero) entre la duracion de la sesion, dicen que "se debe tratar cada presionada de palanca como un evento instantaneo, como un punto en el tiempo, que no tiene duracion. Esta suposicion implica que dos respuestas pueden seguir inmediatamente una a la otra, sin que intervenga ningun tiempo. Sin embargo, ya que cada respuesta requiere una cantidad de tiempo, el tiempo minimo entre respuestas es cero" (pp. 869). Al admitir entonces que el comportamiento tiene cierta duracion esta puede ser contada y medida. Al igual que la tasa de respuestas, la duracion de una respuesta o el tiempo gastado realizando una actividad, puede ser una medida basica del comportamiento. Usualmente se selecciona la medida del comportamiento sobre las bases del refuerzo; si se refuerza una accion continua, como es la de permanecer en cierta localizacion, se tendera a usar medidas continuas de comportamiento. Baum y Rachlin (1969), de acuerdo con el razonamiento anterior, aducen que la ley de igualacion podna predecir tiempo relativo gastado en alguna actividad segun la siguiente ecuacion: ~ ~ +T2 = R1 R1 +R2 Donde T 1 YT2 es el tiempo gastado respondiendo ante las claves 1 y 2 respectivamente. Estos autores realizaron una investigacion en la cual variaron frecuencia de refuerzo asociada con coaccion temporal y no con tasa de respuesta. Demostraron que en ausencia de refuerzo para una respuesta especffica, el mismo tipo de ley gobierna la revision del tiempo que el organismo hace entre las actividades; concluyeron ademas que es probable que las leyes de la distribucion temporal sean mas ampliamente aplicables al comportamiento, que las leyes de anteriormente. Aplicando la ecuacion (7) a cada una distribucion de respuestas. Introdujeron tambien el concepto de valor relativo de una actividad el cual es igual a la proporcion del tiempo gastado en esta: tl -=- T V; V; El denominador expresa la suma de los valores de todas las fuentes por ejemplo todas las posibles actividades de una situacion). En una situacion de dos escogencias (por ejemplo un programa concurrente) tenemos la ecuacion anterior para ambas alternativas, de la misma forma que las ecuaciones de Herrstein estudiadas de las alternativas de un programa concurrente se encuentra igualacion: V; tl t;= V; + V2 + Vo V 2 V; =V (8) 2 V;+V2+VO Es decir, el tiempo relativo gastado en las dos actividades es igual al valor relativo de estas dos. De todo esto se deriva el concepto de situacion comportamental de Baum (1973), que se via con su planteamiento de la ley del efecto basado en la correlacion- "Una situacion comportamental consiste en un conjunto de posibles actividades, un conjunto de posibles eventos 0 estimulos y un conjunto de funciones de retroalimentacion, que determinan los efectos de las actividades sobre los eventos" (pp. 150). El valor de una situacion sena la suma de todas las posibles actividades. Es importante anotar, a proposito de la determinacion del valor de una actividad 0 situacion, que se debe evitar caer en una tautologia de la cual se ha acusado algunas veces a la ley de la igualacion (Rachlin, 1971). Se cae en una tautologia 0 en una circularidad cuando se asume por ejemplo, el valor de la situacion a posteriori, esto es, despues del hecho y en este caso despues de la investigacion. Algunos autores realizan un estudio y despues de terminarlo, determinan la situacion de mayor valor de acuerdo con la cual el sujeto permaneciola mayor parte del tiempo; es algo irrefutable, solo es definitorio el hecho pero no explicatorio. En este ultimo hay que determinar antes de la investigacion parametros que posiblemente 10 influyen y comprobarlos 0 no en la investigacion. El problema no es adaptar los datos a nuestras suposiciones. Baum (1974) intenta desarrollar una formula que permita predecir mejor, y con menos valores a posteriori, la relacion de la ley de la igualacion. Parte del hecho de que la relacion establecida por Herrstein (1970) falIa en demostrar la regularidad de los datos por 10 cmU considera mejor la razon de escogencia entre las dos altemativas como una fun cion de la razon de refuerzos obtenidos en una de las altemativas. Baum y Rachlin (1969) ya habian encontrado el mismo problema y habian sugerido la misma solucion: Que es algebraicamente equivalente a la ley de la igualacion de Herrstein (1970). Baum propone: Donde k es la pendiente y k es la interseccion. De esta ecuacion se deduce: Esta nueva relacion la denornina Baum subigualacion; refiriendose a ella como una relacion menos extrema que la relacion de la ley de la igualacion. Una posicion preferente puede producir subigualacion cuando la ejecucion del sujeto esti en contra de las diferencias de en refuerzo; la sobreigualacion (preferencia mas extrema que la igualacion) se puede producir cuando la ejecucion va en la rnisma direccion que las diferencias en refuerzo. Los dos rerrninos introducidos se refieren de esta forma a desviaciones sistematicas de la relacion de la igualacion. Cuando el resultado de la ecuacion (11) es menor que 1.0 quiere decir que hay preferencia hacia ambas altemativas denorninandosele a esto subigualacion. Lander e Irwinng (1968) mostraron que una pobre discriminacion entre las altemativas del progra- ma podia producir subigualacion, ademas, propusieron que siendo 'a' menor que 1.0 podia utilizarse como medio para predecir el contraste en programas multiples. Cuando los componentes son cortos, 'a' se ve afectado de tal forma que la ejecucion se aproxima a la relacion de igualacion. Cuando las razones para los val ores de 'a' son desviadas de 1.0,las fluctuaciones de 1< ' son mejor entendidas; aeste parametro Baum (1974) Ie denomino sesgo dado que puede indicar la magnitud de la preferencia cuando la ecuacion de refuerzo (RI = R2) puede predecir indiferencia. Cuando 'k ' es mayor 0 menor que 1.0 las preferencias encontradas pueden ser no conocidas, pero si se evidencia la asimetna entre las altemativas. Por 10 tanto sesgo significa no tenido en cuenta para la preferencia, es decir que alguna variable independiente no ha sido medida. Si todas las variables independientes fueran incorporadas al experimento no habria sesgo ya que las fluctuaciones de 1<', las interacciones, senan igual a 1.0. Por 10 tanto el sesgo puede ser entendido como un resultado de la generalizacion de la ley de la igualacion: Donde WI Y W2 pueden ser los valores de los factores indeterminados diferentes de RI y R2• La relacion de igualacion se ha ampliado a aspectos distintos de la tasa de ocurrencia del reforzador. Por ejemplo, se ha descubierto que la tasa relativa de respuestas es una funcion de la cantidad relativa de cada reforzador, 10 mismo que la demora relativa de refuerzo (Gibbon y Fairhurst, 1994; Grace, 1995). Se ha encontrado que tambien 10 agradable de los reforzadores puede determinar las tasas relativas de respuestas (Shah, Bradshaw y Szabadi, 1991). Las caractensticas de un reforzador, como su cantidad, agradabilidad, demora y el programa bajo el cual operen pueden considerarse como aspectos del valor general del reforzador. Con todo aun no esta claro exactamente c6mo se combinan las diversas caracterfsticas de un reforzador para determinar su valor (Williams, 1994). Podrfa preguntarse el por que las investigaciones iniciales de igualaci6n se realizaron en programas concurrentes y no en cualquier otro. Catania (1963) mostr6 que el comportamiento en un programa concurrente es bastante sensible a diferencias en parametros de refuerzo tales como frecuencia, cantidad y calidad, mientras que el comportamiento en un programa de operante simple por ejemplo, es tipicamente insensible a tales diferencias. Sin embargo, el numero de operandas en una situaci6n parece ser menos importante que la frecuencia de cambio de programas (Killeen, 1972). En un programa concurrente la frecuencia de cambio es generalmente muy alta y, correlacionado con este incremento en la frecuencia de cambio, hay un incremento en la sensibilidad al procedimiento. Todo esto indicarfa entonces que i,en un programa como el multiple (cuya frecuencia de cambio entre programas es moderada) no podrfamos encontrar igualaci6n? Las investigaciones iniciales de igualaci6n en multiple confirmaron esta suposici6n (Shimp y Wheatley, 1971). Herrstein (1970) plantea una serie de ecuaciones que relacionan tasa de respuestas y refuerzo en diferentes programas. Propone una f6rmula utilizable, tanto para contraste en programas multiples como para igualaci6n concurrente: D6nde PI representa la tasa de respuestas ante el componente 1, RJ la tasa de refuerzo, Rz la tasa de refuerzo frente al componente 2, con este ultimo decrementado notablemente por el factor multiplicativo 'm'. Este factor es una constante que repre- senta la interacci6n de los componentes. En el caso del multiple' m 'varia entre cero y uno dependiendo del grado de interacci6n de los componentes; en el caso del concurrente 'm ' es igual a uno (1.0), es decir es el mayor grado de interacci6n. La rapida altemaci6n de los componentes incrementa 'm', 'k' es una constante que es igual a PI cuando Ro y Rz son iguales a cero. En un programa concurrente el sujeto mismo es quien cambia el programa y el tiempo que esta ante un componente son s610 pocos segundos. En un programa multiple el experimentador es quien controla la duraci6n del componente la cual es usualmente de tres minutos. Shimp y Wheatly (1971) y Todorov (1972) demostraron empfricamente 'm' acortando la duraci6n de los componentes en un programa multiple (utilizando palomas como sujetos) ya que cuando la duraci6n de los componentes en multiple se acorta a unos pocos segundos, la frecuencia relativa de respuestas cambia a un valor mas cercano a la frecuencia de refuerzo. Conforme se ha visto el programa multiple es una de las especificaciones de las contingencias de refuerzo que mas se presta para el estudio de las ejecuciones relativamente diferenciadas. Este programa esta especificado por dos 0 mas componentes, cada uno con un estfmulo discriminativo propio y refuerzo primario. Los componentes pueden tener iguales 0 diferentes programas. Dado que cada componente es independiente del otro, la ejecuci6n esperada en cada uno es la tipica del programa. En general se encuentra que cuando los componentes tienen todos igual especificaci6n, en terminos de raz6n 0 de intervalo, las ejecuciones son discretas (Thompson y Grabowski, 1970). Es evidente que a pesar de esta independencia entre los programas, existe algun tipo de interacci6n entre las ejecuciones de los mismos; el contraste comportamental es una de estas interacciones y se presenta general mente en un program a multiple de dos componentes d6nde la interacci6n es minimizada al maximo. Reynolds (1961b) definio los cuatro tipos de interaccion mas importantes: 1. Contraste positivo: incremento en la tasa de repuestas de un componente como funcion del decremento en la tasa de respuestas del segundo componente. 2. Contraste negativo: decremento en la tasa de respuestas en un componente, como funcion de un incremento en la tasa de respuestas en el otro componente. 3.Induccion positiva: incremento en la tasa de respuestas de un componente, como funcion de un incremento en la tasa de respuestas del segundo componente. 4. Induccion negativa: decremento en la tasa de respuestas de un componente, como funcion de un decremento en la tasa de respuestas del segundo componente. Normalmente la linea de base utilizada es un programa multiple IV - IV; para efectos experimentales, el primer componente se mantiene constante y el segundo se varia, dentro de un disefio de replicacion directa intrasujeto (con palomas como sujetos experimentales). La reduccion en la tasa de respuestas es considerada como un producto colateral del aprendizaje de discriminacion y por 10 tanto una caracterfstica del contraste. Sin embargo, los trabajos con programa de refuerzo independiente de las respuestas han mostrado que la reduccion de la respuesta no es condicion suficiente para la ocurrencia de al menos un tipo de producto colateral, conforme 10 es el contraste (Wrisman y Ramsden, 1973). Halliday y Boake (1974) llevaron a cabo un estudio en programas multiples, en el cual el segundo componente pasaba de una lfnea de base en programa de refuerzo dependiente de la respuesta a un program a de refuerzo independiente de la respuesta, ambos con igual frecuencia de refuerzo. En este procedimiento las respuestas ante el primer componente (IV) no se incrementaron. En cambio, la transicion del programa libre de extincion sf produjo contraste. Otros sujetos entrenados ante un estfmulo con un programa de IV, fueron expuestos ante un estfmulo nuevo en extincion, y aunque la mayorfa de los sujetos nunca respondio ante este estfmulo, si presentaron todos contraste conductual. Esto sugiere que la reduccion de la respuesta no es necesaria para el contraste, y esta en contradiccion con las teorfas de la inhibicion activa 0 inhibicion de las respuestas que implican que el decremento en las respuestas ante el segundo componente, es necesario para que se de un incremento en el primer componente. La reduccion de la respuesta es necesaria aunque puede que no suficiente para el desarrollo del contraste. Esta aparente contradiccion puede ser resuelta en parte por la postulacion del automoldeamiento, y en parte ya ha sido resuelta porque como demuestran Spealman y Gollub (1974), el contraste es un hecho y ocurre aun cuando se cambie solo el programa y no la frecuencia relativa de refuerzo en un componente. Para tener una mejor vision sobre el contraste comportamental es conveniente retomar una serie de investigaciones que plantean cuestionamientos a la ley del efecto. Con base en los estudios sobre los diferentes parametros, se concluyo que el castigo suprime las respuestas si es aplicado en forma adecuada, con intensidad optima, inmediatez y una frecuencia que permita suprimir las respuestas realmente. A pesar de esto, Herrstein y Rachlin (1969) afirman que aunque el castigo sea efectivo, la ley del efecto se toma relativa si tenemos en cuenta que al decrementar una respuesta se incrementan otras. En 10 referente especfficamente a 108 estudios de castigo en la ley del efecto, parece que en su gran mayoria, se han centrado unicamente en la relacion repuesta - estfmulo aversivo, teniendo un estfmulo antecedente solo como ocasion, y por ello se Ie connota como estimulo emocional condicionado, sin profundizar en las demas relaciones que se producen en el contexto. La ley del efecto solo hace referencia al resultado comportamental, en terminos de incremento 0 decremento, de forma tal que se torna parcial y ambigua; la controversia simetna - asimetna puede ser el resultado de esta ambigtiedad. En terminos generales, el refuerzo debe incrementar, a la vez que el castigo debe decrementar para postular una simetrfa. Hasta aca sin tener en cuenta el que estos efectos ocurren en un contexto, que es finalmente el que determina el efecto comportamental. Lo anterior permite plantearse en primera instancia cuatro tipos de analisis 0 de relaciones a ser estudiadas: estfmulo - refuerzo, estfmulo - respuesta, respuesta - refuerzo y la respuesta ocurriendo en el contexto. La mayona de los estudios de igualacion se han realizado con refuerzo positivo (Garnzu y Schwartz, 1973; Boakes, Halliday y Poli, 1975; Westbroock, 1973; Boakes, 1972; Redford y Perkins, 1974; y Catania, 1963); es importante ver si esta ley es aplicable a comportamientos en otras condiciones que parecen diferentes cualitativamente, como por ejemplo el control aversivo. Es fundamental aclarar si el control positivo y el aversivo estan regidos por las mismas leyes. De Villiers (1972) presento evidencia de que el analisis cuantitativo hecho por Herrstein (1970) sobre las interacciones de tasa de respuesta y tasa de refuerzo, pueden ser extendidas al refuerzo negativo con la reduccion de la frecuencia de choque como el refuerzo que controla la evitacion. Estas interacciones cuantitativas entre frecuencia de reduccion de choque, tasa de choque y tasa de respuestas en programas simples y multiples de evitacion, fueron investigadas desarrollando un programa de evitacion de intervalo al azar para eliminar las relaciones temporales entre respuestas y choques; ademas, permite que tanto la tasa de choque como la frecuencia de reduccion seaomedida. De Villiers (1974) efectuo otra investigacion para estudiar con mas detalle las relaciones cuantitativas entre tasa de respuesta y reduccion en la frecuencia de choque y choques recibidos; 10 estudio en un programa simple de intervalo variable y en un programa multiple de intervalo variable de evitacion utilizando igualmente ratas como sujetos. Los resultados de esta investigacion estuvieron de acuerdo con aquellos de De Villiers (1972) y demostraron una relacion legal entre tasa de refuerzo y frecuencia de reduccion de choque en programas IV de evitacion; ademas, sugiere que la relacion cuantitativa entre tasa de respuesta y frecuencia de refuerzo es la misma tanto para refuerzo positive como para refuerzo negativo. Al utilizar el programa multiple de IV de evitacion se tuvo en cuenta el estudio de Shimp y Wheatley (1971), por 10 tanto trabajo con componentes de corta duracion para maximizar la interaccion en program as multiples. La mayor interaccion en el multiple la encontro cuando la duracion de los componentes era de cuarenta segundos. "Las ecuaciones de Herrstein (1970) se pueden aplicar para relaciones entre tasa de respuesta y tasa de refuerzo tanto en programas de IV con comida, como en programas de IV con evitacion de choques. La asfntota de la tasa relativa de respuestas en programas multiples IV con componentes cortos aparea la frecuencia relativa de refuerzo cuando el refuerzo es comida 0 reduccion de choques" (pp.234). Esta relacion entre frecuencia relativa de respuesta y reduccion de choque, no se encontro entre frecuencia relativa de respuesta y tasa relativa de choque recibidos en los componentes cuya duracion incrementaba al maximo la interaccion 0, como se vefa anteriormente, el parametro de la ecuacion (13). En 10 referente al castigo, existen estudios de programas concurrentes, en los cuales ambas respuestas del programa son castigadas y se encuentra una reduccion caracterfstica en la tasa de respuestas en ambos componentes, pero, se mantiene el apareamiento de frecuencia relativa de refuerzos recibidos con la frecuencia relativa de respuestas (Holz, 1968). Cuando uno de los componentes no recibe castigo, se encuentra un incremento en la tasa de respuestas ante un componente y un decremento ante el componente castigado (Reynolds, 1963). En el programa multiple se ha encontrado que el castigo en un componente puede, ya sea incrementar respuestas no castigadas (Terrace, 1968) 0 incrementar respuestas castigadas en el otro componente (Rachlin, 1966). Deluty (1976) estudiolos efectos de la tasa del castigo en un programa concurrente. Mantuvo constante la frecuencia de refuerzo y aplico castigo en ambos componentes, pero variola tasa ante un componente y analizo los efectos de las dos. Encontro que a medida que la tasa de castigo se incrementaba ante el componente 2, la tasa de respuesta ante este decrementaba y, concomitantemente, la tasa de respuestas ante el componente 1 incrementaba, independientemente de que se mantuviera constante ante este, y de castigo. En programas de refuerzo positivo se ha encontrado (Catania, 1963) que un incremento en la tasa de refuerzo para una respuesta, incrementa esta respuesta, a la vez que decrementa la tasa de la respuesta concurrente. Por 10 tanto existe una relacion simetrica con los programas concurrentes de intervalo al azar-intervalo con programas al azar de castigo. Deluty (1976) plantea que los efectos de refuerzo y castigo en un programa concurrente pueden ser expresados como sigue: ~ = P = 2 k (R1 +P2) Ro + R1 + R2 + ~ + P 2 k(R2 +~) la tasa de respuesta disminuye y la tasa de respuesta castigada concurrentemente aumenta, como se mostro en este experimento" (pp.79). Ademas, con respecto a tasas relativas este mismo autor propone: k(~ tPz) RutRltR2t~+Pz ~ --= k(RI + Pz) k(R2 + ~) ~tPz -~~~_·t-~~~- Rut~+~+~+Pz Ru+~+~+~tPz Conforme se puede ver en este ultimo estudio, la igualacion es aplicable tambien para castigo. Hay que tener en cuenta que en los estudios sobre control aversivo el sujeto demora en adaptarse al choque, 10 que puede interactuar con la igualacion, factor que no sucede con el refuerzo positivo, por motivos obvios. Por esta razon el proposito de la presente investigacion es hacer una evaluacion de las interacciones entre los componentes de un programa multiple con castigo, asf como tambien de los efectos de exponer inicialmente a los sujetos a condiciones de estfmulo diferenciales y no-diferenciales. Los objetivos del experimento fueron Msicamente tres: a) analizar a partir de una condicion estfmulo no - diferencial las interacciones de un programa multiple con castigo; b) evaluar la generalidad de la ley de la igualacion en programas multiples para el castigo; c) evaluar la generalidad de la funcion del concurrente con castigo al programa multiple con castigo. Ro + R1 + R2 + ~ + P2 Donde PI indica la tasa de castigos obtenidos por responder ante una palanca y P2 indica los castigos obtenidos por responder en la segunda palanca. Esta ecuacion (14) "predice que a medida que la tasa de castigo aumenta para una respuesta, Independientes. 1. Probabilidad de refuerzo 2. Variaciones de probabilidades de castigo 3. Nivel de informacion asignado a los estfmulos. Dependientes. 1. Tasa de respuesta relativa y absoluta 2. Interacciones entre los componentes del programa. Se trabaj6 con dos ratas albinas ingenuas de 90 dfas de nacidas, hijas de una misma madre, pertenecientes ala misma cepa. Se denominaron respectivamente SIA y SUA' Una caja de mantenimiento para cada sujeto, y una caja experimental del SCIENTIFIC PROTOTYPE MFG. CORP. MODELO A - 115. Un programador amHogo, del cual se utilizaron dos Timers, un Stepper, dos puIs adores, doce Relays, ocho contadores, un registro acumulativo, un registro de eventos, un zumbador y un generador de probabilidades. Los sujetos fueron entrenados primero a tomar el alimento del comedero en la caja experimental. La palanca se retir6 durante este periodo. EI nivel de deprivaci6n utilizado fue de 23 horas a traves de todo el experimento. Una vez condicionados al sonido que emite el comedero, se les entren6 en la opresi6n de la palanca. EI reforzador fue una pastilIa de concentrado de Purina y Maizena con un peso de 27 gramos. Los programas de refuerzo utilizados fueron de estfmulo T (Shoenfeld y Cole, 1973). Se inici6 con un T de 2 segundos y un t = 0.66, con probabilidad (p) 1.0 de refuerzo; esto con el fin de que todas las respuestas fueran reforzadas. La longitud del cicIo se fue aumentando a 4, 6, 8 y 10 segundos manteniendo t- constante a 1 segundo. Una vez se lIeg6 a T= 10 segundos con T = 0.90 y p= 1.0, se comenz6 a variar la probabilidad a 0.7,0.45 Y 0.2. EI programa final fue especificado con T = 10 segundos, T =0.90 y p= 0.2, donde tD = 9 segundos y t- = 1 segundo. Este programa produce una frecuencia de refuerzo y una tasa de respuesta similares a la encontrada con un IV de panimetros iguales (Millenson, 1963). Se requirieron 22 sesiones para la obtenci6n de esta linea de base (de 4 sujetos en este programa fueron elegidos los dos mas estables). EI criterio de estabilidad que se utiliz6, es el propuesto por Shoenfeld y Cole (1973). Semide la tasa total de cada sesi6n; se determina arbitrariamente que los datos de las primeras cinco sesiones pertenecen al periodo de transici6n. Luego se comparan bloques de tres sesiones consecutivas, con las tres sesiones que Ie siguen inmed!atamente. La diferencia entre el promedio de las tres sesiones se determina como promedio del porcentaje de las seis sesiones. Si esta diferencia es menor del cinco por ciento se acepta como perteneciente al rango que caracteriza un estado estable. Si no se logra, se hace una nueva prueba en la sesi6n siguiente (analizando siempre seis sesiones). Ademas la frecuencia promedio de refuerzo obtenida en las mismas sesiones no debe presentar una diferencia mayor del cinco por ciento. Una vez obtenida la linea de base, se introdujo un programa multiple. Ante el estfmulo A (luz) el programa de refuerzo qued6 vigente; ante el estfmulo B (zumbador) el program a de refuerzo qued6 tambien en vigencia. Ademas, se superpuso en ambos componentes un programa de castigo con especificaciones iguales al del refuerzo. EI estfmulo aversivo utilizado fue un choque severo (Azrin y Holz, 1960), con intensidad de 60 voltios y setenta y cinco centesimas de segundo de duraci6n. La duraci6n de cada componente fue de treinta segundos. Una vez obtenida la linea de base en este programa que tuvo probabilidad 0.2 de castigo, la probabilidad de este se vari6 a traves de 0.1 y 0.0 (procedimiento de ida), replicandose con probabilidades 0.1 y 0.2 (procedimiento de vuelta). La Tabla 1 ejemplifica el procedimiento. La probabilidad de la fase no fue cambiada sin haber obtenido la linea de base correspondiente. Sesenta y dos sesiones de una hora de duraci6n fueron requeridas con cada sujeto a partir de la iniciaci6n del programa multiple. i ·x. I I " ! 4<;t •• 1 1 •• I •• j 1 Tabla 1. Variaciones en la probabilidad del castigo ante el primer componente del programa _:-_-t~~ FJI,S£ IPZIC~;';;;; n m: m --"'X III •• {I'.21 CAS(P •• ..."...ft --- •CIl.H "".Cl." t II A I) 30 S09 (PZICAS lPO) Rho II' 2ltAS IP.ZI 30 509· II' •• --- ._---~. ~_._--(PtICAS(P.I) Illto RIa Rho IPZI CAs(PZI (P.IICAS lP.Zl Itho II' I) CAS(I' 11 -\ 1 '0 t •• 1 .. j 30 Se. 'Un lP.2)CASIP.11 IIfro (I'. VCAS (1'.21 •• ••• --_.- •• ~ 4<> 10501· -_ .....•. J 1 '_"-"-- 30 So. "'. ,. "~. ,~, .,__ ..~..._,."._""'-"N ':1 _ ',J Figura 1. Tasa de respuesta del sujeto IA (no diferencial) que ejemplijica Lainduccion obtenida. Las Uneas quebradas representan Lasfases 4 y 5 de replicacion. Las figuras 1 y 2, muestran la tasa promedio de respuesta de las tres ultimas sesiones de cada fase para los sujetos IA y IIA respectivamente. En el procedimiento de ida, fases 1 a 3, se observa una inducci6n positiva, acentuada en el componente A, ante el cmU se hicieron las variaciones. EI procedimiento de vuelta, fases 4 y 5 presenta una relaci6n imprecisa, aunque si mantienen la misma funci6n los dos componentes. Es decir, a pesar de variar en la misma direcci6n los dos componentes, no replican las fases anteriores. EI sujeto II A evidencia el mismo tipo de inducci6n positiva que el sujeto IA en el procedimiento de ida, pero mostrando en la fase 3 del componente A un punto extrafio; la tasa de respuesta decrement6 de una manera inesperada al contrario del sujeto II A el cmil increment6 como era 10 esperado. En la fase 3, la frecuencia de castigo ante el componente A se redujo acero, esto es, no recibi6 choques. En general se observ6 un incremento ante el componente B, es decir, donde siempre se recibia to •• •• 1 f\ /\ j i •• 11 •• j l I,J 44 •• ••! ..••• ...• • J 1 ••• ~ I \ ,I J / / A & \\ \l ,~ f ·-1 C:o_o C-?_,. \, I at •• •• •• - ·u. r""" I I I I I I I I Figura 2. Tasa de respuesta del sujeto IIA (no diferencial) que ejemplijica Lainduccion obtenida. Las Uneas quebradas representan Lasfases 4 y 5 de replicacion. probabilidad de 0.2 de choque, dado que siempre se mantuvo con stante. Esto ultimo ejemplifica la induccion positiva, el cambio de los dos componentes es en la misma direccion. En el procedimiento de vuelta, la funcion de la replicacion es ordenada en ambos componentes para el sujeto IIA• Se observo (en ambos sujetos) que el componente B vario en la misma direccion en que vario el componente A (respecto a ejecuciones de los sujetos).Ademas, al introducirles la contingencia de castigo se observo un decremento en la tasa. La relacion encontrada entre la tasa de respuestas y las frecuencias de castigo no pudo ser predicha por la ley de la igualacion 0 algunas de sus correcciones analizadas anteriormente en la revision. Esto es consistente dada la induccion positiva encontrada. Con los principios del automoldeamiento se ha podido establecer que el partir de una situacion no - diferencial, impide la adecuada discriminacion posterior de la informacion dada por los estfmulos 0, el control que establecen estos sobre el comportamiento. Este experimento confirma estas predicciones del automoldeamiento dado que los sujetos no discriminaron las diferencias en las frecuencias de castigo. Ademas la induccion encontrada es caracteristica, en alguna medida, del debil control de estfmulos (Pear y Wilkie, 1971), producto de la condicion no - diferencial inicial, 0 sea en la primera fase. La induccion encontrada en este caso elimina la posibilidad de igualacion. En todo programa multiple, las contingencias de un componente no solo afectan ese componente sino tambien el otro; sin embargo,esto no elimina la posibilidad de una igualacion. En este caso, aunque la frecuencia relativa de castigo se vario, la frecuencia relativa de respuestas no vario, la tasa incremento de igual forma en ambos componentes. El decremento de la tasa de respuestas en la fase 1 con respecto a la lfnea de base del program a t, es explicable por los efectos supresores del castigo. En ambos sujetos la supresion fue mayor para el componente B, 10 cual puede ser debido a efectos aversivos del sonido. El sujeto IIA presento un incremento en la tasa ante la fase 1 del componente A. Azrin y Holz (1963) afirman que para predecir si el castigo al ser introducido producira supresion 0 facilitacion hay que estudiar mas a fonda los parametros. Aunque las ultimas afirmaciones no son categoricas, sino mas bien tentativas para el resultado, si se puede concluir en general que una informacion no - diferencial con respecto a los estfmulos, imposibilita una adecuada discriminacion. En este caso, el castigo tenia la misma probabilidad durante los dos estimulos de la primera fase, 10 cual imposibilitaba la discriminacion posterior, convirtiendose los estimulos en redundantes, por cuanto no se correlacionaban con ningun cambio en el ambiente. Segun Mackintosh (1973), el sujeto aprende a no atender a los estimulos redundantes, 10 cual implicarla, ademas, la no diferenciacion posterior entre los componentes. Debido a que los dos sujetos de este experimento no presentaron exactamente la misma funcion, como para aseverar la replicacion entre sujetos, es posible que en alguna medida los resultados puedan ser debidos a efectos seriales 0 factores no controlados, dadas las condiciones del laboratorio. Sin embargo, aunque esto es algo para tener en cuenta, no creemos en realidad que estas variaciones tengan mucha incidencia en los resultados. De todas formas, es deseable que se Hevaran a cabo mas experimentos sobre este tema para que los datos encontrados sean mas generalizables. Los objetivos del presente experimento fueron basicamente cuatro: a) Analizar a partir de una condicion estimulo diferenciallas interacciones de un programa multiple con castigo; b) Evaluar la generalidad de la ley de la igualacion en programa multiples; c) Evaluar la generalidad de la funcion del concurrente con castigo al programa multiple; e) Estudiar los efectos d ela variacion en la duracion de los componentes. ponente A la probabilidad del castigo se vario a traves de 0.0, 0.05, 0.2 Y0.4 (procedimiento de ida). La replicacion se hizo con las probabilidades 0.4, 0.2 Y0.0 (procedimiento de vuelta), con la duracion del componente en dos minutos. La tabla 2 ejemplifica el procedimiento. Tabla 2. Variaciones en la probabilidad del castigo ante el primer componente y en el tiempo de duraci6n de ios dos Independientes. 1. Probabilidades de refuerzo 2. Variaciones de probabilidades de castigo 3. Variaciones en la duracion de los componentes 4. Nivel de informacion asignado a los estimulos. :I RIZO(PZJCAS( n RllO(PZI IlizolP21 m 1-----"---'--IH,.(P;:) Dl: ---'-"11: Dependientes. 1. Tasa de respuestas relativa y absoluta. 2. Interacciones entre los componentes programa. A fA Sf B 'III •• u.••. •• ('.~ tOllll'fOtt1:ti'ft: 1'.01 Ril. (PZ) CAS (P. Z I 30 S. 9 Ilh. (1'.21 CAS {I' 2J 30 S 09 CAS (P.06l CAS (1'.2 I Ill •• , (PIP CAS(P.41 Rilo CA.';(1'21 (1'.21 CAS (I'll -_·_···_·_· __·-t······_·····__· Moo (P2) CAS (PAl ItflO (1'.21 CAS (PZI n Rtt.(P.21 CAS (1'.21 Rlt. 1CI RI"'("2) CAS(P·Ol 'Rho -- 30 So; -- 30 So, 2 Mfnu, -- (1'21 CAS (1'.21 2 "'''\I ' {p.tI CAS (pzl 2 NllW. del Se trabajo con dos ratas albinas ingenuas, de 90 dias de nacidas, hijas de una misma madre, pertenecientes ala misma cepa. Se denominaron respectivamente Ie y III A' Se llevo a cabo igual que en el experimento anterior, hasta estabilizar los sujetos en el programa i. EI programa multiple se introdujo con los mismos estimulos que el experimento 1, al igual que los programas, con la diferencia de que ante el com- De acuerdo ala ecuacion (15) descrita por Deluty (1976) para el programa concurrente con castigo, derivamos una relacion, invirtiendo la ecuacion y cambiando el orden de los factores para simplificarla, se obtuvo: RA RB = CA +PB CB +PA Teniendo en cuenta la ecuacion (10) propuesta por Baum (1974) que es algebraicamente equivalente ala igualacion, se tiene: Siguiendo el mismo desarrollo de Baum, elevando las funciones exponenciales de k y a (la pendiente), se obtiene: La figura 3 representa la ecuacion (16) para el sujeto lIlA' con el procedimiento de ida y vuelta por separado. P B YP A son los castigos obtenidos; C son los refuerzos programados. Puede observarse una funcion relativamente homogenea que relaciona tanto los puntos de ida como de vuelta. La lfnea de regresion nos indica la funcion de los puntos, k es el punto de interseccion y a la pendiente. Las funciones logarftmicas de la funcion anterior, son representadas en la figura 4. La ecuacion de regresion determina k y a. A pesar de la relacion vista en la ecuacion anterior, la presente muestra que la pendiente no se aproxima a la relacion 1.0 esperada. Aplicando anteriormente el factor de correccion exponencial, ecuacion (18), se esperaria la determinacion de los puntos como una funcion perteneciente a la relacion esperada. La figura 5 representa esta relacion. La figura 6 representa la misma relacion exponencial pero para el sujeto Ie . Cll "'- Q: <l "1t cr 5 ()(j. ... OG~ 0 ..J mA 8 , u~ Figura 4. A - relaciones en las fases de ida. B- relaciones en las fases de replicacion, la duracion del componente incrementada a 2 minutos y sus rectas de regresion respectivas. .4' ht.i/ SmA ivO IRe o. sm .\ F, .~_.~---=--"--""-_._---'~;" ..':'"_.:;.~-: F. LO·(%t;~) Figura 5. A- indica las tasas de ida del Sic. B- indica las Figura 3. A - relaciones en las fases de ida. B- relaciones en las fases de vue Ita. Las lineas punteadas indican la recta de regresion. tasas de vuelta con la duracion de cada componente incrementado a 2 minutos y sus rectas de regresion respectivas. 1« C+Pt ). C+P~ ..,... .•••.••.••••••.•.•••.•'"T""'....,...'"T""'".,..,..,.., .• ,., _.00 I'" ..,..,...,.,....,."7. .....,..,..,..,..,..,...,...,..,. .•.• ,~c ", '''0 It!- Figura 6. A- Indica lasfases de ida del sujeto Ie. B- Indica lasfases de vuelta con la duracion de cada componente incrementando a 2 minutos, y su rectas de regresion respectivas. A pesar de la funcion vista en la figura 3, la figura 5 muestra que no se aproxima a la pendiente1.0 que se predice. El sujeto IeProdujo una linea negativa, pero de todas formas representa una relacion entre los puntos. La funcion es mucho mas precis a para la ida en ambos sujetos, que la vuelta. Al comparar las ejecuciones de los sujetos, en las dos duraciones diferentes de los componentes, se verifican los hallazgos de Shimp y Wheatley (1971). Todorov (1972) y de Villiere (1974). En ambos sujetos y especialmente en Ie la interaccion de los componentes se redujo al incrementar la duracion de estos. Los resultados plantean varios puntos interesantes. El hecho de que con base en la ecuacion de Deluty (1976) y, a pesar de la relacion expresada en la figura 3, la funcion exponencial no se aproxima a 1.0, se puede pensar que 10 que Deluty hallo fue un caso unico y no precisamente un punto perteneciente a una familia general de curvas que pueda ser predicha por la ecuacion, conforme sf se ha demostrado en el caso de la igualacion. Ademas, el factor 'k' de correccion propuesto por Baum no se encuentra, ya sea por que el caso de la ecuacion es mas compleja, haciendo mas complicada la introduccion del castigo, 0 simplemente por que hubo factores extraiios en la investigacion, tales como el control de la probabilidad de choques 0 precision del programador. De todas maneras el hecho de que los dos sujetos presentaran una relacion homogenea en las fases de ida, aunque opuestas entre las dos, da pie para pensar que el caso del programa multiple con castigo, la ecuacion de Deluty no predice realmente la fun cion. Sin embargo, solo cabe sugerir mas investigaciones de este tipo con castigo. Se ve claramente que, el hecho de partir de una condicion diferencial, permite que se establezca una relacion mas 0 menos clara entre las respuestas y los eventos ambientales. Al contrario del experimento 1, los sujetos aquf muestran una funcion homogenea. Esto confirmaria tambien los estudios de Gamzu y Williams; se confirmo igualmente que en un programa multiple, al incrementar la duracion de los componentes se decrementa la interaccion de estos, es decir, el parametro 'm' de las ecuaciones de Herrstein. Con una duracion de dos minutos para cada componente, esta interaccion esta muy cercana a cero; dicho en otras palabras, no hay interaccion. Los resultados del estudio confirman en general una serie de experimentos que pueden ser enmarcados dentro de la evaluacion empfrica de la ley del efecto. Se confirman los experimentos de Rachlin (1967) y los de Williams y Williams (1969), acerca de la no adquisicion de una relacion estfmulo - respuesta cuando los sujetos han tenido una condici6n no - diferencial inicial; tambien se conform6 la irreversibilidad de este comportamiento. Se encontr6 que la primera exposici6n de los sujetos a los estfmulos (A y B) del programa multiple fue determinante para que se desarrollara 0 no una ejecuci6n diferente ante cada uno. Despues de haber iniciado con una fase diferencial, el pasar por una fase no - diferencial, no afectaba una posible discriminaci6n posterior una vez carnbiadas las contingencias. En cambio si se iniciaba con una fase no diferencial, asf se cambiara luego a una fase diferencial, no se lograba la discriminaci6n. Esto mismo encontr6 Rescorla (1967) pero con supresi6n condicionada. Los sujetos cuya fase inicial fue la no - diferencial mostraron una inducci6n positiva, no permitiendo analizar los datos en terminos de la ley de la igualaci6n. Reynolds (1963) demostr6 que la inducci6n positiva se daba en prograrnas multiples, comenzando a evidenciar la importancia de cuantificar las relaciones entre las respuestas y el refuerzo. Estos resultados apoyan la crftica de Herrstein (1970) a la ley del efecto, en la medida que la inducci6n positiva presentada no es 10 adaptativo, y al contrario de 10 que predice la ley, las respuestas castigadas no se debilitan. En realidad estos experimentos plantean que el comportamiento es producto de una serie de relaciones determinadas y no precisamente una simple relaci6n cualitativa. Este tipo de postulaci6n fue 10que llev6 al mismo Thorndike (1932) a criticar su ley del efecto original. Segun este investigador, la parte negativa de la ley debfa ser reformada en tanto que era menos general y universal que la parte positiva, siendo por ello mas especializada, contingente e indirecta. La controversia simetrfa - asimetrfa no ha sido hasta el momento de esta investigaci6n dilucidada, siendo posible trabajar desde cualquiera de las dos referencias te6ricas. Sin embargo, el estudio pormenorizado de los parametros del castigo ha dado evidencia de que el castigo y el refuerzo, aunque opuestos en sus efectos estan regidos por las mismas leyes; es decir, que son dos lados de una misma moneda que equidista en sus efectos (Herrstein y Rachlin, 1967). En el castigo 10 primero que se ha discutido es si nos referimos a el en terminos de castigo 0 de castigador. Azrin y Holz (1966) y Logan (1969) afirman que el castigo debe ser definido en terminos funcionales como el refuerzo, ya que en terminos operacionales se convierte en un proceso secundario, en la medida en que el estfmulo aversivo debe ser definido en terminos de evitaci6n y escape. Creemos que se requiere mayor investigaci6n en el control aversivo y especfficamente en el castigo, realizando analisis en terminos de relaciones cuantitativas; por 10 tanto los resultados de estos experimentos s610 pueden ser enmarcados por ahora dentro de una crftica general a los principios cualitativos de la ley del efecto original. El unico estudio reportado que trata de encontrar relaciones cuantitativas en la explicaci6n de los efectos del castigo, desde el punto de vista de la ley de la igualaci6n, fue el realizado por Deluty (1976). En resumen, no se puede afirmar categ6ricamente 0 en rerminos de la ley, que el refuerzo siempre incrementa y el castigo decrementa, sino que estos procesos se dan en funci6n de las relaciones ambientales existentes. Baum, W.M. and Rachlin, H.C. (1969). Choice as time allocation. Journal of the Experimental Analysis of Behavior, 12, 861 - 874. Baum, W.M. (1973). The correlation - based matching law. Journal of the Experimental Analysis of Behavior, 12, 861 - 874. Baum, W.M. (1973). Time allocation and negative reinforcement. Journal of the Experimental Analysis of Behavior, 20, 313 - 322. Baum, W.M. (1974). On two types of deviation from the matching law: bias and under matching. Journal of Experimental Analysis of Behavior, 22, 231 - 242. Boakes, RA., Halliday, M.S. and Poli, M. (1975). Response additivity: Effects of superimposed free reinforcement on a variable - interval base line. Journal of the Experimental Analysis of Behavior, 23, 1977 - 191. Brown, P. and Jenkins, H. (1968). Auto-shaping of the pigeon key peck Journal of the Experimental Analysis of Behavior, 11, 1-8. Burkhard, B., Rachlin, H., and Schrader, S., (1978). Reinforcement and punishment in a closed system. Learning and Motivation, 9, 392 - 410. Catania, C. (1966). Concurrent operants. In W.K. Honing (Ed.), Operant Behavior: Areas ofresearch and application. New York: Appleton Century Crofts. Catania, C. (1973).Behavioral contrast in a multiple and concurrent schedule of reinforcement. Journal of Experimental Analysis of Behavior, 4,335 - 342. Catania, C. (1973). Concurrent performances: reinforcement - interaction and response independence. Journal of Experimental Analysis of Behavior, 19, 517 - 526. De Villiers, P. (1972). Reinforcement and response rate interaction in multiple random-interval avoidance schedules. Journal of Experimental Analysis of Behavior, 18, 499 - 507. De Villiers, P. (1974). The Law of the effect and avoidance: a quantitative relationship between response rate and shock frequency reduction. Journal of Experimental Analysis of Behavior, 21,223 - 235. De Villiers, P. (1977). Choice in concurrent schedules and quantitative formulation of the Law of the Effects. In W.K. Honing & 1.E.R Satddon (Eds). Handbook of operant behavior. Englewood Cliff, NJ: Prentice Hall. Deluty, M. (1976). Chicer and the rate punishment in concurrent schedules. Journal of Experimental Analysis of Behavior, 21, 223 - 235. Estes, W. and Skinner, B.P. (1941). Some quantitative properties of anxiety. Journal of Experimental Analysis of Behavior, 29, 390 - 400. Ferster, c.B. and Skinner, B.F (1957). Schedules of reinforcement. New York: Appleton Century Croft. Findley, 1.D. (19 ). Preference and Switching under concurrent scheduling. Journal of Experimental Analysis of Behavior, 1, 123 - 144. Garnzu, Rand Scwartz, B. (1973). The maintenance of key pecking by stimulus contingent and response independent food presentation. Journal of Experimental Analysis of Behavior, 19,65 -72. Gamzu, R and Williams, D. (1973). Associative factors underline the pigeons key pecking in auto shaping procedures. Journal of Experimental Analysis of Behavior, 19,225 - 232. Gibbon, 1., and Fairhust, S. (1994). Ratio versus difference comparators in choice. Journal of Experimental Analysis of Behavior, 62, 409 - 434. Grace, RC., (1995). Independence of reinforcement delay and magnitude in concurrent chains. Journal of Experimental Analysis of Behavior, 63. 255 - 276. Halliday, M.S., and Boakes, RA. (1974). Behavioral contrast without response rate reduction. Journal of Experimental Analysis of Behavior, 22, 453 - 462. Herrnstein, R.J. (1961). Relative and absolute strength of response as function of frequency of reinforcement. Journal of Experimental Analysis of Behavior, 4, 267 - 272. Herrstein, R.J. (1970). On the law of effect. Journal of Experimental Analysis of Behavior, 13, 243 - 266. Herrstein, R.J. (1974). Formal properties of the matching law. Journal of Experimental Analysis of Behavior, 21, 159 - 164. Herrstein, R.J. (1990). Rational choice theory: necessary but no sufficient American Psychologist, 45,356 - 367. Herrstein, R.J. (1991). Reply to Binmore and Staddon. American Psychologist, 46, 799 - 801. Hilgard, E.R., and Bower, G.H. (1966). Theories of learning. New York: Appleton Century Crofts. Holz, W.e. (1968). Punishment and rate of positive reinforcement. Journal of Experimental Analysis of Behavior, 11, 285 - 292. Jenkins, H. (1975). Behavior theory today: a return to fundamentals. Revista Mexicana de Amilisis de Comportamiento. 1. Kamin, L. (1969). Predictability, surprise, attention and conditioning. Punishment and aversive behavior. New York: Appleton Century Crofts. Killen, P. (1972). A yoked chamber comparison of concurrent and multiple schedules. Journal of Experimental Analysis of Behavior. 18, 13- 22. Koders, T., and Rilling, M. (1976). Procedural antecedents of behavioral contrast: a re-examination of errorless learning. Journal of Experimental Analysis of Behavior. 25, 27 - 42. Mackintosh, A. (1973). Learning to ignore stimuli that predict no change in reinforcement. Constrains on learning. New York:Academic Press. McSweeney, F. (1975). Matching and contrast on several concurrent treadle - press schedule. Journal of Experimental Analysis of Behavior. 23, 193 - 195.. Millenson, 1.R. (1963). Random of interval schedules of reinforcement. Journal of Experimental Analysis of Behavior, 6, 437 - 443. Morse, R. (1966). Intermittent reinforcement. In W. Honing. Operant Behavior: Areas of research an application. New York: Appleton Century Crofts. Nevin, 1.A. (1973). The maintenance of behavior. The Study of Behavior. Glenview: Scott Foresman Co. Pearl, 1., and Wilkie, M. (1971). Contrast and induction in rats on multiple schedules. Journal of Experimental Analysis of Behavior, 15, 289 - 296. Poli, M. (1975). Response decrements produced by extiction and by response - independent reinforcement. Journal of Experimental Analysis of Behavior, 19,293 - 302. Postman, L. (1947). The history and present status of the law of effect. Psychological bulletin. 44, 489 - 563. Premack, D. (1971). Catching up with common sense, or two sides ofa genaralization: Reinforcement and punishment. In R. Glaser (Ed.), The nature of reinforcement. New York: academic Press. Rachlin, H. (1966). Recovery of responses during mild punishment. Journal of Experimental Analysis of Behavior, 9, 251 - 263. Rachlin, H. (1971). On the tautology of the matching law. Journal of Experimental Analysis of Behavior, 15, 249 - 251. Rachlin, H., and Baum, W.M. (1972). Effects of alternative reinforcement: does the source matter? Journal of Experimental Analysis of Behavior. 18,231 - 241. Rachlin, H.C. and Herrstein, R.I. (1969). Hedonism revisited: On the law of effect. Punishment and aversive behavior. New York: Appleton Century Crofts. Redford, M., and Perkin, e. (1974). The role of autopecking in behavioral contrast. Journal of Experimental Analysis of Behavior, 21, 145 150. Reynolds, G. (1961a). Behavioral contrast. Journal of Experimental Analysis of Behavior, 4, 57 - 71. Reynolds, G. (1961b). An analysis of interactions in a multiple schedule. Journal of Experimental Analysis of Behavior, 4, 107 - 117. Reynolds, G. (1961c). Relativity of response rate and reinforcement frequency in a multiple schedule. Journal of Experimental Analysis of Behavior, 4, 179 - 184. Reynolds, G., and Catania, C.(1961). Behavioral contrast with fixed interval and law rate rein- forcement Journal of Experimental Analysis of Behavior. 4, 387 - 391. Reynolds, G. (1963). Some limitations on behavioral contrast and induction during successive discrimination. Journal of Experimental Analysis of Behavior. 6, 131 - 139. Shimp, c., and Weatley, K. (1971). Matching to relative reinforcement frequency in multiple schedules with a short component duration. Journal of Experimental Analysis of Behavior, 15,205 - 210. Schoenfeld, W., and Cole, J. (1972). Stimulus schedule: the t system. New York: Harper Row. Schuwartz, B. (1975). Discriminative stimulus location as a determinant of positive and negative behavioral contrat in the pigeon. Journal of Experimental Analysis of Behavior, 23, 167 176. Schull, RL., and Pliskoff, S.S. (1967). Change over delay and concurrent performance: some effects on relative performances measures. Journal of Experimental Analysis of Behavior, 10, 517 527. Shah, K., Bradshaw, C. M., and Szabadi, E. (1991). Relative and absolute reinforcement frequency as determinants of choice in concurrent variable interval schedules. Quarterly. Journal of Experimental Psychology, 43, 25 - 38. Sidman, M. (1960). Tactics of scientific research. New York: Basic Books, Inc. Publishers. Spealman, Rand Gollub, L. (1974). Behavioral interactions in multiple variable interval schedules. Journal of Experimental Analysis of Behavior, 22, 471 - 481. Stein, L., Hoffman, H., and Stitt, S. (1971). Collateral behavior of the pigeon during conditioning suppression. Journal of Experimental Analysis of Behavior, 15,83 - 93. Terrace, H. (1966). Stimulus control. In WHoning, Operant Behavior: areas of research and application. New York: Appleton Century Crofts. Terrace,H. (1968). Discrimination learning, the peak shift and behavioral contrast. Journal of Experimental Analysis of Behavior, 11, 727- 741. Todorov, lC., (1972). Component duration and relative response rates in multiple schedules. Journal of Experimental Analysis of Behavior, 17,45 - 49. Todorov, lC.,Hanna, E.S., and De Sa, M.C.N.B. (1984). Frequency versus magnitude of reinforcement: New data with a different procedure. Journal of Experimental analysis of Behavior, 41, 151 - 167. Wagner, A., and Rescorla, A. (1972). Inhibition in pavlovian conditioning: application of a theory. In R Boakes and M, Halliday. Inhibition and learning. New York: Academic Press. Wallace, H., and Henle, M. (1941). An experimental analysis of the law of effect. Journal of Experimental Analysis of Behavior, 28, 340 - 349. Weisman, R, and Ramsden, M. (1973). Discrimination of a response independent component in a multiple schedule. Journal of Experimental Analysis of Behavior, 19, 55 -64. Weisman, R, and Premack, D. (1966). Reinforcement and punishment produced by the same response depending upon the probability relation between the instrumental and contingent responses. Documento sin editar presentado enl a reunion de de Psychonomic Society, S1,Louise. Westbrook, R (1973). Failure to obtain positive contrast when pigeons press a bar. Journal of Experimental Analysis of Behavior, 20, 499510. Williams, D., and Williams, H. (1969). Auto-maintenance in the pigeon: sustained pecking despite contingent non-reinforcement. Journal of Experimental Analysis of Behavior, 12,511 520. Williams, B. A. (1994). Reinforcement and Choice. In N.J. Mackintosh (Ed.). Animal Learning and cognition (pp. 81-108). San Diego: Academic Press.