la ley del efecto - Universidad El Bosque

Anuncio
LA LEY DEL EFECTO: UN ESTUDIO SOBRE LA IGUALACI6N
Y LAS INTERACCIONES DE LOS COMPONENTES RELACIONADOS
CON LAS VARIACIONES DEL CASTIGO EN UN PROGRAMA MULTIPLE
Resumen
Este artfculo tiene dos objetivos: en primer lugar actualizar el soporte te6rico existente en
relaci6n con la Ley del efecto y en segundo lugar presentar los resultados de una investigaci6n
empfrica orientada a la evaluaci6n de las interacciones entre los componentes en un programa
multiple con castigo, asf como tambien de los efectos de exponer inicialmente a los sujetos a
condiciones de estfmulo diferenciales y no - diferenciales; se diseiiaron dos experimentos cada
uno con dos ratas albinas como sujetos. Todos los sujetos obtuvieron una lfnea de base en un
programa T de 10 segundos, con una probabilidad 0.2 de refuerzo y donde T=0.90, tD= 9 segundos
y 1= 1 segundo. En el experimento 1 se introdujo posteriormente un programa multiple donde
los dos componentes tuvieron el mismo programa de refuerzo que el de la lfnea de base. pero
habiendoseles superpuesto ademas un programa de castigo en ambos componentes, con identicas
especificaciones que el de refuerzo. Posteriormente el castigo se vari6 a traves de 0.2, 0.1 Y 0.0
probabilidades ante el componente A (procedimiento de ida) replicando las probabilidades 0.1 y
0.2 (procedimiento de vuelta). Estos sujetos tuvieron por 10 tanto, inicialmente, condici6n no diferencial. En el experimento 2 el programa multiple se introdujo 10 mismo que en el experimento
1, pero las probabilidades de castigo fueron variadas en el componente A, a traves de 0.0, 0.05,
0.2 y 0.4 (procedimiento de ida) replicandose con 0.4, 0.2 Y 0.0 (procedimiento de vuelta). Esta
replicaci6n fue hecha con una duraci6n de dos minutos para cada componente. En el experimento
1 y en el procedimiento de ida del experimento 2 , la duraci6n del componente fue de 30 segundos.
Los resultados para el experimento 1 mostraron que una condici6n no - diferencial inicial
impidi6 una igualaci6n entre la respuesta y los estfmulos programados que ejemplificara en alguna
medida la discriminaci6n. Se encontr6 una inducci6n positiva para los dos sujetos, siendo mas
acentuada ante el componente A. Los resultados para el experimento 2 , mostraron una relaci6n
ordenada en el procedimiento de ida para ambos sujetos, expresada en terminos de una proporci6n
derivada a partir de la ecuaci6n del castigo en programas concurrentes. Sin embargo, utilizando
factores de correcci6n no fue posible que la relaci6n se aproximara a la funci6n 1.0 predicha
originalmente. Se discuten igualmente los resultados e implicaciones de este estudio.
Palabras Clave: Ley de igualaci6n, Ley del efecto, castigo, programas multiples, programas
concurrentes, condicionamiento diferencial, condicionamiento no diferencial, condicionamiento
inhibitorio.
Abstract
This article has two objectives: first, it intends to actualize the existent theoretical base related to
the effect law. In second place, it intends to present the results of an empiric investigation oriented
to the evaluation of interactions between components related to punishment in a multiple program.
I Profesor asociado, Universidad EI Bosque. Psic610goegresado de la Universidad de los Andes; M.A. California State University,
Sacramento.
2 Psicologa, egresada de la Universidad De Los Andes.
3 Docente, Universidad EI Bosque. Psicologa egresada de la Universidad EI Bosque. Especialista en Docencia Universitaria.
4 Psicologo. egresado de la Universidad De Los Andes.
Moreover, this research also pretends to evaluate the consequences of exposing first the subjects to
conditions of differential and non differential stimulus. Two experiments were designed. Each one
used two albino rats as subjects. All of them got a base line of 10 seconds in a program T, with a
reinforcement probability of 0.2 and T= 0.90, TO= 9 seconds and T = 1 second. In experiment 1 a
multiple program was introduced afterwards. In that program, the two components shared the same
reinforcement program than the one in the base line. However, a punishment program was overlapped
in both components. Such as the reinforcement program, the punishment one presented identical
specifications. Then, the punishment varied through 0.2, 0.1 and 0.0 probabilities before component
A (departure procedure), replying with 0.1 and 0.2 probabilities (return procedure). Thus, these
subjects had first non differential condition. In experiment 2, the multiple program was introduced
in the same way than in experiment 1. However, the punishment probabilities varied in component
A through 0.0, 0.05, 0.2 and 0.4 (departure procedure), replying with 0.4, 0.2 and 0.0 (return procedure). This replying was designed with a duration of two minutes for each component. In experiment
1 and in the departure procedure of experiment 2, the component duration was 30 seconds. The
results for experiment 1 showed that an initial non differential condition impeded a equating between
the answer and the programmed stimulus, which will exemplify discrimination to a certain extent. A
positive induction for both subjects was found. Such induction was more strong before component
A. the results for experiment 2 showed an arranged relation in the departure procedure for both
subjects. That relation was expressed in terms of a derived proportion through the equation of
punishment in concurrent programs. However, by using correction factors it was not possible that
the relation approached to function 1.0, which was originally predicted. The results and implications
of this research are also discussed.
Key Words: equating law, effect law, punishment, multiple programs, concurrent programs,
differential conditioning, non differential conditioning, inhibitory conditioning.
La postulacion de la Ley del efecto es ampliamente conocida (Wallace y Henle, 1941; Solomon,
1964). En su acepcion mas simple se destacan el
principio de fijacion (stamping in) para los eventos
placenteros y el principio de debilitamiento (stamping on) para los eventos displacenteros. Thorndike
desarrollola ley, basado en una serie de experimentos tanto con animales (Hilgard y Bower, 1966)
como con humanos (Nevin, 1974), estableciendola
como sigue:
"De varias respuestas dadas a una misma situacion, aquellas que esten acompafiadas 0 inmediatamente seguidas por satisfaccion para el animal, seran fijadas mas firmemente a la situacion manteniendo los otros aspectos constantes, de tal forma
que cuando el animal vuelve a estar en esa situacion
sera mas probable que estas respuestas se repitan;
aquellas respuestas que esrnn acompafiadas 0, inmediatamente seguidas por molestia para el animal,
se debilitaran en su conexion con la situacion,
manteniendo los otros aspectos constantes, de tal
forma que cuando el animal vuelve a estar en estas
situaciones sera menos probable que estas respuestas se repitan. A mayor satisfaccion 0 molestia,
mayor sera la fijacion 0 el debilitamiento de la
conexion." (Postman, 1947 pp. 493).
Herrnstein (1970) critico la nocion de fijacion
considefllndola insuficiente, dado que los animales,
afirma , no repiten siempre su primer acto exitoso.
Recalca que es necesaria una forma no estatica de
la ley para que pueda ser persuadida una teorfa, ya
que el caer en el sentido comun de la adaptacion es
dar respuestas donde se requieren preguntas.
Cuando se habla de fuerza del comportarniento
se refiere al principio de fijacion. Segun Hernstein,
esto es inapropiado ya que el hablar de fuerza implica hablar de alguna dimension del comportamiento,
siendo este problema de la medida un problema
empfrico y no conceptual, dado que 10 que se trata
es de mostrar, por ejemplo, relaciones ordenadas
entre parametros de refuerzo y el parametro establecido en el comportamiento. Es decir, la ley del efecto debe ser expresada en terminos de relaciones
cuantitativas.
Algunos experimentos dan evidencia contraria
al principio de fijaci6n en el sentido de no ejecutarse
el comportamiento
mas adaptativo.
Ferster y
Skinner (1957), reportaron que al cambiar un sujeto
de un programa de intervalo (I) a uno de raz6n (R),
su tasa de respuestas tambien cambiaba; segun el
principio de fijaci6n, la tasa deberfa permanecer
igual dado que en un programa de raz6n las
respuestas tienen igual probabilidad, haciendose
innecesario un cambio en la tasa Los autores
tambien
informaron
que algunos
sujetos
presentaron decrementos en la tasa, 10 cual no es
adaptativo, ya que por el contrario el responder mas
alto implica mayor numero de refuerzos, siendo la
aceleraci6n 10 adaptativo en este caso.
En programas conjuntivos (Morse, 1966) se sabe
que la tasa encontrada es proporcional al nit exigido. Morse experiment6 con programas conjuntivos
de intervalo fijo 15 minutos (IF 15') Yrazones fijas
variadas desde cero hasta doscientos cuarenta (RFO
- RF240). Aunque los sujetos (palomas)venian
respondiendo a raz6n de 300 respuestas por minuto
en un IF, requerimientos tan pequefios como de 10
640 respuestas dentro del conjuntivo, produjeron
un profundo decremento en la tasa, acentuandose
progresivamente con incrementos en el requerimiento. Esto contradice el principio de fijaci6n por
que 10 adaptativo serfa el incremento en la tasa
proporcional a los incrementos en las razones.
Baum (1973), de acuerdo con los hallazgos y planteamientos de Herrstein (1969, 1970) critica la visi6n
tradicional de la ley del efecto y ve la necesidad de
una descripci6n mas completa de las relaciones
ambiente - organismo, incluyendo especificaciones
cuantitativas de cada una. "Aunque no hay duda que
el comportamiento es afectado por sus consecuencias, la ley del efecto todavia esta expresada cualitativamente, mas que en una relaci6n medible entre
variables" (Herrstein, 1970 pp. 244). Baum trata de
mostrar que una reinterpretaci6n de la ley implica la
comprensi6n que el organismo y su ambiente constituyen un sistema de retroalimentaci6n (feedback).
Lo anterior habfa sido ya planteado por Ferster y
Skinner (1957 pp. 282): "Cuando un organismo acma
sobre el ambiente en el cual vive, este cambia de
forma tal que afecta al mismo organismo". No se
trata simplemente de que el ambiente afecte el comportamiento del organismo, sino que el organismo
tambien afecte el ambiente y este a su vez afectara
al organismo, y asi sucesivamente. Segun Baum la
importancia de esta relaci6n s610 se via recientemente. Plantea, que ademas de las reglas organfsmicas que son las relaciones funcionales, existen las
reglas ambientales que son las funciones de retroalimentaci6n, las cuales expresan la relaci6n cuantitativa que una contingencia impone entre las respuestas
y la retroalimentaci6n. "Por ejemplo: una posible
funci6n de retroalimentaci6n impuesta por RF5 puede ser, r= O.2B, donde B es la tasa de respuestas y r
la tasa de refuerzo. La tasa de refuerzo sera siempre
1/5 de la tasa de respuestas" (Baum, 1973 pp.318).
No se aclaran solamente las condiciones necesarias
para la ocurrencia de refuerzo como 10 haria el
concepto usual de contingencia; la funci6n de retroalimentaci6n especifica una curva de regresi6n,
alrededor de la cual, varia la retroalimentaci6n y la
respuesta.
En esto ultimo se centra su crftica a la ley del
efecto original, ya que se dice que la simple contigtiidad entre el refuerzo y la respuesta no es 10unico
que cuenta en el comportamiento instrumental: es
crucialla relaci6n molar. La ley del efecto establecida en terminos de correlaci6n tiene mayor flexibilidad y simplicidad: "El comportamiento incrementa
en frecuencia si el incremento esta correlacionado
con un aumento en la tasa de refuerzo 0 decremento
en la tasa de estimulaci6n aversiva" (Baum, 1973
pp.321).
De la ley del efecto original se ha critic ado
basicamente dos ideas, la primera referente a que
III
el fortalecimiento depende de la cercana contigtiidad entre la respuesta y el refuerzo, y la segunda
sobre la concepcion de respuesta y refuerzo como
eventos discretos ocurriendo en ciertos momentos
del tiempo.
Se ha encontrado (Nevin y Reynolds, 1973) que
una demora sustancial de refuerzo decrementa la
efectividadde un reforzador;pero es importanteanotar
que una mayor demora de refuerzo ocasiona una
menor tasa de este. "Es posible que todos los efectos
de variacionde la contigtiidadsean debidos solamente
a la variacion resultante en la buena correlacion. De
esta forma aunque la correlacion determina la
ejecucion, la contigtiidad retiene un papel como
panimetro" (Baum, 1973pp. 320). La correlacionque
se establece entre la respuesta y el refuerzo, es dentro
de una muestra relativamente amplia de tiempo en el
caso del refuerzo demorado; a menor muestra de
tiempo la correlacion es mas imprecisa.
Al reconocer que se requiere una vision molar y
que la contigtiidad no es esencial, desaparece la
necesidad de asumir respuestas discretas. Ya que
el intercambio entre el organismo y el ambiente es
continuo, entonces la medicion se extiende en el
tiempo. Ademas, se puede establecer la ley del efecto como una relacion entre tiempo gastado en una
actividad y la tasa de refuerzo producida por esta
misma. A partir de esta concepcion se pueden desarrollar nociones tales como valor y situacion comportamental conforme veremos mas adelante.
Un enfoque del analisis de la ley del efecto negativo 10inicio Premack (1971), cuando propone que
el refuerzo positivo tiene lugar cuando la oportunidad de participar en una actividad de mayor valor
se hace depender de la ejecucion previa de una actividad de menor valor. De acuerdo a estos planteamientos, la contingencia de castigo invierte esta
relacion. En el castigo una actividad de menor valor
se hace contingente a la ejecucion de una conducta
de mayor valor. La perspectiva de Premack propone
que el castigo es similar al refuerzo positivo en
cuanto a que impone una restriccion a la que tiene
que cefiirse la conducta. La ley del efecto negativo
es una afirmacion de la forma en que se modifica
la conducta con estas restricciones: una actividad
de bajo valor produce una disminucion en la actividad de mayor valor. Las teorias de tendencia economica proponen, como en el caso de refuerzo positiyo, que los organismos responden para maximizar
el valor total. El proceso de maximizacion, con procedimientos tanto de refuerzo como de castigo, implica un aumento en la actividad de bajo valor en
contraste con una acti vidad de valor elevado
(Burkhard, Rachlin y Schrader, 1978).
Hasta hoy se sabe que la ley del efecto es un
fenomeno solido. Se mantiene para una amplia
variedad de especies, reforzadores, respuestas y
programas de refuerzo (de Villiers, 1977). Por ejemplo, se sostiene con diferentes tasas (Herrstein,
1970), cantidades (Todorov et aI., 1984),0 demoras
en el refuerzo (Catania, 1966); y se sostiene tanto
para programas de castigo de castigo como de refuerzo (Baum, 1975). Sin embargo, la ley del efecto
no siempre se cumple, y ha sido tema de considerable polemic a (Binmore, 1991; Herrstein, 1990,
1991; Staddon, 1991).
Herrstein (1961) estudiola respuesta como una
funcion de la frecuencia del refuerzo, tratando de
aclarar las propiedades de las frecuencias relativas
de respuesta como una variable dependiente. Esto,
por que las relaciones de frecuencias absolutas no
eran precisas. Para el caso utilizo un program a concurrente en el cual se variaba la frecuencia de refuerzo manteniendo la frecuencia total de estos
constante; los sujetos utilizados fueron palomas.
Encontro una correspondencia entre las respuestas
y el refuerzo en terminos de frecuencias relativas,
surgidas de la funcion que relaciona frecuencias
absolutas de respuesta y refuerzo. Cuando esta
funcion es lineal e intercepta cero, se encuentra
igualacion (matching), es decir:
D6nde P es el numero de respuestas y R el numero de refuerzos. Los subindices indican la altemativa (v.g. izquierda 0 derecha).
Esta correspondencia entre frecuencias relativas
de respuesta y refuerzo se rompe cuando se omite
el penodo de demora de cambio (D.C). Aunque la
igualaci6n no es funci6n de D.C se sabe que este
penodo tiene una duraci6n minima para que se obtenga la igualaci6n; mas alla de este valor la igualaci6n siempre se obtiene (Shull y Pliskoff, 1967).
Cuando el D.C se alarga, este periodo comienza a
interactuar con el programa mismo y a causar una
notable reducci6n en la frecuencia de refuerzo.
Cuando no hay D.C la distribuci6n de las respuestas
tiende a ser 50 - 50 independientemente
de la
distribuci6n de refuerzos.
Findley (1958) observ6 este fen6meno analizando tasas absolutas en un programa concurrente ante
el cual, el cambio del programa y de estimulo correspondiente, es realizado por el sujeto, presionando una segunda tecla; los diferentes programas son
realizados en una misma tecla. Es decir, las dos
altemativas estan representadas por los color~s
diferentes de una misma tecla. La segunda tecla se
denomina, de cambio. Se encontr6 que las palomas
se comportaban igual con teclas separadas 0 unicas.
Catania (1963) encontr6 que las palomas en un
programa concurrente con el procedimiento
de
Findley, apareaban su frecuencia relativa de respuestas con la frecuencia relati va de refuerzos, igual
que en un concurrente normal. Es decir, encontr6
que se cumplia la ley de la igualaci6n y Clue no
s610 igualaban disponibilidades relativas de los dos
operando con la tasa relativa de refuerzo.
En las situaciones de respuesta simple, cuando
una sola respuesta esta siendo reforzada en un solo
programa, la ecuaci6n (1) podria quedar asi:
ambientes demandan continuamente una escogencia ya sea que el experimentador conozca 0 no cual
es la otra altemativa y sus refuerzos. Por 10 tanto la
ecuaci6n (2), teniendo en cuenta otras fuentes de
refuerzo desconocidas, no describe realmente la
situaci6n de una sola respuesta; se puede describir
como sigue:
p=
kR
R+Ro
F1 = kR1
(3 a)
II
LR
i
i=O
En la cual el denominador expresa la cantidad
total de los refuerzos.
En contraste con el numerador R1 ' el denominador jamas se conoce con su valor real. Se sabe por
los estudios de contraste realizados en programas
multiples que el refuerzo dispersa sus efectos aun
hacia aquellos periodos de tiempo en los cuales no
puede ocurrir, causando incrementos 0 decrementos
en el comportamiento. Este problema del denominador desconocido desaparece en los procedimientos de escogencia (Herrstein, 1970, 1974):
(a)
~=~
tR;
i..()
(4)
(b)
P2= kR2
Ri
t,-4
kR1
II
(c)
D6nde K sena la asintota de la tasa de respuestas.
Sin embargo, anota Herrstein (1970), todos los
L~
-.!L=
J:+~
i=O
kRI
kR2
--+-"
LRi
II
L~
R1
R1 +R2
Aqui se deriva la igualacion aplicando la ecuacion (3 a) a cada altemativa. Notese la invarianza
de k para cada respuesta, cualquiera que sea el refuerzo. Segun Herrstein (1974) esta invarianza de
k es la forma cntica de la ley de la igualacion. k es
la asintota de la tasa de respuestas, ademas es una
frecuencia de respuestas observadas, PI' y se conocen los refuerzos totales, se encuentra igualacion;
final mente, es la cantidad de comportamiento generado por todos los refuerzos que estan operando en
el sujeto en un momenta dado. Todo 10 anterior es
aplicable siempre que se trate de respuestas mensurabIes.
En las ecuaciones anteriores se introdujo un planteamiento importante de Herrstein, como 10 es Ro•
El sujeto se esta comportando en un contexto en el
cual no solo actuan los refuerzos programados, sino
que existen otras fuentes de refuerzo (pueden ser
del mismo organismo) las cuales estan necesariamente interactuando con el programa. Los determinantes cnticos de una respuesta son por 10 tanto, el
programa especificado y la cantidad de refuerzo
de otras fuentes. EI refuerzo tiende a incrementar
la respuesta de la cual es dependiente y decrementar
otras respuestas. La ecuacion (3 a) ilustra muy bien
este fenomeno, ya que al incrementar el denominador decrece la razon. En programas como el concurrente 0 el multiple hay estimulos claros que indican las dos fuentes (sin embargo puede haber otras
fuentes que esten afectando y el investigador no
las este tomando en cuenta).
Catania (1973) da una explicacion diferente a
las fuentes de refuerzo no controladas, 0, mejor aun
al por que P no es igual a k, hablando de los efectos
inhibitorios del refuerzo. Con respecto a los refuerzos producidos por una respuesta, el responder se
incrementa como funcion negativamente acelerada
al refuerzo. Sin embargo, cuando los refuerzos producidos por la respuesta son mantenidos constantes,
el responder decrementa como funcion del refuerzo
de otras fuentes; como ejemplo tipico, se nota en
un program a concurrente que se produce un decre-
mento en las respuestas reforzadas como resultado
de reforzar otras.
El refuerzo tiene un efecto excitatorio espedfico
en la respuesta que 10 produce, pero tambien un
efecto inhibitorio que opera en todas las respuestas.
Es en este sentido que Catania (1973) dice que el
refuerzo es auto-inhibitorio. La formula final que
este autor desarrolla es:
R1 es la tasa de respuestas por minuto; krl es una
constante producida por k, la constante excitatoria
y rl el total de refuerzos. M es la constante de interaccion que refleja el grado en el cuallas respuestas
en un componente son afectados por el refuerzo en
el otro componente. c es la constante de los efectos
inhibitorios y rl es el total de los efectos de todas
las respuestas. Es de anotar que los efectos inhibitorios del refuerzo pueden disminuir como funcion
del control de estimulos en un programa multiple,
debido ala relacion existente con diferentes fuentes
de refuerzo.
Generalmente, la variable dependiente utilizada
en la mayona de las investigaciones comportamentales, en el campo del analisis experimental, ha sido
la frecuencia de respuestas medida como tasa (por
ejemplo, picoteos por minuto). Baum y Rachlin
(1969) proponen que la frecuencia de respuestas
puede ser medida como tiempo que no gasta respondiendo. Al respecto de esta medida basica del comportamiento obtenida dividiendo por ejemplo, presionadas de palanca (numero) entre la duracion de
la sesion, dicen que "se debe tratar cada presionada
de palanca como un evento instantaneo, como un
punto en el tiempo, que no tiene duracion. Esta suposicion implica que dos respuestas pueden seguir
inmediatamente una a la otra, sin que intervenga
ningun tiempo. Sin embargo, ya que cada respuesta
requiere una cantidad de tiempo, el tiempo minimo
entre respuestas es cero" (pp. 869). Al admitir
entonces que el comportamiento tiene cierta duracion esta puede ser contada y medida. Al igual que
la tasa de respuestas, la duracion de una respuesta
o el tiempo gastado realizando una actividad, puede
ser una medida basica del comportamiento. Usualmente se selecciona la medida del comportamiento
sobre las bases del refuerzo; si se refuerza una
accion continua, como es la de permanecer en cierta
localizacion, se tendera a usar medidas continuas
de comportamiento.
Baum y Rachlin (1969), de acuerdo con el razonamiento anterior, aducen que la ley de igualacion
podna predecir tiempo relativo gastado en alguna
actividad segun la siguiente ecuacion:
~
~ +T2
=
R1
R1 +R2
Donde T 1 YT2 es el tiempo gastado respondiendo
ante las claves 1 y 2 respectivamente.
Estos autores realizaron una investigacion en la
cual variaron frecuencia de refuerzo asociada con
coaccion temporal y no con tasa de respuesta. Demostraron que en ausencia de refuerzo para una
respuesta especffica, el mismo tipo de ley gobierna
la revision del tiempo que el organismo hace entre
las actividades; concluyeron ademas que es probable que las leyes de la distribucion temporal sean
mas ampliamente aplicables al comportamiento,
que las leyes de anteriormente. Aplicando la ecuacion (7) a cada una distribucion de respuestas. Introdujeron tambien el concepto de valor relativo de
una actividad el cual es igual a la proporcion del
tiempo gastado en esta:
tl
-=-
T
V;
V;
El denominador expresa la suma de los valores
de todas las fuentes por ejemplo todas las posibles
actividades de una situacion). En una situacion de
dos escogencias (por ejemplo un programa concurrente) tenemos la ecuacion anterior para ambas
alternativas, de la misma forma que las ecuaciones
de Herrstein estudiadas de las alternativas de un
programa concurrente se encuentra igualacion:
V;
tl
t;=
V; + V2 + Vo
V
2
V;
=V
(8)
2
V;+V2+VO
Es decir, el tiempo relativo gastado en las dos
actividades es igual al valor relativo de estas dos.
De todo esto se deriva el concepto de situacion
comportamental de Baum (1973), que se via con
su planteamiento de la ley del efecto basado en la
correlacion- "Una situacion comportamental consiste en un conjunto de posibles actividades, un conjunto de posibles eventos 0 estimulos y un conjunto
de funciones de retroalimentacion, que determinan
los efectos de las actividades sobre los eventos"
(pp. 150). El valor de una situacion sena la suma
de todas las posibles actividades.
Es importante anotar, a proposito de la determinacion del valor de una actividad 0 situacion, que
se debe evitar caer en una tautologia de la cual se
ha acusado algunas veces a la ley de la igualacion
(Rachlin, 1971). Se cae en una tautologia 0 en una
circularidad cuando se asume por ejemplo, el valor
de la situacion a posteriori, esto es, despues del
hecho y en este caso despues de la investigacion.
Algunos autores realizan un estudio y despues de
terminarlo, determinan la situacion de mayor valor
de acuerdo con la cual el sujeto permaneciola mayor parte del tiempo; es algo irrefutable, solo es
definitorio el hecho pero no explicatorio. En este
ultimo hay que determinar antes de la investigacion
parametros que posiblemente 10 influyen y
comprobarlos 0 no en la investigacion. El problema
no es adaptar los datos a nuestras suposiciones.
Baum (1974) intenta desarrollar una formula que
permita predecir mejor, y con menos valores a
posteriori, la relacion de la ley de la igualacion.
Parte del hecho de que la relacion establecida por
Herrstein (1970) falIa en demostrar la regularidad
de los datos por 10 cmU considera mejor la razon
de escogencia entre las dos altemativas como una
fun cion de la razon de refuerzos obtenidos en una
de las altemativas. Baum y Rachlin (1969) ya
habian encontrado el mismo problema y habian
sugerido la misma solucion:
Que es algebraicamente equivalente a la ley de
la igualacion de Herrstein (1970). Baum propone:
Donde k es la pendiente y k es la interseccion.
De esta ecuacion se deduce:
Esta nueva relacion la denornina Baum subigualacion; refiriendose a ella como una relacion menos
extrema que la relacion de la ley de la igualacion.
Una posicion preferente puede producir subigualacion cuando la ejecucion del sujeto esti en contra de
las diferencias de en refuerzo; la sobreigualacion (preferencia mas extrema que la igualacion) se puede
producir cuando la ejecucion va en la rnisma direccion que las diferencias en refuerzo. Los dos rerrninos introducidos se refieren de esta forma a desviaciones sistematicas de la relacion de la igualacion.
Cuando el resultado de la ecuacion (11) es menor que
1.0 quiere decir que hay preferencia hacia ambas
altemativas denorninandosele a esto subigualacion.
Lander e Irwinng (1968) mostraron que una pobre discriminacion entre las altemativas del progra-
ma podia producir subigualacion, ademas, propusieron que siendo 'a' menor que 1.0 podia utilizarse
como medio para predecir el contraste en programas multiples. Cuando los componentes son cortos,
'a' se ve afectado de tal forma que la ejecucion se
aproxima a la relacion de igualacion.
Cuando las razones para los val ores de 'a' son
desviadas de 1.0,las fluctuaciones de 1< ' son mejor
entendidas; aeste parametro Baum (1974) Ie denomino sesgo dado que puede indicar la magnitud de
la preferencia cuando la ecuacion de refuerzo (RI
= R2) puede predecir indiferencia. Cuando 'k ' es
mayor 0 menor que 1.0 las preferencias encontradas
pueden ser no conocidas, pero si se evidencia la
asimetna entre las altemativas. Por 10 tanto sesgo
significa no tenido en cuenta para la preferencia,
es decir que alguna variable independiente no ha
sido medida. Si todas las variables independientes
fueran incorporadas al experimento no habria sesgo
ya que las fluctuaciones de 1<', las interacciones,
senan igual a 1.0. Por 10 tanto el sesgo puede ser
entendido como un resultado de la generalizacion
de la ley de la igualacion:
Donde WI Y W2 pueden ser los valores de los
factores indeterminados diferentes de RI y R2•
La relacion de igualacion se ha ampliado a aspectos distintos de la tasa de ocurrencia del reforzador.
Por ejemplo, se ha descubierto que la tasa relativa
de respuestas es una funcion de la cantidad relativa
de cada reforzador, 10 mismo que la demora relativa
de refuerzo (Gibbon y Fairhurst, 1994; Grace,
1995). Se ha encontrado que tambien 10 agradable
de los reforzadores puede determinar las tasas
relativas de respuestas (Shah, Bradshaw y Szabadi,
1991). Las caractensticas de un reforzador, como
su cantidad, agradabilidad, demora y el programa
bajo el cual operen pueden considerarse como
aspectos del valor general del reforzador. Con todo
aun no esta claro exactamente c6mo se combinan
las diversas caracterfsticas de un reforzador para
determinar su valor (Williams, 1994).
Podrfa preguntarse el por que las investigaciones
iniciales de igualaci6n se realizaron en programas
concurrentes y no en cualquier otro.
Catania (1963) mostr6 que el comportamiento
en un programa concurrente es bastante sensible a
diferencias en parametros de refuerzo tales como
frecuencia, cantidad y calidad, mientras que el
comportamiento en un programa de operante simple por ejemplo, es tipicamente insensible a tales
diferencias. Sin embargo, el numero de operandas
en una situaci6n parece ser menos importante que
la frecuencia de cambio de programas (Killeen,
1972). En un programa concurrente la frecuencia
de cambio es generalmente muy alta y, correlacionado con este incremento en la frecuencia de
cambio, hay un incremento en la sensibilidad al
procedimiento.
Todo esto indicarfa entonces que i,en un programa como el multiple (cuya frecuencia de cambio
entre programas es moderada) no podrfamos encontrar igualaci6n? Las investigaciones iniciales de
igualaci6n en multiple confirmaron esta suposici6n
(Shimp y Wheatley, 1971).
Herrstein (1970) plantea una serie de ecuaciones
que relacionan tasa de respuestas y refuerzo en
diferentes programas. Propone una f6rmula utilizable, tanto para contraste en programas multiples
como para igualaci6n concurrente:
D6nde PI representa la tasa de respuestas ante el
componente 1, RJ la tasa de refuerzo, Rz la tasa de
refuerzo frente al componente 2, con este ultimo
decrementado notablemente por el factor multiplicativo 'm'. Este factor es una constante que repre-
senta la interacci6n de los componentes. En el caso
del multiple' m 'varia entre cero y uno dependiendo
del grado de interacci6n de los componentes; en el
caso del concurrente 'm ' es igual a uno (1.0), es
decir es el mayor grado de interacci6n. La rapida
altemaci6n de los componentes incrementa 'm', 'k'
es una constante que es igual a PI cuando Ro y Rz
son iguales a cero.
En un programa concurrente el sujeto mismo es
quien cambia el programa y el tiempo que esta ante
un componente son s610 pocos segundos. En un
programa multiple el experimentador es quien controla la duraci6n del componente la cual es usualmente de tres minutos. Shimp y Wheatly (1971) y
Todorov (1972) demostraron empfricamente 'm'
acortando la duraci6n de los componentes en un
programa multiple (utilizando palomas como sujetos) ya que cuando la duraci6n de los componentes
en multiple se acorta a unos pocos segundos, la
frecuencia relativa de respuestas cambia a un valor
mas cercano a la frecuencia de refuerzo.
Conforme se ha visto el programa multiple es
una de las especificaciones de las contingencias de
refuerzo que mas se presta para el estudio de las
ejecuciones relativamente diferenciadas. Este programa esta especificado por dos 0 mas componentes, cada uno con un estfmulo discriminativo propio
y refuerzo primario. Los componentes pueden tener
iguales 0 diferentes programas. Dado que cada
componente es independiente del otro, la ejecuci6n
esperada en cada uno es la tipica del programa. En
general se encuentra que cuando los componentes
tienen todos igual especificaci6n, en terminos de
raz6n 0 de intervalo, las ejecuciones son discretas
(Thompson y Grabowski, 1970).
Es evidente que a pesar de esta independencia
entre los programas, existe algun tipo de interacci6n
entre las ejecuciones de los mismos; el contraste
comportamental es una de estas interacciones y se
presenta general mente en un program a multiple de
dos componentes
d6nde la interacci6n
es
minimizada al maximo.
Reynolds (1961b) definio los cuatro tipos de
interaccion mas importantes:
1. Contraste positivo: incremento en la tasa de
repuestas de un componente como funcion del
decremento en la tasa de respuestas del segundo
componente.
2. Contraste negativo: decremento en la tasa de
respuestas en un componente, como funcion de
un incremento en la tasa de respuestas en el otro
componente.
3.Induccion positiva: incremento en la tasa de
respuestas de un componente, como funcion de
un incremento en la tasa de respuestas del
segundo componente.
4. Induccion negativa: decremento en la tasa de
respuestas de un componente, como funcion de
un decremento en la tasa de respuestas del
segundo componente.
Normalmente la linea de base utilizada es un
programa multiple IV - IV; para efectos experimentales, el primer componente se mantiene constante
y el segundo se varia, dentro de un disefio de replicacion directa intrasujeto (con palomas como sujetos experimentales).
La reduccion en la tasa de respuestas es considerada como un producto colateral del aprendizaje
de discriminacion y por 10 tanto una caracterfstica
del contraste. Sin embargo, los trabajos con programa de refuerzo independiente de las respuestas
han mostrado que la reduccion de la respuesta no
es condicion suficiente para la ocurrencia de al menos un tipo de producto colateral, conforme 10 es
el contraste (Wrisman y Ramsden, 1973). Halliday
y Boake (1974) llevaron a cabo un estudio en programas multiples, en el cual el segundo componente
pasaba de una lfnea de base en programa de refuerzo
dependiente de la respuesta a un program a de
refuerzo independiente de la respuesta, ambos con
igual frecuencia de refuerzo. En este procedimiento
las respuestas ante el primer componente (IV) no
se incrementaron. En cambio, la transicion del
programa libre de extincion sf produjo contraste.
Otros sujetos entrenados ante un estfmulo con un
programa de IV, fueron expuestos ante un estfmulo
nuevo en extincion, y aunque la mayorfa de los
sujetos nunca respondio ante este estfmulo, si presentaron todos contraste conductual. Esto sugiere
que la reduccion de la respuesta no es necesaria
para el contraste, y esta en contradiccion con las
teorfas de la inhibicion activa 0 inhibicion de las
respuestas que implican que el decremento en las
respuestas ante el segundo componente, es necesario para que se de un incremento en el primer componente. La reduccion de la respuesta es necesaria
aunque puede que no suficiente para el desarrollo
del contraste.
Esta aparente contradiccion puede ser resuelta
en parte por la postulacion del automoldeamiento,
y en parte ya ha sido resuelta porque como demuestran Spealman y Gollub (1974), el contraste es un
hecho y ocurre aun cuando se cambie solo el programa y no la frecuencia relativa de refuerzo en un
componente.
Para tener una mejor vision sobre el contraste
comportamental es conveniente retomar una serie
de investigaciones que plantean cuestionamientos
a la ley del efecto. Con base en los estudios sobre
los diferentes parametros, se concluyo que el castigo suprime las respuestas si es aplicado en forma
adecuada, con intensidad optima, inmediatez y una
frecuencia que permita suprimir las respuestas realmente. A pesar de esto, Herrstein y Rachlin (1969)
afirman que aunque el castigo sea efectivo, la ley
del efecto se toma relativa si tenemos en cuenta
que al decrementar una respuesta se incrementan
otras.
En 10 referente especfficamente a 108 estudios
de castigo en la ley del efecto, parece que en su
gran mayoria, se han centrado unicamente en la
relacion repuesta - estfmulo aversivo, teniendo un
estfmulo antecedente solo como ocasion, y por ello
se Ie connota como estimulo emocional condicionado, sin profundizar en las demas relaciones que
se producen en el contexto. La ley del efecto solo
hace referencia al resultado comportamental, en
terminos de incremento 0 decremento, de forma
tal que se torna parcial y ambigua; la controversia
simetna - asimetna puede ser el resultado de esta
ambigtiedad.
En terminos generales, el refuerzo debe incrementar, a la vez que el castigo debe decrementar
para postular una simetrfa. Hasta aca sin tener en
cuenta el que estos efectos ocurren en un contexto,
que es finalmente el que determina el efecto
comportamental.
Lo anterior permite plantearse en primera instancia cuatro tipos de analisis 0 de relaciones a ser
estudiadas: estfmulo - refuerzo, estfmulo - respuesta, respuesta - refuerzo y la respuesta ocurriendo
en el contexto.
La mayona de los estudios de igualacion se han
realizado con refuerzo positivo (Garnzu y Schwartz,
1973; Boakes, Halliday y Poli, 1975; Westbroock,
1973; Boakes, 1972; Redford y Perkins, 1974; y
Catania, 1963); es importante ver si esta ley es
aplicable a comportamientos en otras condiciones
que parecen diferentes cualitativamente, como por
ejemplo el control aversivo. Es fundamental aclarar
si el control positivo y el aversivo estan regidos
por las mismas leyes.
De Villiers (1972) presento evidencia de que el
analisis cuantitativo hecho por Herrstein (1970)
sobre las interacciones de tasa de respuesta y tasa
de refuerzo, pueden ser extendidas al refuerzo
negativo con la reduccion de la frecuencia de choque como el refuerzo que controla la evitacion. Estas interacciones cuantitativas entre frecuencia de
reduccion de choque, tasa de choque y tasa de respuestas en programas simples y multiples de evitacion, fueron investigadas desarrollando un programa de evitacion de intervalo al azar para eliminar
las relaciones temporales entre respuestas y choques; ademas, permite que tanto la tasa de choque
como la frecuencia de reduccion seaomedida.
De Villiers (1974) efectuo otra investigacion para
estudiar con mas detalle las relaciones cuantitativas
entre tasa de respuesta y reduccion en la frecuencia
de choque y choques recibidos; 10 estudio en un
programa simple de intervalo variable y en un programa multiple de intervalo variable de evitacion
utilizando igualmente ratas como sujetos. Los resultados de esta investigacion estuvieron de acuerdo
con aquellos de De Villiers (1972) y demostraron
una relacion legal entre tasa de refuerzo y frecuencia de reduccion de choque en programas IV de
evitacion; ademas, sugiere que la relacion cuantitativa entre tasa de respuesta y frecuencia de refuerzo
es la misma tanto para refuerzo positive como para
refuerzo negativo. Al utilizar el programa multiple
de IV de evitacion se tuvo en cuenta el estudio de
Shimp y Wheatley (1971), por 10 tanto trabajo con
componentes de corta duracion para maximizar la
interaccion en program as multiples. La mayor
interaccion en el multiple la encontro cuando la
duracion de los componentes era de cuarenta segundos. "Las ecuaciones de Herrstein (1970) se pueden
aplicar para relaciones entre tasa de respuesta y tasa
de refuerzo tanto en programas de IV con comida,
como en programas de IV con evitacion de choques.
La asfntota de la tasa relativa de respuestas en programas multiples IV con componentes cortos aparea la frecuencia relativa de refuerzo cuando el
refuerzo es comida 0 reduccion de choques"
(pp.234). Esta relacion entre frecuencia relativa de
respuesta y reduccion de choque, no se encontro
entre frecuencia relativa de respuesta y tasa relativa
de choque recibidos en los componentes cuya
duracion incrementaba al maximo la interaccion
0, como se vefa anteriormente, el parametro de la
ecuacion (13).
En 10 referente al castigo, existen estudios de
programas concurrentes, en los cuales ambas respuestas del programa son castigadas y se encuentra
una reduccion caracterfstica en la tasa de respuestas
en ambos componentes, pero, se mantiene el apareamiento de frecuencia relativa de refuerzos recibidos con la frecuencia relativa de respuestas (Holz,
1968). Cuando uno de los componentes no recibe
castigo, se encuentra un incremento en la tasa de
respuestas ante un componente y un decremento
ante el componente castigado (Reynolds, 1963). En
el programa multiple se ha encontrado que el
castigo en un componente puede, ya sea incrementar respuestas no castigadas (Terrace, 1968) 0
incrementar respuestas castigadas en el otro componente (Rachlin, 1966).
Deluty (1976) estudiolos efectos de la tasa del
castigo en un programa concurrente. Mantuvo constante la frecuencia de refuerzo y aplico castigo en
ambos componentes, pero variola tasa ante un componente y analizo los efectos de las dos. Encontro
que a medida que la tasa de castigo se incrementaba
ante el componente 2, la tasa de respuesta ante este
decrementaba y, concomitantemente, la tasa de respuestas ante el componente 1 incrementaba, independientemente de que se mantuviera constante
ante este, y de castigo. En programas de refuerzo
positivo se ha encontrado (Catania, 1963) que un
incremento en la tasa de refuerzo para una respuesta, incrementa esta respuesta, a la vez que decrementa la tasa de la respuesta concurrente. Por 10
tanto existe una relacion simetrica con los programas concurrentes de intervalo al azar-intervalo con
programas al azar de castigo.
Deluty (1976) plantea que los efectos de refuerzo
y castigo en un programa concurrente pueden ser
expresados como sigue:
~ =
P =
2
k (R1 +P2)
Ro + R1 + R2 + ~ + P 2
k(R2 +~)
la tasa de respuesta disminuye y la tasa de respuesta
castigada concurrentemente aumenta, como se
mostro en este experimento" (pp.79). Ademas, con
respecto a tasas relativas este mismo autor propone:
k(~ tPz)
RutRltR2t~+Pz
~
--=
k(RI + Pz)
k(R2 + ~)
~tPz -~~~_·t-~~~-
Rut~+~+~+Pz
Ru+~+~+~tPz
Conforme se puede ver en este ultimo estudio,
la igualacion es aplicable tambien para castigo. Hay
que tener en cuenta que en los estudios sobre control aversivo el sujeto demora en adaptarse al choque, 10 que puede interactuar con la igualacion, factor que no sucede con el refuerzo positivo, por motivos obvios.
Por esta razon el proposito de la presente investigacion es hacer una evaluacion de las interacciones
entre los componentes de un programa multiple con
castigo, asf como tambien de los efectos de exponer
inicialmente a los sujetos a condiciones de estfmulo
diferenciales y no-diferenciales.
Los objetivos del experimento fueron Msicamente tres: a) analizar a partir de una condicion
estfmulo no - diferencial las interacciones de un
programa multiple con castigo; b) evaluar la
generalidad de la ley de la igualacion en programas
multiples para el castigo; c) evaluar la generalidad
de la funcion del concurrente con castigo al programa multiple con castigo.
Ro + R1 + R2 + ~ + P2
Donde PI indica la tasa de castigos obtenidos
por responder ante una palanca y P2 indica los
castigos obtenidos por responder en la segunda
palanca. Esta ecuacion (14) "predice que a medida
que la tasa de castigo aumenta para una respuesta,
Independientes.
1. Probabilidad de refuerzo
2. Variaciones de probabilidades de castigo
3. Nivel de informacion asignado a los estfmulos.
Dependientes.
1. Tasa de respuesta relativa y absoluta
2. Interacciones entre los componentes del programa.
Se trabaj6 con dos ratas albinas ingenuas de 90
dfas de nacidas, hijas de una misma madre, pertenecientes ala misma cepa. Se denominaron respectivamente SIA y SUA'
Una caja de mantenimiento para cada sujeto, y
una caja experimental del SCIENTIFIC PROTOTYPE MFG. CORP. MODELO A - 115.
Un programador amHogo, del cual se utilizaron
dos Timers, un Stepper, dos puIs adores, doce Relays, ocho contadores, un registro acumulativo, un
registro de eventos, un zumbador y un generador
de probabilidades.
Los sujetos fueron entrenados primero a tomar
el alimento del comedero en la caja experimental.
La palanca se retir6 durante este periodo. EI nivel
de deprivaci6n utilizado fue de 23 horas a traves
de todo el experimento. Una vez condicionados al
sonido que emite el comedero, se les entren6 en la
opresi6n de la palanca. EI reforzador fue una pastilIa de concentrado de Purina y Maizena con un peso
de 27 gramos. Los programas de refuerzo utilizados
fueron de estfmulo T (Shoenfeld y Cole, 1973). Se
inici6 con un T de 2 segundos y un t = 0.66, con
probabilidad (p) 1.0 de refuerzo; esto con el fin de
que todas las respuestas fueran reforzadas. La longitud del cicIo se fue aumentando a 4, 6, 8 y 10 segundos manteniendo t- constante a 1 segundo. Una vez
se lIeg6 a T= 10 segundos con T = 0.90 y p= 1.0, se
comenz6 a variar la probabilidad a 0.7,0.45 Y 0.2.
EI programa final fue especificado con T = 10 segundos, T =0.90 y p= 0.2, donde tD = 9 segundos y
t- = 1 segundo. Este programa produce una frecuencia de refuerzo y una tasa de respuesta similares a
la encontrada con un IV de panimetros iguales
(Millenson, 1963). Se requirieron 22 sesiones para
la obtenci6n de esta linea de base (de 4 sujetos en
este programa fueron elegidos los dos mas estables).
EI criterio de estabilidad que se utiliz6, es el propuesto por Shoenfeld y Cole (1973). Semide la tasa
total de cada sesi6n; se determina arbitrariamente
que los datos de las primeras cinco sesiones pertenecen al periodo de transici6n. Luego se comparan
bloques de tres sesiones consecutivas, con las tres
sesiones que Ie siguen inmed!atamente. La diferencia
entre el promedio de las tres sesiones se determina
como promedio del porcentaje de las seis sesiones.
Si esta diferencia es menor del cinco por ciento se
acepta como perteneciente al rango que caracteriza
un estado estable. Si no se logra, se hace una nueva
prueba en la sesi6n siguiente (analizando siempre
seis sesiones). Ademas la frecuencia promedio de
refuerzo obtenida en las mismas sesiones no debe
presentar una diferencia mayor del cinco por ciento.
Una vez obtenida la linea de base, se introdujo
un programa multiple. Ante el estfmulo A (luz) el
programa de refuerzo qued6 vigente; ante el estfmulo B (zumbador) el program a de refuerzo qued6
tambien en vigencia. Ademas, se superpuso en ambos componentes un programa de castigo con especificaciones iguales al del refuerzo. EI estfmulo
aversivo utilizado fue un choque severo (Azrin y
Holz, 1960), con intensidad de 60 voltios y setenta
y cinco centesimas de segundo de duraci6n. La duraci6n de cada componente fue de treinta segundos.
Una vez obtenida la linea de base en este programa
que tuvo probabilidad 0.2 de castigo, la probabilidad de este se vari6 a traves de 0.1 y 0.0 (procedimiento de ida), replicandose con probabilidades 0.1
y 0.2 (procedimiento
de vuelta). La Tabla 1
ejemplifica el procedimiento. La probabilidad de
la fase no fue cambiada sin haber obtenido la linea
de base correspondiente. Sesenta y dos sesiones de
una hora de duraci6n fueron requeridas con cada
sujeto a partir de la iniciaci6n del programa
multiple.
i
·x.
I
I
"
!
4<;t
••
1
1
•• I
•• j
1
Tabla 1.
Variaciones en la probabilidad del castigo ante el primer
componente del programa
_:-_-t~~
FJI,S£
IPZIC~;';;;;
n
m:
m
--"'X
III •• {I'.21 CAS(P
••
..."...ft
---
•CIl.H
"".Cl."
t
II
A
I)
30 S09
(PZICAS lPO) Rho II' 2ltAS IP.ZI
30 509·
II' ••
--- ._---~.
~_._--(PtICAS(P.I)
Illto
RIa
Rho
IPZI CAs(PZI
(P.IICAS lP.Zl Itho II' I) CAS(I' 11
-\
1
'0
t
•• 1
.. j
30 Se.
'Un lP.2)CASIP.11 IIfro (I'. VCAS (1'.21
••
•••
--_.-
•• ~
4<>
10501·
-_ .....•.
J
1
'_"-"--
30 So.
"'.
,. "~.
,~,
.,__ ..~..._,."._""'-"N
':1
_
',J
Figura 1. Tasa de respuesta del sujeto IA (no diferencial)
que ejemplijica Lainduccion obtenida. Las Uneas quebradas
representan Lasfases 4 y 5 de replicacion.
Las figuras 1 y 2, muestran la tasa promedio de
respuesta de las tres ultimas sesiones de cada fase
para los sujetos IA y IIA respectivamente. En el procedimiento de ida, fases 1 a 3, se observa una inducci6n positiva, acentuada en el componente A, ante
el cmU se hicieron las variaciones. EI procedimiento
de vuelta, fases 4 y 5 presenta una relaci6n imprecisa, aunque si mantienen la misma funci6n los dos
componentes. Es decir, a pesar de variar en la misma direcci6n los dos componentes, no replican las
fases anteriores.
EI sujeto II A evidencia el mismo tipo de inducci6n positiva que el sujeto IA en el procedimiento
de ida, pero mostrando en la fase 3 del componente
A un punto extrafio; la tasa de respuesta decrement6
de una manera inesperada al contrario del sujeto II
A el cmil increment6
como era 10 esperado. En la
fase 3, la frecuencia de castigo ante el componente
A se redujo acero, esto es, no recibi6 choques. En
general se observ6 un incremento ante el componente B, es decir, donde siempre se recibia
to
••
••
1
f\
/\
j
i
•• 11
••
j
l
I,J
44
••
••!
..•••
...•
•
J
1
••• ~
I \
,I
J
/
/
A
&
\\
\l
,~
f
·-1
C:o_o
C-?_,.
\,
I
at
••
••
••
-
·u.
r"""
I
I
I
I
I
I
I
I
Figura 2. Tasa de respuesta del sujeto IIA (no diferencial)
que ejemplijica Lainduccion obtenida. Las Uneas quebradas
representan Lasfases 4 y 5 de replicacion.
probabilidad de 0.2 de choque, dado que siempre
se mantuvo con stante. Esto ultimo ejemplifica la
induccion positiva, el cambio de los dos componentes es en la misma direccion.
En el procedimiento de vuelta, la funcion de la
replicacion es ordenada en ambos componentes para
el sujeto IIA• Se observo (en ambos sujetos) que el
componente B vario en la misma direccion en que
vario el componente A (respecto a ejecuciones de
los sujetos).Ademas, al introducirles la contingencia
de castigo se observo un decremento en la tasa.
La relacion encontrada entre la tasa de respuestas
y las frecuencias de castigo no pudo ser predicha
por la ley de la igualacion 0 algunas de sus correcciones analizadas anteriormente en la revision. Esto
es consistente dada la induccion positiva encontrada. Con los principios del automoldeamiento se
ha podido establecer que el partir de una situacion
no - diferencial, impide la adecuada discriminacion
posterior de la informacion dada por los estfmulos
0, el control que establecen estos sobre el comportamiento. Este experimento confirma estas predicciones del automoldeamiento dado que los sujetos
no discriminaron las diferencias en las frecuencias
de castigo. Ademas la induccion encontrada es
caracteristica, en alguna medida, del debil control
de estfmulos (Pear y Wilkie, 1971), producto de la
condicion no - diferencial inicial, 0 sea en la
primera fase.
La induccion encontrada en este caso elimina la
posibilidad de igualacion. En todo programa multiple, las contingencias de un componente no solo
afectan ese componente sino tambien el otro; sin
embargo,esto no elimina la posibilidad de una igualacion. En este caso, aunque la frecuencia relativa
de castigo se vario, la frecuencia relativa de respuestas no vario, la tasa incremento de igual forma en
ambos componentes.
El decremento de la tasa de respuestas en la fase
1 con respecto a la lfnea de base del program a t, es
explicable por los efectos supresores del castigo.
En ambos sujetos la supresion fue mayor para el
componente B, 10 cual puede ser debido a efectos
aversivos del sonido.
El sujeto IIA presento un incremento en la tasa
ante la fase 1 del componente A. Azrin y Holz
(1963) afirman que para predecir si el castigo al
ser introducido producira supresion 0 facilitacion
hay que estudiar mas a fonda los parametros.
Aunque las ultimas afirmaciones no son categoricas, sino mas bien tentativas para el resultado, si
se puede concluir en general que una informacion
no - diferencial con respecto a los estfmulos, imposibilita una adecuada discriminacion. En este caso,
el castigo tenia la misma probabilidad durante los
dos estimulos de la primera fase, 10 cual imposibilitaba la discriminacion posterior, convirtiendose
los estimulos en redundantes, por cuanto no se
correlacionaban con ningun cambio en el ambiente.
Segun Mackintosh (1973), el sujeto aprende a no
atender a los estimulos redundantes, 10 cual implicarla, ademas, la no diferenciacion posterior entre
los componentes. Debido a que los dos sujetos de
este experimento no presentaron exactamente la
misma funcion, como para aseverar la replicacion
entre sujetos, es posible que en alguna medida los
resultados puedan ser debidos a efectos seriales 0
factores no controlados, dadas las condiciones del
laboratorio. Sin embargo, aunque esto es algo para
tener en cuenta, no creemos en realidad que estas
variaciones tengan mucha incidencia en los resultados. De todas formas, es deseable que se Hevaran a
cabo mas experimentos sobre este tema para que
los datos encontrados sean mas generalizables.
Los objetivos del presente experimento fueron
basicamente cuatro: a) Analizar a partir de una
condicion estimulo diferenciallas interacciones de
un programa multiple con castigo; b) Evaluar la
generalidad de la ley de la igualacion en programa
multiples; c) Evaluar la generalidad de la funcion
del concurrente con castigo al programa multiple;
e) Estudiar los efectos d ela variacion en la duracion
de los componentes.
ponente A la probabilidad del castigo se vario a
traves de 0.0, 0.05, 0.2 Y0.4 (procedimiento de ida).
La replicacion se hizo con las probabilidades 0.4,
0.2 Y0.0 (procedimiento de vuelta), con la duracion
del componente en dos minutos. La tabla 2 ejemplifica el procedimiento.
Tabla 2.
Variaciones en la probabilidad del castigo ante el primer
componente y en el tiempo de duraci6n de ios dos
Independientes.
1. Probabilidades de refuerzo
2. Variaciones de probabilidades de castigo
3. Variaciones en la duracion de los componentes
4. Nivel de informacion asignado a los estimulos.
:I
RIZO(PZJCAS(
n
RllO(PZI
IlizolP21
m
1-----"---'--IH,.(P;:)
Dl:
---'-"11:
Dependientes.
1. Tasa de respuestas relativa y absoluta.
2. Interacciones
entre los componentes
programa.
A
fA Sf
B
'III
••
u.••.
••
('.~
tOllll'fOtt1:ti'ft:
1'.01 Ril.
(PZ) CAS (P. Z I
30 S. 9
Ilh.
(1'.21 CAS {I' 2J
30 S 09
CAS (P.06l
CAS (1'.2 I Ill •• , (PIP
CAS(P.41
Rilo
CA.';(1'21
(1'.21 CAS (I'll
-_·_···_·_·
__·-t······_·····__·
Moo (P2) CAS
(PAl ItflO (1'.21 CAS (PZI
n
Rtt.(P.21
CAS (1'.21
Rlt.
1CI
RI"'("2)
CAS(P·Ol
'Rho
--
30 So;
--
30 So,
2 Mfnu,
--
(1'21 CAS (1'.21
2
"'''\I '
{p.tI CAS (pzl
2
NllW.
del
Se trabajo con dos ratas albinas ingenuas, de 90
dias de nacidas, hijas de una misma madre, pertenecientes ala misma cepa. Se denominaron respectivamente Ie y III A'
Se llevo a cabo igual que en el experimento anterior, hasta estabilizar los sujetos en el programa i.
EI programa multiple se introdujo con los mismos estimulos que el experimento 1, al igual que
los programas, con la diferencia de que ante el com-
De acuerdo ala ecuacion (15) descrita por Deluty
(1976) para el programa concurrente con castigo,
derivamos una relacion, invirtiendo la ecuacion y
cambiando el orden de los factores para simplificarla, se obtuvo:
RA
RB
=
CA +PB
CB +PA
Teniendo en cuenta la ecuacion (10) propuesta
por Baum (1974) que es algebraicamente
equivalente ala igualacion, se tiene:
Siguiendo el mismo desarrollo de Baum, elevando las funciones exponenciales de k y a (la pendiente), se obtiene:
La figura 3 representa la ecuacion (16) para el
sujeto lIlA' con el procedimiento de ida y vuelta
por separado. P B YP A son los castigos obtenidos; C
son los refuerzos programados. Puede observarse
una funcion relativamente homogenea que relaciona tanto los puntos de ida como de vuelta. La lfnea
de regresion nos indica la funcion de los puntos, k
es el punto de interseccion y a la pendiente.
Las funciones logarftmicas de la funcion anterior, son representadas en la figura 4. La ecuacion
de regresion determina k y a. A pesar de la relacion
vista en la ecuacion anterior, la presente muestra
que la pendiente no se aproxima a la relacion 1.0
esperada. Aplicando anteriormente el factor de
correccion exponencial, ecuacion (18), se esperaria
la determinacion de los puntos como una funcion
perteneciente a la relacion esperada. La figura 5
representa esta relacion. La figura 6 representa la
misma relacion exponencial pero para el sujeto Ie .
Cll
"'-
Q:
<l
"1t
cr
5
()(j.
...
OG~
0
..J
mA
8
,
u~
Figura 4. A - relaciones en las fases de ida. B- relaciones en
las fases de replicacion, la duracion del componente
incrementada a 2 minutos y sus rectas de regresion
respectivas.
.4'
ht.i/
SmA
ivO
IRe
o.
sm .\
F,
.~_.~---=--"--""-_._---'~;"
..':'"_.:;.~-:
F.
LO·(%t;~)
Figura 5. A- indica las tasas de ida del Sic. B- indica las
Figura 3. A - relaciones en las fases de ida. B- relaciones en
las fases de vue Ita. Las lineas punteadas indican la recta de
regresion.
tasas de vuelta con la duracion de cada componente
incrementado a 2 minutos y sus rectas de regresion
respectivas.
1«
C+Pt ).
C+P~
..,... .•••.••.••••••.•.•••.•'"T""'....,...'"T""'".,..,..,.., .•
,.,
_.00
I'"
..,..,...,.,....,."7. .....,..,..,..,..,..,...,...,..,. .•.•
,~c
",
'''0
It!-
Figura 6. A- Indica lasfases de ida del sujeto Ie. B- Indica
lasfases de vuelta con la duracion de cada componente incrementando a 2 minutos, y su rectas de regresion respectivas.
A pesar de la funcion vista en la figura 3, la figura
5 muestra que no se aproxima a la pendiente1.0
que se predice. El sujeto IeProdujo una linea negativa, pero de todas formas representa una relacion
entre los puntos. La funcion es mucho mas precis a
para la ida en ambos sujetos, que la vuelta.
Al comparar las ejecuciones de los sujetos, en
las dos duraciones diferentes de los componentes,
se verifican los hallazgos de Shimp y Wheatley
(1971). Todorov (1972) y de Villiere (1974). En
ambos sujetos y especialmente en Ie la interaccion
de los componentes se redujo al incrementar la
duracion de estos.
Los resultados plantean varios puntos interesantes. El hecho de que con base en la ecuacion de
Deluty (1976) y, a pesar de la relacion expresada
en la figura 3, la funcion exponencial no se aproxima a 1.0, se puede pensar que 10 que Deluty hallo
fue un caso unico y no precisamente un punto perteneciente a una familia general de curvas que pueda
ser predicha por la ecuacion, conforme sf se ha demostrado en el caso de la igualacion. Ademas, el
factor 'k' de correccion propuesto por Baum no se
encuentra, ya sea por que el caso de la ecuacion es
mas compleja, haciendo mas complicada la introduccion del castigo, 0 simplemente por que hubo
factores extraiios en la investigacion, tales como el
control de la probabilidad de choques 0 precision
del programador. De todas maneras el hecho de que
los dos sujetos presentaran una relacion homogenea
en las fases de ida, aunque opuestas entre las dos,
da pie para pensar que el caso del programa multiple
con castigo, la ecuacion de Deluty no predice realmente la fun cion. Sin embargo, solo cabe sugerir
mas investigaciones de este tipo con castigo.
Se ve claramente que, el hecho de partir de una
condicion diferencial, permite que se establezca una
relacion mas 0 menos clara entre las respuestas y
los eventos ambientales. Al contrario del experimento 1, los sujetos aquf muestran una funcion homogenea. Esto confirmaria tambien los estudios de
Gamzu y Williams; se confirmo igualmente que en
un programa multiple, al incrementar la duracion de
los componentes se decrementa la interaccion de
estos, es decir, el parametro 'm' de las ecuaciones
de Herrstein. Con una duracion de dos minutos para
cada componente, esta interaccion esta muy cercana
a cero; dicho en otras palabras, no hay interaccion.
Los resultados del estudio confirman en general
una serie de experimentos que pueden ser enmarcados dentro de la evaluacion empfrica de la ley del
efecto. Se confirman los experimentos de Rachlin
(1967) y los de Williams y Williams (1969), acerca
de la no adquisicion de una relacion estfmulo -
respuesta cuando los sujetos han tenido una condici6n no - diferencial inicial; tambien se conform6
la irreversibilidad de este comportamiento. Se encontr6 que la primera exposici6n de los sujetos a
los estfmulos (A y B) del programa multiple fue
determinante para que se desarrollara 0 no una ejecuci6n diferente ante cada uno. Despues de haber
iniciado con una fase diferencial, el pasar por una
fase no - diferencial, no afectaba una posible discriminaci6n posterior una vez carnbiadas las contingencias. En cambio si se iniciaba con una fase no diferencial, asf se cambiara luego a una fase diferencial, no se lograba la discriminaci6n. Esto mismo
encontr6 Rescorla (1967) pero con supresi6n condicionada.
Los sujetos cuya fase inicial fue la no - diferencial mostraron una inducci6n positiva, no permitiendo analizar los datos en terminos de la ley de la
igualaci6n. Reynolds (1963) demostr6 que la inducci6n positiva se daba en prograrnas multiples, comenzando a evidenciar la importancia de cuantificar las relaciones entre las respuestas y el refuerzo.
Estos resultados apoyan la crftica de Herrstein
(1970) a la ley del efecto, en la medida que la inducci6n positiva presentada no es 10 adaptativo, y al
contrario de 10 que predice la ley, las respuestas
castigadas no se debilitan. En realidad estos experimentos plantean que el comportamiento es producto de una serie de relaciones determinadas y no precisamente una simple relaci6n cualitativa. Este tipo
de postulaci6n fue 10que llev6 al mismo Thorndike
(1932) a criticar su ley del efecto original. Segun
este investigador, la parte negativa de la ley debfa
ser reformada en tanto que era menos general y
universal que la parte positiva, siendo por ello mas
especializada, contingente e indirecta. La controversia simetrfa - asimetrfa no ha sido hasta el momento de esta investigaci6n dilucidada, siendo posible trabajar desde cualquiera de las dos referencias
te6ricas. Sin embargo, el estudio pormenorizado
de los parametros del castigo ha dado evidencia de
que el castigo y el refuerzo, aunque opuestos en
sus efectos estan regidos por las mismas leyes; es
decir, que son dos lados de una misma moneda que
equidista en sus efectos (Herrstein y Rachlin, 1967).
En el castigo 10 primero que se ha discutido es si
nos referimos a el en terminos de castigo 0 de castigador. Azrin y Holz (1966) y Logan (1969) afirman
que el castigo debe ser definido en terminos funcionales como el refuerzo, ya que en terminos operacionales se convierte en un proceso secundario, en
la medida en que el estfmulo aversivo debe ser
definido en terminos de evitaci6n y escape.
Creemos que se requiere mayor investigaci6n en
el control aversivo y especfficamente en el castigo,
realizando analisis en terminos de relaciones cuantitativas; por 10 tanto los resultados de estos experimentos s610 pueden ser enmarcados por ahora dentro de una crftica general a los principios cualitativos de la ley del efecto original. El unico estudio
reportado que trata de encontrar relaciones cuantitativas en la explicaci6n de los efectos del castigo,
desde el punto de vista de la ley de la igualaci6n,
fue el realizado por Deluty (1976).
En resumen, no se puede afirmar categ6ricamente 0 en rerminos de la ley, que el refuerzo siempre
incrementa y el castigo decrementa, sino que estos
procesos se dan en funci6n de las relaciones ambientales existentes.
Baum, W.M. and Rachlin, H.C. (1969). Choice as
time allocation. Journal of the Experimental
Analysis of Behavior, 12, 861 - 874.
Baum, W.M. (1973). The correlation - based
matching law. Journal of the Experimental
Analysis of Behavior, 12, 861 - 874.
Baum, W.M. (1973). Time allocation and negative
reinforcement.
Journal of the Experimental
Analysis of Behavior, 20, 313 - 322.
Baum, W.M. (1974). On two types of deviation
from the matching
law: bias and under
matching. Journal of Experimental Analysis of
Behavior, 22, 231 - 242.
Boakes, RA., Halliday, M.S. and Poli, M. (1975).
Response additivity: Effects of superimposed
free reinforcement on a variable - interval base
line. Journal of the Experimental Analysis of
Behavior, 23, 1977 - 191.
Brown, P. and Jenkins, H. (1968). Auto-shaping of
the pigeon key peck Journal of the Experimental Analysis of Behavior, 11, 1-8.
Burkhard, B., Rachlin, H., and Schrader, S., (1978).
Reinforcement and punishment in a closed system. Learning and Motivation, 9, 392 - 410.
Catania, C. (1966). Concurrent operants. In W.K.
Honing (Ed.), Operant Behavior: Areas ofresearch and application. New York: Appleton
Century Crofts.
Catania, C. (1973).Behavioral contrast in a multiple and concurrent schedule of reinforcement.
Journal of Experimental Analysis of Behavior,
4,335 - 342.
Catania, C. (1973). Concurrent performances: reinforcement - interaction and response independence. Journal of Experimental Analysis of
Behavior, 19, 517 - 526.
De Villiers, P. (1972). Reinforcement and response
rate interaction in multiple random-interval
avoidance schedules. Journal of Experimental
Analysis of Behavior, 18, 499 - 507.
De Villiers, P. (1974). The Law of the effect and
avoidance: a quantitative relationship between
response rate and shock frequency reduction.
Journal of Experimental Analysis of Behavior,
21,223 - 235.
De Villiers, P. (1977). Choice in concurrent schedules and quantitative formulation of the Law of
the Effects. In W.K. Honing & 1.E.R Satddon
(Eds). Handbook of operant behavior.
Englewood Cliff, NJ: Prentice Hall.
Deluty, M. (1976). Chicer and the rate punishment
in concurrent schedules. Journal of Experimental Analysis of Behavior, 21, 223 - 235.
Estes, W. and Skinner, B.P. (1941). Some quantitative properties of anxiety. Journal of Experimental Analysis of Behavior, 29, 390 - 400.
Ferster, c.B. and Skinner, B.F (1957). Schedules
of reinforcement. New York: Appleton Century
Croft.
Findley, 1.D. (19 ). Preference and Switching under concurrent scheduling. Journal of Experimental Analysis of Behavior, 1, 123 - 144.
Garnzu, Rand Scwartz, B. (1973). The maintenance of key pecking by stimulus contingent
and response independent food presentation.
Journal of Experimental Analysis of Behavior,
19,65 -72.
Gamzu, R and Williams, D. (1973). Associative
factors underline the pigeons key pecking in
auto shaping procedures. Journal of Experimental Analysis of Behavior, 19,225 - 232.
Gibbon, 1., and Fairhust, S. (1994). Ratio versus difference comparators in choice. Journal of Experimental Analysis of Behavior, 62, 409 - 434.
Grace, RC., (1995). Independence of reinforcement delay and magnitude in concurrent chains.
Journal of Experimental Analysis of Behavior,
63. 255 - 276.
Halliday, M.S., and Boakes, RA. (1974). Behavioral contrast without response rate reduction.
Journal of Experimental Analysis of Behavior,
22, 453 - 462.
Herrnstein, R.J. (1961). Relative and absolute
strength of response as function of frequency
of reinforcement. Journal of Experimental
Analysis of Behavior, 4, 267 - 272.
Herrstein, R.J. (1970). On the law of effect. Journal of Experimental Analysis of Behavior, 13,
243 - 266.
Herrstein, R.J. (1974). Formal properties of the
matching law. Journal of Experimental Analysis of Behavior, 21, 159 - 164.
Herrstein, R.J. (1990). Rational choice theory:
necessary but no sufficient American Psychologist, 45,356 - 367.
Herrstein, R.J. (1991). Reply to Binmore and
Staddon. American Psychologist, 46, 799 - 801.
Hilgard, E.R., and Bower, G.H. (1966). Theories
of learning. New York: Appleton Century
Crofts.
Holz, W.e. (1968). Punishment and rate of positive reinforcement. Journal of Experimental
Analysis of Behavior, 11, 285 - 292.
Jenkins, H. (1975). Behavior theory today: a return to fundamentals. Revista Mexicana de
Amilisis de Comportamiento. 1.
Kamin, L. (1969). Predictability, surprise, attention
and conditioning. Punishment and aversive behavior. New York: Appleton Century Crofts.
Killen, P. (1972). A yoked chamber comparison of
concurrent and multiple schedules. Journal of
Experimental Analysis of Behavior. 18, 13- 22.
Koders, T., and Rilling, M. (1976). Procedural antecedents of behavioral contrast: a re-examination of errorless learning. Journal of Experimental Analysis of Behavior. 25, 27 - 42.
Mackintosh, A. (1973). Learning to ignore stimuli
that predict no change in reinforcement. Constrains on learning. New York:Academic Press.
McSweeney, F. (1975). Matching and contrast on
several concurrent treadle - press schedule.
Journal of Experimental Analysis of Behavior.
23, 193 - 195..
Millenson, 1.R. (1963). Random of interval schedules of reinforcement. Journal of Experimental Analysis of Behavior, 6, 437 - 443.
Morse, R. (1966). Intermittent reinforcement. In
W. Honing. Operant Behavior: Areas of research an application. New York: Appleton
Century Crofts.
Nevin, 1.A. (1973). The maintenance of behavior.
The Study of Behavior. Glenview: Scott
Foresman Co.
Pearl, 1., and Wilkie, M. (1971). Contrast and induction in rats on multiple schedules. Journal
of Experimental Analysis of Behavior, 15,
289 - 296.
Poli, M. (1975). Response decrements produced
by extiction and by response - independent reinforcement. Journal of Experimental Analysis of Behavior, 19,293 - 302.
Postman, L. (1947). The history and present status
of the law of effect. Psychological bulletin. 44,
489 - 563.
Premack, D. (1971). Catching up with common
sense, or two sides ofa genaralization: Reinforcement and punishment. In R. Glaser (Ed.),
The nature of reinforcement. New York: academic Press.
Rachlin, H. (1966). Recovery of responses during
mild punishment. Journal of Experimental
Analysis of Behavior, 9, 251 - 263.
Rachlin, H. (1971). On the tautology of the
matching law. Journal of Experimental Analysis of Behavior, 15, 249 - 251.
Rachlin, H., and Baum, W.M. (1972). Effects of
alternative reinforcement: does the source matter? Journal of Experimental Analysis of Behavior. 18,231 - 241.
Rachlin, H.C. and Herrstein, R.I. (1969). Hedonism
revisited: On the law of effect. Punishment and
aversive behavior. New York: Appleton Century Crofts.
Redford, M., and Perkin, e. (1974). The role of
autopecking in behavioral contrast. Journal of
Experimental Analysis of Behavior, 21, 145 150.
Reynolds, G. (1961a). Behavioral contrast. Journal of Experimental Analysis of Behavior, 4,
57 - 71.
Reynolds, G. (1961b). An analysis of interactions
in a multiple schedule. Journal of Experimental Analysis of Behavior, 4, 107 - 117.
Reynolds, G. (1961c). Relativity of response rate
and reinforcement frequency in a multiple
schedule. Journal of Experimental Analysis of
Behavior, 4, 179 - 184.
Reynolds, G., and Catania, C.(1961). Behavioral
contrast with fixed interval and law rate rein-
forcement Journal of Experimental Analysis
of Behavior. 4, 387 - 391.
Reynolds, G. (1963). Some limitations on behavioral contrast and induction during successive
discrimination. Journal of Experimental Analysis of Behavior. 6, 131 - 139.
Shimp, c., and Weatley, K. (1971). Matching to
relative reinforcement frequency in multiple
schedules with a short component duration.
Journal of Experimental Analysis of Behavior,
15,205 - 210.
Schoenfeld, W., and Cole, J. (1972). Stimulus
schedule: the t system. New York: Harper Row.
Schuwartz, B. (1975). Discriminative stimulus location as a determinant of positive and negative behavioral contrat in the pigeon. Journal of
Experimental Analysis of Behavior, 23, 167 176.
Schull, RL., and Pliskoff, S.S. (1967). Change over
delay and concurrent performance: some effects
on relative performances measures. Journal of
Experimental Analysis of Behavior, 10, 517 527.
Shah, K., Bradshaw, C. M., and Szabadi, E. (1991).
Relative and absolute reinforcement frequency
as determinants of choice in concurrent variable interval schedules. Quarterly. Journal of
Experimental Psychology, 43, 25 - 38.
Sidman, M. (1960). Tactics of scientific research.
New York: Basic Books, Inc. Publishers.
Spealman, Rand Gollub, L. (1974). Behavioral
interactions in multiple variable interval
schedules. Journal of Experimental Analysis of
Behavior, 22, 471 - 481.
Stein, L., Hoffman, H., and Stitt, S. (1971). Collateral behavior of the pigeon during conditioning
suppression. Journal of Experimental Analysis
of Behavior, 15,83 - 93.
Terrace, H. (1966). Stimulus control. In WHoning,
Operant Behavior: areas of research and
application. New York: Appleton Century
Crofts.
Terrace,H. (1968). Discrimination learning, the peak
shift and behavioral contrast. Journal of Experimental Analysis of Behavior, 11, 727- 741.
Todorov, lC., (1972). Component duration and
relative response rates in multiple schedules.
Journal of Experimental Analysis of Behavior,
17,45 - 49.
Todorov, lC.,Hanna, E.S., and De Sa, M.C.N.B.
(1984). Frequency versus magnitude of reinforcement: New data with a different procedure.
Journal of Experimental analysis of Behavior,
41, 151 - 167.
Wagner, A., and Rescorla, A. (1972). Inhibition in
pavlovian conditioning: application of a theory.
In R Boakes and M, Halliday. Inhibition and
learning. New York: Academic Press.
Wallace, H., and Henle, M. (1941). An experimental analysis of the law of effect. Journal of Experimental Analysis of Behavior, 28, 340 - 349.
Weisman, R, and Ramsden, M. (1973). Discrimination of a response independent component
in a multiple schedule. Journal of Experimental Analysis of Behavior, 19, 55 -64.
Weisman, R, and Premack, D. (1966). Reinforcement and punishment produced by the same response depending upon the probability relation
between the instrumental and contingent responses. Documento sin editar presentado enl a
reunion de de Psychonomic Society, S1,Louise.
Westbrook, R (1973). Failure to obtain positive
contrast when pigeons press a bar. Journal of
Experimental Analysis of Behavior, 20, 499510.
Williams, D., and Williams, H. (1969). Auto-maintenance in the pigeon: sustained pecking despite contingent non-reinforcement. Journal of
Experimental Analysis of Behavior, 12,511 520.
Williams, B. A. (1994). Reinforcement and Choice.
In N.J. Mackintosh (Ed.). Animal Learning and
cognition (pp. 81-108). San Diego: Academic
Press.
Descargar