Refuerzo: Skinner

Anuncio
B.F.SKINNER:PROGRAMAS Y FORMAS DE REFUERZO.
Eduardo Calatayud Gonzalez.
Facultad de Psicología.
U.C.M.18−IV−94.
INTRODUCCION.
Burrus Frederic Skinner(1904−1990) concibió el conductismo como una doctrina basada en un sistema
estrictamente empírico,sin ningún supuesto teórico previo capaz de condicionar la investigación.Parte de unos
datos empíricos y,solo en un segundo momento pasa con mucha cautela a una formulación final de
generalizaciones y teorizaciones.Su objetivo es describír el comportamiento humano,no explicarlo.En
consecuencia se ocupa sólo del comportamiento observable y considera que es deber de la investigación
científica establecer unas relaciones entre las condiciones del estímulo originarias y la consiguiente respuesta
del organismo.
En oposición con gran parte de los psicólogos contemporaneos,Skinner sostiene la posibilidad de obtener unos
resultados generalizables válidos,sin recurrir a análisis de tipo estadístico,pero recogiendo un amplio número
de datos de un solo individuo mantenido en condiciones experimentales rigurosa−
mente controladas.
Skinner extrapola sus análisis generales a partir del estudio del comportamiento de ratones y palomas
encerrados en jaulas(Skinner box).Entre las diferentes respuestas que el animal puede dar,se escoge una,que
irá seguida por un estímulo reforzador.Esta respuesta seguida de reforzamiento tenderá a presentarse con
mayor frecuencia.De esto deduce Skinner que aquellas ocasiones en las que una respuesta determinada va
seguida de una recompensa constituyen la base para cualquier tipo de aprendizaje.
El paradigma del condicionamiento operante,se ha convertido en un esquema fundamental en psicología
comparada y fisiológica para estudiar otras variables y ha pasado a ser la clave de bóveda para explicar
aprendizajes complejos que resultaban inexplicables desde el punto del condicionamiento clásico.
Skinner se entregó a analizar las principales respuestas humanas,tratando de averiguar cuáles eran los hechos
reforzadores que provocaban su mantenimiento y consolidación.A través de estas investigaciones demostró la
manipulabilidad del comportamiento humano,tanto en términos positivos y utiles para la humanidad,como
en términos negativos y destructivos.
CONCEPTOS BASICOS.
La aportación más sistemática y rica al campo de conocimientos del condicionamiento instrumental se debe
a Skinner y sus colaboradores.Los conceptos básicos son los de operante y refuerzo, y las técnicas
principales están constituidas por los índices o programas de refuerzo(schedules),en los que se analizan
minuciosamente las repercusiones de numerosos parámetros sobre la efectividad del condicionamiento.Las
leyes son muy similares a las del condicionamiento clásico,a excepción del principio de modelado,que
constituye una auténtica novedad.
La conducta operante, es el nivel en el que se desarrollan los experimentos de Skinner,no obstante,la
relación de ésta con la conducta respondiente es algo de lo que Skinner no se ocupa,probablemente por que
1
implica una relación con la biología en la que no desea entrar.Las relaciones con un posible nivel conductual
superior al operante,quedan igualmente, fuera de lugar.
Cualquier conducta espontánea(no elicitada por un estímulo localizable en el ambiente),forma parte de un
operante.La conducta voluntaria es para Skinner parte de la conducta operante y los estímulos
operables(aquellos a los que un organismo puede responder con un operante) se llaman discriminati−
vos,y,se distinguen de los elicitantes en que éstos preceden regularmente a las respuestas y las suscitan de
forma necesaria,mientras que los discriminativos no fuerzan la respuesta.El efecto de un operante es el
refuerzo.Si el operante es seguido de un refuerzo, la obtención de éste pasa a depender funcional−
mente de ese operante(contingente respecto de él).
PROGRAMAS Y FORMAS DE REFUERZO.
La efectividad del condicionamiento depende,sobre todo,de la forma en que se efectúa el refuerzo.Los
condicionamientos más eficaces se obtienen con refuerzos intermitentes y no continuados y obedecen a unas
leyes estudiadas y analizadas en animales por Fester y Skinner(1957) entre otros.Los índices o programas de
refuerzo que fueron estudiados pueden clasificarse de acuerdo con la regularidad o irregularidad de los
intervalos entre los refuerzos,y con un número de respuestas no reforzadas o el tiempo que transcurre entre los
refuerzos.En síntesis son:
1.Programas de razón fija .El refuerzo ocurre tras un número fijo de operantes no reforzados;si sólo se
refuerza un operante de cada 20 emitidos,se dice que la ratio es de 20 a 1.
2.Programas de intervalo fijo.El refuerzo ocurre tras un periodo de tiempo fijo,por ejemplo un minuto, a
partir de la última respuesta reforzada.Por muchos operantes que emita un animal después de un refuerzo,ha
de transcurrir un intervalo de tiempo antes de recibir un nuevo refuerzo.
3.Programas de razón variable. Es idéntico al programa de razón fija excepto en que el número de
respuestas no reforzadas varía de un refuerzo a otro.Si la ratio básica es de 20 a 1,el número de operantes no
reforzados puede variar entre 0 y 40,con tal que la razón final media continue siendo de 20 a 1.
4.Programas de intervalos variables.El refuerzo ocurre tras un periodo de tiempo que varía,al primer
refuerzo,por ejemplo,puede seguir un periodo de un minuto sin refuerzo;al segundo un periodo de 15
segundos,etc.Generalmente los periodos de tiempo se eligen aleatoriamente entre márgenes que oscilan de 0 a
120 segundos,aunque estos márgenes dependen de muchos factores.
Los programas de razones fijas y variables originan tasas de respuestas muy rápidas,a diferencia de lo que
ocurre con los programas de intervalos.En los de intervalo fijo,el animal parece estar atendiendo al tiempo,y
una vez obtenido el refuerzo deja casi de emitir operantes,que son en cambio muy frecuentes cuando se
aproxima el final del intervalo.En los de intervalo variable la tasa de respuestas fluctua mucho
menos,probablemente porque el animal no puede establecer expectativas temporales precisas acerca de la
duración del intervalo sin refuerzo.
Estos programas de reforzamiento combinándose entre sí dan lugar a nuevas posibilidades:
5.Situación de alternancia.En la que se combina el reforzamiento de intervalo y el de razón.Se refuerza la
primera respuesta después de pasado un ntervalo de tiempo para que en la siguiente ocasión el refuerzo venga
después de una respuesta posterior(la número 30,por ejemplo).
6.Situación en la que se utiliza conjuntamente,en un mismo experimento el reforzamiento de intervalo y
2
el de razón(para que el refuerzo aparezca tiene que pasar un determinado tiempo y emitirse un determinado
número de respuestas).
7.Programas concurrentes.En el que funcionan simultáneamente dos programas,pero con una respuesta
diferente.
El aprendizaje de una actividad compleja exige una serie determinada de pasos y cada paso se aprende
mediante el refuerzo,es decír, lo que se ha dado en llamar técnica de las aproximaciones sucesivas ,tambien
conocida como modelado.Toda actividad compleja supone un cierto núnero de actos que se suceden unos a
otros según un cierto orden.Skinner,habla, en este sentido de partes o elementos conductuales
significativos,conductas de aproximación, partes de la conducta total.
Para hacer que un animal ejecute un acto y luego el siguiente se tiene en cuenta el principio de
diferenciación de respuestas,reforzando positiva y sucesivamente cada respuesta según un orden
previsto.Una vez aprendido un acto determinado se exije el siguiente al animal como requisito de refuerzo.De
esta manera se van moldeando o formando los actos del animal hasta llegar a la conducta final por medio de
estas aproximaciones sucesivas recompensadas.
Se considera el refuerzo ante un tipo de respuesta unicamente en el caso de que ésta vaya precedida de un
cierto estímulo.Este estímulo propicia la aparición de la respuesta,aunque es la recompensa que sigue a la
actividad la que de hecho la suscita.El estímulo discriminatorio,no provoca la respuesta como el estímulo
condicionado,sólo hace más probable que la respuesta ocurra cuando aparece tal estímulo.Los estímulos están
siempre actuando sobre el organismo,pero su conexión funcional con la conducta operante no es similar a la
del reflejo.Por lo tanto la conducta operante es emitida más que provocada y debe poseer esta propiedad para
que la noción de probabilidad de respuestas tenga sentido.Un estímulo es la ocasión en que una respuesta
va seguida de un reforzamiento.El efecto sobre un animal consiste en que es más probable que la
respuesta ocurra cuando el estímulo está presente.El proceso a través del cual esto se consigue se
denomina discriminación.
Si dejamos actuar al animal libremente durante y le recompensamos mediante un programa de intervalo fijo,lo
que el animal hace antes de la recompensa queda condicionado a ella aumentando la tasa de la respuesta.De la
misma manera las modificaciones azarosas de la conducta pueden tambien reforzarse si coinciden con el
momento del alimento.En este procedimiento el experimentador no sabe que respuesta será recompensada.La
respuesta dada se reforzará en un momento determinado sin que el experimentador haya tenido la intención de
hacerlo,es por esto por lo que se ha denominado a este procedimiento aprendizaje no planeado ó técnica de
la formación supersticiosa de la conducta(al igual que las civilizaciones primitivas creían
supersticiosamente en la causa de los fenómenos naturales,creyendo que la causa del refuerzo era un
determinado acto y en realidad la relación es puramente causal).
En el hombre,el condicionamiento operante permite modelar innumerables conductas,entre ellas la verbal.En
la clínica,en el colegio , en la familia , etc
pueden aplicarse todas estas técnicas,pero recurrír solo a ellas no tiene sentido más que cuando la enfermedad
o la subnormalidad del sujeto han puesto fuera de juego los modos de acción intelectual propiamente
humanos.En un mundo como el que imagina Skinner cabría, quizá,comprimír toda la conducta humana dentro
de los limites del aprendizaje operante;pero la programación y la ejecución de esto habría de hacerse desde un
nivel intelectual superior.Las posibilidades del modelado son,en suma,fascinantes;entre ellas,sin embargo,no
se encuentra la de sustituir al pensamiento."(Pinillos,"Principios de psicología",pag.304.).
BIBLIOGRAFIA.
− Skinner,B.F.(1985)," Aprendizaje y comportamiento ",Barcelona, Martinez Roca.
3
−Pinillos,J.L.(1975)," Principios de psicología ",Madrid, Alianza Editorial.
−García,L. y Moya,J.(1993)," Historia de la psicología II ",Madrid,Siglo XXI de España.
4
Descargar