psicología del aprendizaje - blog de psicología y filosofía

Anuncio
PSICOLOGIA DEL APRENDIZAJE
TEMA 1
ASPECTOS HSITORICOS, CONCEPTUALES Y METODOLOGICOS DEL APRENDIZAJE Y CONDUCTA
La psicología del aprendizaje es experimental. Trata de explicar los cambios de la conducta como resultado de la
experiencia. La conducta es todo lo que se hace incluyendo el pensar o la consciencia, no como una explicación de la
conducta sino como otra conducta más que debe ser explicada. Las teorías modernas del aprendizaje señalan la
conducta como interacción entre factores genéricos y experiencias ambientales basadas en la observación y
experimentación controlada.
Si conocemos los principios del aprendizaje, entendemos el comportamiento humano o cualquier especie. El
proceso del aprendizaje nos lleva a sistemas educativos más eficaces y mejores herramientas para trastornos
psicológicos, perdida de capacidades durante la vejez, o ayudar a las personas a tener mayor control sobre su
comportamiento. A través del aprendizaje se adquieren casi todas las conductas, con lo que se pudiera a llegar a
cambiar el funcionamiento de una sociedad.
Antecedentes históricos
Aproximaciones teóricas y filosóficas al estudio del aprendizaje.
 Asociacionismo clásico: Con origen en la filosófica griega, dice que los pensamientos están relacionados
entre si por simples reglas de conexión. ARISTOTELES estableció tres principios: la semejanza, el contraste y
la frecuencia de las ideas que funcionan paralelamente.
 S. XVII. Empirismo británico: Estas ideas se combinaron con los empiristas que defendían que la única
fuente de información acerca del mundo procede de la experiencia sensorial que se desarrolla a lo largo de
la vida de las personas como resultado de la experiencia. La mente se desarrolla con el conocimiento que
nace de la experiencia.
 Dualismo cartesiano: Descartes había propuesto una distinción entre conocimiento racional o verdadero
(Dios), estructura biológica, comportamiento racional exclusivo del hombre y la mecánica o irracional
compartido por animales y hombre. Por tanto la mente se estudiaba por introspección y el cuerpo por la
ciencia natural. Descartes introdujo la noción del arco reflejo donde decía que los movimientos reflejos se
producían cuando algún acontecimiento externo excitaba algún órgano sensorial. Este concepto fue
aceptado por muchos pensadores. El dualismo permaneció hasta que el movimiento conductista surgido en
Norteamérica dio un vuelco con la psicología experimental y a la psicología del aprendizaje. Monismo: no
separa cuerpo y mente en contraposición con el dualismo.
 La reflexología representada por sechenov, bechterev y pavlov, incorporó el arco reflejo en la psicología
experimental. La causa inicial de toda conducta radica en la estimulación sensorial externa sin la cual el
pensamiento no es posible. Pavlov con los estudios de estimulación en perros dio lugar a la explicación del
aprendizaje por condicionamiento clásico.
 Teoría de la evolución: Selección natural, origen único. Darwin negó la existencia de un impulso interno que
explicase la perfección y introdujo que el origen del hombre no es una cuestión filosófica o teológica, sino
biológica, según el sistema nervioso central. Tanto animales como humanos no tenían distintos orígenes,
sino que eran producto de la evolución biológica. La teoría de la evolución estableció un origen único de los
seres vivos y una evolución de las capacidades mentales. Para Darwin la conducta es un elemento
importante para el cambio evolutivo y las modificaciones en el instinto pueden ser beneficiosas para la
especie. Fue el preceptor de la ciencia del aprendizaje, del estudio de la motivación y de la cognición animal.
 Los científicos posteriores aportaron estudios que ayudaron a estimular el análisis dentro de la psicología
experimental y ha mantenido como estrategia de trabajo la conducta a lo largo de la evolución filogenética.
Por lo que la evolución de las especies es tanto dominio de la biología (anatómicos y fisiológicos) como de la
psicología (conducta según el comportamiento que ayuda a la supervivencia y reproducción). Darwin
introdujo el control externo donde el ambiente es el primer mecanismo evolutivo. La evolución biológica
está controlada por la demanda del entorno. Darwin también introdujo el funcionalismo y el concepto de
función, por el que los procesos moldeados por la evolución realizan alguna función útil para el organismo.
William james se baso en la mente consciente dice que adapta al organismo al ambiente y que el hombre
posee funciones mentales innatas y modos de percibir que habían evolucionado a través de la selección
natural y no por asociaciones heredadas.
Esther González UNED 2014
Página 1
La consolidación de la psicología del aprendizaje como ciencia experimental.
Siglo XIX, se establece la psico como disciplina científica. Sus fundadores explican los fenómenos mentales según
unidades discretas, ideas, sensaciones, estímulos y respuestas. Siguiendo a los físicos, la materia estaba formada por
pequeñas unidades discretas (corpúsculos) que interactuaban por colisión. Más tarde el principio de la contigüidad
entiende que interactúan por contacto y si suceden repetidamente se forma una asociación entre ellos. (estimulorespuesta y reflexología)
El conexionismo proporciona una forma más concreta de pensar y con Thorndike y la ley del efecto (donde la
asociación E-R se debe a la propia consecuencia de la acción) alejándose del conexionismo simple. El efecto de la
acción tiene consecuencias y actúa retroactivamente y fortaleciendo E-R.
Watson, fundador del conductismo, propone un cambio en el objeto de estudio tradicional, abandonando el estudio
de la mente y la consciencia y se centro en la conducta. El canon Morgan influye en que el objeto de estudio es la
conducta. El positivismo lleva a Watson a basarse en hechos observables, explicables por hechos observables. Ej.
Dadme una docena de niños sanos…. Lo haré abogado, ladrón sin tener en cuenta su capacidad, tendencia,
vocación, afición, talento ni sus antepasados.
Neoconductismo: naturaleza del aprendizaje. Teorías de las leyes del aprendizaje.
Hull utiliza E-R para explicar el comportamiento. Un evento positivo refuerza la asociación E-R debido a la reducción
del impulso lo que le lleva a la teoría de la conducta. El incentivo, imposible de explicar con la teoría anterior, el
reforzador que incita a la acción, la conducta depende del hábito, del impulso e incentivo.
Tolman comparte con Hull el método hipotético-deductivo, pero difiere en la función de los reforzadores, ya que no
actúan para fortalecer la conexión E-R, sino que la conducta está determinada por demandas y expectativas de los
eventos dando lugar a la conducta propositiva (propósito), que se manifiesta a través de la conducta observable.
Defiende E-R en el aprendizaje y el organismo no es un elemento pasivo que los estímulos del ambiente provocan
reacciones cuasi automáticas. Transformamos la información del exterior y emitimos respuestas, y aunque empezó
como conductista, se acerca más a la psico cognitiva. También dice que los animales aprenden respuesta pero eligen
si la ejecutan o no.
Skinner estudia la conducta voluntaria, dejando atrás la refleja, y la denominó operante libre, que dice que la
respuesta se emite sin depender de la aparición del estímulo, que depende del organismo y no de estímulos
ambientales o discriminativos que moldean el momento adecuado para realizar la respuesta, distinguiendo entre
respuestas elicitadas o respondientes y las repuestas emitidas u operantes. Y busca en las consecuencias
ambientales la emisión de respuestas en la experiencia del pasado. Ej. La paloma que picotea la caja conocedora del
resultado de esta acción, por lo que el fin se encuentra en la historia y no en acontecimientos futuros. Por lo que la
respuesta es predictoria. Según la teoría evolucionista el medio selecciona rasgos adecuados y moldea la conducta.
Thorndike afirmaba que la fuerza de los estímulos actúan como reforzadores proceden de la capacidad de producir
placer o reducir dolor (ley teórica del efecto) . Skinner describe los reforzadores como un efecto de incrementar o
disminuir la probabilidad futura de la conducta (ley empírica del efecto). Los patrones de conducta se deben evaluar
según el hábitat y una muestra amplia. El interés se traslada de los eventos a patrones. La variabilidad en la
conducta es condicionable. Se puede recompensar por responder de modo variable. Ej: La paloma que picotea 8
veces tecla de forma variada y no estereotipada.
El control estimular lleva a estudiar la conducta en periodos temporales amplios y no momentáneos. Ej para saber si
lees o duermes, tienes que esperar acciones. Por tanto no se puede pensar en una contigüidad entre respuesta y
consecuencia momentánea puesto que la conducta está organizada en patrones extensos y las consecuencias son
patrones extendidos.
Herrnstein estudió programas concurrentes de intervalo variable y demostró que los animales responden a una u
otra alternativa según la frecuencia del reforzamiento asociado a cada alternativa. Igual reforzamiento local, igual
proporción de respuesta. La ley de igualación explica la conducta de elección y la asocia a las consecuencias a largo
plazo. El reforzador demorado puede reforzar respuesta.
Rachlin recurre a la distinción aristotélica de causas eficientes (eventos antecedentes, inmediatos, que producen el
efecto observado: si A es una causa eficiente de B , B es un evento que su ocurrencia necesita de A como evento
antecedente). Las causas finales es un patrón más amplio donde los eventos se acopan y relacionan entre si como
notas de una sinfonía para crearla. Cada nota se explica por su ajuste sin ello sería incompleta. Se A es la causa final
de B, B se explica cómo parte que encaja en A como un todo. Tendemos a ver las causas como eventos
Esther González UNED 2014
Página 2
inmediatamente antecedentes y a veces no distinguimos las causas finales que son confundidas con las causas
eficientes que ocurren en el futuro y se rechazan como imposible. Si un sistema se mueve hacia un estado final, la
confusión es más grande y se clarifica con el tiempo. El error es que los fines hagan referencia a causas eficientes
futuras y las causas finales sean un tipo diferente de causa por una noción diferente del tiempo. Pepper distingue
entre el mecanicismo: representado por la teoría E-R o por la teoría cognitiva del procesamiento de la información
(maquina que cada pieza hace que funcione entera). La pregunta sobre la conducta ¿cómo? Nos lleva a las causas
eficientes y a preguntarse por los mecanicismos. , pero dado que todas las causas eficientes pueden retrotraerse a
otras anteriores, no hay una ultima causa eficiente de un acto. El contextualismo, hace alusión a la metáfora del acto
en contexto, porque las cosas se ven siempre cambiantes preguntándose el ¿por qué? de la conducta haciendo
referencia a las causas finales. Y las causas molares pueden dilatarse con el tiempo en otras mas amplias.
CONCEPTO Y METODO EN LA PSICOLOGIA DEL APRENDIZAJE.
Marco filosófico de la psico del aprendizaje.
Las teorías de la psico aprendizaje están basadas en la observación y la experimentación controlada.
La concepción materialista de la ciencia considera que la única realidad del mundo es la materia, que existe
objetivamente. Según esto los fenómenos del aprendizaje otorgan que la psico son propiedades materiales como la
física o la biología.
La concepción metafísica engloba el monismo nacido en Grecia con los filósofos presocráticos. La naturaleza es un
único elemento o arché y el universo está formado por una sola cosa. Para los idealistas esta única sustancia es la
mente, para los materialistas es la materia.
El monismo materialista niega que la mente exista como entidad diferente del cerebro y el conductismo y la pisco
del aprendizaje se enmarcan en esta postura.
El dualismo reconoce dos sustancias reales diferentes.
El determinismo tiene que ver con la libertad. El libre albedrio o libertad de elección sostiene que las personas
pueden elegir diferentes alternativas. El determinismo lo niega y cree que cualquier hecho del universo depende de
una cadena anterior de causas y efectos, por tanto la libertad de elección no existe y suceden cosas mas allá de lo
establecido de antemano siguiendo esa cadena de causas y efectos. Así se podría predecir el futuro conociendo las
variables del pasado en una situación puntual dentro de la cadena causal. Si una persona elige entre dos opciones
no podemos explicar su comportamiento futuro y la psico no tendría sentido. Según el determinismo la libertad es
una ingenua ilusión. El conductismo de skinner mantiene que la conducta está determinada por el ambiente pero es
un dilema que no ha hallado una solución definitiva.
El método científico aplicado a las ciencias del comportamiento.
Ciencia viene del latin del verbo saber que se podría traducir por conocimiento que es acumulativo y debe solucionar
problemas y explicar fenómenos. La ciencia describe, explica, controla o predice los fenómenos naturales según el
método científico sin entrar en concepciones científicas, religiosas o pseudociencia.
La psicología del aprendizaje como ciencia experimental.
Para construir el conocimiento se asumen unos presupuestos básicos como
 La tesis o principio ontológico de realismo, donde existe una realidad que estudiar independientemente del
conocimiento humano, los fenómenos existen aunque no puedan ser explicados.
 La tesis o principio de legalidad, que dice que la realidad está sometida a leyes naturales y que la naturaleza
es regular. El universo es complejo, pero está sujeto a unas reglas predeterminadas que permiten predecir
hechos futuros y esclarecer los pasados.
 El principio de falsación de Popper, 1959, dice que una proposición es científica si puede ser refutable y se
convierte en teoría si no ha podido ser refutada. Esta teoría consiste en criticar las leyes y dicen que un solo
caso que no encaje es mas importante que todas las confirmaciones. No se puede confirmar algo universal
partiendo de datos particulares. El inductismo ingenuo ej. Los cuervos negros.
El método hipotético-deductivo o científico sigue las etapas de
 Observación: donde se observa algún fenómeno de la naturaleza, se describe en detalle sin perjuicios, se
delimita y especifica los instrumentos para realizar las observaciones. , planteamiento del problema: donde
se delimita el objeto de la investigación. Hay que revisar la literatura sobre el problema planteado.
 formulación de hipótesis: consiste en hacer suposiciones y pronósticos formulando afirmaciones o
enunciados que apunten a una solución al problema.
 prueba mediante experimentos: se trata de comprobar las hipótesis derivadas de fenómenos observados a
través de la manipulación y correlaciones de las variables consideradas causas del fenómeno.
 obtención de resultados
Esther González UNED 2014
Página 3
 elaboración de leyes. Y teorías que son un conjunto de leues que permiten describir, explicar y predecir la
existencia de regularidades empíricas en relación con una realidad objetiva. La teoría en un lenguaje
coloquial sería una especulación, una suposición.
 Publicación y comunicación científica. Que tiene unas cualidades como la claridad, precisión que posibiliten
la replicación del estudio, el uso de terminología universal y objetividd.
Nivel de análisis en la explicación científica
El conocimiento está fragmentado, dividido en disciplinas el reduccionismo consiste en la explicación de un
fenómeno desde un nivel inferior descomponiendo sistemas complejos en mas simples. El materialismo reduce todo
conocimiento a una explicación a nivel físico y así explica toda realidad incluso el ser humano y la conducta en
términos físico-químicos, reduciendo el pensamiento y el leguaje al funcionamiento de las neuronas y reacciones
bioquímicas. Pero como es difícil decir que una persona está deprimida por los movimientos de sus átomos se
recurre al análisis psicológico que es como se estudia esta asignatura.
Una teoría debe explicar los fenómenos sin caer en los componentes del mismo. Si no se crea la circularidad es decir
una persona es inteligente porque realiza bien las pruebas y realiza bien las pruebas porque es inteligente.
Aristóteles decía que la ciencia debía dar una explicación causal. Siendo la causa final la mas importante. Esta
influencia duro toda la época clásica hasta el renacimiento que las explicaciones científicas tomaron carácter
teleológico(estudio de fines o propósitos) o propositivo. La ciencia moderna reduce el pluralismo causal dándole a la
causa una explicación concreta prescindiendo de las causas finales. Pero estas causas finales entendidas como
patrones extensos donde los fenómenos se acoplan entre sí, se han retomado en la actualidad.
causas según Aristóteles
causa material
causa formal
causa eficiente o motriz
causa final
explicación
aquello de lo que un objeto surge o está compuesto
lo que da el ser o esencia a un objeto
aquello que produce el cambio o movimiento
para lo que el objeto existe
ejemplo de escultura del dios Zeus
mármol
el dios Zeus
escultor
embellecer la ciudad
Definición y objeto del estudio de la psicología del aprendizaje.
La psicología del aprendizaje es una disciplina científica que trata de explicar las causas de la conducta y las causas
de los cambios en la conducta.
El aprendizaje es cualquier cambio duradero en el repertorio conductual de un organismo que tiene lugar como
resultado de la experiencia con los acontecimientos ambientales. El aprendizaje depende de la experiencia y da
lugar a cambio duraderos en la conducta entendiendo lo que hace el organismo incluso acciones encubiertas como
el pensamiento o sentimientos.
Incluso en el feto y hasta que morimos, aprendemos cosas que nos ayudan a adaptarnos al entorno. Algunas
conductas son innatas, pero la mayoría son adquiridas o aprendidas mediante la práctica de forma gradual. Cuanto
mayor el grado filogenético de la especie, mayor la proporción de conductas adquiridas. El aprendizaje implica
cambios a largo plazo y los a corto plazo como la fatiga, no se consideran aprendizaje. Así como los cambios donde
no esté implicada la experiencia y sean debido al desarrollo o envejecimiento, tampoco son aprendizaje.
Tiene función adaptativa, ya que posibilita el comportamiento en función de las demandas del entorno. La conducta
no aprendida, aunque adaptativa, depende de la programación genética, menos flexible y en entornos específicos,
elementales y predecibles.
La relación del organismo con el medio ambiente producen estímulos ambientales, percibidos por los sistemas
sensoriales del organismo y que producen una respuesta conductual. Ej: olor de un depredador, el sonido de una
campana, descenso de temperatura o exceso de luz. La psicología del aprendizaje tiene como fin el conocimiento de
los efectos del ambiente en la conducta que a través de procesos de condicionamiento o reforzamiento producen
cambios en el comportamiento humano.
La psicología del aprendizaje y los eventos privados.
Se plantea si la conducta no observable, puede ser objeto de estudio. El conductismo radical asume el monismo
materialista y aplica el determinismo para la explicación de estos fenómenos. Podríamos aplicar el mismo
tratamiento que en conductas observables, pero para el aprendizaje lo que ocurre fuera y dentro del organismo
tiene la misma naturaleza y no existe forma en que podamos medirlo de forma directa. Pero los eventos internos
deben ser abordados desde el marco de la ciencia natural. Y la psicología del aprendizaje lo engloba todo los
comportamientos simples, los complejos, las conductas observables y los eventos internos.
Esther González UNED 2014
Página 4
LA PSICOLOGIA DEL APRENDIZAJE COMO DISCIPLINA CIENTIFICA.
Pretende describir todos los comportamientos de una amplia gama de especies y en todas las situaciones y
pretenden descubrir principios generales.
Utilización de animales en la investigación sobre el aprendizaje.
Ratas, palomas, pollos, conejos, peces, caracoles son utilizados en la investigación y es una cuestión muy
controvertida y controlada por un comité de bioética.
Relaciones de la psico del aprendizaje con otras disciplinas.
La psicología del aprendizaje se considera una disciplina base para el estudio de otros procesos y cuyos principios
fundamentan otras técnicas aplicadas en la educación, conducta y neurociencia.
La psico del aprendizaje y la terapia de la conducta.
Una de las contribuciones mas importantes de la psico del aprendizaje es las técnicas utilizadas en la terapia de la
conducta, que surgieron a partir de los años 60 como alternativas a los tratamientos tradicionales y como superar las
limitaciones de la clínica tradicional en el psicoanálisis y se llaman terapias de primera generación.
Las características generales de los enfoques en la terapia de la conducta según Kazdin:
 Tendencia a centrarse en los determinantes actuales del comportamiento, mas los acontecimientos pasados.
 Considerar el cambio de la conducta observable como criterio fundamental
 Especificación de la intervención en términos objetivos, facilitando la replicación
 Confianza en la investigación básica como fuente de hipótesis sobre el tratamiento y las técnicas
terapéuticas especificas a emplear.
 Especificidad en la definición del tratamiento y medida de los problemas y objeticos en la terapia.
Estas técnicas, aunque tuvieron mucho éxito, presentaban problemas a las cuestiones psicológicas y surgieron las
terapias de segunda generación, que empezaron a emplear elementos cognitivos, dando lugar a las terapias
cognitivo-conductuales, que se alejan un poco de las teorías de la psico del aprendizaje.
Las terapias de tercera generación serían la psicoterapia analítico-funcional, basada en el conductismo radical de
Skinner, pero con un análisis individualizado de los problemas del paciente, que marca una relación propia entre
cliente y terapeuta y que esto introduce un cambio que es que se tratan las acciones privadas como los
pensamientos, sentimientos o intenciones y el tratamiento se aplica en la misma sesión en vivo, considerando la
conducta verbal como el material clínico mas importante.
La influencia de la psico del aprendizaje en la neurociencia.
Tras la Década del Cerebro( 1990-1999), éste órgano ha vuelto a ser actual tras dos grandes proyectos uno europeo
y otro americano que pretenden liderar los avances necesarios para comprender el cerebro humano. La
neurociencia para estudiar el cerebro, sigue las bases biológicas de la conducta e intenta aproximarse al estudio del
sistema nervioso y del aprendizaje. La sociedad para la neurociencia, fundada por científicos de distintas disciplinas
pero sobretodo psicólogos fisiológicos muy influenciados por la psicología del aprendizaje donde se analizaba las
distintas regiones cerebrales en determinados comportamientos. Los conductistas clásicos se han alejado de estos
estudios por su relación de ideas sobre la mente o consciencia, pero los conductistas contemporáneos han
participado. El principal problema de la neurociencia es entender que está sucediendo con las neuronas individuales
como con los circuitos que se forman cuando se produce el aprendizaje y la memoria. Los modelos animales
basados en el condicionamiento operante han sido importantes para la neurobiología de las adicciones como el
modelo de autoadministración de drogas sin necesidad de intervención por el investigador y así se conoce el
potencial de abuso de diferentes drogas, actuando de la misma manera los animales que los humanos.
Los animales interactúan con un ambiente externo cambiante y es muy ventajoso poder predecir los eventos
ambientales. El condicionamiento clásico y el operante son fundamentales para las memorias predictivas. La
asociación de EC y EI produce una respuesta anticipatoria y aprenden a anticiparse a sucesos importantes. Mediante
la asociación de conducta y consecuencias de las mismas, el animal aprende y ajusta las conductas adaptativas.
Esther González UNED 2014
Página 5
TEMA 2
CONDICIONAMIENTO CLASICO: FUNDAMENTOS
Aprender a predecir lo que va pasar nos permite dar una respuesta con antelación. Si tenemos hambre agudizamos
el olfato, salivamos y la predicción de la comida predispone el cuerpo para aprovechar mejor los nutrientes,
hacemos mejor la digestión, nos sienta mejor…
El condicionamiento clásico se produce al presentar dos estimulos independientes, es decir el sujeto aprende a
predecir un estimulo por la presentación de otro estimulo que le antecede.
Los comienzos del estudio del condicionamiento clásico.
Rusia, finales del siglo XIX, laboratorio del instituto de medicina experimental de S. Peterburgo, el fisiólogo Ivan
Petrocich Pavlov (1849-1936) investigaba con el sistema digestivo de los perros (premio nobel en medicina 1904),
empleando técnicas quirúrgicas que permitiera alimentar ficticiamente al perro mediante un tubo en el esófago que
recogía la comida que le introducía en la boca, sin llegar al estomago. Los perros segregaban jugos gástricos no solo
con la ingestión de la comida, sino también ante la visión de la comida o de la persona que la suministraba. Estas
secreciones se denominaron “secreciones psíquicas” porque se debían al estado psicológico del perro al esperar
comida, considerando estas secreciones como resultado de un reflejo psíquico.
Para estudiar estos reflejos, buscó una respuesta diferente a los jugos gástricos y recogió la saliva mediante una
fistula en la glándula salivar
Sonido de un metrómetro (estimulo neutro) y media la salivación
Le daba comida ( estimulo incondicional) y media salivación (respuesta incondicional)
Luego hacia sonar el metrómetro (estimulo condicional) cuando le daba comida y medía salivación (respuesta
refleja).
Tras varios ensayos el perro asoció la comida(estimulo incondicional) al sonido (estimulo condicional) y el perro
salivaba(respuesta condicional) ante el sonidos (reflejos condicionados)
NATURALEZA DE LA ASOCIACION
La asociación que se aprendía entre el metrómetro y la salivación era entre una EC-RI y se establecía relación entre E
y R. Pavlov pensaba que el perro asociaba el metrómetro con la comida EC con EI y establecía asociación entre E-E y
que la RC seria elicitada por medio de la representación del EI por el EC.
Pero como saber cuál de los dos tipos de aprendizaje se estaba dando? Se debía someter a una devaluación EI.
Ejemplo de las ratas-luz-ruido. Las ratas habituadas al ruido mostraron menos miedo.
SITUACIONES EXPERIMENTALES
Condicionamiento del miedo
Watson y Rayner (1920) afirmaron según el método pavloviano que los patrones de reacción emocional en la
infancia eran el miedo, la ira y el amor, y se incrementaban de adultos y hicieron el experimento en un niño de 9
meses: Albert B, que era un niño sano, impasible. Se le presentaron estímulos ( una rata, un conejo, un perro, un
mono, mascaras, algodón, fuego y observaron que la respuesta no reflejaba miedo. Se le presentó una rata y se la
asoció a un sonido fuerte que hacía llorar al niño, y el niño asoció rata-ruido. Por lo que el niño había desarrollado
miedo a la rata. Se le presentó un conejo blanco, algodón blanco, etc y el niño respondía de la misma forma,
generalizando el miedo a todo lo peludo blanco. Por ética se realizan experimentos con ratas como el de la caja de
skinner donde se introduce una rata y se le aplica una descarga eléctrica que provoca la paralización de la rata por
miedo a la descarga, llegando a aprender a anticipar la descarga en periodos con una misma separación temporal.
Para conocer en que medida el EC suprime la conducta se cuentan el nº de presiones de la palanca durante el EC y
durante el periodo de igual duración antes del EC llamado pre EC y se calcula
Respuestas durante el EC
Razón de supresión=
Esther González UNED 2014
Página 6
(respuestas durante EC + rptas durante el pre-EC)
Cuando el EC no predice la descarga el nº de presiones durante el EC y durante el pre EC será el mismo.
Pulsa 40 /(40 +40)= 0,5 no predice
Pulsa 20/(20+40)=0,33 predice un poco
No pulsa 0/(0+40)=predice ( aprendizaje al máximo)
Mayor nivel de condicionamiento es indicado por un valor mas bajo de razón de supresión. Curva de adquisicon
inversa. A valor mas alto, menos grado de condicionamiento. Cuanto mas pequeña es la razón de supresión mas
paralizado está el animal durante el Ec debido al miedo que le provoca.
Ej. Del videojuego que se debe acabar con los marcianos y hay un escudo anti-laser que permite que los marcianos
aterricen si se sigue disparando.
Condicionamiento del parpadeo.
El reflejo palpebral es el parpadeo ante un objeto repentino ante los ojos. Si se relaciona un tono con el parpadeo, el
sujeto parpadeará cuando oiga el tono. Se ha probado con conejos.
EI soplo o descarga
EC luz o tono
Se presenta el EC y seguidamente el EI. Cuando se hace el emparejamiento se observa la respuesta ante el EC.
Seguimiento del signo
Paradigma del seguimiento del signo o automoldeamiento, el sujeto se aproxima y toma contacto con el estimulo
que señala la disponibilidad de comida. Experimento realizado con palomas donde cuando se iluminaba una tecla
antes de dar comida y las palomas aprenden a picotear la tecla para obtener comida incluso si la tecla está lejos del
comedero. Este resultado se ha repetido con otros animales incluso humanos dando el mismo resultado.
Aprendizaje de aversión al sabor
Aprendemos que hay alimentos que son beneficiosos y otros no por condicionamiento clásico. Cuando comemos
algo y nos sentimos mal, no volvemos a probarlo. Esto es importante para la supervivencia. Ejemplo de
quimioterapia y efectos secundarios. Tiene características especiales como que con una sola vez, se produce el
emparejamiento. El aprendizaje ocurre incluso que ha ocurrido con horas de diferencia entre la ingesta y el malestar.
PROCESAMIENTOS DE CONDICIONAMIENTO PAVLOVIANO EXCITATORIO
El condicionamiento pavloviano excitatorio, se produce cuando se presenta un EC seguido de un EI. Hasta ahora los
EC aparecen después de los EI.
Procedimientos típicos del condicionamiento pavloviano excitatorio.
La ordenación del EC y el EI es un factor en la formación de un condicionamiento pavloviano.
Un condicionamiento se adquiere mejor cuando el EC ocurre antes del EI, es decir el Ec es señal de que va a
presentarse el EI.
Según el intervalo entre estímulos o intervalo EC-EI que es el tiempo que transcurre desde el comienzo del EC y el
comienzo del EI dentro de un mismo ensayo. El tiempo que tarda en finalizar un ensayo y empezar otro es el
intervalo entre ensayos.
Condicionamiento de demora: es el procedimiento mas frecuente y que obtiene mejor aprendizaje. El EC está
presente hasta que aparece el EI y puede continuar durante el EI o terminar cuando empieza el mismo. Este
intervalo depende de la prueba, por ejemplo un condicionamiento palpebral es optimo en 0.4 segundos con un
Esther González UNED 2014
Página 7
intervalo de 2 o 3 segundos. En el de aversión del sabor puede ser que se demore en 2 o 3 horas y la respuesta
condicionada disminuye según aumenta el intervalo EC-EI.
Condicionamiento de huella: el EI no se presenta hasta cierto tiempo de acabado el EC,. Entre el final de la EC y el
comienzo de EI hay un intervalo de huella. El nivel de condicionamiento empeora a medida que aumenta el intervalo
de huella.
Condicionamiento simultaneo: EI y EC se presentan a la vez y tienen la misma duración, lo que significa que el EC no
señala que el EI va a ocurrir y la RC es escasa, pero no significa que no haya aprendizaje.
Condicionamiento hacia atrás: la presentación del EI es seguido del EC, invirtiendo el orden. Habitualmente no da
tanta respuesta condicionada aunque se puede obtener cierto grado de condicionamiento excitatorio i el sujeto
trata al EC como señal de no EI.
Medición de respuestas condicionadas.
Ensayo de prueba: Procedimiento para medir el grado de condicionamiento, se presenta el EC sin el EI. Así nos
aseguramos que la respuesta que medimos es el RC sin influencia del EI estos ensayos son imprescindibles en el
condicionamiento simultaneo y en el hacia atrás porque si se midiera la RC en un ensayo normal estaría
contaminada por la presencia de EI y en el condicionamiento de demora seria necesario los ensayos de prueba del
EC aislado.
La conducta del sujeto puede cuantificarse registrando la magnitud de la RC, la cantidad de conducta. Pavlov midió
las gotas de saliva.
Otra manera es registrando la frecuencia con que ocurre la RC ante el EC, números de ensayos que los EC provocan
una ER.
Otra es medir la rapidez con que aparece la RC cuando se presenta el EC. Cuanto mas rápido aparezca la RC mayor el
condicionamiento: latencia de la RC.
Procedimientos de control
La aparición de respuesta no asegura que sea debido a la asociación establecida entre el EC y el EI. Para asegurar el
condicionamiento debe haber un procedimiento de control que permita afirmar que el cambio conductual no se
debe a la presentación de EC y EI por separado. Las que son como consecuencia de procesos distintos se denominan
respuestas pseudocondicionadas. Un ejemplo es la aversión a sabores nuevos o neofobia, donde un sabor nuevo
produce aversión pero no es una RC sino una respuesta pseudocondicionada. La sensibilización es un proceso del
aprendizaje no asociativo ante la presentación repetida de un estimulo en solitario que produce cada vez mas
respuesta. Para asegurarse de la relación entre EI y EC se puede aplicar el control aleatorio donde se presenta el EC
y el EI de forma aleatoria, pero presenta problemas porque puede dar lugar al condicionamiento excitatorio. Para
evitar esto se entremezclan 4 ensayos:
 Presentar el EC en presencia del EI
 Presentarlo el EC solo
 Presentar el EI solo
 No presentar ni el EC ni el EI y que la contingencia sea 0.
Si en este control ocurren emparejamientos se utiliza el procedimiento de control pseudoaleatorio en el que la
contingencia es 0 pero el experimentador distribuye los tipos de ensayos de manera equivalente en toda la sesión de
entrenamiento.
PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO INHIBITORIO.
El condicionamiento excitatorio es cuando el sujeto aprende a predecir cuando va a aparecer un estimulo
incondicionado y es tan importante como aprender cuando no se va a presentar un estímulo incondicionado. En este
caso se produce el condicionamiento inhibitorio. Cuando el EI es aversivo el EC nos indica ausencia del EI. En un EC
excitatorio como una luz que indica descarga provoca miedo y un EC inhibitorio como que una luz es ausencia de
descarga, provoca alivio. Pero el condicionamiento inhibitorio también se produce en situaciones en que el EI es
apetitivo, si se utiliza comida como EI, un EC excitatorio elicita estado de euforia y en un EC inhibitorio (luz asociada
a falta de comida) puede inhibir dicho estado y causar frustración. Por tanto, la excitación y la inhibición son
considerados procesos opuestos e importantes para la adaptación al ambiente.
Para que se desarrolle la inhibición condicionada es necesario un contexto excitatorio, es decir para que se aprecie la
ausencia del EI es necesario que se pueda echar de menos, es decir que se pueda decir que ya no está.
El condicionamiento inhibitorio fue descubierto por Pavlov en su laboratorio y incide en la importancia del
contexto excitatorio.
El procedimiento estándar de inhibición condicionada consiste en presentar dos ensayos uno para el
condicionamiento inhibitorio y el otro para el condicionamiento excitatorio entremezclados aleatoriamente en una
Esther González UNED 2014
Página 8
sesión. Es decir, el ensayo excitatorio un estimulo excitatorio EC+ se presenta junto con un estimulo inhibitorio ECque no va seguido por el EI. Los sujetos aprenden a responder cuando el EC+ va solo y no compuesto EC+-EC-. El
EC- solo se ha convertido en señal de la ausencia del EI es decir es un estimulo inhibitorio.
Inhibición diferencial: se presentan ensayos de un EC+ seguido del EI entremezclados con ensayos de un ECno seguido de EI. Los sujetos aprenden a discriminar ambos estímulos y presentan la EC ante el EC+ pero no ante el
EC- que se convierte en estímulo inhibitorio.
Desemparejamiento explicito: consiste en la presentación de un EC u del EI separados por tiempo amplio. El
EC y EI nunca se emparejan y supone un caso concreto del procedimiento por contingencia o correlación negativa
porque la correlación ente EC y Ei en el tiempo es negativa, es decir, menos probable que el EI se presente tras el EC
que en cualquier otro momento, por lo que el EC señala la reducción de la probabilidad que aparezca el EI.
El condicionamiento inhibitorio se puede desarrollar incluso cuando el EC va seguido del EI.
Puede ser por demora: si el EC tras mucho tiempo señala la ausencia del EI.
Puede ser por condicionamiento de huella: cuando el intervalo de la huella es de gran tamaño es inhibitorio,
si no es muy grande es excitatorio, aunque influye el tamaño que tenga el intervalo entre ensayos.
Condicionamiento hacia atrás: establece el EC como señal de ausencia del EI es decir, como inhibidor
condicionado.
Mediación de la inhibición condicionada.
En la excitación condiconada medición se hace de forma directa ante el EC+ y que depende del estimulo
incondicionado. En la inhibición condicionada se espera que el EC- tenga una reacción opuesta al EC+, y su medición
solo puede ser directa en sistemas de conductas bidireccionales, aunque se da en muy pocas ocasiones y se tiene
que medir la inhibición de manera indirecta.
Sistemas de respuestas bidireccionales
Formados por respuestas en direcciones opuestas respecto a la línea base. Muchas respuestas fisiológicas son de
este tipo como ritmo cardiaco, temperatura corporal, respiración que aumentan o disminuyen respecto a la línea
base. Con el miedo el ritmo cardiaco aumenta y el estimulo condicionado inhibitorio produce alivio ( ausencia de
descarga asociada a la luz). Este método no se puede generalizar por ej. Cuando un perro traga saliva ante un tono
sabemos que el tono es excitatorio, pero la reacción contraria es no salivar ante una liz y no sabemos si es debido a
que la luz es un estimulo inhibitorio o que no ha habido condicionamiento y la luz es un estimulo neutro.
Prueba del estimulo compuesto o sumación Se presenta de forma conjunta el estímulo inhibitorio y el estimulo
excitatorio si el estimulo condicionado es inhibitorio debe reducir la EC, asociando el estimulo excitatorio con el
neutro.
Un ejemplo largo mirar libro pag 81.
Esther González UNED 2014
Página 9
Retraso en la adquisición cuando un estimulo se ha convertido en inhibitorio necesitara mas ensayos de
emparejamiento con el EI para conseguir el mismo grado de excitación que un estimulo neutro. La velocidad de
adquisición de respuesta excitatoria disminuye si el EC es inicialmente un inhibidor condicionado.
Mirar ejemplo pag 82.
LA EXTINCION DEL CONDICIONAMIENTO PAVLOVIANO.
La conducta aprendida es una adaptación al ambiente cambiante. La perdida de la conducta condicionada debería
ser tan relevante como su adquisición. En la extinción ya no se presenta el EI tras el EC, el EC solo se presenta en
repetidas ocasiones y tiene como resultado la disminución o la desaparición de la EC. Se denomina extinción tanto el
procedimiento como el resultado. La extinción es similar a la habituación ya que ambas provocan una disminución
de la respuesta debido a la exposición repetida de un estímulo, pero la extinción es un descenso de una respuesta
previamente aprendida y la habitación no se ha aprendido respuesta anteriormente. La extinción no es olvido ya
que ocurre como consecuencia de las presentaciones repetidas del EC en solitario. Pavlov pensaba que durante la
extinción el sujeto aprendía una nueva asociación entre el EC y la ausencia del EI y creía que se producía una
inhibición condicionada, pero no lo es, ya que no supera la prueba de sumación ni la del retraso necesarias para
afirmar que un EC es un inhibidor condicionado EC-. Cuando se somete a una prueba de sumación un estimulo
extinguido, en lugar de obtener una menor RC ante el EC+ se puede obtener mayor RC también pasa cuando se
empareja de nuevo EC extinguido con el EI se obtiene un condicionamiento rápido.
Fenómenos de la extinción:
. Desinhibición: durante la extinción se aprende una asociación distinta que no eliminaba la asociación excitatoria
entre EC y EI. La desinhicion consiste en la presentación de un nuevo estímulo junto con el EC durante la fase de
extinción que provoca que el sujeto vuelva a ejecutar la RC inmediatamente. Perro luz seguida de comida durante la
adquisición, solo la luz en extinción. Si se pone un tono el perro saliva, lo cual no se ha erradicado la asociación EC-EI,
ya que la RC se recupera ante un estímulo novedoso, sin entrenamiento.
. Recuperación espontanea: la asociación EC-EI no es eliminada durante la fase de extinción. Si dejamos pasar un
tiempo sin contacto con el EC y el EI, tras la fase de extinción, presentamos de nuevo el EC, la RC se recobra
espontáneamente. Se puede recuperar una RC que ha sido extinguida con el simple paso del tiempo.
. Renovación de la RC: No se da desaprendizaje como resultado de la extinción. Ejemplo pag 85-86 el efecto de
renovación de la RC, se obtiene si el cambio de contexto es distinto al de extinción sin necesidad de que vuelva al
contexto original de condicionamiento. Se ha demostrado que la extinción puede ser relativamente especifica del
contexto en el que se aprende, mientras la excitación condicionada se generaliza mas fácilmente a otros contextos.
El contexto actúa como clave que ayuda a eliminar la ambigüedad del significado de un estimulo condicionado. Un
EC que adquiere condicionamiento excitatorio y luego se extingue puede indicar que va a aparecer o no el EI en esta
situación, y el contexto puede ayudar a saber que va a ocurrir. El sujeto puede saber que significa el EC en ese
momento y adecuar su respuesta a lo que va a venir. La renovación cuando el sujeto deja de estar en el contexto de
la extinción, y se introducen claves de otro contexto distinto, se recupera la RC excitatoria.
. Restablecimiento de la excitación condicionada: ocurre si el EI se presenta en solitario tras al extinción esto hace
que vuelva a darse RC ante el EC en prueba posterior, lo que vuelve a no suponer la eliminación de la asociación ECEI adquirida durante el condicionamiento. El restablecimiento parece indicar que el contexto también juega un papel
en la renovación y estaría suprimiendo la ambigüedad del EC.
INCIDENCIA DEL CONDICIONAMIENTO CLASICO:
Mediante el condicionamiento clásico el aprendizaje permite la adaptación al medio. Si un animal predice un evento
responderá ante la señal antes que ocurra. Fuera del laboratorio se puede estudiar el condicionamiento clásico.
Territorialidad y reproducción:
Ejemplo del pez gurami azul y el éxito en la reproducción.
Condicionamiento con drogas:
Los lugares donde se consumen, las compañías o los estímulos que forman parte de este ritual de consumo pueden
convertirse en señales de las drogas. La respuesta condicionada es diferente a la incondicionada la RC es opuesta y
contrarresta el efecto de la droga. Esta respuesta es adaptativa porque una dosis de droga puede causar al
organismo la perdida de homeostasis y equilibrio interno. La respuesta condicionada ayuda a recuperar el equilibrio
al responder a la señal antes que se de la droga. La respuesta ante un EC es una repuesta condicionada
compensatoria y pueden ser la razón de la tolerancia que se produce con un consumo habitual de droga. Cada vez
que se toma droga los efectos son mas fuertes y las claves ambientales se convierten en estímulos condicionados
Esther González UNED 2014
Página 10
que provocan la respuesta condicionada compensatoria disminuyendo el efecto que tiene la droga y generando
tolerancia.
Si el contexto o claves ambientales son EC al retirar estas claves se recupera la respuesta ante la droga y elimina la
tolerancia. Si se cambia el contexto desaparece la tolerancia y la respuesta es como si recibiera droga por primera
vez. La tolerancia es adaptativa y protege al organismo de sobredosis. El drogadicto compensa la tolerancia
aumentando la dosis cambiando el contexto de administraciones de la droga y se pondrán en marcha respuestas
compensatorias llegando a morir.
TEMA 3
MECANISMOS ASOCIATIVOS Y TEORIAS DEL CONDICIONAMIENTO CLASICO.
El EI produce RI sin necesidad de asociación con ningún estímulo. Generalmente se usa como EI la comida como
apetitivo y descargas y malestar estomacal como aversivos. Una rata blanca puede ser un EN que para alguien
sometido a condicionamiento aversivo puede dar una RC similar a la que un EI como un ruido fuerte, provoca. Pero
ni Albert responde igual a un ruido fuerte que a uno breve.
Factores que entorpece o favorecen el condicionamiento:
 INTENSIDAD:
no es lo mismo una rata que cientos de ratas ya que el miedo es distinto. Un EI o EC intenso tiene como
consecuencia una aceleración en el aprendizaje y mayor expresión de la RC.
La saliencia: es un estímulo mas perceptible o significativo que los otros para el organismo. Un EC que capta la
atención es un EC saliente. Los EI son salientes por naturaleza. Un EI como la comida no será tan saliente para un
animal satisfecho que para uno en ayuno. Cuanto mas significativo sea el EI mas aprendizaje rápido y exitoso. El
carácter biológico de los EI , y la influencia de la intensidad concluyen que la RC es mas fuerte cuando se utilizan EI
salientes.
Respuestas debido a la intensidad pueden ser parpadeo, movimientos mandibulares, de flexión como la pata de los
gatos. Las reacciones fisiológicas como salivación tasa cardiaca, cambios glucemicos. La intensidad puede provocar
una respuesta distinta, si aumentamos la cantidad de comida de las ratas, aumenta su intensidad en la respuesta,
dedicaban mas tiempo y menos respuestas de orientación.
Si presentamos 2 EI simultáneamente el condicionamiento es mas intenso.
La intensificación de los estímulos se traduce en un aumento de RC, pero a partir de cierta intensidad o saliencia no
hay variación en el condicionamiento ni en la expresión de la RC llegando al nivel máximo.
 NOVEDAD:
La variación en la intensidad puede resultar novedosa y esta novedad puede ser responsable de los efectos de la
intensidad.
La novedad por si sola suscita reacciones mas intensas que a los que estamos habituados.
Efecto de preexposicion: ausencia de novedad en los estímulos.
Según los dos estímulos implicados en el condicionamiento clásico, tenemos 2 efectos
Preexposicion al EC o inhibición latente: como kiwi de forma normal porque nunca me ha sentado mal. Un
dia tengo dolor de estomago y no asocio el dolor con el kiwi ya que nunca me había producido malestar.
La repetición de un EC en ausencia del EI, retrasa la asociación EC-EI. Si un estimulo no es seguido de una
consecuencia ni positiva ni negativa, no provoca RC y dejamos de prestarle atención. La inhibición latente
promueve la selección de los estímulos necesarios para el aprendizaje rápido. La habituación es una
disminución en respuestas como la orientación y la inhibición latente supone un retraso en el aprendizaje.
Preexposicion al EI: me duele el estomago sin razón aparente. Hoy he comido kiwi pero como nunca me ha
dolido el estomago con el kiwi me cuesta aprender que mi dolor se debe al kiwi. Cuando el EI se presenta
repetidamente sin asociación del EC deja de ser novedoso. Si posteriormente pretendemos asociar el EC con
el EI el aprendizaje costará. Las repeticiones reducen la capacidad de aprendizaje, probablemente por
economía conductual para la supervivencia, ya que no predice consecuencias importantes y le dejamos de
prestar atención. Las inferencias asociativas o de memoria provocan disminución de dichos estímulos con
estímulos nuevos.
 NATURALEZA:
Contempla características como tipo, relevancia, importancia biológica.
Esther González UNED 2014
Página 11
Tipos de estímulo: el tipo determina el condicionamiento y la RC, que no serán los mismos si el EI es
apetitivo o aversivo. Un animal no mostrará salivación ante una descarga, ni tendrá miedo ante la comida. Ejemplo
de las palomas comida o agua, respuesta diferente. El EC funciona como señal anticipatoria de un futuro EI, pero hay
qie tener en cuenta que distintos EC pueden provocar distintas RC. Ejemplos de ratas y tonos ( mov cabeza) y luz(en
pie)
Bowe, Green y Miller descubrieron que las palomas procesan mejor o prestan mas atencion a los colores que a la
localización espacial del EC.
Relevancia de los estímulos: relación entre el EC y el EI en un contexto natural.
Garcia y Koelling: intentaban ver cuales de los EC (sabor o audiovisules), eran mas suceptibles de condiconarse con
EI’s. Ej: ratas bebían agua dulce o salada previa aparición de un EI (EC gustativo), junto con un estímulo audiovisual).
Después se les administraba descarga o malestar estomacal creando aversión. Luego se realizo por separado. Los
animales expuestos a la descarga suprimieron antes su respuesta ante un estimulo visual que gustativo y los del
malestar gástrico al revés.
La explicación es porque en un contexto natural es mas fácil asociar el malestar estomacal con un alimento en mal
estado, que una descarga eléctrica. Y que ante el ataque de un depredador (daño de la descarga) los estímulos
visuales y auditivos son mas importantes.
Por eso la relevancia o pertenencia del EC respecto al EI es importante, ya que el aprendizaje de asociaciones como
(sabor-malestar) se ve favorecido si el EC es pertinente al EI.
Lolordo, Jacobs i Forre concluyen que las palomas asocian EI alimentarios con estímulos EC visuales antes que con
auditivos y los EI aversivos con EC auditivos. Para las palomas las claves visuales son mas relevantes para obtener
comida y las auditivas para conductas defensivas.
Los humanos asociamos fotografías de animales con descargas y no si son flores.
Por lo que llegamos a la conclusión que la relevancia o pertinencia del EC con respecto a un EI se centra en que el EC
provoca la activación de sistemas de conductas dependiendo del estado motivacional y la naturaleza del EI. Si el EI
es comida el EC activa la producción de conductas relacionadas con la búsqueda de la misma. Si el EC es una
descarga, se activan conductas defensivas similares a las que hay en presencia de un depredador.
La fuerza biológica: el carácter biológico no es atribuible a todos los EC. Un EC neutro como la luz o un tono
no tiene el mismo carácter biológico que la comida. Pavlov decía que para que se diera condicionamiento el EC
debía tener menos fuerza biológica que el EI por lo que las RC debían ser menos intensas que las RI.
CONDICIONAMIENTO DE SEGUNDO ORDEN: DOS ESTIMULOS CON DIFERENTE FUERZA BIOLOGICA: un EC
condicionado por otro EC previamente condicionado, el EC inicialmente neutro, hace las veces de EI para el nuevo
condicionamiento porque ha adquirido la fuerza biológica que antes no tenía. Dinero primero adquiere el valor de
comprar algo, luego asociamos cajeros, tarjetas con dinero. Ej: como manzana y me sienta mal, como el kiwi me
sienta mal, la manzana también.
Pavlov decía que todo estímulo que tiene fuerza biológica no puede servir como EC para un nuevo
condicionamiento. Si una luz se asocia con una descarga no se puede asociar la misma luz a la comida.
CONTRACONDICIONAMIENTO: DOS ESTIMULOS CON FUERZA BIOLOGICA: Un EC que se ha emparejado con un EI
puede emparejarse con un EI diferente o incluso opuesto. Un estímulo que inicialmente provoca un acercamiento ,
después puede provocar una respuesta de alejamiento, pero la nueva asociación aprendida no borra del todo el
aprendizaje original por lo que la RC inicial puede reaparecer un tiempo después o en contexto distinto. El
Contracondicionamiento se aplica en fobias. Ej: la consulta del dentista produce ansiedad en los niños, pero si
dentista regala una piruleta, ir al dentista es menos aversivo.
PRECONDICIONAMIENTO SENSORIAL: DOS ESTIMULOS SIN FUERZA BIOLOGICA: dos estímulos con poca fuerza
biológica también pueden dar aprendizaje, pero no provocan respuestas intensas como en el caso del
precondicionamiento sensorial. Queremos relacionar un tono y una luz, pero al no tener respuesta, no sabemos si
se ha dado o no la asociación. Para comprobarlo asociamos el EC con el EI para que de RC. Si el EC1-EC2 ha tenido
lugar el EC2 provoca una respuesta similar que la mostrada por el EC1 tras su emparejamiento con el EI.
La fuerza biológica sirve para medir el aprendizaje sobre todo en RC no observables. La respuesta dice que se ha
dado el aprendizaje, pero no su adquisición, ya que aprendizaje y adquisición son procesos distintos. Ej: arroz con
leche sin canela me produce malestar, pero cuando veo la canela la asocio con el malestar.
 CONTIGÜIDAD TEMPORAL ENTRE ESTIMULOS:
Esther González UNED 2014
Página 12
La relación temporal entre EC y EI puede favorecer o perjudicar el aprendizaje de la asociación entre los mismos y
influir en la aparición e intensidad de la RC.
 Intervalo EC-EI: el RC es mas débil cuando el intervalo EC –EI es mayor. Si es corto el intervalo se dan mas
conductas de orientación hacia el EC. Si es largo las conductas de orientación es hacia el EI.
 Intervalo entre ensayos: cuando los ensayos entre Ec-Ei están distanciados entre si, el condicionamiento es
mejor y la expresión del RC.
Tanto la duración de cada ensayo como la distancia entre los mismos es importante para el aprendizaje correcto de
la asociación EC-EI. Las mejores condiciones se dan en EC-Ei intervalos cortos y aislados en el tiempo.
¿CÓMO SE ASOCIAN EL EC Y EL EI?
Para un buen condicionamiento no solo es importante el emparejamiento repetido de la EC-EI además el EC debe ser
buen predictor del EI.
-
El concepto de contingencia: se utiliza para medir si el EC es un buen predictor de la aparición de otro
estimulo.
La aparición de ambos estímulos no garantiza el condicionamiento. Se calcula por probabilidades y hay tres tipos de
contingencia:
 Positiva: >0, si la aparición del Ec es un buen predictor de la aparición del EI. Se llama condicionamiento
excitatorio.
 Nula: =0si la probabilidad de que el EI apareciese en presencia o ausencia del EC es la misma. Esto implica
ausencia total de condicionamiento. Esto tiene un efecto llamado de irrelevancia aprendida. El sujeto
aprende que no hay relación de contingencia entre EC y EI y así lo aprende y luego retrasa el aprendizaje de
dicha relación.
 Negativa <0 indica que el EC es un gran predictor de la ausencia de la EI, es decir, el EI es menos probable en
presencia que en ausencia del EC.
- Fenómenos de competición de claves: aunque la contingencia entre EC y EI sea perfecta no siempre da RC.
Puede darse
 Ensombrecimiento: cuando se dan dos EC (luz y sonido) Compiten entre ellos para ser el mejor predictor del
EI. Como aparecen juntos EC2 emsombrece al EC1 teniendo una menor RC ante EC1. Es reversible.
 Bloqueo: aparición conjunta de dos EC pero hay un previo condicionamiento del EC a un EI y esto condiciona
cuando se añade el segundo EC2. EJ: Si como huevos para cenar me sienta mal. Preparo huevos con patatas,
pero solo como patatas.
Teorías del aprendizaje. :
 Mod. Rescorla=Wagner: la primera vez que asociamos EC y EI hasta ese momento EI no era predicho por
nada y esto nos sorprende y aprendemos la asociación. El emparejamiento sucesivo hace que la
aparición del EI a continuación del EC ya no nos sorprenda ya que el EC es capaz de predecir el EI y el
aprendizaje ya no tiene lugar.
El concepto sorpresa propone un modelo asociativo para el proceso del aprendizaje, siendo la primera
característica que en un condicionamiento el aprendizaje solo tiene lugar si el EI es sorprendente.
La fuerza asociativa entre EC y EI aumenta en cada ensayo hasta que el EC predice el EI que ha alcanzado
la fuerza máxima. Estas variaciones de fuerza asociativa en casa ensayo dependen de:
- La saliencia del EC y EI expresada con valor numérico entre 0 y 1
- La magnitud del EI y la esperabilidad
- La fuerza asociativa adquirida en ensayo anterior y puede oscilar entre -1 y 1.
El incremento en la fuerza asociativa de relación de EC-EI es directamente proporcional a la saliencia de
ambos estímulos y depende de la diferencia entre el máximo aprendizaje adquirible y la fuerza de la
asociación del ensayo anterior , es decir la diferencia entre lo que podemos llegar a aprender de esta
asociación y lo que hemos aprendido (lo sorprendente que nos resulta la aparición del EI tras el EC).
Esther González UNED 2014
Página 13
La curva de aprendizaje es el crecimiento de la fuerza asociativa neta ( que se calcula sumando la fuerza
asociativa adquirida en el entrenamiento hasta el ensayo anterior y el incremento de las mismo en el
ensayo actual).
Si lo que ocurre y lo que esperamos (sorpresividad) disminuye con el entrenamiento la fuerza de
asociación ha alcanzado el 100 % de su valor.
La sorpresividad del Ei depende directamente de la magnitud o intensidad del mismo, por lo que dos
magnitudes distintas de un EI dan lugar a curvas de aprendizaje iguales, comprobando la concordancia
de los efectos de la intensidad. La saliencia del EC puede modificar la cantidad de aprendizaje de un
ensayo porque multiplica la sorpresividad.
El bloqueo y Ensombrecimiento influyen en los cambios de la fuerza asociativa.
BLOQUEO:
EXTINCION:
INHIBICION CONDICIONADA
PROBLEMAS DEL MODELO
Aunque el aprendizaje asociativo según recorla –Wagner es un modelo de referencia tiene limitaciones:
- La extinción de la inhibición condicionada donde se afirma que si se presenta repetidamente un inhibidor
condicionado sin ir acompañado de un EI la inhibición se extinguirá. Pero si se aplica la formula en fase de
inhibición el incremento de fuerza asociativa del EC inhibitorio sería positivo y se convertiría en excitatorio
poco a poco. Pero en realidad no ocurre así, no presentar EI tras EC puede aumentar sus propiedades
inhibitorias, esto ocurre porque considera la excitarcion y la inhibición como procesos opuestos de signo
contrario.
- La inhibición latente un EC preexpuesto seguido de un EI que aparecen juntos en fase posterior, sin que
haya asociación en la preexposicion, afectando al aprendizaje posterior de la fase de condicionamiento, por
lo que se ve retrasado y no como da la formula.
- Bloqueo el modelo de Rescorla-wagenr no da explicación al contrabalanceo que el efecto contrario al
bloqueo ( el resultado es una menor RC como respuesta al >EC bloqueado (EC2) durante la segunda fase del
entrenamiento).
- Extinción de la excitación condicionada la extinción como desaprendizaje, pero no explica que sea un
modelo distinto.
La importancia del contexto. EC i RC se presentan dentro de un contexto específico. Los estímulos propios del
contexto acompañan al aprendizaje (olores, formas, colores… ) y condicionan la relación entre EC y EI. Según la
presencia o ausencia del EC se pueden dar estos tipos de ensayos:
Cuando el EC van seguidos del EI y en los momentos entre ensayos solo están presentes el contexto y el EI, dando
contingencia positiva.
Cuando aparece el EI solo en presencia del contexto la contingencia será negativa.
Cuando EC y contexto va acompañado de EI pero el contexto está cuando aparece el EI la contingencia será nula.
Hipótesis del comparador esta hipótesis propone que la respuesta condicionada no solo depende de la asociación
entre EC y EI sino también del resto de asociaciones presentes en ese mismo momento que puedan establecerse
entre las claves del contexto y el propio EI. El sujeto aprende la asociación entre EC y EI y que las claves del contexto
y el EI también tienen asociación.
Si la asociación entre EC-EI es mayor que la asociación entre claves de contexto-EI, la RC será de contingencia
positiva.
Si la asociación entre EC-EI es menor que la de las claves del contexto –EI el animal esperará que el EI ocurra en
presencia del contexto y no del EC y la contingencia será negativa. Es decir, si el valor excitatorio de las claves del
contexto es mayor que la del propio EC, se dará una RC inhibitoria ante el EC. Si la asociación entre EC y EI es
comparable en fuerza a las formadas entre el contexto y EI, la RC no aparece ante el EC por tanto la contingencia
será nula.
Según la hipótesis del comparador el sujeto aprende tres tipos de asociaciones: entre el EC-EI, entre el EC y claves
del contexto y entre las claves del contexto y el EI.
Cuando se presenta EC el EI se activa:
Esther González UNED 2014
Página 14
De forma directa ante el EC
De forma indirecta por asociaciones creadas por el contexto y entre el contexto y el EC.
Premisa 1: Esas asociaciones determinan la intensidad del la RC y su carácter excitatorio o o inhibitorio.
Pero según el modelo no existen asociaciones inhibitorias, y la manifestación final del a RC depende de la fuerza
relativa de la asociación excitatoria entre el Ec y EI con respecto a las asociaciones excitatorias entre el mismo
contexto y EI.
Premisa 2: la comparación entre las asociaciones excitatorias determinan la RC pero no el aprendizaje porque el
sujeto compara las fuerzas asociativas una vez acabado el entrenamiento, Ej: si extinguimos la relación contexto-EI la
RC frente al EC aumentará.
Modelos atencionales:
TEORIA DEL MACKINSTOSH
Basándose en la atención en el aprendizaje, Mackinstosh y Turner pusieron un sonido seguido de una descarga
eléctrica en primera fase de condicionamiento. En fase 2 pusieron sonido y luz seguido de descarga. Tercera fase,
sonido+luz seguido de descarga mayor . los sujetos aprenden que en fase 3 la intensidad aumenta ante la luz para
grupo control. El grupo experimental aprenden que la luz es redundante y que la descarga se da de todas maneras,
por tanto no prestan atención a la luz. Mientras que rescorla-Wagner explicarían que este efecto es causa de la
falta de sorpresividad, Mackinstosh dice que se debe a que ignoran los estímulos predictories redundantes, es decir
a la falta de atención. Cuanto mayor predictor sea el EC del EI mayor atención le presamos. Y depende del resto de
los ECs presentes.
TEORIA DE PEARCE Y HALL
Sugieren que no debemos malgastar recursos prestando atención a estímulos que conocemos, sino a aquellos que
no controlamos con seguridad.
Según esta teoría la atención a un EC disminuye con cada ensayo según se convierte en mejor predictor del EI. si el
EI tgras EC no resulta sorprendente, prestamos menos atención al EC en el siguiente ensayo, si el EI nos sorprende,
la atención aumentará.
Otras teorías.
El modelo SOP el aprendizaje depende de que el EI sea sorprendente, pero defiende que un estímulo sorprendente
tiene mejor procesamiento en nuestra memoria a corto plazo, y mayor probabilidad de mantenerse en nuestra
memoria a largo plazo. La sorpresa se ve reducida si el estímulo ya esta activado en nuestra memoria a corto plazo.
Este modelo representa el condicionamiento por nodos y redes neuronales, propias de conexionismo. La
representación de los estímulos se denomina NODO y las asociaciones entre nodos son CONEXIONES.
Según este modelo los nodos que representan el EC y EI se activan cuando los estímulos reales se activan y lo hacen
a dos niveles:
 Estado A1 cuando EC y EI están presentes provocan un nivel de activación y atención alto. Un nodo solo
puede mantenerse en este estado un intervalo de tiempo porque decae al
 Estado A2 relacionado con la atención periférica y menos focalizada y permanece allí durante un lardo
periodo de tiempo hasta su inactivación.
La asociación entre ambos nodos EC-EI, solo tendrá lugar si ambos están activados y coinciden en el estado A1,
memoria a corto plazo. Esta coincidencia ensayo tras ensayo hace que la asociación sea mas fuerte y cuando están
asociados y la activación se da en el estado A2 (el nodo Ei se activará con presencia real de dicho EI)
Esther González UNED 2014
Página 15
Tema 4
PRINCIPIOS BASICOS DEL CONDICIONAMIENTO OPERANTE.
Conducir, hablar, trabajar no ocurre de forma automática ante un estímulo, el sujeto emite respuesta que estuvo
relacionada con un acontecimiento ambiental en el pasado. Cuando las conductas es probable que se vuelvan a
repetir si se recibe un incentivo de placer, pero si recibimos aversión, es probable que no se vuelva a hacer. Si
después de trabajar todo el mes, no recibimos el salario, dejaremos de trabajar. El condicionamiento operante se
encarga de predecir las respuestas que no son evocadas por estímulos.
ANTECEDENTES HISTORICOS.
La teoría evolutiva de Darwin es una gran influencia del análisis experimental de la conducta desde el punto de vista
del condicionamiento operante. La variación y selección como postilados principales de su teoría en cuanto a las
características heredadas, se aplica al comportamiento. En el condicionamiento operante el reforzador actúa como
seleccionador de las respuestas mas apropiadas y así aparece una conducta según la circunstancia.
Thorndike y la ley del efecto.
Thorndike: Primer científico que estudió la conducta operante y lo llamo aprendizaje por ensayo y error.
Centró su interés en como los aciertos y fracasos afectaban la conducta. Concluye que el aprendizaje ocurre cuando
se fortalecen las conexiones entre estímulo y respuesta danto una satisfacción al sujeto, y lo llamó conexionismo
encuadrado dentro del paradigma E-R.
Ej: de los gatos que activaban por casualidad el mecanismo de apertura (latencia tiempo desde que empieza el
experimento hasta el escape que disminuía a lo largo de los ensayos).
Concluye cuando una conducta va seguida de un incentivo agradable, el aprendizaje está basado en una concepción
hedonista (los resultados placenteros se fortalecen, los desagradables se eliminan).
El análisis experimental del comportamiento de skinner,.
Skinner: primer responsable del reforzamiento. Desarrolla la idea que los reflejos podrían ser estudiados como
conductas y distingue entre el condicionamiento de reflejos de pavlov y el aprendizaje de thorndike que dijo que la
conducta se regula por el condicionamiento de los reflejos y el operante, centrándose en las relaciones funcionales
entre la conducta y sus consecuencias. Llamó condicionamiento operante a la capacidad para operar sobre el
ambiente. Llamó condicionamiento instrumental al hecho de que la conducta del sujeto es el instrumento para
obtener el reforzador. Pensaba que se podía repetir respuestas sin intervención del experimentador y medía el
número de respuestas emitidas por unidad de tiempo en lugar de la latencia.
Esther González UNED 2014
Página 16
DEFINICION DEL CONDICIONAMIENTO OPERANTE.
Pavlov utilizaba como base los reflejos, pero era difícil identificar el estímulo evocador. Podemos saber lo que
produce salivación en un perro, pero no el estímulo que incita a tocar el piano. La conducta futura, viene
determinada por las consecuencias del pasado.
El condicionamiento operante es el proceso que da lugar a que una respuesta se vea modificada por sus los efectos
que tiene el ambiente sobre ella. Por tanto el condicionamiento operante dispone al sujeto en unas circunstancias
en las que alguna de sus conductas da lugar a la aparición de un cambio de emisión de respuesta.
En el condicionamiento operante es el sujeto el que opera en el medio, lo modifica a la vez que este modifica el
organismo. Si el resultado es beneficioso, la conducta se fortalecerá, si es perjudicial, tenderá a desaparecer. Con el
condicionamiento operante los sujetos aprenden a obtener o eliminar consecuencias del ambiente. Con este
condicionamiento los sujetos además de aprender respuestas ante una nueva circunstancias con respuestas que
formaban parte de su repertorio anterior, sino que pueden dar respuestas nuevas.
La contingencia de tres términos.
En el condicionamiento operante la consecuencia está relacionada con la presentación de la respuesta.
La contingencia: en presencia de un estímulo especifico, el reforzador se presentará si la respuesta operante sucede.
Tres términos elementales y sus interrelaciones funcionales:
Estímulo discriminativo: la conducto no siempre da respuestas discretas, puede ser la ejecución que ocurre después
de un estímulo que tiene como resultado una consecuencia específica.
Los estímulos antecedentes tienen gran importancia en el condicionamiento operante y se llaman discriminatorios.
En el condicionamiento operante los estímulos no provocan la aparición de respuesta, sino que señalan la ocasión
para que un estímulo indique que una respuesta puede tener consecuencia. El reforzamiento diferencial implica
reforzar una operante en una situación y no en otra, por lo que el estímulo discriminatorio ejerce control sobre esa
respuesta pero no es el ED el que provoca la respuesta. Cuando el Ed es seguido de una respuesta con consecuencia
apetitiva, la respuesta se ve reforzada y hace que aumente la probabilidad de que se produzca posteriormente.
Ejemplo de maquina de bebidas con luz verde(ed) o roja(EA a estimulo delta =ausencia del reforzador). En presencia
de un EA la respuesta operante disminuye. CONTROL POR EL ESTIMULO se refiere a cómo los estímulos que
preceden una conducta pueden controla la ocurrencia de esa conducta.
La respuesta: En el condicionamiento instrumental, la respuesta operante son los efectos provocados en el
ambiente. La operante se define por su función y no por su forma, la misma respuesta es la misma operante. Se
puede apretar la palanca con el pico o con el morro o con la pata, diferentes respuestas mismos efectos, misma
operante. La conducta puede adoptar distintas formas en la misma función. Ejemplo: Como ponernos un gorro para
no tener frio es una clase de respuesta es decir la forma, con una misma función: no tener frio.
El reforzador: para el condicionamiento instrumental hay gran variedad de estímulos que refuerzan una conducta.
Un reforzador es cualquier evento que cambia la probabilidad de aparición de una respuesta en el futuro.
Reforzamiento condicionado: elogios, criticas, el dinero, son reforzadores que pueden fortalecer o debilitar la
ocurrencia de una conducta. Las experiencias, condicionan la consecuencia. “yo no canto por dinero, canto por
placer”, “pero del dinero da mucho placer”. El reforzamiento condicionado o secundario es un estimulo que en
principio no es reforzante, (luz o sonido) puede adquirir la capacidad de reforzante mediante asociación repetida con
otro que era previamente reforzante y siempre dependiendo de la historia del sujeto, es decir, cuando un evento
arbitrario es capaz de aumentar la frecuencia de respuesta.
ACLARACIONES
 Reforzador (evento)-reforzamiento(procedimiento/proceso).
El reforzamiento produce incremento en la conducta y los reforzadores son los eventos que hacen que el
reforzamiento tenga efectos.
Castigo: cuando el procedimiento disminuye la conducta y los eventos son de naturaleza aversiva.
 Respuesta discreta –operante libre: en el ensayo discreto donde el experimentador solo puede intervenir
para ubicar el aparato al final o principio del ensayo, solo se puede medir una respuesta en cada ensayo y la
VD es la latencia de respuesta y el tiempo entre ensayos. La caja de skinner permitiría los procedimientos
operantes libres ya que los sujetos pueden emitir respuesta de forma constante sin la manipulación del
investigador entre ensayo y ensayo pudiendo medir la presión, tasa de respuesta…
Esther González UNED 2014
Página 17

Topografía-función: el análisis de la conducta puede hacerse según la forma de la respuesta o topografía,
refiriéndose a las propiedades o características físicas de una respuesta en el tiempo. Es decir para cerrar
una puerta podemos usar el codo, la mano, un dedo, el pie, hacerlo mas deprisa, mas lento y cada una de
ellas sería una forma, que está relacionada con las contingencias del reforzamiento; es menos probable
cerrar la puerta con el pie en una situación social por lo que la topografía es una función de las ontingencias
de reforzamiento. Sin embargo la función se refiere a las relaciones de la respuesta con los estímulos
antecedentes y las consecuencias de la misma. Por tanto la conducta es la ejecución de una respuesta que
sigue a un estímulo especifico y que tiene como resultado alguna consecuencias. Dos respuestas con la
misma topografía puede tener una función diferente y dos respuestas con distinta ropografia puede tener la
misma función. La biología puede imponer limitaciones al condicionamiento de algunas respuestas.
Instancia de respuesta y clase de respuesta (UNIDAD CONDUCTUAL).
Las relaciones conductuales son una correlacion entre una clase de estímulo y una clase de respuesta. La conducta
es molar, la operante son relaciones funcionales entre clases de respuestas y consecuencias ambientales. Pero hay
que diferencias entre lo que es una clase de respuesta y lo que son respuestas particulares o instancias de
respuestas (punto de vista molar). Una instancia de respuesta es la unidad mínima de conducta como “presionar
palanca” sin tener en cuenta, el momento, cuantas veces o su topografía.
Interacciones clásicas y operantes en el control de la conducta
Aprendizaje pasivo es cuando un sujeto solo necesita ser expuesto a los estímulos para que el aprendizaje ocurra.
El condicionamiento operante requiere que el sujeto sea activo y emita el la respuesta. Para reforzar o castigar una
conducta tiene que haber conducta. Cuando queremos que una paloma picotee un botón en una caja de skinner
tenemos que esperar que ocurra por casualidad, lo que lleva tiempo para poder reforzar y condicionar. El
automoldeamiento consiste en implementar en un primer momento un procedimiento clásico excitatorio apetitivo
emparejado aun estímulo inicialmente neutro para acabar dando una respuesta operante aunque topográficamente
tanto la EC como la ED sean topográficamente indiferenciables. La interaccion entre condicionamiento clásico y
operante es porque los acontecimientos ambientales actúan sobre los sistemas neurofisiológicos de los organismos
de forma global y no sobre un sistema concreto. Neurológicamente se ha sugerido que ambos tipos de aprendizaje
se deben considerar fenómenos distintos, pero esta afirmación genera discusión.
Esther González UNED 2014
Página 18
PROCEDIMIENTOS BASICOS DEL CONDICIONAMIENTO OPERANTE
La conducta es dinámica y se modifica según las variables de interrelaciones que se puedan dar.
Los procesos conductuales reproducibles son los que se pueden siguen un patrón temporal identificable que bajo
condiciones objetivamente especificas son reproducibles.
La contingencia es una relación de dependencia funcional entre dos componentes del condicionamiento y es la
relación que se establece cuando un componente se correlaciona con el otro.
Puede ser positiva si la respuesta es seguida de una consecuencia o negativa si la respuesta elimina la aparición de la
consecuencia.
Según la contingencia (positiva o negativa) y la naturaleza de las consecuencias (apetitivas o aversivas se pueden
establecer cuatro procedimientos fundamentales de condicionamiento operante. Unos que incrementan conducta
(reforzamiento positivo, evitación y escape) y los que disminuyen conducta (castigo y entrenamiento de omisión).
Esther González UNED 2014
Página 19
Procedimientos destinados a aumentar conductas
REFORZAMIENTO POSITIVO O ENTRENAMIENTO DE RECOMPENSA: Es cuando aumenta la fuerza de la respuesta
(frecuencia, intensidad, tasa,) por una consecuencia apetitiva, que puede consistir en un reforzador primario como la
comida o el placer o secundario como elogios, dinero… pero el sujeto debe estar motivado para obtener el
reforzador. (comida como reforzador si estoy lleno)
El moldeamiento o método de aproximaciones sucesivas implica reforzar respuestas para que se aproxime a la
respuesta final exigida, muy lejos de cómo se actuaría en el medio natural (presionar palanca)
ESCAPE Y EVITACION: Conocidas como reforzamiento negativo= incremento de tasa de respuesta o intensidad.
Escape: La respuesta operante consiste en la eliminación de un evento de naturaleza aversiva. (Me voy de la
conferencia porque me aburre)
Eliminación: La respuesta consiste en impedir que esté presente el evento de naturaleza aversiva (no voy a la
conferencia porque me aburre).
En laboratorio los sujetos aprenden primero el escape i luego la eliminación.
Procedimientos destinados a disminuir conductas
EL CASTIGO O CASTIGO POSITIVO: tiene como resultado la disminución en la fuerza de la respuesta. El castigo se
define por su función y cuando no tiene efectos en la conducta se considera que este no ha ocurrido. Para castigar
una respuesta, antes ha tenido que ser reforzada y el castigo consiste en la imposición de una contingencia de tipo
aversivo sobre la respuesta.
Castigo negativo o entrenamiento de omisión: implica no entregar una recompensa cuando se presenta una
conducta no deseada. Los eventos o circunstancias eliminadas en el caso del castigo negativo, se asume que son
eventos reforzantes (ver la tele, hablar con compañeros, comer caramelos, rechazo sexual ante conductas no
deseadas en la pareja).
Efectos colaterales de los procedimientos aversivos: las razones éticas desaconsejan los procedimientos aversivos
para producir cambios conductuales.
 Para skinner estos procedimientos no son una forma fiable de disminución de conducta porque tiene
efectos emocionales no impide que en el futuro vuelva a ocurrir en cuanto la activación emocional se disipe.
 También puede que la estimulación aversiva se asocie a otros estímulos presentes y inhibir conductas
deseables.
 Cuando se castiga se asocia el castigo con quien lo ejecuta mas que con la conducta indeseada y en el futuro
puede ser que se rechace a quien castiga en lugar de cambiar de comportamiento.
La extinción en el reforzamiento positivo:
la extinción es el procedimiento mediante el cual una respuesta que previamente se reforzaba, se deja de reforzar.
También es un proceso que disminuye la frecuencia o intensidad de la respuesta causada por la ausencia del
reforzador y una disminución gradual de respuesta.
La extinción es la disminución de tasa de respuesta, pero no se elimina completamente. Si observamos que se
produce cierta recuperación de la respuesta se llama recuperación espontánea.
Estallido de extinción es cuando dejamos de presentar el reforzador y aumenta la respuesta sobre la que
anteriormente se daba. Después la tasa de respuesta empieza a disminuir de forma gradual.
El aumento de la variabilidad de la respuesta porque hay cierta variación conductual al aumentar las oportunidades
de que el organismo pueda reinstaurar el reforzamiento.
Las respuestas emocionales incondicionadas es cuando la extinción produce un estado emocional de frustración
que hace que respondas repetidamente Ej: presionar un botón de una maquina que no ha dado la bebida tras poner
dinero, incluso puede aparecer la agresión.
En laboratorio la extinción provoca que las respuestas emocionales desaparezcan y la intensidad de la respuesta
disminuye al nivel registrado antes de que la conducta fuese reforzada.
Resistencia a la extinción es la tasa de respuesta mostrada hasta conseguir la extinción.
Efecto de sobreentrenamiento en la extinción: Las respuestas que han sido reforzadas en pocas ocasiones se
extinguen de forma lenta y las que han sido muy reforzadas muestra menor resistencia a la extinción.
Esther González UNED 2014
Página 20
Los reforzadores parciales o intermitentes presentan mas resistencia que los continuos. Ej: el llanto del niño que a
veces es reforzado o tras no, es difícil de erradicar. El efecto del reforzamiento parcial aumenta la resistencia al
cambio.
La magnitud del reforzador y la inmediatez de la recompensa son otras variables que influyen en la persistencia de
la respuesta durante la extinción. Cuando la magnitud de la recompensa es alta y se administra de forma continua,
la resistencia disminuye. Si es intermitente o parcial , la resistencia será alta. Lo mismo ocurre con el tiempo que
tarda en caer la bolita.
La disminución de respuesta puede que sea debida al olvido debido al paso del tiempo. La extinción no revierte lo
ocurrido, sino que implica un nuevo aprendizaje.
La renovación: consiste en la recuperación de la respuesta extinguida en un contexto diferente al que se llevo a cabo
la extinción.
La restauración: es igual pero en el mismo contexto de la extinción.
El restablecimiento: respuestas extinguidas vuelven a aparecer sin que esta de lugar al reforzador.
FENOMENOS DEL CONDICIONAMIENTO OPERANTE
La conducta supersticiosa
Una respuesta sin motivo aparente sea seguida depor un reforzador da lugar a una conducta reforzada
accidentalemente.
El experimento de supersticion de Skinner demostró las consecuencias del reforzamiento accidental en el
aprendizaje. Palomas, un grano cada 15 segundos, presentaban pautas de comportamiento que parecía indicar que
su conducta controlaba la entrega y lo llamo reforzamiento accidental o adventicio. Si se da el grano cuando alza la
cabeza, lo relacionará y esta conducta quedará reforzada, con lo que repetirá la conducta aumentando la
probabilidad que se de la ocurrencia y quede reforzado la relación de conducta-respuesta.
Satddon y simmelhag llegaron a la conclusion que las respuestas de los animales se podían englobar en dos grupos:
 Las conductas interin que son aquellas que tenían lugar en medio del intervalo, cuando aún faltaba tiempo
para la aparicion del reforzador. Como su respuesta no variaba de una paloma a otra, concluyeron que las
conductas se producen de forma innata y no por reforzamiento accidental cuando la probabilidad de
reforzamiento es baja.
 Las conductas terminales ocurrian al funal del intervalo, proximas a la aparicion del reforzador. Su aparicion
no estaría relacionada con un reforzamiento accidental.
Esther González UNED 2014
Página 21
Por consecuencia, no todas las conductas que aparecen cuando se entregan reforzadores de forma periodica son el
resultado de un emparejamiento aleatorio entre respuesta y reforzador, siendo algunas respuestas conductas
innatas con alta probabilidad de aparicion cuando el sujeto espera la aparicion de un reforzador.
Por lo que algunas conductas se podrían explicar que son supersticiosas y otras tienen que ver con conductas innatas
relacionadas con reforzadores en ambientes naturales.
En los humanos ocurren conductas supersticiosas, cuando en las situaciones no tenemos ningun tipo de control
sobre las consecuencias de las acciones, como juegos de azar. Habitual en deportistas, jugadores. Las personas
controladoras, que necesitan el control sobre los eventos, son supersticiosas.
Herstein estableció:
Las supersticiones idiosincráticas: motivadas por la experiencia propia de siutaciones anteriores de reforzamiento
(me pongo calcetines rojos con los que he aprobado los examenes anteriores)
Las supersticiones sociales típicas: que se mantiene a lo largo del tiempo ( el nº 13, pasar debajo escalera…) que
tienen sus inicios en creencias populares que ya no son efectivas. (encender 3 cigarros con la misma cerilla viene de
la guerra mundial, porque una cerilla encendida daba al enemigo tu posición).
La deriva instintiva y el concepto de relevancia o petinencia en el condicionamiento instrumental.
El condicionamiento instrumental no condiciona siempre la misma forma de respuesta.
Existen situaciones que la relacion de pertinencia o relevancia entre respuestas y reforzadores dependen del tipo de
reforzador. Por tanto el condicionamienot depende del reforzador que usenos y de la historia evolutiva del animal.
Marion y keller descubrieron que las conductas innatas interferían con las respuestas operantes pretendidas.
A esto lo llamaron deriva instintiva: frotar moneda mapaches, relinchar caballos, son respuestas naturales muy
fuertes relacionadas con la comida y que compiten con las que requiere el entrenador para el condicionamiento
operante.
Los cambios en la cantidad y calidad de recompensa:
El efecto de la recompensa depende de la experiencia pasada con otros reforzadores. Dependiendo de la motivacion
y efectividad de un reforzador para controlar una conducta puede verse modificada por la experiencia previa. Esto es
el CONTRASTE CONDUCTUAL. El aumento de sueldo pone contenta a la gente, una bajada nos enfada porque tiene
que ver con el valor del reforzador. Los efectos de la recompensa dependen de la experiencia previa con otras
recompensas.
1600 euros te quitan 100 contraste conductual negativo trabajo menos
1400 euros te dan 100 contraste conductual positivo trabajo mas.
Contrabilidad de las consecuencias aversivas y el efecto de indefension aprendida.
Experimento del video de la clase y auschvic
Las situaciones incontrolabes desarrollan una reaccion emocional en la que se manifiesta un comportamiento pasibo
ante las circunstancias. Es similar a la depresion humana. Las conductas no tienen efectos por lo que la aparicion de
la descarga es independiente de la conducta: hipotesis de la indefension aprendida. Para reducir el efecto de la
indefension es reforzando las expectativs de que toma el control de la conducta sobre las consecuencias.
Inmunicion: (seligman): proceso que se desarrolla cuando un sujeto teien una primera experiencia con descargas
escapables que bloquea el desarrollo de la indefension aprendida cuando se presentan descargas inescapables en
una fase posterior.
Los efectos de la demora del reforzador en el condicionamiento isntrumental: el precedimiento de marcado.
La entrega de la recompensa aumenta la probabilidad de respuesta, si es inmediato en el tiempo.
La demora del reforzamiento puede aumentar o disminuir la conducta.
Muchas teorias asociativas del aprendizaje defienden que dos eventos deben ser contiguos para que sean asociados.
Si marcamos la respuesta la podemos diferenciar de otros eventos que ocurren durante el periodo de demora.
El marcado evita los efectos de la demora en la entrega del reforzador. Marcamos la respuesta haciendo que esta
pueda diferenciarse. Ratas brazo lateral negro o blanco y caja de demora.
Devaluacion del reforzador: consiste en asociar al reforzador (comida) un estímulo de naturaleza contraria (
sustancia aversiva que da dolor de barriga) . bolitas con gustos.
Los animales aprenden acerca de las consecuencias de su conducta durante el condicionamiento operante.
Pero la respuesta instrumental puede llegar a automatizarse con la practica (habitos) podemos conducir y hablar.
Esther González UNED 2014
Página 22
Tema 5
PROGRAMAS Y TEORIAS DEL REFORZAMIENTO.
Programas basicos de reforzamiento: vinculado al condicionamiento operante, donde se aprecia la relacion entre
estímulo discriminativo y respuesta operante o reforzador.
Los programas de reforzamiento especifican las regals que determinan las condiciones en que una respuesta puede
ser reforzada. No se refuerzan todas las respuestas, solo algunas y se llama programa intermintente de
reforzamiento que en comparacion con el continuo, produce un aprendizaje mas duradero y dificil de extinguir.
Basandose en la adquisicon y no en la extincion se consideran efectos diferenciales de los programas de
reforzamiento.
Diferentes formas de programar los reforzadores de forma intermitente son:
 Programas de razon: estipulan que se debe emitir un determinado numero de respuestas antes de que la
última de ellas sea reforzada.
Esther González UNED 2014
Página 23
De razon fija: el numero de respuestas requerido es siempre el mismo
De razon variable: El numero de respuestas varia de una ocasión a la siguiente de manera irregular. Se
hacen promedios.
Programas de intervalo: establecen que debe pasar un determinado tiempo desde la consecucion del
reforzador anterior antes de que la respuesta requerida sea de nuevo reforzada
De intervalo fijo, mantienen constante el tiempo requerido para que se entregue el siguiente
reforzador, y reforzaran la respuesta despues de que haya ocurrido un tiempo siempre igual desde que se
dispensó el anterior reforzador.
De intervalo variable: varia la cantidad de tiempo que debe transcurrir entre un reforzador y el
siguiente antes de que la respuesta sea reforzada dando lugar a promedios de intervalos entre reforzdores.
Cada programa produce una ejecucion conductual diferente, apreciable a simple vista según como se distribuyen
las respuestas.
Un registrador acumulativo registra las respuesta de manera automatica. Consite en un rollo de papel, que gira a
velocidad constante con dos plumillas, una mide respuestas y el tiempo transcurrido entre respuestas y dejar
constancia de otros sucesos ambientales como presentacion de estimulos, registros discriminativos y reforzadores.
Mide respuestas incluso las que son muy rapidas y estructuras complejas de comportamientos sin perder detalles de
cambios relativamente pequeños en la conducta.
Las respuestas variables proporcionan programas de perseverancia muy elevado.
Las respuestas fijas inicialmente tienen una tasa elevada de respuesta.
La duracion de la pausa post-reforzamiento en los programs de RF depende del valor de la razon.
TENSION DE LA RAZON: dejar de responder por completo si el requisito de la razon es elevado.
La tasa de respuesta aumenta progresivamente en cada uno de los intervalos a mendida que avanza el tiempo y es
es tipico de los programas IF. Estos programas reflejan la discriminacion temporal y los animales reponden cuando
“subjetivamente” consideran que es probable la consecucion del reforzador.
La diferencia entre los programas fijos (RF y IF) y los variables (RV y IV) es que en los fijos suele aparecer una pausa
despues de cada reforzamiento. En RF la pausa post-reforzamiento es alta y estable de respuesta, en IF se pasa de la
pausa a una aceleracion gradual en la tasa de respuesta hasta alcanzar una tasa alta al final del intervalo.
para conseguir un reforzador se puede limitar el tiempo.
Duracion limitada: cuando la recompensa se esta disponible un tiempo limitado.
La duracion de la pausa post reforzamiento que ocurre en los programas de RF se incrementa a medida que
aumenta el requisito de la razon y su duracion está relacionada con la longitud del programa de IF, de manera que a
mayor duracion del intervalo, mayor pausa. En los programas de razón a mayor numero de respuestas, mayor
intervalo entre reforzadores, dado que se tarda mas en completar las respuestas necesarias para conseguri el
reforzador.
Las transiciones de uno a otro programa de RF pueden ser: corta-corta, larga-larga, corta-larga y larga-corta. Mirar
cuando se dan cada uno de los casos (pag. 224)
Aunque parezca paradojico, las variables de control sobre la longitud de la pausa post-reforzamiento no son tan
diferentes en programas de razon e intervalo, aunque en los de razon, el dejar de responder lleva a una perdida
efectiva de reforzaores, (cuanto mas rapido se responda) mas reforzadores se obtendràn), siendo la frecuencia de
reforzamiento y el programa que se acaba de iniciar determinantes fundamientales.
Programas de razón frente a programas de intervalo: funciones de retroalimentacion.
Cuando se igualan las tasas de reforzamiento la respuesta es mayor en los programas de razon que en los de
intervalo.
Para equiparar los dos programas en cuanto al nº de reforzadores y distribucion de los mismos, se usa un
procedimiento en el que se asigna un valro de intervalo a un programa de reforzamiento en funcion de lo que
tarden los animales en completar previametne un programa de razón.
En los programas de intervalo, la tasa de respuesta no influye directamente sobre la frecuencia de administracion de
los reforzadores, mientras que la tasa de reforzamiento varia de manera directa con los cmaibos en la tasa de
respuesta en programas de razon. Es porque los programas de intervalos refuerzan TER largos, ya que el paso del
tiempo lleva a un incremento en la probabilidad de reforzamiento.
Esther González UNED 2014
Página 24
En los programas de razon RV, no presentan la tendencia de reforzar un TER en particualr, por lo que no favorecen
la ocurrencia de TER largos. Es mas al responder en rafagas es probable que el reforzador actue sobre TER cortos.
En los programas de RV existe una correlacion directa entre la tasa de respuesta y la de reforzamiento. La tasa de
respuesta aumentará para maximinar la tasa de reforzamiento. En los programas IV no esixte relacion entre tasa de
respuesta y tasa de reforzamiento, por lo que las variaciones de una no afectan a la otra.
Baum ha denominado esta explicacion como MOLAR, porque las variables efectivas ( la tasa de reforzamiento y su
dependencia de la tasa de respuesta) son fenomenos temporalemtne extensos, haciendo enfasis en la correlacion
frente a la contigüidad.
La relacion entre conducta y ambiente, establecidad como programas de reforzamiento, se pueden describir en
FUNCIONES DE RETROALIMENTACION: correlaciones entre la tasa de respuesta y de reforzamiento. La forma en que
actua el ambiente como la frecuencia de reforzamiento, la magnitud del reforzador, la demora. Las funciones de
retroalimentacion no asumen que la conducta este bajo el control de una VI, sino que la conducta afecta a algun
aspecto del ambiente.
La tasa de reforzamiento es proporcional a la tasa de respuesta realizada y la proporcionalidad es el requisito de la
razon. Cuanto mas rapido se responda, mayor sera la tasa de reforzamiento y el nº de respuestas requeridas para
producir incrementos en la tasa de reforzamiento debe aumentar conforme se incrementa el requisito de la razón.
Las areas aplanadas de las funciones de retroalimentacion en los programas de intervalos indican que el control
diferencial de la conducta es bastante débil, las contingencias de reforzamiento no empujan la conducta en ninguan
direccion. Esto significa que el punto en el que la VD y VI llegan a la semiestabilidad es bastante impredecibe la tasa
de reforzamiento. Es por esto que los programas de intervalos generan mauor variabilidad entre los sujetos en la
tasa de respuesta, por diferencias indiduales entre unos animales y otros.
Sin entrenamiento los animales desarrollan conductas innatas especificas de cada especie, que puedn considerarse
resultado de la operación de historias conductuales remotas.
Programas de reforzamiento diferencial de tiempos entre respuestas.
El diseño básico de los TER es elegir un tiempo determinado y reforzar únicamente los TER que sean largos en ese
tiempo.
RDB : (TER largos en tiempo) REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS DE RESPUESTA.
RDA : (TER cortos en tiempo) REFORZAMIENTO DIFERENCIAL DE TASAS ALTAS DE RESPUESTA.
Ej de RDA: contestar un cuestionario con tiempo limite para cada pregunta o saltar a la siguiente; tiempo para el
saque en un partido de tenis;
Ej. De RDB: retirar la comida del horno antes de que se cueza; coordinar pasos de baile, tocar instrumentos
musicales,
Cualquier aceleracion en la conducta que lleve aun resultado no reforzado, sino castigado.
Los programas RDB se diferencian de los IF que en RDB se refuerza la respuesta si ha transcurrido un tiempo
especifico desde la anterior respuesta. ( TER) y en los IF desde el anterior reforzador.
Los RDB añaden castigo si la respuesta ocurre antes del tiempo especificado. Para obtener reforzador hay que
esperar para emitir respuesta.
En el programa RDA se obtiene el reforzador si se respinde antes de que transcurra el tiempo especificado por lo que
se obtienen tasas altas de respuestas. Este programa es mas facil de ejecutar ya que en el RDB es mas dificil el
entrenamiento de reforzar una respuesta que no se haga de forma repetida y espaciada y la degradacon del valor del
reforzador por encontrarse demorado desde la emision de la respuesta criterio.
Teoria del reforzamietno diferencial de los tiempos entre respuestas.
Los reforzadores ademas de reforzar la respuesta refuerzan tambien el ritmo espaciamiento entre respuestas. Los
programas de RDB y RDA estan diseñados para reforzar respectivamente, TER de larga y corta duración, sin embargo
los programas de reforzamiento operante el sujeto puede responder libremente en los preiodos entre reforzadores
por lo que los sujetos y el tipo de programas fijos o variables, de razon o de intervalos son interdependientes.
Los programas RV y IV consiguen respuestas constantes, sin post-reforzamiento, y la duracion del TER es
homogénea.
Los programas de RF y IF tienen pausas post reforzamientos, y los TER deberían ser cortos puesto que los
reforzadores se presentan al final cunado los sujetos estan respondiendo a una tasa alta.
Esther González UNED 2014
Página 25
Programas compuestos de reforzamiento:
Programas alternantes y secuenciales: el control por el estímulo y el reforzamietno condicionado.
Mejor leer los ejemplos para entender diferencias:
PROGRAMA MIXTO: 2 o mas programas básicos alternados al azar. El cambio de unió a otro es independiente de la
conducta, pero si de la duración de un tiempo establecido
PROGRAMA MULTIPLE: igual que el mixto con la diferencia de que cada componente se señala con una clave
discriminativa distinta, una luz, un sonido, etc y el sujeto es informado en que parte del programa se encuentra.
PROGRAMA TANDEM: 2 programas simples que se presentan en el mismo orden. Se debe completar el primer
programa para iniciar el segundo, para conseguir el reforzador.
PROGRAMA ENCADENADO :igual que el tándem pero los dos programas se señalan de manera diferente, de forma
que el sujeto conoce que en que momento del programa se encuentra. Cuando acaba un programa se enciende una
luz o un sonido que permanece en funcionamiento durante el segundo programa hasta la consecución del
reforzador. Una luz puede adquirir capacidades reforzantes de segundo orden por su emparejamiento con la
comida. En los programas encadenados, el cambio en el ambiente por la finalización del primer programa adquiere
propiedades reforzantes por su asociación con el reforzador que consigue en el segundo programa.
Programas simultáneos: programas concurrentes y programas combinados.
PROGRAMA CONCURRENTE: se caracterizan por disponer simultáneamente de al menos dos programas básicos de
reforzamiento. Se puede cambiar de un programa a otro sin que se haya completado un tiempo o un numero de
respuestas.
PROGRAMA ALTERNATIVO.: Se refuerza una respuesta cada vez que se cumple con el requisito del programa de
razón o intervalo, existiendo así dos formas de conseguir el reforzador
PROGRAMA CONJUNTIVO. Se refuerza una respuesta cada vez que se cumple al mismo tiempo con el requisito de la
razón y el intervalo.
PROGRAMA ENTRELAZADO: La respuesta que se refuerza bien determinada por dos programas, pero la disposición
de uno de ellos se altera por el desarrollo del otro.
Esther González UNED 2014
Página 26
CONDUCTA DE ELECCION:
Elección o preferencia entre las alternativas de respuestas se calcula por la tasa relativa de respuesta y se presenta
por el cociente: Ra/ra+rb donde ra y rb presentan la tasa de respuesta alternativa a y b.
Los premios concurrentes se dan a elegir entre dos actividades diferentes como comer o beber y así se conocían las
inferencias preferidas,
En los programas concurrentes los sujetos no eligen entre diferentes premios, sino entre diferentes alternativas, que
requieren la misma respuesta pero pueden llevar a diferentes premios esto se llama respuestas instrumentales
concurrentes.
Ley de igualación: el Hernstein utilizo un programa concurrente donde las alternativas diferían en la tasa o
frecuencia de reforzamiento, con cada alternativa proporcionaba reforzamiento con un programa independiente de
IV. Observó que las palomas distribuían su respuesta en función de la frecuencia de reforzamiento en cada una de
las alternativas. Esto se llama la ley de igualación donde se afirma que la tasa relativa de respuesta entre dos
alternativas de respuestas concurrentes es igual a la tasa (frecuencia) relativa de reforzamiento asociada con casa
una de dichas alternativas de respuesta Ra/Ra+Rb=Fa/Fa+Fb. Donde Ra y Rb representan las tasas alternativas y Fa y
Fb la tasa (frecuencia) de reforzamiento asociada a las alternativas a y b respectivamente.
Lo que Hernstein encontró en sus experimentos es que variando la frecuencia de reforzamiento asociada a las
alternativas de respuesta en distintos programas de IV, los animales se ajustaban bien a una relación lineal de
manera que si la alternativa a ofrecia una mayor frecuencia de reforzamiento que la b, los animales elegian mas la a
que la b y al contrario.
Además de igualar la tasa relativa de respuesta con la tasa relativa de reforzamiento, observo que los animales
igualan la tasa relativa de respuesta con otros parametos que definen al reforzador como la magnitud o inmediatez.
De manera que en la formulación de la ley de igualación se pueden incluir todos los parámetros de reforzamiento.
Esther González UNED 2014
Página 27
Lo esencial de la ley de igualación es que establece igualdad entre la tasa relativa de respuesta y la tasa relativa de
reforzamiento de manera que la proporción entre las respuestas emitidas en las alternativas debe ser igual a la
proporción de los reforzadores obtenidos en dichas alternativas. EN ESA LEY NO SE EQUIPARAN TASAS ABSOLUTAS,
SOLO RELATIVAS.
Maximización: elección entre programas concurrentes de razón.
Se intento generalizar la ley de igualación a otras situaciones, variando el programa de reforzamiento asociado a las
alternativas de respuesta evaluando la elección cuando las diferentes alternativas consistían en programas de razón.
En este caso los sujetos tienden a elegir la alternativa de respuesta que tiene una razón mas baja, describiéndose
dicho resultado como MAXIMIZACION. Esta es un comportamiento adaptativo,elige en exclusiva la alternativa mas
favorable sin contradecir la ley de la igualación. Es el único comportamiento que en una situación de programa
concurrente de razón cumple con la ley de igualación.
Igualación temporal: además de la tasa relativa de reforzamiento y de respuesta, igualan el tiempo de estancia en las
alternativas de respuesta. Se puede formalizar Ta/Ta+Tb=Fa/Fa+Fb.
Ley generalizada de la igualación: cuando se tiene que elegir entre dos o mas alternativas de respuesta se produce el
comportamiento denominado de alternancia, caracterizado por el cambio intermitente de una alternativa de
respuesta a otra sin que guarde relación con los reforzadores asociados a cada una de dichas alternativas de
respuesta. En las situaciones de laboratorio no existe el reforzamiento accidental que refuerza el comportamiento
natural en situaciones de vida en libertad. En el laboratorio se tiene que controlar la influencia extraña que se
introduce con el comportamiento alternante en los animales experimentales para lo que se añade la limitación de
que no se refuerce la respuesta de cambio de alternativa por tiempo, este procedimiento se llama DEMORA POR EL
CAMBIO y consiste en introducir un periodo temporal breve de 2/3 segundos después de la primera respuesta a una
de las alternativas para que pueda entrar en funcionamiento el programa de reforzamiento asociado a dicha
respuesta alternativa de respuestas. Otras influencias no deseables en los experimentos de elección son los sesgos
como el color, fuerza requerida de respuesta, disposición espacial. No siempre es posible que todos los factores
permanezcan iguales, por lo que Baum ideo un método para corregir la influencia de los sesgos o fuentes de
influencia desconocida. Consiste en tres pasos:
 Se equiparan los factores de reforzamiento entre las alternativas de respuesta. La frecuencia, magnitud y
demora de los reforzadores deben ser iguales.
 Se debe medir las preferencias, si la respuesta se distribuye de forma igual no hay influencia de sesgos, pero
si no es así dicha elección indicaría la contribución de los sesgos que se puede determinar cuantitativamente
por el valor de la tasa relativa de respuesta.
 Una vez conocido el valor de los sesgos relativos, se deben variar los factores de reforzamiento asociados
con las alternativas de respuestas.
Los sesgos de respuesta pueden incidir en la elección y conviene corregirlos o evitarlos. En los casos de programas
concurrentes, sucede lo mismo. A veces la alternativa de respuesta es sobrevalorada o infravalorada. Este cálculo de
reforzador es la generalidad.
La sobreigualacion es cuando la mejor alternativa es valorada por encima de la preferencia establecida por la
igualación perfecta.
La infraigualacion es cuando la mejor alternativa es valorada por debajo de la preferencia establecida por debajo de
la igualación perfecta.
Es mas común la infraigualacion debido principalmente a la tendencia a cambiar de alternativa cuando se ha
obtenido reforzamiento en una de ellas, lo que disminuye el ajuste perfecto a la igualación. la infraigualacion y la
sobreigualacion hace referencia a la tasa de respuesta en la alternativa mas favorable ( mayor frecuencia de
reforzamiento) en el contexto de las predicciones de la ley de igualación. ello implica que de las dos alternativas de
Esther González UNED 2014
Página 28
respuesta, una sea siempre mas favorable. Por lo que la ley de igualación hace predicciones de preferencias relativas
de los sujetos. Los sesgos también pueden intervenir en facilitar la sobreigualacion y la infraigualacion.
Teorías de la igualación: hay dos enfoques principales:
Aproximación molecular. Afirma que el cambio de una alternativa de respuesta a otra se realiza en el momento en
que la probabilidad momentánea de reforzamiento sea mayor en la otra alternativa. Se basa en el calculo de
probabilidades relativas de reforzamiento en cada momento, de ahí que se llame molecular.
Aproximación de corte mas molar. Al contrario de la molecular, afirma que los animales distribuyen sus respuestas
de acuerdo a un calculo global de las tasas relativas de reforzamiento entre las dos alternativas de respuesta,
eligiendo mas aquella alternativa que proporciona una mayor tasa de reforzamiento. A través de un calculo general,
los animales ajustan proporcionalmente sus respuestas entre los reforzadores disponibles en las diferentes
alternativas, cumpliendo la ley de igualación.
Aunque las predicciones de la teoría molecular y el mecanismo propuesto parecen demasiado precisas, justo en su
precisión está la virtud, puesto que es comprobable y se ha visto que los animales responden de manera aproximada
a como predice la teoría. Pero no explica porqué los animales prefieren reforzadores variables antes que los fijos
aunque tengan la misma tasa de reforzamiento, sin embargo no existe tal preferencia por responder de forma
variada frente a repetitiva si se mantienen los reforzadores fijos.
La aproximación molar tiene problemas para explicar el resultado.
El mejoramiento. Es una síntesis de las aproximaciones molecular y molar. Dice que los organismos eligen entre dos
fuentes de premio de manera que se igualen las tasas locales de reforzamiento, respondiendo a la alternativa que en
un momento dado presenta una mejor tasa local de reforzamiento. Así los resultados tienen un alcance a mas largo
plazo que la teoría molecular, pero no es refiere a tasas globales de reforzamiento como en la teoría molar. Al
obtener mayor tasa de reforzamiento se mantienen mas tiempo con la misma alternativa de respuesta. Por lo que
las tasas locales de respuesta y de reforzamiento serán las iguales o parecidas entre diferentes alternativas de
respuesta, se responde menos a la alternativa menos favorable, se obtiene menos reforzador pero se le dedica
menos tiempo.
La teoría de la mejora se deriva de la igualación: teniendo en cuenta el tiempo empleado en responder a cada
alternativa se puede derivar con lógica que los animales al igualar están equiparando tasas locales de respuesta y de
reforzamiento entre alternativas de respuestas.
Impulsividad y autocontrol: la elección con compromiso.
Las cadenas concurrentes de respuesta: no mide la elección entre premios ni entre respuestas instrumentales
concurrentes, sino que se mide la elección entre diferentes fuentes de premio. Pueden ser simples o encadenados.
En el simple se dan a elegir a los animales dos alternativas de respuesta, cada una acompañada de un programa de
reforzamiento particular.
El encadenado, es de dos pasos, un eslabón inicial donde el sujeto tiene que elegir entre dos alternativas idénticas y
otro eslabón terminal donde se proporcionan los reforzadores por responder en la alternativa de respuesta elegida
durante el eslabón inicial. Luego se vuelve a presentar el eslabón inicial hasta que el sujeto elija otra alternativa que
le lleve al eslabon final. Esto permite que los sujetos sean consecuentes con sus decisiones y separa el aprendizaje de
los eslabones iniciales de los terminales.
Estos programas se asemejan a la vida cotidiana., donde optar por una alternativa te compromete por un tiempo
hasta poder cambiar de opción, pero no se puede cambiar de forma caprichosa en cada momento.
Ej un estudiante se apunta a un nº determinado de asignaturas y a medio curso se da cuenta que no se debía
apuntar a tantas, pero no puede cambiar porque ha adquirido un compromiso de permanencia.
IMPULSIVIDAD: Programa concurrente simple: se prefiere la opción de un premio pequeño inmediato.
AUTOCONTROL: Programa concurrente encadenado: tiene un tiempo constante de espera para acceder al
reforzamiento de la respuesta y entonces se opta por un reforzador mayor pero mas demorado. Al introducir una
demora, la fuerza de la inmediatez se debilita y la elección se guía por la magnitud del reforzador.
La noción de valor de los reforzadores.
El valor de una alternativa de respuesta aumenta con la magnitud del reforzador y disminuirá con la demora para la
entrega del reforzador. Por lo que el valor del reforzador vendrá determinado por el cociente magnitud/demora.
Esto nos permite predecir fenómenos complejos en apariencia.
Esther González UNED 2014
Página 29
Mazur propone que el cambio de un comportamiento impulsivo a uno autocontrolado se puede expresar mediante
una función hiperbólica: Va= Ma/1+kDa
El valor del reforzador seria mayor a medida que su magnitud fuese mayor y la demora para la obtención menor,
pero la relación no seria lineal sino hiperbólica. Por ejemplo: para una magnitud dada, el valor del reforzador
aumentaría en una proporción creciente a medida que sea menor la demora. En el reforzamiento inmediato el valor
del reforzador vendría determinado por su magnitud. Cuando un reforzador grande y otro pequeño son demorados,
el valor del reforzador grande será superior al pequeño (autocontrol), el valor del reforzador pequeño será mayor
que el del grande, cuando la espera para el primero sea pequeña (impulsividad) .
El valor aversivo del castigo, tambien cambia mediante una función hiperbolica semejante a la recompensa.
La tasa de respuesta en relación a la ley de igualación.
Hernstein amplió la leu de igualación al considerar que cualquier situación implica una elección. Y pueden elegir
entre responder o no, o elegir responder como requiere el experimentador o realizar otras actividades. Por lo que el
reforzamiento total de la situación comprende reforzadores programados o no explícitamente programados.
Además valoro que la tasa de conducta total implica aceptar la idea que los organismos siempre están haciendo algo,
aunque sea descansar. Por tanto la suma de la tasa de respuesta criterio mas cualquier otra actividad debe ser
siempre igual. Un respuesta implica una redistribución de respuestas alternativas.
Una forma de aumentar la tasa de respuesta seria aumentar la tasa de reforzamiento asociada a esa conducta y otra
seria disminuir la tasa de reforzamiento alternativo.
Esther González UNED 2014
Página 30
>
LA NATURALEZA DE LA ASOCIACION EN EL APRENDIZAJE INSTRUMENTAL:
La formulación de la ley de igualación (Skinner, Hull) y la teoría de la igualación (Hernestein) se basaron en le
constructo de fuerza de respuesta. Constructo que responde a un conjunto de cantidades medibles de conducta.
Thorndike dentro del ambiente darwinista construyo cajas –problema que permitían estudiar de manera
experimental la conducta de los animales hambrientos y tenían que resolver el problema de obtener la comida que
estaban viendo, pero que no les era accesible. Por casualidad accionaban el dispositivo que abría la puerta. Los
siguientes intentos actuaban con mas rapidez hasta que cuando los metía en la caja eran capaces de salir
inmediatamente. Así formulo leyes para explicar el aprendizaje como la ley del efecto donde dice que varias
respuestas que se dan en la misma situación aquellas que van acompañadas o seguidas de satisfacción, tienen la
probabilidad de que vuelvan a ocurrir, y las respuestas que van acompañadas de malestar, tiene menos probabilidad
de volver a ocurrir. Cuanto mayor sea la satisfacción o el malestar mayor el fortalecimiento o debilitamiento del
vinculo. Esta ley postula la fuerza de la asociación. E-R, que depende de la propia consecuencia de la acción. En los
años 30-40 en pleno auge del aprendizaje, en eeuu, los investigadores se centraron en la naturaleza asociativa del
aprendizaje.
Guthrie continuador de Watson, opinaba que la función del reforzador en el aprendizaje facilita la formación de una
asociación entre E-R. distinguió entre actos y movimientos musculares discretos (comportamiento). Cada gato
escapa de la caja accionando la palanca de una forma diferente.
Esther González UNED 2014
Página 31
Hull dice que la consecución del reforzador refuerza la formación de la asociación E-R , introduciendo el concepto de
motivación. Para que los animales ejecuten una acción es necesaria una necesidad biológica. Desarrollo la primea
teoría formal sobre la formación de hábitos y el neoconductismo. Introdujo el incentivo
Tolman se erige como defensor de E-E contrario al E-R. Con sus ratas nadadoras, los mapas cognitivos y el
aprendizaje de donde ir y no solo activar los músculos concretos, intentaba demostrar que los cambios en la
conducta atribuidos al aprendizaje son el resultado de la intervención de procesos como la expectativa de
recompensa, además de distinguir entre aprendizaje y ejecución, no resultando necesario el reforzador para el
aprendizaje, pero si para la ejecución.
El aprendizaje latente es cuando se hace recorrer a los animales un laberinto pero no se les da recompensa. Luego
vuelven a recorrer el laberinto y si se les da recompensa. Los animales aprenden a efectuar la respuesta correcta ya
que han aprendido a recorrer el laberinto antes de recibir el premio. Por lo que según tolman la recompensa no es
necesaria para el aprendizaje, pero imprescindible para que se ejecute la respuesta aprendida.
Tanto tolman como hull coinciden que aprendizaje y ejecución son separables.
Los mecanismos asociativos E-R E-E pueden estar implicados en el aprendizaje instrumental, siendo E-R el mas
especifico en cuanto que establece formas precisas para producir las respuestas, no solo la adquisición de la
asociación. A través del E-R, se pueden entender por qué determinadas respuestas son mas adecuadas a
determinados estímulos antecedentes y en función de las consecuencias que hayan seguido a las respuestas con
anterioridad, un mecanismo que establece reglas de ejecución y no solo de aprendizaje.
REGLAS DE EJECUCION OPERANTE.
Pero la asociación no es solo lo que marca la fuerza de la respuesta y algunos psicólogos han propuesto
aproximaciones conductuales siguiendo las teoría de Skinner donde propone que en el condicionamiento operante
los reforzadores seleccionan respuestas sin asociación concreta. Los estímulos ambientales son moduladores de las
reacciones entre respuestas y reforzadores. Según esta concepción hacemos distinción entre estímulos condicionado
(condicionamiento clásico) y estimulo discriminativo (condicionamiento operante)
Teoría de la probabilidad diferencial
Premack señalo que las respuestas que acompañan a los estímulos reforzadores son altamente probables, las de
actividades instrumentales, son menos probables. Para que una respuesta se convierta en reforzadora viene
determinada por su probabilidad de ocurrencia en la línea base.” Ante dos respuestas en un procedimiento
instrumental la respuesta mas probable reforzará a la menos probable y la respuesta menos probable no reforzara a
la mas probable.
PRINCIPIO DE REFORZAMIENTO DE PREMARK. Tiene dos supuestos fundamentales para que una actividad se
convierta en reforzador eficaz.
Primero: dicha actividad debe ser preferida en la línea base.
Segundo: la probabilidad de ocurrencia de la actividad preferida debe ocurrir de forma contingente con la realización
de una actividad menos preferida, que se convierte en instrumental.
Como resultado de la operación de reforzamiento la actividad reforzadora ocurre a menor probabilidad que en
condiciones de libre acceso y la actividad instrumental aumenta su probabilidad de ocurrencia, como ocurre
generalmente en el condicionamiento operante.
Dos grupos de niños según si les gusta mas comer golosinas o jugar a la play. Los niños que preferían comer
golosinas jugaban mas para conseguir dulces, los que preferían jugar a la play no aumentaron su tasa de juego.
También dijo que la actividad de mas baja probabilidad puede castigar a la de mayor probabilidad y las actividades
mas preferidas no pueden castigar a las menos preferidas.
Pero en una prueba de libre elección no podemos saber la razón última de porqué los sujetos prefieren una actividad
mas que otra por lo que nos remitimos al corte biológico.
La teoría de la probabilidad tiene un gran poder predictivo. Para predecir si una conducta reforzara a otra basta con
medir sus probabilidades bajo la línea base donde las dos conductas no tienen limitaciones. Una actividad reforzara a
la otra siesta es mas probable que la otra en la situación de línea base. Pero es compleja en cuanto a la medida de la
probabilidad de la respuesta. Se puede medir la frecuencia si es accionar una palanca, pero no si es comer un bocado
o toda una ración. Premarck sugirió que la probabilidad e respuesta debería considerarse en una dimensión
temporal según el tiempo dedicado a una actividad particular sobre el tiempo total, pero como las probabilidades de
respuesta varían con el tiempo, sugirió que la medida de la respuesta mas apropiada es la probabilidad
momentánea.
Esther González UNED 2014
Página 32
Teoría de la privación de respuesta:
En el condicionamiento operante la probabilidad momentánea de respuesta reforzadora es alta.
Según la hipótesis de privación de respuesta para que una actividad funcione como reforzador eficaz solo es
necesario restringir la realización de dicha actividad en relación con su ocurrencia en el punto de bienestar, pero no
es necesario que dicha actividad sea mas preferida que la que se va a convertir en actividad instrumental.
Rata con dos actividades de libre acceso. El punto de bienestar es cuando bebe 400 veces y realiza 200 giros en la
rueda. Si se le restringe beber, correr es la respuesta instrumental y beber la contingente o reforzada.
Con un programa de reforzamiento donde cada giro de rueda permite beber se pretende determinar cómo se ajusta
la rata a la contingencia aceptando las limitaciones impuestas por el medio.
Aumenta la probabilidad de ocurrencia y disminuye la actividad contingente en relación al punto de bienestar.
Cuando se restringe la actividad de correr, de menor probabilidad que la de beber, el animal tiene que dar
lametones para hacer girar la rueda, en este caso la actividad instrumental (beber) aumenta y la contingente (correr)
disminuye.
Según la ley de igualación a una mayor frecuencia de reforzamiento se debe esperar una mayor tasa de respuesta, es
decir, cuanto mas largo sea el intervalo entre reforzadores, la tasa de respuesta deberá ser menor.
Según la hipótesis de privación de respuesta, predice la tasa de respuesta y la de reforzamiento como una U
invertida y no lineal, a medida que disminuya la frecuencia de reforzamiento, la tasa de rpta instrumental aumenta
para posteriormente disminuís a intervalos entre reforzadores aun mayores.
Tema 6
CONTROL DE LA CONDUCTA POR ESTIMULO.
La psicología estudia la conducta: la pública, privada, refleja, operante, consciente, inconsciente.
La psicología científica establece relaciones causales entre eventos y conducta. Esto nos permite predecir causas y
comportamientos y manipularlos.
Las relaciones funcionales es cuando un evento depende del otro, es decir que la aparición de B está controlada por
la aparición anterior de A. El control del estímulo implica ajuste al ambiente. El organismo depende de su capacidad
para adaptarse a la exigencias del ambiente y del control por los estímulos juega un papel fundamental en esa
adaptación. Un organismo ante las variaciones del estímulo puede mantener el control o perderlo. Una posición o
otra depende del ambiente.
CONTROL PAVLOVIANO Y CONTROL OPERANTE.
Las especies han evolucionado desarrollando ciertas respuestas innatas ante estímulos EI EI y el EC funcionan como
estímulos control para respuestas (RC y RI). La conducta operante no se activa automáticamente ante un estimulo.
La respuesta depende de múltiples factores y su predicción es probabilística. La conducta operante no está
controlada por un estimulo antecedente.
Esther González UNED 2014
Página 33
Los eventos de control de la conducta operante, se denominan estímulos discriminativos y se dividen en positivos
(discriminativos) y negativos (delta). El ambiente selecciona en cada momento la respuesta=consecuencia adecuada.
Los estímulos discriminativos:
1. Modifican la probabilidad de emisión de conducta, no son exclusivos.
2. No modifica la probabilidad de cualquier operante, solo las que han tenido reforzamiento, castigo o
extinción.
3. La presencia de un discriminativo, no implica aparición de reforzador, solo la posibilidad de conducta
reforzada.
4. Si la conducta esta bajo un discriminativo positivo debe haber uno negativo para esa conducta.
5. Igual que el control del EC puede extinguirse, el control discriminativo puede desaparecer
El control pavloviano usa dos términos (EI=RI o EC=RC) , la operante tres porque cuenta con los estímulos
discriminativos que la controlan.
GENERALIZACION Y DISCRIMINACION.
Un estímulo puede ser cualquier evento que produzca una reacción en el sujeto, es decir, que cumpla la función de
estimulo. Como preguntar la hora. Un estimulo puede ser
 exteroceptivo si proviene del medio externo al organismo (el sonido de un claxon)
 interoceptivo si proviene del medio interno (malestar gástrico).
 propioceptivos son los generados por posición y movimiento del cuerpo
 relacionales es cuando dos o mas elementos mantienen relación y no significan nada por si solos.
Los estímulos están compuestos por rasgos o propiedades (un círculo rojo, puede ser grande, brillante, con olor, con
movimiento, con dirección) y estas propiedades pueden ser compartidas por otros eventos, que cada observador
puede etiquetas como estímulos diferentes.
La novedad no es absoluta. No existen dos estímulos iguales, ni completamente diferentes. Dos figuras iguales no
comparten espacio-temporal. Para que un individuo se comporte de la misma manera ante estímulos semejantes,
se han desarrollado dos capacidades complementarias y contrarias: la generalización y la discriminación.
Cuando un estimulo adquiere control sobre la conducta todos los rasgos del estimulo adquieren control, aunque no
en la misma medida, por lo que los estímulos que comparten los mismos rasgos, adquieren cierto control ¿rojo=
peligro, pasión). Debido al valor adaptativo, nos comportamos de una manera efectiva ante estímulos nuevos.
Pero no siempre generalizamos, en ocasiones pequeñas diferencias entre estímulos comportan diferentes
conductas. Mi llave del coche es igual que la de la casa, pero ante las dos llaves mi conducta es diferente, en función
del estimulo que esté presente.
La discriminación es responder de manera diferente ante estímulos diferentes y requiere de entrenamiento que se
denomina condicionamiento discriminativo o respuesta diferencial.
Ejemplos de entrenamiento discriminativo:
Control pavloviano: se presenta un sonido (EC1) y una descarga (EI). La luz (EC2) se mantiene con la descarga. Si el
sujeto dicrimina entre el EC1 y el EC2 y la rspuesta condicionada se emite ante los dos estumulos o ante ninguno,
concluiriamos que no exite control.
Control operante: Reforzamiento positivo de una conducta correlaciona con una luz roja (E1) y negativo con una
verde (E2) si el sujeto emite respeusta con mayor frecuencia en E1 que en presencia de E2 consideramos la luz roja
como discriminativo positivo para esa conducta. El sujeto discrimina entre ambos estímulos, si conducta se
encuentra bajo el control de estos.
 El control del estimulo es un continuo con extremos de generalizacion y discriminacion en posiciones
opuestas. Ante alta generalizacion baja discriminacion y vicerversa. Mayor control del estímulo mayor es la
discriminacion.alto grado de generalizacon bajo control del estímulo.
 La generalizacion y la adaptacion son igual de adaptativas. El grado de adaptacion depende del ambiente.
Discriminar entre tonalidades de blanco puede estar bien en el polo norte, no en el cairo. Cuanto mauor
discriminacion tengamos entre est´`imulos, mas fino es nuestro ajuste al medio, ya que emitimos respuestas
ante peuqeñas variaciones del contexto.
 La generalizacion y la discriminacion, se pueden producir con todos los estímulos que ejercen control sobre
la conducta, incluso los discriminativos.
MEDICION DEL CONTROL POR ESTIMULO: LOS GRADIENTES DE GENERALIZACION.
Esther González UNED 2014
Página 34
Pavlov describio la generalizacion como un proceso neurologico primario en el que la activacion de ciertas areas
cerebrales, provocada por la presencia del EC, se extiende a areas proximas asociadas a otros estímulos similares.
Lashley y wade conciben la generalizacion como un fallo en la discriminacion. Las pruebas de generalizacion en las
que se presentas estímulos nuevos, crean confusion en los individuos, de manera que guian su respuesta en funcion
del parecido con el E entrenado. El estimulo no entrenado será el estimulo prueba o generalizado y eherce sobre la
conducta contol directamente proporcional a su semejanza con el estimulo que adquirió ese control durante el
condicionamiento.
Metodos para comparar la relacion entre E original que adquiere el control y otros semejantes:
 Estimulo unico: consiste en entrenar para que un estimulo adquiera el control (E+o E-)y luego someterlo a
un estimulo diferente per parecido al original. Se observa que cuanto mayor es el parecido, mayor es la
fuerza de respuesta. Son los mas costosos. Mayor control de las variables individuales.
 Estímulos multiples: es estimulo que adquiere el control se presenta junto con otros estímulos diferentes,
uno cada vez. Se mide la fuerza de respuesta de las combinaciones. Esta deberia decrecer en funcion de lo
distinto que sea el estimulo prueba del original.
 Generalizacion mantenida: alternamos ensayos reforzados con el estimulo control, con ensayos donde el
estimulo prueba está en extincion. Así el sujeto tiene contacto con todos los estímulos prueba generalizados
varias veces y en otden aleatorio.
El orden es importante porque puede alterar la respuesta. La presentacion repetida o el contrabalanceo del
roden, es una forma de controlar ese efecto.
El gradiente de generalizacion es la representacion grafica del decremento en la fuerza de la respuesta en funcion
del alejamiento en cuanto al parecido con el estimuolo criterio.
Silencio conductual, cuando los estímulos condicionados inhibitorios que ejercen control sobre la respuesta, y no se
puede medir directamente.
Cuando la mauor cantidad de respuesta se observa en los valores ceracanos al E+ original y van decreciendo según
se alejan de el, tanto si disminuye como si aumenta el valor del rasgo, la grafica tiene forma de U.
La forma del gradiente no solo
informa de la naturaleza del estimulo,
sino que además en función de la
pendiente del gradiente, informa del
grado de
generalización/discriminación que
muestra el sujeto. Cuanto mas plana
es la pendiente mas generalización se
ha producido y menos discriminación
y al contrario.
No solo nos permite confirmar la existencia o no de respuestas diferenciales, sino también determinar cuanto tiene
que modificarse el ambiente para producir un cambio en la conducta del individuo.
CONTROL CONDICIONAL:
Cuando el control lo ejercen ciertos estímulos sobre nuestra conducta o depende de la presencia de otros eventos,
estamos ante un caso de control condicional. Estos eventos no afectan directamente a la conducta sino a través de
estímulos de control simple modificando su función.
El control condicional necesita un MODULADOR, requiriendo una contingencia mínima de 3 términos (Ed-R-Er), el
nuevo evento control denominado ESTIMULO CONDICIONAL, aumentaría el número de elementos a 4.
MODULACION: FACILITACION , ESTABLECIMIENTO DE LA OCASIÓN. Es lo mismo con diferente terminología.
Robert rescorla y peter Holland, empezaron a estudiar el control condicional pavloviano.
Si una luz va tras un sonido y la aparición de comida, pero en ausencia de luz el mismo sonido no va seguido de
comida, la luz terminará modulando la función del sonido como estimulo condicionado excitatorio apetitivo.
Podemos observar que:
Esther González UNED 2014
Página 35
La contingencia EC-EI es positiva tras la luz pero negativa cuando no aparece. EC es excitatoria apetitiva si aparece la
luz y la EC es inhibitoria apetitiva si no aparece la luz.
La luz (el modulador) no mantiene relación de contingencia con el EI, ni negativa ni positiva. La aparición de la luz
predice la presentación de comida en un 50 % y la no presentación en un 50 %, por lo que no predice nada en
absoluto ya que mantiene una relación de acontingencia a correlación nula. Los estímulos que adquieren
propiedades moduladoras no elicitan por si mismo respuestas excitatorias ni inhibitorias, sino que modifican la
función de los EC con los que se han asociado. El efecto de un modulador no se pierde por su exposición frecuente
siempre que no se quiebre la conexión que mantuvo con la relación EC-EI durante la fase de adquisición.
DISCRIMINACION CONDICIONAL: Lashley fue de los primeros en identificar las propiedades físicas de los estímulos
controladores. Experimento de 2 triángulos, ratas, cajas y el fondo de diferente color cada 20 ensayos. Con este
experimento se comprobó que la dirección o sentido de la reacción era condicional con respecto a un estimulo
adicional “REACCION CONDICIONAL”. El fondo podía ser alterado aleatoriamente de un ensayo a otro sin perjudicar
la ejecución de los sujetos que mantenían el control adquirido.
Las discriminaciones condicionales son aquellas situaciones de control operante en las que la función de los
estímulos discriminativos depende de la presencia de otro evento, el estimulo condicional. La contingencia operante
aumenta de tres a cuatro EC-E-R-C.
La presencia de un estimulo condicional determina la función del estimulo discriminativo y por tanto su control
sobre la conducta. el estimulo condicional por si solo no controla ninguna respuesta sino la interaccion entre el
condicional y el discriminativo.
Las medidas típicas de ejecución en una discriminación condicional son la velocidad de adquisición (nº de ensayos o
sesiones hasta un determinado criterio de aprendizaje)y la precisión (porcentaje de ensayos con rpta correcta). Otra
medida es la latencia.
El criterio de igualación que determina el estimulo de segundo orden puede ser de igualdad, de semejanzas de
diferencia.
FACTORES QUE AFECTAN AL CONTROL POR EL ESTIMULO
Cuanto mas se diferencian dos situaciones mas sencillo es distinguirlas y cuanto mas se diferencian los elementos
que las componen, mayor será la diferencia global.
RELACIONADOS CON LOS ESTÍMULOS:
Capacidad sensorial: solo reaccionamos ante sonidos, colores olores y no ante un evento completo. Los órganos
sensoriales se han desarrollado para la supervivencia según cada especie y permite que el organismo reacciones
ante las propiedades de un evento y ante otras no. Esto también pasa entre individuos de una misma especie, ya que
el desarrollo de estos órganos esta sujeto a variabilidad. Una pirámide es un triangulo si no podemos ver las otras
caras. El tamaño es diferente en función de la distancia que separa el objeto del observador. Un evento es único, el
estimulo diferente para cada individuo.
Facilidad relativa de condicionamiento de los elementos de un compuesto: si un estimulo discriminatorio está
compuesto de dos componentes la adquisición del control por parte de componente menos saliente puede ser
impedida por un componente mas eficaz. El fenómeno de Ensombrecimiento indica que los estímulos pueden
competir por adquirir el control sobre la conducta de manera que los mas intensos dificultan el condicionamiento de
los mas débiles.
Modalidad sensorial: los estímulos visuales han sido los mas comunes en experimentos de discriminación. El sistema
visual de las palomas las hace apropiadas para discriminar este tipo de estímulos, suponemos que debido a la
navegación, forrajeo y elección de pareja. Esto nos ha permitido afirmar que hay ciertas características de las
imágenes que son mas efectivas que otras en el entrenamiento de discriminación. Es mas discriminativo los colores
que las figuras geométricas.
Discriminabilidad: entre dos estímulos cuanto mayor las diferencias de las características físicas de lso estímulos,
mas sencilla es la tarea de discriminarlos. Pero las tareas mas simples no nos garantiza una medida fiable de
discriminalidad. Factores inherentes a una situación experimental como la asociación y la respuesta, son efectos que
se mezclan haciendo que la discriminalidad entre dos estímulos sea un índice que solo pueda averiguarse a
posteriori.
Intensidad de los estímulos discriminativos: la mayoría de los gradientes generados por estímulos de prueba
intensos suelen responder a una función monotonica en lugar de una curva de máxima respuesta. Esta función es
creciente. Cuando el E+ es mas intenso que el E- y decreciente en caso inverso.
Esther González UNED 2014
Página 36
Aprendizaje del rasgo positivo: cuando el elemento predictivo que distingue al E- del E+, los sujetos aprenden con
mayor facilidad E+ Palomas y teclas verdes con cuadrados blancos como rasgo positivo aprenden antes.
RELACIONADOS CON LA RESPUESTA:
Relacion respuesta- reforzador: otro factor que puede adquirir el control es la naturaleza de la respuesta requerida
para obtener el reforzador. La respuesta de los perros ante sonidos derecha-izquierda era controlada por la posición
de los sonidos pero actuar o no actuar era controlada por la naturaleza de los sonidos. Esto nos lleva a la conclusión
que las respuestas que están diferenciadas por la localización quedan bajo el control de la posición de los estímulos
discriminativos, y las respuestas que están diferenciadas por su naturaleza, quedan bajo el control del tipo de
estímulo.
Respuesta de observación a la muestra: cuando se refuerza alguna conducta del sujeto orientada al estimulo
condicional. Ej: retener la aparición de los estímulos de comparación hasta que el sujeto toca la muestra.
Otro efecto es que parece influir en el nivel asintónico de la discriminación. Se comprobó que después de la
adquisición de una discriminación en la que se requería picar a la muestra, el porcentaje de aciertos bajo entre un
10 y 25 % cuando se elimino este requisito. La propia conducta es el elemento muestra a discriminar porque el nº de
respuestas puede facilitar la adquisición del aprendizaje.
Respuesta diferencial: puede ser que se den respuestas diferentes ante cada estimulo control, bien como requisito
del entrenamiento, o bien como algo espontaneo de conductas diferenciales. Estas respuestas pueden aparecer
aunque las contingencias del experimento no lo requieran e incluso aunque se castigue por ello.
RELACIONADOS CON LA EXPERIENCIA PREVIA
La historia del sujeto, no solo influye en la velocidad sino en el grado de generalización.
Disposiciones de aprendizaje: aprendizaje con monos que premiaba la respuesta correcta y ocultaba los objetos ante
la incorrecta. Al principio el aprendizaje fue lento, pero a mayor numero de problemas resueltos, el aprendizaje
aumentaba con lo que del problema 257 al 312, los animales respondieron correctamente al segundo ensayo el 97%
de las veces. En ratas la velocidad de aprendizaje es mayor en los que tienen experiencia. Según Lawrence se debe a
la atención. Seraganian no cree que sea la atención lo que mejora sino la capacidad general para resolbver
problemas de discriminación y no solo el hecho de atender a un rasgo concreto.
La experiencia favorece las habilidades generales de resolución de problemas. Los cambios intradimensionales se
aprenden mejor que los interdimensionales.
Efecto del sobreaprendizaje en la inversión: Mackinstosh entreno ratas para realizar discriminación con el mismo
criterio de eficacia, uno de los grupos tuvo 100 ensayos adicionales. Luego entreno a los dos grupos en
discriminación inversa. Los de sobreaprendizaje aprendieron la discriminación inversa antes.
Experiencia de reforzamiento no diferencial: ratas, fondo gris o a rayas. Reforzamiento 100 % o 50 % no hay
diferencias entre grupos de fondo gris independientemente del reforzamiento. Si hay diferencia entre fondo a rayas
a los del reforzamiento al 50 % les costo el doble aprender la discriminación. El reforzamiento diferencial en fase 2
mantuvo la atención de los sujetos expuestos a el. Los entrenamientos discriminativos potencian la atención,
reduciendo la generalización.
RELACIONADOS CON EL ENTRENAMIENTO DISCRIMINATIVO:
Tipos de entrenamientos discriminativos: debemos saber si los estímulos discriminativos van a aparecer juntos o por
separado. Si aparecen juntos se considera un entrenamiento simultaneo. Con entrenamiento los sujetos solo
responden al estimulo discriminativo positivo. El procedimiento de discriminación de respuesta o no respuesta es
cuando el sujeto no aparecen los estímulos antecedentes al mismo tiempo y el sujeto acaba respondiendo solo al
estimulo discriminativo y no al delta. La adquisición de discriminaciones simples son mas lentas cuando el
procedimiento es simultaneo. La demora en la presentación del estimulo muestra y los estímulos comparativos
afecta a los índices de ejecución en discriminaciones condicionales. La duración máxima de demora que se puede
tolerar, depende de las diferencias entre especies. Eliminar la muestra en el momento en que aparecen las
comparaciones aumenta el número de ensayos necesarios para aprender la discriminación con respecto a una
discriminación condicional simultánea.
Eficacia relativa de los elementos del estimulo como señales para el reforzamiento:
Luz+tono 1 reforzado 50%; luz+tono 2 reforzado 50%) ( luz +tono 1 reforzado 100%; luz + tono 2 reforzado 0%).
Esther González UNED 2014
Página 37
Los resultados sugieren que los estímulos discriminativos tienen un poderoso efecto sobre la conducta, no solo
porque están emparejados con el reforzador, sino que señalan la forma y el momento en que se va a producir el
reforzamiento. Si un estimulo es mejor predictor de la disponibilidad del reforzamiento que otro, es mas probable
que adquiera el control de la conducta operante.
Tipo de reforzamiento: el control por el estímulo depende de la eficacia relativa del estimulo como señal para el
reforzamiento y de la naturaleza del reforzador utilizado. Unos ejercen mas control sobre la conducta con
reforzamiento positivo que negativo. La luz consigue mas control que el sonido dando comida. Dando descarga
eléctrica, el sonido consigue mas control que la luz. El control esta determinado por el tipo de reforzamiento que se
utilice. Los estímulos visuales tienen mas probabilidad de control sobre conducta reforzada positivamente y los
auditivos mas control sobre la conducta negativamente reforzada.
Consecuencia diferencial: las tareas de discriminación simple con palomas y ratas demuestran que si se usan
consecuencias diferenciales para cada combinación entre el estimulo discriminativo y la respuesta mejroa la
discriminación. Ante el estimulo E1 tiene que emitir respuesta R1 para recibir consecuencia C1 e igual con el E2. El
reforzamiento diferencial favorece la adquisición de la discriminación condicional.
Duración del intervalo entre ensayos: entre 0 y 60 segundos entre ensayos muestran que un intervalo 0 muestra una
ejecución de niveles al aza, mientras que los de 26-60 segundos exhibían mejores desempeños de tarea. Pero la
duración del intervalo ejerce poco efecto sobre la presión, excepto cuando el intervalo se elimina por completo.
Grado de entrenamiento: cuanto mayor el entrenamiento para la adquisición de la discriminación mas acusado es el
gradiente formado en la prueba de generalización, es decir menor generalización se observa.
Los gradientes de generalización se acusan mas en función del nº de sesiones de entrenamiento.
Entrenamiento en discriminación “sin errores”: minimiza las respuestas al E-, reduciendo el nº de errores cometidos
por el sujeto como las reacciones emocionales asociadas a la aplicación de extinción o castigo.
Terrace palomas luz roja E+ misma intensidad siempre: E- luz verde intensidad baja en aumento hasta equipararse
con E+. los sujetos pueden adquirir discriminación simple sin cometer errores es decir sin responder al E-.
Intervalo entrenamiento prueba: el paso del tiempo aumenta la generalización, los estímulos diferentes al E+ ejercen
mayor control cuanto mas lejana la finalización del entrenamiento.
INTERACCIONES EXCITATORIAS- INHIBITORIAS:
Desplazamiento del máximo: Hanson, 1959, discriminación de sonidos de longitud de onda con Palomas. Se
comprobó la respuesta ante diferentes estímulos de prueba. Spence dice que el entrenamiento en discriminación
incide tanto en el discriminativo positivo como negativo (excitatorio como inhibitorio) por lo que ambos estímulos
adquieren el control del comportamiento que puede generalizarse a otros estímulos semejantes, de manera que los
estímulos prueba mantienen parecido con el E+ i el E-. destaca que todos los estímulos tanto condicionados como
generalizados, tienen efecto excitatorio como inhibitorio de manera que el efecto ( la conducta provocada) se
entiende como la suma de ambas tendencias. Para calcularlo se toman las medidas hipotéticas del E+ y E- como si se
hubiera entrenado una discriminación intradimensional. El gradiente solo está mostrando la fuerza excitatoria de
cada estimulo de prueba presentado, pero para realizar la suma de tendencias es necesario contemplar la fuerza
inhibitoria y tomaremos como valor de referencia el máximo de respuesta observada en cada gradiente.
Efecto de tendencia central: define que la respuesta generalizada no se basaría en respuestas a las características
fijas absolutas de los estímulos, sino a sus referencias relativas en función de los estímulos con los que tiene
experiencia. Solo se ha comprobado en sujetos humanos y no todas las investigaciones obtienen resultados
coherentes, en algunos casos se usan reconocimientos de caras y no se observa esta respuesta relacional.
TEORIAS SOBRE LA GENERALIZACION.
¿Por qué un estimulo que nunca ha participado en una contingencia de aprendizaje puede ejercer control sobre la
conducta de un individuo?
PAVLOV la irradiación, semejante al efecto onda al tirar un objeto al agua. Cada estimulo produce excitación en una
zona concreta del cortex cerebral, de manera que estímulos parecidos pueden activar zonas adyacentes, la
Esther González UNED 2014
Página 38
irradiación se volvía mas débil a medida que aumenta la distancia del centro de excitación correspondiente al E+
original.
HULL el cerebro no percibe los estímulos como algo único, sino que cada rasgo era registrado con una horquilla de
valores. Cuando un estimulo adquiere control sobre cierta conducta, ese control no es exclusivo del valore de las
dimensiones sino es comparado con otros estímulos
Hipotesis inversa: Blough: mantiene que la generalización se debe a que los sujetos no pueden discriminar entre
estímulos de prueba a los que son expuestos, es decir, la capacidad de los sujetos para discriminar ciertos estímulos
determina si mostraran o no generalización. Concluyo que la visión de las palomas es especialmente sensible a
variaciones, por lo que son capaces de distinguir mejor colores que otros.
Teoria atencional: shutherland y mackintosh: el fallo en la discriminación (responsable de la generalización) se debe
a la falta de atención hacia el rasgo pertinente del estimulo discriminativo, del que correlaciona con el
reforzamiento. Siguen dos procesos:
El cerebro recibe y procesa la información sensorial a través de analizadores específicos que representan cada
dimensión del estimulo por separado (color, brillo, tamaño… ) al inicio del entrenamiento antes del reforzamiento
diferencial, la fuerza de cada analizador dependerá de la saliencia de la dimensión. El reforzamiento afectaría a la
fuerza de los analizadores activos, de manera que la dimensión mas aliente, a la que estamos prestando atención se
condicionaría mas que el resto.
Se desarrolla un vinculo entre la respuesta especifica y un analizador, por ejemplo, el reforzamiento establecería una
unión entre elegir la tecla roja en lugar de la verde y el analizador correspondiente al color.
Respuesta múltiple: staddon: en un experimento de psicología la VD es la conducta del sujeto. Los estudios con
animales requieren otras variables que delimitan los eventos de observación. Por ejemplo se refuerza la respuesta
(picar techa, presión palanca, corredor y se miden los parámetros de frecuencia, latencia, intensidad ante los
estímulos y se observa la conducta objetivo. Esta teoría propone romper con esta concepción y analizar el resto de
conductas. Staddon diferencia entre dos categorías de conductas: las terminales controladas por la presencia del E+
y fortalecidas por aparición del reforzador y las de interin ausencia de E+ o presencia de E- y que son reforzadas por
otros eventos diferentes.
Esther González UNED 2014
Página 39
Tema 7
CONTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE.
El miedo y el control afectan a nuestra manera de actuar.
Se ha estudiado como respuesta física (pavlov) o biológica ( cannon).
Ante una amenaza si existe una salida, la reacción mas probable es la huida, si no la tiene es la parálisis. La variedad
de estímulos aversivos es amplia, pero podemos definirlos como aquellos que elicitan algún reflejo defensivo.
También afecta a las reacciones del futuro (semáforo rojo, claxon). En ambientes mas salvajes los estímulos
aversivos son mas adaptativos y el sujeto dispone de mecanismos de aprendizaje.
También afecta el ambiente, el tiempo, la sorpresa, es probable que no siempre aparezca el EI-.
Estimulacion aversiva en el condicionamiento operante.
Procedimiento del condicionamiento operante: se pueden clasificar según:
 El efecto sobre la conducta si aumenta la probabilidad de conducta se llama reforzamiento, si la reduce, se
llama castigo. Si la correlación respuesta-consecuencia es directa se dice es positivo, si es inversa, se le
añade negativo. Hay 4 procedimientos:
o Entrenamiento de recompensa o reforzamiento positivo: respuesta + contingencia +, consecuencia
+= aumenta probabilidad de conducta.
o Entrenamiento evitación/escape o reforzamiento negativo: respuesta -, contingencia -, consecuencia
-= aumenta probabilidad de conducta.
o Castigo o castigo positivo: respuesta y consecuencia+ consecuencia -= reduce la emisión de
respuesta operante.
o Entrenamiento de omisión o castigo negativo: respuesta y contingencia – consecuencia+= no
emisión de respuesta en el futuro.
Castigo, escape y evitación:
Para el reforzamiento negativo hay dos variantes: evitación y escape.
Aunque tienen características en común muestran importantes diferencias:
 En el escape la consecuencia aversiva está presente y no desaparece hasta la emisión de la conducta
operante. Que es reforzada por supresión del evento aversivo en curso.
 En la evitación, el sujeto es expuesto a la presentación periódica de alguna consecuencia aversiva y la
emisión de la operante impide o retrasa su aparición. La respuesta operante no se emite mientras el
estimulo aversivo se encuentra presente sino antes de que haya desaparecido. (llamamos para avisar que
llegamos tarde)
 En el castigo todos los procedimientos son para reducir la conducta. no mantiene relación con la aparición
de estimulación aversiva. Castigo positivo, es decir la conducta va seguida de un estimulo aversivo. La
efectividad del castigo depende de la supresión de la respuesta.
Procedimientos de condicionamiento operante y estados emocionales.
Una orden de siéntate a la mascota que reforzamos con comida, el sentarse es un discriminativo positivo, pero la
comida es consecuencia que provoca salivación y convierte los eventos antecedentes en estímulos condicionados
excitatorios apetitivos.
 Los discriminativos positivos como las conductas de evitación o escape, generan estados de alivio en los
sujetos,
 Los estímulos delta (respuestas castigadas) como las propias conductas castigadas producen ansiedad.
 Un estimulo incondicionado aversivo provoca miedo.
El castigo (sobretodo el positivo) tiene efectos emocionales que inhiben la conducta apetitiva y cualquier operante
en general.
La estimulación aversiva producida por la respuesta es mucho mas eficaz que la estimulación aversiva independiente
de la respuesta para suprimir la conducta.
TEORIA DE LA RESPUESTA EMOCIONAL CONDICIONADA: Estes (1944) Un EC excitatorio aversivo provoca respuestas
emocionales (como la paralización) por el hecho de estar emparejadas con una descarga. Estas respuestas
Esther González UNED 2014
Página 40
emocionales condicionadas son incompatibles con la respuesta de la presión de la palanca ( no se puede quedar
paralizado al mismo tiempo que pulsa la palanca). Po lo que la presión de la palanca se suprime durante las
presentaciones del EC. No obstante a diferencia de la supresión condicionada, los procedimientos de castigo no
incluyen un EC explicito que señale la administración de la descarga. Estes sugirió que cumplen esta función los
diversos estímulos ( visuales, táctiles y propioceptivos) que el sujeto experimenta antes de dar la respuesta
castigada como la visión de la palanca, los discriminativos (luces, sonidos), orientación del cuerpo o postura antes de
responder, etc.
CONDUCTA DE EVITACION:
(luz de reserva en el coche, buscas gasolinera).
La velocidad de adquisición como el nivel de ejecución de la supuesta RC era mayor en el grupo que podía evitar la
descarga que en el que no. Esto demostraba que había diferentes conductas de aprendizaje.
Procedimientos de evitación:
Evitación discriminada: hay claves que señalan el acontecimiento aversivo, (una descarga). El resultado depende de
lo que haga el sujeto:
 No emite respuesta para la evitación entre la señal y el EI aversivo se llama ensayo escape.
 Si emite respuesta antes del EI aversivo, la señal cesa y se omite el EI, se llama evitación con éxito.
En un procedimiento de evitación discriminada hay tres elementos: la señal de aviso, la respuesta operante y la
consecuencia aversiva.
 Contingencia respuesta-señal de aviso: la emisión de respuesta operante conlleva la desaparición de la señal
de aviso, la contingencia será de escape.
 Contingencia respuesta-consecuencia: la contingencia será por evitación
 Contingencia señal de aviso-consecuencia: antes que el sujeto adquiera la respuesta de evitación la señal de
aviso y la consecuencia ocurren conjuntamente. Cuando el sujeto consigue evitar con su respuesta la
descarga programada, se rompe la contingencia y aparece la señal de aviso, pero no la consecuencia.
Esto requiere gran cantidad de ensayos. Las ratas y palomas aprenden rápido y otros lentos, por lo que la elección
de la operante que se pretende reforzar determina el tiempo necesario para adquirirla y cuanto mas se asemeje a la
respuesta elicitada de la especie mayor es la velocidad de aprendizaje.
TEORIA BIFACTORIAL : Mowrer (1947), dice que en el aprendizaje de evitación están implicados dos procesos
interdependientes: el condicionamiento clásico de mido al EC y el reforzamiento operante de la respuesta de
evitación a través de la reducción del miedo. Reducción del miedo y no por impedir el EI. esta teoría predice una
interacción entre el proceso clásico y el operante, con cambios cíclicos en la respuesta de evitación:
 La señal se condiciona de forma excitatoria aversiva mientras el sujeto no emite la respuesta de evitación
 El sujeto emite la respuesta para escapar del miedo generado por el EC, impidiendo aparezca el EI
 Una vez extinguido el EC deja de emitir respuesta volviendo a presentarse el EI.
Schoenfeld dice que la señal adquiere, por condicionamiento clásico funciones de consecuencia aversiva secundaria
o condicionada. La evitación es una situación de reforzamiento negativo secundario o condicionado. Schoerfeld no
considera necesario aludir al efecto emocional en proceso.
Evitación no discriminada del operante libre de Sidman.
La descarga se programa para que ocurra periódicamente sin aviso cada 10 segundos y se obtiene como respuesta
de evitación una determinada conducta y la aparición de respuesta impide la administración de la descarga durante
un periodo fijo de por ejemplo 30 segundos. Se utilizan dos intervalos de tiempo:
Intervalo E-E, Er-Er o reloj choque-choque: intervalo entre descargas en ausencia de una respuesta.
Intervalo R-E, E-Er o reloj respuesta-choque: que es el intervalo entre la respuesta y la descarga programada, es
decir, el periodo de seguridad.
Las respuesta de evitación se dan en cualquier momento, ya que reinician el intervalo R-Ei por eso se llama evitación
de operante libre.
Se diferencia de la evitación discriminada:
Periodos mas largos de entrenamiento que en evitación discriminada.
Después del entrenamiento, los animales nunca aprenden a evitar todas las descargas.
Los sujetos se diferencian de la forma de responder ante el mismo procedimiento de evitación operante libre.
La HIPOTESIS PROPIOCEPTIVA, siguiere que el aviso lo ocupa la propia conducta de operante libre. Todas las
conductas que realiza el sujeto en la situación experimental, quedan asociadas a la aplicación de la descarga, por lo
Esther González UNED 2014
Página 41
que sufrirá la misma ansiedad que el sijeto con procedimiento de evitación discriminada ante la señal de aviso . la
única manera de escapar de la ansiedad es emitiendo la operante reforzada.
HIPOTESIS INTEROCEPTIVO-TEMPORAL seria el paso del tiempo el que produciría la ansiedad que conduce al sujeto
a responder.
HIPOTESIS DE LA SEÑAL DE SEGURIDAD: los estímulos asociados a los periodos de seguridad provocados por la
respuesta de evitación se convierten en estímulos condicionados inhibitorios aversivos por su contingencia negativa
con la descarga. Por lo que los estímulos que siguen a la respuesta de evitación acaban funcionando como un
reforzador para esta.
La evitación de descarga aleatoria de Hernstein-hineline
La evitación de sidman es discriminativa, aunque el experimentador no programe ninguna señal de aviso al
presentar las descargas en intervalos temporales fijos los estímulos internos pueden adquirir esa función.
El reforzamiento de la conducta de evitación no tanto como el resultado de omitir la presentación de la estimulación
aversiva,l sino como el debido a la reducción de su frecuencia total o densidad, entendida como una contingencia
molar negativa entre tasas de respuesta y de consecuencia aversivas.
Variables que afectan al reforzamiento negativo:
Cuanto mayor es la intensidad de la estimulación aversiva, mayor la velocidad de adquisición de la conducta
reforzada negativamente.
Conducta de escape, la intensidad determina la rapidez con al que semita. La familiaridad del sujeto con la
estimulación y la saciedad puede reducir la efectividad del reforzador y de las consecuencias aversivas tanto para la
adquisición como para la supresión.
Según Sidman en la evitación libre, la tasa de respuesta esta determinada por los intervalos e-e y r-e. cuanto mayor
la frecuencia de las descarga en ausencia de respuestas y mayores los periodos de seguridad mayor la probabilidad
de que aprenda la respuesta de evitación. La evitación de descarga aleatoria, nunca será absoluta. Algunas
respuestas pueden ir seguidas de descargas.
CASTIGO:
THORDINKE : el reforzamiento positivo y el castigo implican procesos opuestos. El reforzamiento fortalece la
conducta, el castigo la debilita.
ESTES: Teoría de la respuesta emocional condicionada.
DINSMOOR: TEORIA DE LAS RESPUESTAS COMPETITIVAS REFORZADAS NEGATIVAMENTE: esta teoría explica el
castigo en términos de la adquisición de respuesta de evitación incompatibles con la respuesta castigada. La
supresión de una conducta no se considera un reflejo del debilitamiento de la respuesta castigada, sino que explica
las respuestas competitivas que evitan la estimulación aversiva.
Variables que afectan al castigo:
El castigo positivo consiste en presentar un estimulo aversivo contingente después de una respuesta específica para
la supresión de la respuesta.
Variables de efectividad de castigo:
 Intensidad del estimulo aversivo: cuanto mas intensa sea la estimulación aversiva, mas eficaz suprimir las
respuestas. Puede que la respuesta reaparezca mas tarde, porque la supresión de la respuesta deja de tener
contacto con la consecuencia aversiva la contingencia de castigo no está activa. Esto hace pensar que el
castigo no es un método eficaz para suprimir la respuesta.
 Inmediatez y demora del estimulo aversivo: la alta contigüidad es favorecedor. El aumento de intervalo
entre R-Er produce menor supresión de la conducta. pero se han encontrado los resultados muy parecidos
tanto si el castigo se aplica de manera demorada como inmediata tras la respuesta.
 Cambios graduales en la intensidad de los estímulos aversivo. La forma que se introduce la consecuencia
aversiva, por ejemplo si se utiliza una descarga de alta intensidad al inicio del procedimiento, la operante se
verá suprimida. Si se utiliza un castigo suave al inicio y poco a poco se va aumentando la supresión será
menos. Si la exposición inicial es intensa, aumenta los efectos supresores de un castigo suave posterior.
 Experiencia previa: los efectos del castigo son menores ante un reforzamiento largo y volumen grande.
Esther González UNED 2014
Página 42



-


Efectos discriminativos del estimulo aversivo: si la respuesta se castiga en presencia de un estimulo
discriminativo, pero no cuando el estimulo está ausente. Los efectos supresores del castigo se limitan a la
presencia del estimulo.
Programa de castigo: igual que el reforzamiento que no tenía que administrarse cada vez que se produjera
la respuesta instrumental, el castigo puede administrarse intermitentemente o después de un número fijo
de respuestas (programa de castigo de razón fija) o variable (programa de castigo de razón variable) así
como la aparición de la consecuencia aversiva tras la emisión de la primera respuesta tras un intervalo de
tiempo ( programa de castigo de intervalo, fijo o variable) . todos los programas de castigo continuos son
mas efectivos que los intermitentes.
Programa de reforzamiento compuesto: todo castigo es mixto, ya que castigar requiere que la conducta sea
reforzada.
Castigo sobre líneas base apetitivas: actúan simultáneamente castigo y reforzamiento positivo sobre la
misma respuesta.
Castigo sobre líneas base defensivas: concurren castigo y reforzamiento negativo (escape/evitación).
Castigo sobre líneas base de extinción: se castiga una respuesta previamente reforzada, pero que al aplicar el
castigo está siendo extinguida.
La eficacia del castigo se verá reducida por la eficacia relativa del procedimiento o aumentada por la eficacia
del proceso de extinción de la misma conducta.
Existencia de una conducta alternativa reforzada: a veces la respuesta castigada es la única respuesta que el
sujeto puede realizar para obtener un reforzamiento positivo.
Manipulaciones motivacionales: si se reduce la motivación para realizar la respuesta, es mayor la eficacia de
suprimir la conducta.
La eficacia relativa del castigo para suprimir la conducta.
El castigo tiene que tener en cuenta la consecuencia sobre la conducta y no solo los aspecto s morfológicos de la
misma. Solo podemos hablar de castigo cuando la consecuencia suprime la conducta. puede que al reprender no
solo no estemos suprimiendo, sino que reforzamos la conducta. la reprimenda asociada con una mayor atención
suele ser un reforzador generalizado por lo que hablamos de reforzamiento positivo.
El castigo es un método de control del comportamiento, las leyes, la educación y las reglas sociales, prestan un
cuidado especial a la ética, eficacia de los castigos programados. El castigo es capaz de modelar la conducta pero
puede reaparecer en el futuro.
El castigo conlleva ventajas y desventajas que hay que valorar antes de ponerlo en práctica como técnica de
supresión de la conducta. el castigo es lento y difícil si es la primera vez que se aplica y puede producir ansiedad,
agresión, neurosis, o reajuste de conductas.
Cuando aplicamos un castigo, la intensidad del estímulo determina la efectividad del procedimiento, pero el
contexto ambiental puede provocar ansiedad y el efecto se puede extender a otros estímulos que nunca estuvieron
presentes a través del fenómeno de generalización y trastornos en el comportamiento.
Los eventos ansiógenos disminuyen la tasa de respuesta operante. El castigo no solo puede disminuir la conducta
que anteriormente se ha sometido a algún procedimiento de refuerzo, sino afectar al comportamiento general del
sujeto. El refuerzo depende de muchas variables como nivel de saciedad privación, etc.
Suprimir que un niño interrumpa (conducta reforzada por nuestra atención) mediante castigo puede fortalecer otras
respuestas como subirse a un lugar peligroso ( conducta reforzada por nuestra atención) .
La agresión elicitada es cuando aparece la agresión como respuesta refleja. Esta agresión también puede ser
operante.
Efectos no descartados: fenómenos paradójicos en el castigo:
Cuando lejos de reducir la conducta el castigo la aumenta o tiene un efecto completamente diferente al esperado.
- LA CONDUCTA MASOQUISTA: El discriminativo negativo o estimulo delta, asociado al castigo no es eficaz
para suprimir la conducta. cuando el reforzamiento positivo solo esta disponible cuando se castiga la
operante. El castigo se convierte en una señal o estimulo discriminativo para el reforzamiento positivo. Niño
que hace algo malo, se le da reprimenda y luego cariño del progenitor arrepentido. Si la privación de cariño
es elevada, por lo que aumenta la conducta en lugar de reducirla. La conducta masoquista es mediante el
contracondicionamiento de la consecuencia aversiva. Descargas de poca intensidad las relacionamos con
comida y vamos aumentando las descargas y disminuyendo la conducta, por lo que la descarga adquiere
Esther González UNED 2014
Página 43
propiedades de Ec excitatorio apetitivo, y se convierte en reforzador de conductas operantes y su
presentación actúa como reforzamiento positivo en lugar de castigo.
- CIRCULO VICIOSO: Cuando se entrena una conducta de escape ante un evento aversivo, el propio evento
adquiere funciones discriminativas positivas, por lo que el castigo no tenda efecto de supresión de
respuesta, sino lo contrario.
OTRAS ESTRATEGIAS DE SUPRESION DE LA CONDUCTA: algunas conductas no requieren de castigo para su
supresión.
Entrenamiento de omisión: la probabilidad de que se emita un reforzador es menor si el sujeto emite la
respuesta que si no la emite. Por lo que la forma que tiene el sujeto de conseguir el reforzador es omitiendo la
respuesta. Las variables de la eficacia redactora del entrenamiento por omisión, se parecen a la de evitación. Para
que desaparezca la respuesta los intervalos de presentación de ausencia de respuesta deben ser de menor duración
que tras la respuesta.
el entrenamiento por omisión tiene como efecto inmediato sobre el mantenimiento residual de la respuesta.
Modificación de la fuerza de conductas alternativas: centramos la atención de manera concreta. Cualquier
comportamiento es una conducta de elección pero siempre hay alternativas incluso en situaciones que etiquetamos
de forzadas. Podemos fortalecer una conducta en lugar de castigar, por ejemplo, para suprimir la conducta de
levantarse del asiento en clase, aplicamos un procedimiento de castigo o reforzamos la conducta de estar sentados.
Extinción: de la operante es romper la contingencia positiva o negativa respuesta –consecuencia en
presencia de los respectivos discriminatorios que hará que descienda la operante ante los discriminatorios. La
extinción del control de los discriminativos positivos es un procedimiento muy eficaz para suprimir la operante per
requiere la identificación del reforzador y control sobre la aparición de los reforzadores. La extinción no implica
desaprendizaje ni olvido, es un nuevo aprendizaje que sustituye al anterior pero un cambio de contexto o la
exposición con el reforzador puede restaurar la capacidad de control de los discriminativos que habíamos
extinguidos y por tanto la emisión de la conducta que habíamos suprimido.
Modificaciones motivacionales: el porque sí, porque quiero, porque me apetece, esconden las verdaderas
causas del comportamiento o la falta de motivación de exponerlas. Los reflejos incondicionados son efecto de la
presentación de estímulos incondicionados, los estímulos condicionados causan los reflejos condicionados, la
emisión de las conductas operantes dependen del estado motivacional, historia del reforzamiento y castigo del
sujeto, estimulación presente, y todos los eventos para la emisión de respuesta. La tasa de emisión depende de la
interacción de estas variables y la manipulación de cada una de ellas por separado puede reducir la fuerza de la
operante. La motivación se refiere a la fuerza de una determinada conducta y esta depende de múltiples variables.
La motivación se operativiza atendiendo a la privación/ saciedad respecto al reforzador o bien al valor del propio
reforzador. En el castigo, la motivación se relaciona con el valor del estimulo aversivo. Es posible suprimir una
conducta sin castigo, aplicando la manipulación de variables relacionadas con la motivación. Un reforzador puede
ser primario o secundario, según las propiedades reforzantes si requieren o no aprendizaje por parte del sujeto. La
sobreexposición al EI con el que se condiciona el EC reduce la capacidad reforzante del EC. Si asociamos un
reforzador positivo con uno aversivo provocamos descenso de la emisión de conductas reforzadas con dicho
estimulo.
La capacidad reforzante de un reforzador secundario puede anularse con la extinción y el contracondicionamiento.
El reforzador secundario es susceptible a perder su capacidad elicitadora si se presenta sin ir emparejado con el EI.
La saciedad y la extinción del reforzador son útiles con reforzadores secundarios, pero si estamos saciados de
comida el dinero va a seguir relacionado con otros eventos reforzantes y aunque el transporte sea gratis, el dinero
seguirá manteniendo contingencia con otros reforzadores. Por lo que la sensibilidad a la saciedad y al a extinción de
las conductas mantenidas por reforzadores secundarios generalizados, es prácticamente nula.
PROGRAMAS CONCURRENTES Y ESTIMULACION AVERSIVA.
Conducta de elección: medida como la localización de sus respuestas en una u otra opción, eran función de la
frecuencia relativa de reforzamiento de cada una de las alternativas. Los resultados llevaron a definir la LEY DE
IGUALACION (B1/B2)= (r1/r2) donde 1 es una alternativa y 2 el sumatorio, B son las elecciones y r el valor del
reforzador.
Elección y reforzamiento negativo: Baurn comprobó cómo se ajustaba la Ley de Igualación a la conducta controlada
por escape usando descargas como evento aversivo y el tiempo de estancia en una localización de la caja como
conducta de elección. El ajuste de elección de los sujetos a la frecuencia de reforzamiento de cada alternativa fue
aumentando. Se comprobó que las tasas de refuerzo negativo funcionaban de la misma forma que la reducción de
reforzamiento positivo, pero solo se comprobó en 2 de las 4 palomas.
Esther González UNED 2014
Página 44
Hutton, Gardner y Lewis también entrenaron palomas para responder ante el reforzamiento positivo para mantener
respuesta de programa concurrente sin y con periodos de descargas. Los resultados mostraron en función de la
frecuencia alternativa de reforzamiento negativo de cada alternativa, un importante ajuste a la Ley de la Igualación,
pero no fue un ajuste perfecto.
Longue y de Villiers, lo intentaron con ratas, pero estos experimentos eran mas complicado porque la respuesta de
esta especie ante una descarga es la parálisis. Los resultados mostraron un buen ajuste en las elecciones en función
de la frecuencia de escape.
Elección y castigo: los trabajos de los efecto del castigo en programas concurrentes indican que los sujetos son
capaces de ajustar su elección a ciertas características del castigo.
Holz comprobó que aunque la tasa de respuesta decrece, la tasa relativa se ajusta a la frecuencia relativa del castigo
en cada alternativa.
Deluty entrenó ratas llegando a la conclusión que el incremento de la tasa relativa de castigo en una alternativa
reducía la tasa relativa con la que era elegida.
Conducta auto-controlada y conducta impulsiva: una conducta en contraposición de la otra, se ha concebido como la
elección de la alternativa con mayor valor relativo de reforzamiento, pero mas demorada. Esto implica 2 programas
concurrentes donde se manipula el tiempo entre la emisión de la respuesta y la aparición de la consecuencia y el
valor del reforzador.
Se considera RESPUESTA IMPULSIVA cuando
la elección de la alternativa con un reforzamiento de menos valor relativo pero más inmediato es comportarse de
manera impulsiva.
El uso de procedimientos de reforzamiento negativo convierte la conducta impulsiva o autocontrolada en conducta
de escape o evitación.
Elegir el escape del evento aversivo con menor valor relativo (menor intensidad, menor tiempo) pero mas
inmediato.
Solmik, kannenbeg Eckerman y Waller, con humanos y sonidos molestos como evento aversivo encontraron una
mayor proporción de elecciones impulsivas pero cuando el procedimiento es el castigo, se hace necesario un camibo
en la demora.
Respuesta impulsiva cuando la elección del castigo con mayor valor (intensidad o duración) pero mas demorado.
Comportamiento autocontrolado cuando se elige el castigo mas leve e inmediato.
Deluty en los experimentos con ratas llego a la conclusión que cuanto mayor era la demora mayor era el numero de
elecciones auto-controladas.
Esther González UNED 2014
Página 45
Descargar