PSICOLOGIA DEL APRENDIZAJE TEMA 1 ASPECTOS HSITORICOS, CONCEPTUALES Y METODOLOGICOS DEL APRENDIZAJE Y CONDUCTA La psicología del aprendizaje es experimental. Trata de explicar los cambios de la conducta como resultado de la experiencia. La conducta es todo lo que se hace incluyendo el pensar o la consciencia, no como una explicación de la conducta sino como otra conducta más que debe ser explicada. Las teorías modernas del aprendizaje señalan la conducta como interacción entre factores genéricos y experiencias ambientales basadas en la observación y experimentación controlada. Si conocemos los principios del aprendizaje, entendemos el comportamiento humano o cualquier especie. El proceso del aprendizaje nos lleva a sistemas educativos más eficaces y mejores herramientas para trastornos psicológicos, perdida de capacidades durante la vejez, o ayudar a las personas a tener mayor control sobre su comportamiento. A través del aprendizaje se adquieren casi todas las conductas, con lo que se pudiera a llegar a cambiar el funcionamiento de una sociedad. Antecedentes históricos Aproximaciones teóricas y filosóficas al estudio del aprendizaje. Asociacionismo clásico: Con origen en la filosófica griega, dice que los pensamientos están relacionados entre si por simples reglas de conexión. ARISTOTELES estableció tres principios: la semejanza, el contraste y la frecuencia de las ideas que funcionan paralelamente. S. XVII. Empirismo británico: Estas ideas se combinaron con los empiristas que defendían que la única fuente de información acerca del mundo procede de la experiencia sensorial que se desarrolla a lo largo de la vida de las personas como resultado de la experiencia. La mente se desarrolla con el conocimiento que nace de la experiencia. Dualismo cartesiano: Descartes había propuesto una distinción entre conocimiento racional o verdadero (Dios), estructura biológica, comportamiento racional exclusivo del hombre y la mecánica o irracional compartido por animales y hombre. Por tanto la mente se estudiaba por introspección y el cuerpo por la ciencia natural. Descartes introdujo la noción del arco reflejo donde decía que los movimientos reflejos se producían cuando algún acontecimiento externo excitaba algún órgano sensorial. Este concepto fue aceptado por muchos pensadores. El dualismo permaneció hasta que el movimiento conductista surgido en Norteamérica dio un vuelco con la psicología experimental y a la psicología del aprendizaje. Monismo: no separa cuerpo y mente en contraposición con el dualismo. La reflexología representada por sechenov, bechterev y pavlov, incorporó el arco reflejo en la psicología experimental. La causa inicial de toda conducta radica en la estimulación sensorial externa sin la cual el pensamiento no es posible. Pavlov con los estudios de estimulación en perros dio lugar a la explicación del aprendizaje por condicionamiento clásico. Teoría de la evolución: Selección natural, origen único. Darwin negó la existencia de un impulso interno que explicase la perfección y introdujo que el origen del hombre no es una cuestión filosófica o teológica, sino biológica, según el sistema nervioso central. Tanto animales como humanos no tenían distintos orígenes, sino que eran producto de la evolución biológica. La teoría de la evolución estableció un origen único de los seres vivos y una evolución de las capacidades mentales. Para Darwin la conducta es un elemento importante para el cambio evolutivo y las modificaciones en el instinto pueden ser beneficiosas para la especie. Fue el preceptor de la ciencia del aprendizaje, del estudio de la motivación y de la cognición animal. Los científicos posteriores aportaron estudios que ayudaron a estimular el análisis dentro de la psicología experimental y ha mantenido como estrategia de trabajo la conducta a lo largo de la evolución filogenética. Por lo que la evolución de las especies es tanto dominio de la biología (anatómicos y fisiológicos) como de la psicología (conducta según el comportamiento que ayuda a la supervivencia y reproducción). Darwin introdujo el control externo donde el ambiente es el primer mecanismo evolutivo. La evolución biológica está controlada por la demanda del entorno. Darwin también introdujo el funcionalismo y el concepto de función, por el que los procesos moldeados por la evolución realizan alguna función útil para el organismo. William james se baso en la mente consciente dice que adapta al organismo al ambiente y que el hombre posee funciones mentales innatas y modos de percibir que habían evolucionado a través de la selección natural y no por asociaciones heredadas. Esther González UNED 2014 Página 1 La consolidación de la psicología del aprendizaje como ciencia experimental. Siglo XIX, se establece la psico como disciplina científica. Sus fundadores explican los fenómenos mentales según unidades discretas, ideas, sensaciones, estímulos y respuestas. Siguiendo a los físicos, la materia estaba formada por pequeñas unidades discretas (corpúsculos) que interactuaban por colisión. Más tarde el principio de la contigüidad entiende que interactúan por contacto y si suceden repetidamente se forma una asociación entre ellos. (estimulorespuesta y reflexología) El conexionismo proporciona una forma más concreta de pensar y con Thorndike y la ley del efecto (donde la asociación E-R se debe a la propia consecuencia de la acción) alejándose del conexionismo simple. El efecto de la acción tiene consecuencias y actúa retroactivamente y fortaleciendo E-R. Watson, fundador del conductismo, propone un cambio en el objeto de estudio tradicional, abandonando el estudio de la mente y la consciencia y se centro en la conducta. El canon Morgan influye en que el objeto de estudio es la conducta. El positivismo lleva a Watson a basarse en hechos observables, explicables por hechos observables. Ej. Dadme una docena de niños sanos…. Lo haré abogado, ladrón sin tener en cuenta su capacidad, tendencia, vocación, afición, talento ni sus antepasados. Neoconductismo: naturaleza del aprendizaje. Teorías de las leyes del aprendizaje. Hull utiliza E-R para explicar el comportamiento. Un evento positivo refuerza la asociación E-R debido a la reducción del impulso lo que le lleva a la teoría de la conducta. El incentivo, imposible de explicar con la teoría anterior, el reforzador que incita a la acción, la conducta depende del hábito, del impulso e incentivo. Tolman comparte con Hull el método hipotético-deductivo, pero difiere en la función de los reforzadores, ya que no actúan para fortalecer la conexión E-R, sino que la conducta está determinada por demandas y expectativas de los eventos dando lugar a la conducta propositiva (propósito), que se manifiesta a través de la conducta observable. Defiende E-R en el aprendizaje y el organismo no es un elemento pasivo que los estímulos del ambiente provocan reacciones cuasi automáticas. Transformamos la información del exterior y emitimos respuestas, y aunque empezó como conductista, se acerca más a la psico cognitiva. También dice que los animales aprenden respuesta pero eligen si la ejecutan o no. Skinner estudia la conducta voluntaria, dejando atrás la refleja, y la denominó operante libre, que dice que la respuesta se emite sin depender de la aparición del estímulo, que depende del organismo y no de estímulos ambientales o discriminativos que moldean el momento adecuado para realizar la respuesta, distinguiendo entre respuestas elicitadas o respondientes y las repuestas emitidas u operantes. Y busca en las consecuencias ambientales la emisión de respuestas en la experiencia del pasado. Ej. La paloma que picotea la caja conocedora del resultado de esta acción, por lo que el fin se encuentra en la historia y no en acontecimientos futuros. Por lo que la respuesta es predictoria. Según la teoría evolucionista el medio selecciona rasgos adecuados y moldea la conducta. Thorndike afirmaba que la fuerza de los estímulos actúan como reforzadores proceden de la capacidad de producir placer o reducir dolor (ley teórica del efecto) . Skinner describe los reforzadores como un efecto de incrementar o disminuir la probabilidad futura de la conducta (ley empírica del efecto). Los patrones de conducta se deben evaluar según el hábitat y una muestra amplia. El interés se traslada de los eventos a patrones. La variabilidad en la conducta es condicionable. Se puede recompensar por responder de modo variable. Ej: La paloma que picotea 8 veces tecla de forma variada y no estereotipada. El control estimular lleva a estudiar la conducta en periodos temporales amplios y no momentáneos. Ej para saber si lees o duermes, tienes que esperar acciones. Por tanto no se puede pensar en una contigüidad entre respuesta y consecuencia momentánea puesto que la conducta está organizada en patrones extensos y las consecuencias son patrones extendidos. Herrnstein estudió programas concurrentes de intervalo variable y demostró que los animales responden a una u otra alternativa según la frecuencia del reforzamiento asociado a cada alternativa. Igual reforzamiento local, igual proporción de respuesta. La ley de igualación explica la conducta de elección y la asocia a las consecuencias a largo plazo. El reforzador demorado puede reforzar respuesta. Rachlin recurre a la distinción aristotélica de causas eficientes (eventos antecedentes, inmediatos, que producen el efecto observado: si A es una causa eficiente de B , B es un evento que su ocurrencia necesita de A como evento antecedente). Las causas finales es un patrón más amplio donde los eventos se acopan y relacionan entre si como notas de una sinfonía para crearla. Cada nota se explica por su ajuste sin ello sería incompleta. Se A es la causa final de B, B se explica cómo parte que encaja en A como un todo. Tendemos a ver las causas como eventos Esther González UNED 2014 Página 2 inmediatamente antecedentes y a veces no distinguimos las causas finales que son confundidas con las causas eficientes que ocurren en el futuro y se rechazan como imposible. Si un sistema se mueve hacia un estado final, la confusión es más grande y se clarifica con el tiempo. El error es que los fines hagan referencia a causas eficientes futuras y las causas finales sean un tipo diferente de causa por una noción diferente del tiempo. Pepper distingue entre el mecanicismo: representado por la teoría E-R o por la teoría cognitiva del procesamiento de la información (maquina que cada pieza hace que funcione entera). La pregunta sobre la conducta ¿cómo? Nos lleva a las causas eficientes y a preguntarse por los mecanicismos. , pero dado que todas las causas eficientes pueden retrotraerse a otras anteriores, no hay una ultima causa eficiente de un acto. El contextualismo, hace alusión a la metáfora del acto en contexto, porque las cosas se ven siempre cambiantes preguntándose el ¿por qué? de la conducta haciendo referencia a las causas finales. Y las causas molares pueden dilatarse con el tiempo en otras mas amplias. CONCEPTO Y METODO EN LA PSICOLOGIA DEL APRENDIZAJE. Marco filosófico de la psico del aprendizaje. Las teorías de la psico aprendizaje están basadas en la observación y la experimentación controlada. La concepción materialista de la ciencia considera que la única realidad del mundo es la materia, que existe objetivamente. Según esto los fenómenos del aprendizaje otorgan que la psico son propiedades materiales como la física o la biología. La concepción metafísica engloba el monismo nacido en Grecia con los filósofos presocráticos. La naturaleza es un único elemento o arché y el universo está formado por una sola cosa. Para los idealistas esta única sustancia es la mente, para los materialistas es la materia. El monismo materialista niega que la mente exista como entidad diferente del cerebro y el conductismo y la pisco del aprendizaje se enmarcan en esta postura. El dualismo reconoce dos sustancias reales diferentes. El determinismo tiene que ver con la libertad. El libre albedrio o libertad de elección sostiene que las personas pueden elegir diferentes alternativas. El determinismo lo niega y cree que cualquier hecho del universo depende de una cadena anterior de causas y efectos, por tanto la libertad de elección no existe y suceden cosas mas allá de lo establecido de antemano siguiendo esa cadena de causas y efectos. Así se podría predecir el futuro conociendo las variables del pasado en una situación puntual dentro de la cadena causal. Si una persona elige entre dos opciones no podemos explicar su comportamiento futuro y la psico no tendría sentido. Según el determinismo la libertad es una ingenua ilusión. El conductismo de skinner mantiene que la conducta está determinada por el ambiente pero es un dilema que no ha hallado una solución definitiva. El método científico aplicado a las ciencias del comportamiento. Ciencia viene del latin del verbo saber que se podría traducir por conocimiento que es acumulativo y debe solucionar problemas y explicar fenómenos. La ciencia describe, explica, controla o predice los fenómenos naturales según el método científico sin entrar en concepciones científicas, religiosas o pseudociencia. La psicología del aprendizaje como ciencia experimental. Para construir el conocimiento se asumen unos presupuestos básicos como La tesis o principio ontológico de realismo, donde existe una realidad que estudiar independientemente del conocimiento humano, los fenómenos existen aunque no puedan ser explicados. La tesis o principio de legalidad, que dice que la realidad está sometida a leyes naturales y que la naturaleza es regular. El universo es complejo, pero está sujeto a unas reglas predeterminadas que permiten predecir hechos futuros y esclarecer los pasados. El principio de falsación de Popper, 1959, dice que una proposición es científica si puede ser refutable y se convierte en teoría si no ha podido ser refutada. Esta teoría consiste en criticar las leyes y dicen que un solo caso que no encaje es mas importante que todas las confirmaciones. No se puede confirmar algo universal partiendo de datos particulares. El inductismo ingenuo ej. Los cuervos negros. El método hipotético-deductivo o científico sigue las etapas de Observación: donde se observa algún fenómeno de la naturaleza, se describe en detalle sin perjuicios, se delimita y especifica los instrumentos para realizar las observaciones. , planteamiento del problema: donde se delimita el objeto de la investigación. Hay que revisar la literatura sobre el problema planteado. formulación de hipótesis: consiste en hacer suposiciones y pronósticos formulando afirmaciones o enunciados que apunten a una solución al problema. prueba mediante experimentos: se trata de comprobar las hipótesis derivadas de fenómenos observados a través de la manipulación y correlaciones de las variables consideradas causas del fenómeno. obtención de resultados Esther González UNED 2014 Página 3 elaboración de leyes. Y teorías que son un conjunto de leues que permiten describir, explicar y predecir la existencia de regularidades empíricas en relación con una realidad objetiva. La teoría en un lenguaje coloquial sería una especulación, una suposición. Publicación y comunicación científica. Que tiene unas cualidades como la claridad, precisión que posibiliten la replicación del estudio, el uso de terminología universal y objetividd. Nivel de análisis en la explicación científica El conocimiento está fragmentado, dividido en disciplinas el reduccionismo consiste en la explicación de un fenómeno desde un nivel inferior descomponiendo sistemas complejos en mas simples. El materialismo reduce todo conocimiento a una explicación a nivel físico y así explica toda realidad incluso el ser humano y la conducta en términos físico-químicos, reduciendo el pensamiento y el leguaje al funcionamiento de las neuronas y reacciones bioquímicas. Pero como es difícil decir que una persona está deprimida por los movimientos de sus átomos se recurre al análisis psicológico que es como se estudia esta asignatura. Una teoría debe explicar los fenómenos sin caer en los componentes del mismo. Si no se crea la circularidad es decir una persona es inteligente porque realiza bien las pruebas y realiza bien las pruebas porque es inteligente. Aristóteles decía que la ciencia debía dar una explicación causal. Siendo la causa final la mas importante. Esta influencia duro toda la época clásica hasta el renacimiento que las explicaciones científicas tomaron carácter teleológico(estudio de fines o propósitos) o propositivo. La ciencia moderna reduce el pluralismo causal dándole a la causa una explicación concreta prescindiendo de las causas finales. Pero estas causas finales entendidas como patrones extensos donde los fenómenos se acoplan entre sí, se han retomado en la actualidad. causas según Aristóteles causa material causa formal causa eficiente o motriz causa final explicación aquello de lo que un objeto surge o está compuesto lo que da el ser o esencia a un objeto aquello que produce el cambio o movimiento para lo que el objeto existe ejemplo de escultura del dios Zeus mármol el dios Zeus escultor embellecer la ciudad Definición y objeto del estudio de la psicología del aprendizaje. La psicología del aprendizaje es una disciplina científica que trata de explicar las causas de la conducta y las causas de los cambios en la conducta. El aprendizaje es cualquier cambio duradero en el repertorio conductual de un organismo que tiene lugar como resultado de la experiencia con los acontecimientos ambientales. El aprendizaje depende de la experiencia y da lugar a cambio duraderos en la conducta entendiendo lo que hace el organismo incluso acciones encubiertas como el pensamiento o sentimientos. Incluso en el feto y hasta que morimos, aprendemos cosas que nos ayudan a adaptarnos al entorno. Algunas conductas son innatas, pero la mayoría son adquiridas o aprendidas mediante la práctica de forma gradual. Cuanto mayor el grado filogenético de la especie, mayor la proporción de conductas adquiridas. El aprendizaje implica cambios a largo plazo y los a corto plazo como la fatiga, no se consideran aprendizaje. Así como los cambios donde no esté implicada la experiencia y sean debido al desarrollo o envejecimiento, tampoco son aprendizaje. Tiene función adaptativa, ya que posibilita el comportamiento en función de las demandas del entorno. La conducta no aprendida, aunque adaptativa, depende de la programación genética, menos flexible y en entornos específicos, elementales y predecibles. La relación del organismo con el medio ambiente producen estímulos ambientales, percibidos por los sistemas sensoriales del organismo y que producen una respuesta conductual. Ej: olor de un depredador, el sonido de una campana, descenso de temperatura o exceso de luz. La psicología del aprendizaje tiene como fin el conocimiento de los efectos del ambiente en la conducta que a través de procesos de condicionamiento o reforzamiento producen cambios en el comportamiento humano. La psicología del aprendizaje y los eventos privados. Se plantea si la conducta no observable, puede ser objeto de estudio. El conductismo radical asume el monismo materialista y aplica el determinismo para la explicación de estos fenómenos. Podríamos aplicar el mismo tratamiento que en conductas observables, pero para el aprendizaje lo que ocurre fuera y dentro del organismo tiene la misma naturaleza y no existe forma en que podamos medirlo de forma directa. Pero los eventos internos deben ser abordados desde el marco de la ciencia natural. Y la psicología del aprendizaje lo engloba todo los comportamientos simples, los complejos, las conductas observables y los eventos internos. Esther González UNED 2014 Página 4 LA PSICOLOGIA DEL APRENDIZAJE COMO DISCIPLINA CIENTIFICA. Pretende describir todos los comportamientos de una amplia gama de especies y en todas las situaciones y pretenden descubrir principios generales. Utilización de animales en la investigación sobre el aprendizaje. Ratas, palomas, pollos, conejos, peces, caracoles son utilizados en la investigación y es una cuestión muy controvertida y controlada por un comité de bioética. Relaciones de la psico del aprendizaje con otras disciplinas. La psicología del aprendizaje se considera una disciplina base para el estudio de otros procesos y cuyos principios fundamentan otras técnicas aplicadas en la educación, conducta y neurociencia. La psico del aprendizaje y la terapia de la conducta. Una de las contribuciones mas importantes de la psico del aprendizaje es las técnicas utilizadas en la terapia de la conducta, que surgieron a partir de los años 60 como alternativas a los tratamientos tradicionales y como superar las limitaciones de la clínica tradicional en el psicoanálisis y se llaman terapias de primera generación. Las características generales de los enfoques en la terapia de la conducta según Kazdin: Tendencia a centrarse en los determinantes actuales del comportamiento, mas los acontecimientos pasados. Considerar el cambio de la conducta observable como criterio fundamental Especificación de la intervención en términos objetivos, facilitando la replicación Confianza en la investigación básica como fuente de hipótesis sobre el tratamiento y las técnicas terapéuticas especificas a emplear. Especificidad en la definición del tratamiento y medida de los problemas y objeticos en la terapia. Estas técnicas, aunque tuvieron mucho éxito, presentaban problemas a las cuestiones psicológicas y surgieron las terapias de segunda generación, que empezaron a emplear elementos cognitivos, dando lugar a las terapias cognitivo-conductuales, que se alejan un poco de las teorías de la psico del aprendizaje. Las terapias de tercera generación serían la psicoterapia analítico-funcional, basada en el conductismo radical de Skinner, pero con un análisis individualizado de los problemas del paciente, que marca una relación propia entre cliente y terapeuta y que esto introduce un cambio que es que se tratan las acciones privadas como los pensamientos, sentimientos o intenciones y el tratamiento se aplica en la misma sesión en vivo, considerando la conducta verbal como el material clínico mas importante. La influencia de la psico del aprendizaje en la neurociencia. Tras la Década del Cerebro( 1990-1999), éste órgano ha vuelto a ser actual tras dos grandes proyectos uno europeo y otro americano que pretenden liderar los avances necesarios para comprender el cerebro humano. La neurociencia para estudiar el cerebro, sigue las bases biológicas de la conducta e intenta aproximarse al estudio del sistema nervioso y del aprendizaje. La sociedad para la neurociencia, fundada por científicos de distintas disciplinas pero sobretodo psicólogos fisiológicos muy influenciados por la psicología del aprendizaje donde se analizaba las distintas regiones cerebrales en determinados comportamientos. Los conductistas clásicos se han alejado de estos estudios por su relación de ideas sobre la mente o consciencia, pero los conductistas contemporáneos han participado. El principal problema de la neurociencia es entender que está sucediendo con las neuronas individuales como con los circuitos que se forman cuando se produce el aprendizaje y la memoria. Los modelos animales basados en el condicionamiento operante han sido importantes para la neurobiología de las adicciones como el modelo de autoadministración de drogas sin necesidad de intervención por el investigador y así se conoce el potencial de abuso de diferentes drogas, actuando de la misma manera los animales que los humanos. Los animales interactúan con un ambiente externo cambiante y es muy ventajoso poder predecir los eventos ambientales. El condicionamiento clásico y el operante son fundamentales para las memorias predictivas. La asociación de EC y EI produce una respuesta anticipatoria y aprenden a anticiparse a sucesos importantes. Mediante la asociación de conducta y consecuencias de las mismas, el animal aprende y ajusta las conductas adaptativas. Esther González UNED 2014 Página 5 TEMA 2 CONDICIONAMIENTO CLASICO: FUNDAMENTOS Aprender a predecir lo que va pasar nos permite dar una respuesta con antelación. Si tenemos hambre agudizamos el olfato, salivamos y la predicción de la comida predispone el cuerpo para aprovechar mejor los nutrientes, hacemos mejor la digestión, nos sienta mejor… El condicionamiento clásico se produce al presentar dos estimulos independientes, es decir el sujeto aprende a predecir un estimulo por la presentación de otro estimulo que le antecede. Los comienzos del estudio del condicionamiento clásico. Rusia, finales del siglo XIX, laboratorio del instituto de medicina experimental de S. Peterburgo, el fisiólogo Ivan Petrocich Pavlov (1849-1936) investigaba con el sistema digestivo de los perros (premio nobel en medicina 1904), empleando técnicas quirúrgicas que permitiera alimentar ficticiamente al perro mediante un tubo en el esófago que recogía la comida que le introducía en la boca, sin llegar al estomago. Los perros segregaban jugos gástricos no solo con la ingestión de la comida, sino también ante la visión de la comida o de la persona que la suministraba. Estas secreciones se denominaron “secreciones psíquicas” porque se debían al estado psicológico del perro al esperar comida, considerando estas secreciones como resultado de un reflejo psíquico. Para estudiar estos reflejos, buscó una respuesta diferente a los jugos gástricos y recogió la saliva mediante una fistula en la glándula salivar Sonido de un metrómetro (estimulo neutro) y media la salivación Le daba comida ( estimulo incondicional) y media salivación (respuesta incondicional) Luego hacia sonar el metrómetro (estimulo condicional) cuando le daba comida y medía salivación (respuesta refleja). Tras varios ensayos el perro asoció la comida(estimulo incondicional) al sonido (estimulo condicional) y el perro salivaba(respuesta condicional) ante el sonidos (reflejos condicionados) NATURALEZA DE LA ASOCIACION La asociación que se aprendía entre el metrómetro y la salivación era entre una EC-RI y se establecía relación entre E y R. Pavlov pensaba que el perro asociaba el metrómetro con la comida EC con EI y establecía asociación entre E-E y que la RC seria elicitada por medio de la representación del EI por el EC. Pero como saber cuál de los dos tipos de aprendizaje se estaba dando? Se debía someter a una devaluación EI. Ejemplo de las ratas-luz-ruido. Las ratas habituadas al ruido mostraron menos miedo. SITUACIONES EXPERIMENTALES Condicionamiento del miedo Watson y Rayner (1920) afirmaron según el método pavloviano que los patrones de reacción emocional en la infancia eran el miedo, la ira y el amor, y se incrementaban de adultos y hicieron el experimento en un niño de 9 meses: Albert B, que era un niño sano, impasible. Se le presentaron estímulos ( una rata, un conejo, un perro, un mono, mascaras, algodón, fuego y observaron que la respuesta no reflejaba miedo. Se le presentó una rata y se la asoció a un sonido fuerte que hacía llorar al niño, y el niño asoció rata-ruido. Por lo que el niño había desarrollado miedo a la rata. Se le presentó un conejo blanco, algodón blanco, etc y el niño respondía de la misma forma, generalizando el miedo a todo lo peludo blanco. Por ética se realizan experimentos con ratas como el de la caja de skinner donde se introduce una rata y se le aplica una descarga eléctrica que provoca la paralización de la rata por miedo a la descarga, llegando a aprender a anticipar la descarga en periodos con una misma separación temporal. Para conocer en que medida el EC suprime la conducta se cuentan el nº de presiones de la palanca durante el EC y durante el periodo de igual duración antes del EC llamado pre EC y se calcula Respuestas durante el EC Razón de supresión= Esther González UNED 2014 Página 6 (respuestas durante EC + rptas durante el pre-EC) Cuando el EC no predice la descarga el nº de presiones durante el EC y durante el pre EC será el mismo. Pulsa 40 /(40 +40)= 0,5 no predice Pulsa 20/(20+40)=0,33 predice un poco No pulsa 0/(0+40)=predice ( aprendizaje al máximo) Mayor nivel de condicionamiento es indicado por un valor mas bajo de razón de supresión. Curva de adquisicon inversa. A valor mas alto, menos grado de condicionamiento. Cuanto mas pequeña es la razón de supresión mas paralizado está el animal durante el Ec debido al miedo que le provoca. Ej. Del videojuego que se debe acabar con los marcianos y hay un escudo anti-laser que permite que los marcianos aterricen si se sigue disparando. Condicionamiento del parpadeo. El reflejo palpebral es el parpadeo ante un objeto repentino ante los ojos. Si se relaciona un tono con el parpadeo, el sujeto parpadeará cuando oiga el tono. Se ha probado con conejos. EI soplo o descarga EC luz o tono Se presenta el EC y seguidamente el EI. Cuando se hace el emparejamiento se observa la respuesta ante el EC. Seguimiento del signo Paradigma del seguimiento del signo o automoldeamiento, el sujeto se aproxima y toma contacto con el estimulo que señala la disponibilidad de comida. Experimento realizado con palomas donde cuando se iluminaba una tecla antes de dar comida y las palomas aprenden a picotear la tecla para obtener comida incluso si la tecla está lejos del comedero. Este resultado se ha repetido con otros animales incluso humanos dando el mismo resultado. Aprendizaje de aversión al sabor Aprendemos que hay alimentos que son beneficiosos y otros no por condicionamiento clásico. Cuando comemos algo y nos sentimos mal, no volvemos a probarlo. Esto es importante para la supervivencia. Ejemplo de quimioterapia y efectos secundarios. Tiene características especiales como que con una sola vez, se produce el emparejamiento. El aprendizaje ocurre incluso que ha ocurrido con horas de diferencia entre la ingesta y el malestar. PROCESAMIENTOS DE CONDICIONAMIENTO PAVLOVIANO EXCITATORIO El condicionamiento pavloviano excitatorio, se produce cuando se presenta un EC seguido de un EI. Hasta ahora los EC aparecen después de los EI. Procedimientos típicos del condicionamiento pavloviano excitatorio. La ordenación del EC y el EI es un factor en la formación de un condicionamiento pavloviano. Un condicionamiento se adquiere mejor cuando el EC ocurre antes del EI, es decir el Ec es señal de que va a presentarse el EI. Según el intervalo entre estímulos o intervalo EC-EI que es el tiempo que transcurre desde el comienzo del EC y el comienzo del EI dentro de un mismo ensayo. El tiempo que tarda en finalizar un ensayo y empezar otro es el intervalo entre ensayos. Condicionamiento de demora: es el procedimiento mas frecuente y que obtiene mejor aprendizaje. El EC está presente hasta que aparece el EI y puede continuar durante el EI o terminar cuando empieza el mismo. Este intervalo depende de la prueba, por ejemplo un condicionamiento palpebral es optimo en 0.4 segundos con un Esther González UNED 2014 Página 7 intervalo de 2 o 3 segundos. En el de aversión del sabor puede ser que se demore en 2 o 3 horas y la respuesta condicionada disminuye según aumenta el intervalo EC-EI. Condicionamiento de huella: el EI no se presenta hasta cierto tiempo de acabado el EC,. Entre el final de la EC y el comienzo de EI hay un intervalo de huella. El nivel de condicionamiento empeora a medida que aumenta el intervalo de huella. Condicionamiento simultaneo: EI y EC se presentan a la vez y tienen la misma duración, lo que significa que el EC no señala que el EI va a ocurrir y la RC es escasa, pero no significa que no haya aprendizaje. Condicionamiento hacia atrás: la presentación del EI es seguido del EC, invirtiendo el orden. Habitualmente no da tanta respuesta condicionada aunque se puede obtener cierto grado de condicionamiento excitatorio i el sujeto trata al EC como señal de no EI. Medición de respuestas condicionadas. Ensayo de prueba: Procedimiento para medir el grado de condicionamiento, se presenta el EC sin el EI. Así nos aseguramos que la respuesta que medimos es el RC sin influencia del EI estos ensayos son imprescindibles en el condicionamiento simultaneo y en el hacia atrás porque si se midiera la RC en un ensayo normal estaría contaminada por la presencia de EI y en el condicionamiento de demora seria necesario los ensayos de prueba del EC aislado. La conducta del sujeto puede cuantificarse registrando la magnitud de la RC, la cantidad de conducta. Pavlov midió las gotas de saliva. Otra manera es registrando la frecuencia con que ocurre la RC ante el EC, números de ensayos que los EC provocan una ER. Otra es medir la rapidez con que aparece la RC cuando se presenta el EC. Cuanto mas rápido aparezca la RC mayor el condicionamiento: latencia de la RC. Procedimientos de control La aparición de respuesta no asegura que sea debido a la asociación establecida entre el EC y el EI. Para asegurar el condicionamiento debe haber un procedimiento de control que permita afirmar que el cambio conductual no se debe a la presentación de EC y EI por separado. Las que son como consecuencia de procesos distintos se denominan respuestas pseudocondicionadas. Un ejemplo es la aversión a sabores nuevos o neofobia, donde un sabor nuevo produce aversión pero no es una RC sino una respuesta pseudocondicionada. La sensibilización es un proceso del aprendizaje no asociativo ante la presentación repetida de un estimulo en solitario que produce cada vez mas respuesta. Para asegurarse de la relación entre EI y EC se puede aplicar el control aleatorio donde se presenta el EC y el EI de forma aleatoria, pero presenta problemas porque puede dar lugar al condicionamiento excitatorio. Para evitar esto se entremezclan 4 ensayos: Presentar el EC en presencia del EI Presentarlo el EC solo Presentar el EI solo No presentar ni el EC ni el EI y que la contingencia sea 0. Si en este control ocurren emparejamientos se utiliza el procedimiento de control pseudoaleatorio en el que la contingencia es 0 pero el experimentador distribuye los tipos de ensayos de manera equivalente en toda la sesión de entrenamiento. PROCEDIMIENTOS DE CONDICIONAMIENTO PAVLOVIANO INHIBITORIO. El condicionamiento excitatorio es cuando el sujeto aprende a predecir cuando va a aparecer un estimulo incondicionado y es tan importante como aprender cuando no se va a presentar un estímulo incondicionado. En este caso se produce el condicionamiento inhibitorio. Cuando el EI es aversivo el EC nos indica ausencia del EI. En un EC excitatorio como una luz que indica descarga provoca miedo y un EC inhibitorio como que una luz es ausencia de descarga, provoca alivio. Pero el condicionamiento inhibitorio también se produce en situaciones en que el EI es apetitivo, si se utiliza comida como EI, un EC excitatorio elicita estado de euforia y en un EC inhibitorio (luz asociada a falta de comida) puede inhibir dicho estado y causar frustración. Por tanto, la excitación y la inhibición son considerados procesos opuestos e importantes para la adaptación al ambiente. Para que se desarrolle la inhibición condicionada es necesario un contexto excitatorio, es decir para que se aprecie la ausencia del EI es necesario que se pueda echar de menos, es decir que se pueda decir que ya no está. El condicionamiento inhibitorio fue descubierto por Pavlov en su laboratorio y incide en la importancia del contexto excitatorio. El procedimiento estándar de inhibición condicionada consiste en presentar dos ensayos uno para el condicionamiento inhibitorio y el otro para el condicionamiento excitatorio entremezclados aleatoriamente en una Esther González UNED 2014 Página 8 sesión. Es decir, el ensayo excitatorio un estimulo excitatorio EC+ se presenta junto con un estimulo inhibitorio ECque no va seguido por el EI. Los sujetos aprenden a responder cuando el EC+ va solo y no compuesto EC+-EC-. El EC- solo se ha convertido en señal de la ausencia del EI es decir es un estimulo inhibitorio. Inhibición diferencial: se presentan ensayos de un EC+ seguido del EI entremezclados con ensayos de un ECno seguido de EI. Los sujetos aprenden a discriminar ambos estímulos y presentan la EC ante el EC+ pero no ante el EC- que se convierte en estímulo inhibitorio. Desemparejamiento explicito: consiste en la presentación de un EC u del EI separados por tiempo amplio. El EC y EI nunca se emparejan y supone un caso concreto del procedimiento por contingencia o correlación negativa porque la correlación ente EC y Ei en el tiempo es negativa, es decir, menos probable que el EI se presente tras el EC que en cualquier otro momento, por lo que el EC señala la reducción de la probabilidad que aparezca el EI. El condicionamiento inhibitorio se puede desarrollar incluso cuando el EC va seguido del EI. Puede ser por demora: si el EC tras mucho tiempo señala la ausencia del EI. Puede ser por condicionamiento de huella: cuando el intervalo de la huella es de gran tamaño es inhibitorio, si no es muy grande es excitatorio, aunque influye el tamaño que tenga el intervalo entre ensayos. Condicionamiento hacia atrás: establece el EC como señal de ausencia del EI es decir, como inhibidor condicionado. Mediación de la inhibición condicionada. En la excitación condiconada medición se hace de forma directa ante el EC+ y que depende del estimulo incondicionado. En la inhibición condicionada se espera que el EC- tenga una reacción opuesta al EC+, y su medición solo puede ser directa en sistemas de conductas bidireccionales, aunque se da en muy pocas ocasiones y se tiene que medir la inhibición de manera indirecta. Sistemas de respuestas bidireccionales Formados por respuestas en direcciones opuestas respecto a la línea base. Muchas respuestas fisiológicas son de este tipo como ritmo cardiaco, temperatura corporal, respiración que aumentan o disminuyen respecto a la línea base. Con el miedo el ritmo cardiaco aumenta y el estimulo condicionado inhibitorio produce alivio ( ausencia de descarga asociada a la luz). Este método no se puede generalizar por ej. Cuando un perro traga saliva ante un tono sabemos que el tono es excitatorio, pero la reacción contraria es no salivar ante una liz y no sabemos si es debido a que la luz es un estimulo inhibitorio o que no ha habido condicionamiento y la luz es un estimulo neutro. Prueba del estimulo compuesto o sumación Se presenta de forma conjunta el estímulo inhibitorio y el estimulo excitatorio si el estimulo condicionado es inhibitorio debe reducir la EC, asociando el estimulo excitatorio con el neutro. Un ejemplo largo mirar libro pag 81. Esther González UNED 2014 Página 9 Retraso en la adquisición cuando un estimulo se ha convertido en inhibitorio necesitara mas ensayos de emparejamiento con el EI para conseguir el mismo grado de excitación que un estimulo neutro. La velocidad de adquisición de respuesta excitatoria disminuye si el EC es inicialmente un inhibidor condicionado. Mirar ejemplo pag 82. LA EXTINCION DEL CONDICIONAMIENTO PAVLOVIANO. La conducta aprendida es una adaptación al ambiente cambiante. La perdida de la conducta condicionada debería ser tan relevante como su adquisición. En la extinción ya no se presenta el EI tras el EC, el EC solo se presenta en repetidas ocasiones y tiene como resultado la disminución o la desaparición de la EC. Se denomina extinción tanto el procedimiento como el resultado. La extinción es similar a la habituación ya que ambas provocan una disminución de la respuesta debido a la exposición repetida de un estímulo, pero la extinción es un descenso de una respuesta previamente aprendida y la habitación no se ha aprendido respuesta anteriormente. La extinción no es olvido ya que ocurre como consecuencia de las presentaciones repetidas del EC en solitario. Pavlov pensaba que durante la extinción el sujeto aprendía una nueva asociación entre el EC y la ausencia del EI y creía que se producía una inhibición condicionada, pero no lo es, ya que no supera la prueba de sumación ni la del retraso necesarias para afirmar que un EC es un inhibidor condicionado EC-. Cuando se somete a una prueba de sumación un estimulo extinguido, en lugar de obtener una menor RC ante el EC+ se puede obtener mayor RC también pasa cuando se empareja de nuevo EC extinguido con el EI se obtiene un condicionamiento rápido. Fenómenos de la extinción: . Desinhibición: durante la extinción se aprende una asociación distinta que no eliminaba la asociación excitatoria entre EC y EI. La desinhicion consiste en la presentación de un nuevo estímulo junto con el EC durante la fase de extinción que provoca que el sujeto vuelva a ejecutar la RC inmediatamente. Perro luz seguida de comida durante la adquisición, solo la luz en extinción. Si se pone un tono el perro saliva, lo cual no se ha erradicado la asociación EC-EI, ya que la RC se recupera ante un estímulo novedoso, sin entrenamiento. . Recuperación espontanea: la asociación EC-EI no es eliminada durante la fase de extinción. Si dejamos pasar un tiempo sin contacto con el EC y el EI, tras la fase de extinción, presentamos de nuevo el EC, la RC se recobra espontáneamente. Se puede recuperar una RC que ha sido extinguida con el simple paso del tiempo. . Renovación de la RC: No se da desaprendizaje como resultado de la extinción. Ejemplo pag 85-86 el efecto de renovación de la RC, se obtiene si el cambio de contexto es distinto al de extinción sin necesidad de que vuelva al contexto original de condicionamiento. Se ha demostrado que la extinción puede ser relativamente especifica del contexto en el que se aprende, mientras la excitación condicionada se generaliza mas fácilmente a otros contextos. El contexto actúa como clave que ayuda a eliminar la ambigüedad del significado de un estimulo condicionado. Un EC que adquiere condicionamiento excitatorio y luego se extingue puede indicar que va a aparecer o no el EI en esta situación, y el contexto puede ayudar a saber que va a ocurrir. El sujeto puede saber que significa el EC en ese momento y adecuar su respuesta a lo que va a venir. La renovación cuando el sujeto deja de estar en el contexto de la extinción, y se introducen claves de otro contexto distinto, se recupera la RC excitatoria. . Restablecimiento de la excitación condicionada: ocurre si el EI se presenta en solitario tras al extinción esto hace que vuelva a darse RC ante el EC en prueba posterior, lo que vuelve a no suponer la eliminación de la asociación ECEI adquirida durante el condicionamiento. El restablecimiento parece indicar que el contexto también juega un papel en la renovación y estaría suprimiendo la ambigüedad del EC. INCIDENCIA DEL CONDICIONAMIENTO CLASICO: Mediante el condicionamiento clásico el aprendizaje permite la adaptación al medio. Si un animal predice un evento responderá ante la señal antes que ocurra. Fuera del laboratorio se puede estudiar el condicionamiento clásico. Territorialidad y reproducción: Ejemplo del pez gurami azul y el éxito en la reproducción. Condicionamiento con drogas: Los lugares donde se consumen, las compañías o los estímulos que forman parte de este ritual de consumo pueden convertirse en señales de las drogas. La respuesta condicionada es diferente a la incondicionada la RC es opuesta y contrarresta el efecto de la droga. Esta respuesta es adaptativa porque una dosis de droga puede causar al organismo la perdida de homeostasis y equilibrio interno. La respuesta condicionada ayuda a recuperar el equilibrio al responder a la señal antes que se de la droga. La respuesta ante un EC es una repuesta condicionada compensatoria y pueden ser la razón de la tolerancia que se produce con un consumo habitual de droga. Cada vez que se toma droga los efectos son mas fuertes y las claves ambientales se convierten en estímulos condicionados Esther González UNED 2014 Página 10 que provocan la respuesta condicionada compensatoria disminuyendo el efecto que tiene la droga y generando tolerancia. Si el contexto o claves ambientales son EC al retirar estas claves se recupera la respuesta ante la droga y elimina la tolerancia. Si se cambia el contexto desaparece la tolerancia y la respuesta es como si recibiera droga por primera vez. La tolerancia es adaptativa y protege al organismo de sobredosis. El drogadicto compensa la tolerancia aumentando la dosis cambiando el contexto de administraciones de la droga y se pondrán en marcha respuestas compensatorias llegando a morir. TEMA 3 MECANISMOS ASOCIATIVOS Y TEORIAS DEL CONDICIONAMIENTO CLASICO. El EI produce RI sin necesidad de asociación con ningún estímulo. Generalmente se usa como EI la comida como apetitivo y descargas y malestar estomacal como aversivos. Una rata blanca puede ser un EN que para alguien sometido a condicionamiento aversivo puede dar una RC similar a la que un EI como un ruido fuerte, provoca. Pero ni Albert responde igual a un ruido fuerte que a uno breve. Factores que entorpece o favorecen el condicionamiento: INTENSIDAD: no es lo mismo una rata que cientos de ratas ya que el miedo es distinto. Un EI o EC intenso tiene como consecuencia una aceleración en el aprendizaje y mayor expresión de la RC. La saliencia: es un estímulo mas perceptible o significativo que los otros para el organismo. Un EC que capta la atención es un EC saliente. Los EI son salientes por naturaleza. Un EI como la comida no será tan saliente para un animal satisfecho que para uno en ayuno. Cuanto mas significativo sea el EI mas aprendizaje rápido y exitoso. El carácter biológico de los EI , y la influencia de la intensidad concluyen que la RC es mas fuerte cuando se utilizan EI salientes. Respuestas debido a la intensidad pueden ser parpadeo, movimientos mandibulares, de flexión como la pata de los gatos. Las reacciones fisiológicas como salivación tasa cardiaca, cambios glucemicos. La intensidad puede provocar una respuesta distinta, si aumentamos la cantidad de comida de las ratas, aumenta su intensidad en la respuesta, dedicaban mas tiempo y menos respuestas de orientación. Si presentamos 2 EI simultáneamente el condicionamiento es mas intenso. La intensificación de los estímulos se traduce en un aumento de RC, pero a partir de cierta intensidad o saliencia no hay variación en el condicionamiento ni en la expresión de la RC llegando al nivel máximo. NOVEDAD: La variación en la intensidad puede resultar novedosa y esta novedad puede ser responsable de los efectos de la intensidad. La novedad por si sola suscita reacciones mas intensas que a los que estamos habituados. Efecto de preexposicion: ausencia de novedad en los estímulos. Según los dos estímulos implicados en el condicionamiento clásico, tenemos 2 efectos Preexposicion al EC o inhibición latente: como kiwi de forma normal porque nunca me ha sentado mal. Un dia tengo dolor de estomago y no asocio el dolor con el kiwi ya que nunca me había producido malestar. La repetición de un EC en ausencia del EI, retrasa la asociación EC-EI. Si un estimulo no es seguido de una consecuencia ni positiva ni negativa, no provoca RC y dejamos de prestarle atención. La inhibición latente promueve la selección de los estímulos necesarios para el aprendizaje rápido. La habituación es una disminución en respuestas como la orientación y la inhibición latente supone un retraso en el aprendizaje. Preexposicion al EI: me duele el estomago sin razón aparente. Hoy he comido kiwi pero como nunca me ha dolido el estomago con el kiwi me cuesta aprender que mi dolor se debe al kiwi. Cuando el EI se presenta repetidamente sin asociación del EC deja de ser novedoso. Si posteriormente pretendemos asociar el EC con el EI el aprendizaje costará. Las repeticiones reducen la capacidad de aprendizaje, probablemente por economía conductual para la supervivencia, ya que no predice consecuencias importantes y le dejamos de prestar atención. Las inferencias asociativas o de memoria provocan disminución de dichos estímulos con estímulos nuevos. NATURALEZA: Contempla características como tipo, relevancia, importancia biológica. Esther González UNED 2014 Página 11 Tipos de estímulo: el tipo determina el condicionamiento y la RC, que no serán los mismos si el EI es apetitivo o aversivo. Un animal no mostrará salivación ante una descarga, ni tendrá miedo ante la comida. Ejemplo de las palomas comida o agua, respuesta diferente. El EC funciona como señal anticipatoria de un futuro EI, pero hay qie tener en cuenta que distintos EC pueden provocar distintas RC. Ejemplos de ratas y tonos ( mov cabeza) y luz(en pie) Bowe, Green y Miller descubrieron que las palomas procesan mejor o prestan mas atencion a los colores que a la localización espacial del EC. Relevancia de los estímulos: relación entre el EC y el EI en un contexto natural. Garcia y Koelling: intentaban ver cuales de los EC (sabor o audiovisules), eran mas suceptibles de condiconarse con EI’s. Ej: ratas bebían agua dulce o salada previa aparición de un EI (EC gustativo), junto con un estímulo audiovisual). Después se les administraba descarga o malestar estomacal creando aversión. Luego se realizo por separado. Los animales expuestos a la descarga suprimieron antes su respuesta ante un estimulo visual que gustativo y los del malestar gástrico al revés. La explicación es porque en un contexto natural es mas fácil asociar el malestar estomacal con un alimento en mal estado, que una descarga eléctrica. Y que ante el ataque de un depredador (daño de la descarga) los estímulos visuales y auditivos son mas importantes. Por eso la relevancia o pertenencia del EC respecto al EI es importante, ya que el aprendizaje de asociaciones como (sabor-malestar) se ve favorecido si el EC es pertinente al EI. Lolordo, Jacobs i Forre concluyen que las palomas asocian EI alimentarios con estímulos EC visuales antes que con auditivos y los EI aversivos con EC auditivos. Para las palomas las claves visuales son mas relevantes para obtener comida y las auditivas para conductas defensivas. Los humanos asociamos fotografías de animales con descargas y no si son flores. Por lo que llegamos a la conclusión que la relevancia o pertinencia del EC con respecto a un EI se centra en que el EC provoca la activación de sistemas de conductas dependiendo del estado motivacional y la naturaleza del EI. Si el EI es comida el EC activa la producción de conductas relacionadas con la búsqueda de la misma. Si el EC es una descarga, se activan conductas defensivas similares a las que hay en presencia de un depredador. La fuerza biológica: el carácter biológico no es atribuible a todos los EC. Un EC neutro como la luz o un tono no tiene el mismo carácter biológico que la comida. Pavlov decía que para que se diera condicionamiento el EC debía tener menos fuerza biológica que el EI por lo que las RC debían ser menos intensas que las RI. CONDICIONAMIENTO DE SEGUNDO ORDEN: DOS ESTIMULOS CON DIFERENTE FUERZA BIOLOGICA: un EC condicionado por otro EC previamente condicionado, el EC inicialmente neutro, hace las veces de EI para el nuevo condicionamiento porque ha adquirido la fuerza biológica que antes no tenía. Dinero primero adquiere el valor de comprar algo, luego asociamos cajeros, tarjetas con dinero. Ej: como manzana y me sienta mal, como el kiwi me sienta mal, la manzana también. Pavlov decía que todo estímulo que tiene fuerza biológica no puede servir como EC para un nuevo condicionamiento. Si una luz se asocia con una descarga no se puede asociar la misma luz a la comida. CONTRACONDICIONAMIENTO: DOS ESTIMULOS CON FUERZA BIOLOGICA: Un EC que se ha emparejado con un EI puede emparejarse con un EI diferente o incluso opuesto. Un estímulo que inicialmente provoca un acercamiento , después puede provocar una respuesta de alejamiento, pero la nueva asociación aprendida no borra del todo el aprendizaje original por lo que la RC inicial puede reaparecer un tiempo después o en contexto distinto. El Contracondicionamiento se aplica en fobias. Ej: la consulta del dentista produce ansiedad en los niños, pero si dentista regala una piruleta, ir al dentista es menos aversivo. PRECONDICIONAMIENTO SENSORIAL: DOS ESTIMULOS SIN FUERZA BIOLOGICA: dos estímulos con poca fuerza biológica también pueden dar aprendizaje, pero no provocan respuestas intensas como en el caso del precondicionamiento sensorial. Queremos relacionar un tono y una luz, pero al no tener respuesta, no sabemos si se ha dado o no la asociación. Para comprobarlo asociamos el EC con el EI para que de RC. Si el EC1-EC2 ha tenido lugar el EC2 provoca una respuesta similar que la mostrada por el EC1 tras su emparejamiento con el EI. La fuerza biológica sirve para medir el aprendizaje sobre todo en RC no observables. La respuesta dice que se ha dado el aprendizaje, pero no su adquisición, ya que aprendizaje y adquisición son procesos distintos. Ej: arroz con leche sin canela me produce malestar, pero cuando veo la canela la asocio con el malestar. CONTIGÜIDAD TEMPORAL ENTRE ESTIMULOS: Esther González UNED 2014 Página 12 La relación temporal entre EC y EI puede favorecer o perjudicar el aprendizaje de la asociación entre los mismos y influir en la aparición e intensidad de la RC. Intervalo EC-EI: el RC es mas débil cuando el intervalo EC –EI es mayor. Si es corto el intervalo se dan mas conductas de orientación hacia el EC. Si es largo las conductas de orientación es hacia el EI. Intervalo entre ensayos: cuando los ensayos entre Ec-Ei están distanciados entre si, el condicionamiento es mejor y la expresión del RC. Tanto la duración de cada ensayo como la distancia entre los mismos es importante para el aprendizaje correcto de la asociación EC-EI. Las mejores condiciones se dan en EC-Ei intervalos cortos y aislados en el tiempo. ¿CÓMO SE ASOCIAN EL EC Y EL EI? Para un buen condicionamiento no solo es importante el emparejamiento repetido de la EC-EI además el EC debe ser buen predictor del EI. - El concepto de contingencia: se utiliza para medir si el EC es un buen predictor de la aparición de otro estimulo. La aparición de ambos estímulos no garantiza el condicionamiento. Se calcula por probabilidades y hay tres tipos de contingencia: Positiva: >0, si la aparición del Ec es un buen predictor de la aparición del EI. Se llama condicionamiento excitatorio. Nula: =0si la probabilidad de que el EI apareciese en presencia o ausencia del EC es la misma. Esto implica ausencia total de condicionamiento. Esto tiene un efecto llamado de irrelevancia aprendida. El sujeto aprende que no hay relación de contingencia entre EC y EI y así lo aprende y luego retrasa el aprendizaje de dicha relación. Negativa <0 indica que el EC es un gran predictor de la ausencia de la EI, es decir, el EI es menos probable en presencia que en ausencia del EC. - Fenómenos de competición de claves: aunque la contingencia entre EC y EI sea perfecta no siempre da RC. Puede darse Ensombrecimiento: cuando se dan dos EC (luz y sonido) Compiten entre ellos para ser el mejor predictor del EI. Como aparecen juntos EC2 emsombrece al EC1 teniendo una menor RC ante EC1. Es reversible. Bloqueo: aparición conjunta de dos EC pero hay un previo condicionamiento del EC a un EI y esto condiciona cuando se añade el segundo EC2. EJ: Si como huevos para cenar me sienta mal. Preparo huevos con patatas, pero solo como patatas. Teorías del aprendizaje. : Mod. Rescorla=Wagner: la primera vez que asociamos EC y EI hasta ese momento EI no era predicho por nada y esto nos sorprende y aprendemos la asociación. El emparejamiento sucesivo hace que la aparición del EI a continuación del EC ya no nos sorprenda ya que el EC es capaz de predecir el EI y el aprendizaje ya no tiene lugar. El concepto sorpresa propone un modelo asociativo para el proceso del aprendizaje, siendo la primera característica que en un condicionamiento el aprendizaje solo tiene lugar si el EI es sorprendente. La fuerza asociativa entre EC y EI aumenta en cada ensayo hasta que el EC predice el EI que ha alcanzado la fuerza máxima. Estas variaciones de fuerza asociativa en casa ensayo dependen de: - La saliencia del EC y EI expresada con valor numérico entre 0 y 1 - La magnitud del EI y la esperabilidad - La fuerza asociativa adquirida en ensayo anterior y puede oscilar entre -1 y 1. El incremento en la fuerza asociativa de relación de EC-EI es directamente proporcional a la saliencia de ambos estímulos y depende de la diferencia entre el máximo aprendizaje adquirible y la fuerza de la asociación del ensayo anterior , es decir la diferencia entre lo que podemos llegar a aprender de esta asociación y lo que hemos aprendido (lo sorprendente que nos resulta la aparición del EI tras el EC). Esther González UNED 2014 Página 13 La curva de aprendizaje es el crecimiento de la fuerza asociativa neta ( que se calcula sumando la fuerza asociativa adquirida en el entrenamiento hasta el ensayo anterior y el incremento de las mismo en el ensayo actual). Si lo que ocurre y lo que esperamos (sorpresividad) disminuye con el entrenamiento la fuerza de asociación ha alcanzado el 100 % de su valor. La sorpresividad del Ei depende directamente de la magnitud o intensidad del mismo, por lo que dos magnitudes distintas de un EI dan lugar a curvas de aprendizaje iguales, comprobando la concordancia de los efectos de la intensidad. La saliencia del EC puede modificar la cantidad de aprendizaje de un ensayo porque multiplica la sorpresividad. El bloqueo y Ensombrecimiento influyen en los cambios de la fuerza asociativa. BLOQUEO: EXTINCION: INHIBICION CONDICIONADA PROBLEMAS DEL MODELO Aunque el aprendizaje asociativo según recorla –Wagner es un modelo de referencia tiene limitaciones: - La extinción de la inhibición condicionada donde se afirma que si se presenta repetidamente un inhibidor condicionado sin ir acompañado de un EI la inhibición se extinguirá. Pero si se aplica la formula en fase de inhibición el incremento de fuerza asociativa del EC inhibitorio sería positivo y se convertiría en excitatorio poco a poco. Pero en realidad no ocurre así, no presentar EI tras EC puede aumentar sus propiedades inhibitorias, esto ocurre porque considera la excitarcion y la inhibición como procesos opuestos de signo contrario. - La inhibición latente un EC preexpuesto seguido de un EI que aparecen juntos en fase posterior, sin que haya asociación en la preexposicion, afectando al aprendizaje posterior de la fase de condicionamiento, por lo que se ve retrasado y no como da la formula. - Bloqueo el modelo de Rescorla-wagenr no da explicación al contrabalanceo que el efecto contrario al bloqueo ( el resultado es una menor RC como respuesta al >EC bloqueado (EC2) durante la segunda fase del entrenamiento). - Extinción de la excitación condicionada la extinción como desaprendizaje, pero no explica que sea un modelo distinto. La importancia del contexto. EC i RC se presentan dentro de un contexto específico. Los estímulos propios del contexto acompañan al aprendizaje (olores, formas, colores… ) y condicionan la relación entre EC y EI. Según la presencia o ausencia del EC se pueden dar estos tipos de ensayos: Cuando el EC van seguidos del EI y en los momentos entre ensayos solo están presentes el contexto y el EI, dando contingencia positiva. Cuando aparece el EI solo en presencia del contexto la contingencia será negativa. Cuando EC y contexto va acompañado de EI pero el contexto está cuando aparece el EI la contingencia será nula. Hipótesis del comparador esta hipótesis propone que la respuesta condicionada no solo depende de la asociación entre EC y EI sino también del resto de asociaciones presentes en ese mismo momento que puedan establecerse entre las claves del contexto y el propio EI. El sujeto aprende la asociación entre EC y EI y que las claves del contexto y el EI también tienen asociación. Si la asociación entre EC-EI es mayor que la asociación entre claves de contexto-EI, la RC será de contingencia positiva. Si la asociación entre EC-EI es menor que la de las claves del contexto –EI el animal esperará que el EI ocurra en presencia del contexto y no del EC y la contingencia será negativa. Es decir, si el valor excitatorio de las claves del contexto es mayor que la del propio EC, se dará una RC inhibitoria ante el EC. Si la asociación entre EC y EI es comparable en fuerza a las formadas entre el contexto y EI, la RC no aparece ante el EC por tanto la contingencia será nula. Según la hipótesis del comparador el sujeto aprende tres tipos de asociaciones: entre el EC-EI, entre el EC y claves del contexto y entre las claves del contexto y el EI. Cuando se presenta EC el EI se activa: Esther González UNED 2014 Página 14 De forma directa ante el EC De forma indirecta por asociaciones creadas por el contexto y entre el contexto y el EC. Premisa 1: Esas asociaciones determinan la intensidad del la RC y su carácter excitatorio o o inhibitorio. Pero según el modelo no existen asociaciones inhibitorias, y la manifestación final del a RC depende de la fuerza relativa de la asociación excitatoria entre el Ec y EI con respecto a las asociaciones excitatorias entre el mismo contexto y EI. Premisa 2: la comparación entre las asociaciones excitatorias determinan la RC pero no el aprendizaje porque el sujeto compara las fuerzas asociativas una vez acabado el entrenamiento, Ej: si extinguimos la relación contexto-EI la RC frente al EC aumentará. Modelos atencionales: TEORIA DEL MACKINSTOSH Basándose en la atención en el aprendizaje, Mackinstosh y Turner pusieron un sonido seguido de una descarga eléctrica en primera fase de condicionamiento. En fase 2 pusieron sonido y luz seguido de descarga. Tercera fase, sonido+luz seguido de descarga mayor . los sujetos aprenden que en fase 3 la intensidad aumenta ante la luz para grupo control. El grupo experimental aprenden que la luz es redundante y que la descarga se da de todas maneras, por tanto no prestan atención a la luz. Mientras que rescorla-Wagner explicarían que este efecto es causa de la falta de sorpresividad, Mackinstosh dice que se debe a que ignoran los estímulos predictories redundantes, es decir a la falta de atención. Cuanto mayor predictor sea el EC del EI mayor atención le presamos. Y depende del resto de los ECs presentes. TEORIA DE PEARCE Y HALL Sugieren que no debemos malgastar recursos prestando atención a estímulos que conocemos, sino a aquellos que no controlamos con seguridad. Según esta teoría la atención a un EC disminuye con cada ensayo según se convierte en mejor predictor del EI. si el EI tgras EC no resulta sorprendente, prestamos menos atención al EC en el siguiente ensayo, si el EI nos sorprende, la atención aumentará. Otras teorías. El modelo SOP el aprendizaje depende de que el EI sea sorprendente, pero defiende que un estímulo sorprendente tiene mejor procesamiento en nuestra memoria a corto plazo, y mayor probabilidad de mantenerse en nuestra memoria a largo plazo. La sorpresa se ve reducida si el estímulo ya esta activado en nuestra memoria a corto plazo. Este modelo representa el condicionamiento por nodos y redes neuronales, propias de conexionismo. La representación de los estímulos se denomina NODO y las asociaciones entre nodos son CONEXIONES. Según este modelo los nodos que representan el EC y EI se activan cuando los estímulos reales se activan y lo hacen a dos niveles: Estado A1 cuando EC y EI están presentes provocan un nivel de activación y atención alto. Un nodo solo puede mantenerse en este estado un intervalo de tiempo porque decae al Estado A2 relacionado con la atención periférica y menos focalizada y permanece allí durante un lardo periodo de tiempo hasta su inactivación. La asociación entre ambos nodos EC-EI, solo tendrá lugar si ambos están activados y coinciden en el estado A1, memoria a corto plazo. Esta coincidencia ensayo tras ensayo hace que la asociación sea mas fuerte y cuando están asociados y la activación se da en el estado A2 (el nodo Ei se activará con presencia real de dicho EI) Esther González UNED 2014 Página 15 Tema 4 PRINCIPIOS BASICOS DEL CONDICIONAMIENTO OPERANTE. Conducir, hablar, trabajar no ocurre de forma automática ante un estímulo, el sujeto emite respuesta que estuvo relacionada con un acontecimiento ambiental en el pasado. Cuando las conductas es probable que se vuelvan a repetir si se recibe un incentivo de placer, pero si recibimos aversión, es probable que no se vuelva a hacer. Si después de trabajar todo el mes, no recibimos el salario, dejaremos de trabajar. El condicionamiento operante se encarga de predecir las respuestas que no son evocadas por estímulos. ANTECEDENTES HISTORICOS. La teoría evolutiva de Darwin es una gran influencia del análisis experimental de la conducta desde el punto de vista del condicionamiento operante. La variación y selección como postilados principales de su teoría en cuanto a las características heredadas, se aplica al comportamiento. En el condicionamiento operante el reforzador actúa como seleccionador de las respuestas mas apropiadas y así aparece una conducta según la circunstancia. Thorndike y la ley del efecto. Thorndike: Primer científico que estudió la conducta operante y lo llamo aprendizaje por ensayo y error. Centró su interés en como los aciertos y fracasos afectaban la conducta. Concluye que el aprendizaje ocurre cuando se fortalecen las conexiones entre estímulo y respuesta danto una satisfacción al sujeto, y lo llamó conexionismo encuadrado dentro del paradigma E-R. Ej: de los gatos que activaban por casualidad el mecanismo de apertura (latencia tiempo desde que empieza el experimento hasta el escape que disminuía a lo largo de los ensayos). Concluye cuando una conducta va seguida de un incentivo agradable, el aprendizaje está basado en una concepción hedonista (los resultados placenteros se fortalecen, los desagradables se eliminan). El análisis experimental del comportamiento de skinner,. Skinner: primer responsable del reforzamiento. Desarrolla la idea que los reflejos podrían ser estudiados como conductas y distingue entre el condicionamiento de reflejos de pavlov y el aprendizaje de thorndike que dijo que la conducta se regula por el condicionamiento de los reflejos y el operante, centrándose en las relaciones funcionales entre la conducta y sus consecuencias. Llamó condicionamiento operante a la capacidad para operar sobre el ambiente. Llamó condicionamiento instrumental al hecho de que la conducta del sujeto es el instrumento para obtener el reforzador. Pensaba que se podía repetir respuestas sin intervención del experimentador y medía el número de respuestas emitidas por unidad de tiempo en lugar de la latencia. Esther González UNED 2014 Página 16 DEFINICION DEL CONDICIONAMIENTO OPERANTE. Pavlov utilizaba como base los reflejos, pero era difícil identificar el estímulo evocador. Podemos saber lo que produce salivación en un perro, pero no el estímulo que incita a tocar el piano. La conducta futura, viene determinada por las consecuencias del pasado. El condicionamiento operante es el proceso que da lugar a que una respuesta se vea modificada por sus los efectos que tiene el ambiente sobre ella. Por tanto el condicionamiento operante dispone al sujeto en unas circunstancias en las que alguna de sus conductas da lugar a la aparición de un cambio de emisión de respuesta. En el condicionamiento operante es el sujeto el que opera en el medio, lo modifica a la vez que este modifica el organismo. Si el resultado es beneficioso, la conducta se fortalecerá, si es perjudicial, tenderá a desaparecer. Con el condicionamiento operante los sujetos aprenden a obtener o eliminar consecuencias del ambiente. Con este condicionamiento los sujetos además de aprender respuestas ante una nueva circunstancias con respuestas que formaban parte de su repertorio anterior, sino que pueden dar respuestas nuevas. La contingencia de tres términos. En el condicionamiento operante la consecuencia está relacionada con la presentación de la respuesta. La contingencia: en presencia de un estímulo especifico, el reforzador se presentará si la respuesta operante sucede. Tres términos elementales y sus interrelaciones funcionales: Estímulo discriminativo: la conducto no siempre da respuestas discretas, puede ser la ejecución que ocurre después de un estímulo que tiene como resultado una consecuencia específica. Los estímulos antecedentes tienen gran importancia en el condicionamiento operante y se llaman discriminatorios. En el condicionamiento operante los estímulos no provocan la aparición de respuesta, sino que señalan la ocasión para que un estímulo indique que una respuesta puede tener consecuencia. El reforzamiento diferencial implica reforzar una operante en una situación y no en otra, por lo que el estímulo discriminatorio ejerce control sobre esa respuesta pero no es el ED el que provoca la respuesta. Cuando el Ed es seguido de una respuesta con consecuencia apetitiva, la respuesta se ve reforzada y hace que aumente la probabilidad de que se produzca posteriormente. Ejemplo de maquina de bebidas con luz verde(ed) o roja(EA a estimulo delta =ausencia del reforzador). En presencia de un EA la respuesta operante disminuye. CONTROL POR EL ESTIMULO se refiere a cómo los estímulos que preceden una conducta pueden controla la ocurrencia de esa conducta. La respuesta: En el condicionamiento instrumental, la respuesta operante son los efectos provocados en el ambiente. La operante se define por su función y no por su forma, la misma respuesta es la misma operante. Se puede apretar la palanca con el pico o con el morro o con la pata, diferentes respuestas mismos efectos, misma operante. La conducta puede adoptar distintas formas en la misma función. Ejemplo: Como ponernos un gorro para no tener frio es una clase de respuesta es decir la forma, con una misma función: no tener frio. El reforzador: para el condicionamiento instrumental hay gran variedad de estímulos que refuerzan una conducta. Un reforzador es cualquier evento que cambia la probabilidad de aparición de una respuesta en el futuro. Reforzamiento condicionado: elogios, criticas, el dinero, son reforzadores que pueden fortalecer o debilitar la ocurrencia de una conducta. Las experiencias, condicionan la consecuencia. “yo no canto por dinero, canto por placer”, “pero del dinero da mucho placer”. El reforzamiento condicionado o secundario es un estimulo que en principio no es reforzante, (luz o sonido) puede adquirir la capacidad de reforzante mediante asociación repetida con otro que era previamente reforzante y siempre dependiendo de la historia del sujeto, es decir, cuando un evento arbitrario es capaz de aumentar la frecuencia de respuesta. ACLARACIONES Reforzador (evento)-reforzamiento(procedimiento/proceso). El reforzamiento produce incremento en la conducta y los reforzadores son los eventos que hacen que el reforzamiento tenga efectos. Castigo: cuando el procedimiento disminuye la conducta y los eventos son de naturaleza aversiva. Respuesta discreta –operante libre: en el ensayo discreto donde el experimentador solo puede intervenir para ubicar el aparato al final o principio del ensayo, solo se puede medir una respuesta en cada ensayo y la VD es la latencia de respuesta y el tiempo entre ensayos. La caja de skinner permitiría los procedimientos operantes libres ya que los sujetos pueden emitir respuesta de forma constante sin la manipulación del investigador entre ensayo y ensayo pudiendo medir la presión, tasa de respuesta… Esther González UNED 2014 Página 17 Topografía-función: el análisis de la conducta puede hacerse según la forma de la respuesta o topografía, refiriéndose a las propiedades o características físicas de una respuesta en el tiempo. Es decir para cerrar una puerta podemos usar el codo, la mano, un dedo, el pie, hacerlo mas deprisa, mas lento y cada una de ellas sería una forma, que está relacionada con las contingencias del reforzamiento; es menos probable cerrar la puerta con el pie en una situación social por lo que la topografía es una función de las ontingencias de reforzamiento. Sin embargo la función se refiere a las relaciones de la respuesta con los estímulos antecedentes y las consecuencias de la misma. Por tanto la conducta es la ejecución de una respuesta que sigue a un estímulo especifico y que tiene como resultado alguna consecuencias. Dos respuestas con la misma topografía puede tener una función diferente y dos respuestas con distinta ropografia puede tener la misma función. La biología puede imponer limitaciones al condicionamiento de algunas respuestas. Instancia de respuesta y clase de respuesta (UNIDAD CONDUCTUAL). Las relaciones conductuales son una correlacion entre una clase de estímulo y una clase de respuesta. La conducta es molar, la operante son relaciones funcionales entre clases de respuestas y consecuencias ambientales. Pero hay que diferencias entre lo que es una clase de respuesta y lo que son respuestas particulares o instancias de respuestas (punto de vista molar). Una instancia de respuesta es la unidad mínima de conducta como “presionar palanca” sin tener en cuenta, el momento, cuantas veces o su topografía. Interacciones clásicas y operantes en el control de la conducta Aprendizaje pasivo es cuando un sujeto solo necesita ser expuesto a los estímulos para que el aprendizaje ocurra. El condicionamiento operante requiere que el sujeto sea activo y emita el la respuesta. Para reforzar o castigar una conducta tiene que haber conducta. Cuando queremos que una paloma picotee un botón en una caja de skinner tenemos que esperar que ocurra por casualidad, lo que lleva tiempo para poder reforzar y condicionar. El automoldeamiento consiste en implementar en un primer momento un procedimiento clásico excitatorio apetitivo emparejado aun estímulo inicialmente neutro para acabar dando una respuesta operante aunque topográficamente tanto la EC como la ED sean topográficamente indiferenciables. La interaccion entre condicionamiento clásico y operante es porque los acontecimientos ambientales actúan sobre los sistemas neurofisiológicos de los organismos de forma global y no sobre un sistema concreto. Neurológicamente se ha sugerido que ambos tipos de aprendizaje se deben considerar fenómenos distintos, pero esta afirmación genera discusión. Esther González UNED 2014 Página 18 PROCEDIMIENTOS BASICOS DEL CONDICIONAMIENTO OPERANTE La conducta es dinámica y se modifica según las variables de interrelaciones que se puedan dar. Los procesos conductuales reproducibles son los que se pueden siguen un patrón temporal identificable que bajo condiciones objetivamente especificas son reproducibles. La contingencia es una relación de dependencia funcional entre dos componentes del condicionamiento y es la relación que se establece cuando un componente se correlaciona con el otro. Puede ser positiva si la respuesta es seguida de una consecuencia o negativa si la respuesta elimina la aparición de la consecuencia. Según la contingencia (positiva o negativa) y la naturaleza de las consecuencias (apetitivas o aversivas se pueden establecer cuatro procedimientos fundamentales de condicionamiento operante. Unos que incrementan conducta (reforzamiento positivo, evitación y escape) y los que disminuyen conducta (castigo y entrenamiento de omisión). Esther González UNED 2014 Página 19 Procedimientos destinados a aumentar conductas REFORZAMIENTO POSITIVO O ENTRENAMIENTO DE RECOMPENSA: Es cuando aumenta la fuerza de la respuesta (frecuencia, intensidad, tasa,) por una consecuencia apetitiva, que puede consistir en un reforzador primario como la comida o el placer o secundario como elogios, dinero… pero el sujeto debe estar motivado para obtener el reforzador. (comida como reforzador si estoy lleno) El moldeamiento o método de aproximaciones sucesivas implica reforzar respuestas para que se aproxime a la respuesta final exigida, muy lejos de cómo se actuaría en el medio natural (presionar palanca) ESCAPE Y EVITACION: Conocidas como reforzamiento negativo= incremento de tasa de respuesta o intensidad. Escape: La respuesta operante consiste en la eliminación de un evento de naturaleza aversiva. (Me voy de la conferencia porque me aburre) Eliminación: La respuesta consiste en impedir que esté presente el evento de naturaleza aversiva (no voy a la conferencia porque me aburre). En laboratorio los sujetos aprenden primero el escape i luego la eliminación. Procedimientos destinados a disminuir conductas EL CASTIGO O CASTIGO POSITIVO: tiene como resultado la disminución en la fuerza de la respuesta. El castigo se define por su función y cuando no tiene efectos en la conducta se considera que este no ha ocurrido. Para castigar una respuesta, antes ha tenido que ser reforzada y el castigo consiste en la imposición de una contingencia de tipo aversivo sobre la respuesta. Castigo negativo o entrenamiento de omisión: implica no entregar una recompensa cuando se presenta una conducta no deseada. Los eventos o circunstancias eliminadas en el caso del castigo negativo, se asume que son eventos reforzantes (ver la tele, hablar con compañeros, comer caramelos, rechazo sexual ante conductas no deseadas en la pareja). Efectos colaterales de los procedimientos aversivos: las razones éticas desaconsejan los procedimientos aversivos para producir cambios conductuales. Para skinner estos procedimientos no son una forma fiable de disminución de conducta porque tiene efectos emocionales no impide que en el futuro vuelva a ocurrir en cuanto la activación emocional se disipe. También puede que la estimulación aversiva se asocie a otros estímulos presentes y inhibir conductas deseables. Cuando se castiga se asocia el castigo con quien lo ejecuta mas que con la conducta indeseada y en el futuro puede ser que se rechace a quien castiga en lugar de cambiar de comportamiento. La extinción en el reforzamiento positivo: la extinción es el procedimiento mediante el cual una respuesta que previamente se reforzaba, se deja de reforzar. También es un proceso que disminuye la frecuencia o intensidad de la respuesta causada por la ausencia del reforzador y una disminución gradual de respuesta. La extinción es la disminución de tasa de respuesta, pero no se elimina completamente. Si observamos que se produce cierta recuperación de la respuesta se llama recuperación espontánea. Estallido de extinción es cuando dejamos de presentar el reforzador y aumenta la respuesta sobre la que anteriormente se daba. Después la tasa de respuesta empieza a disminuir de forma gradual. El aumento de la variabilidad de la respuesta porque hay cierta variación conductual al aumentar las oportunidades de que el organismo pueda reinstaurar el reforzamiento. Las respuestas emocionales incondicionadas es cuando la extinción produce un estado emocional de frustración que hace que respondas repetidamente Ej: presionar un botón de una maquina que no ha dado la bebida tras poner dinero, incluso puede aparecer la agresión. En laboratorio la extinción provoca que las respuestas emocionales desaparezcan y la intensidad de la respuesta disminuye al nivel registrado antes de que la conducta fuese reforzada. Resistencia a la extinción es la tasa de respuesta mostrada hasta conseguir la extinción. Efecto de sobreentrenamiento en la extinción: Las respuestas que han sido reforzadas en pocas ocasiones se extinguen de forma lenta y las que han sido muy reforzadas muestra menor resistencia a la extinción. Esther González UNED 2014 Página 20 Los reforzadores parciales o intermitentes presentan mas resistencia que los continuos. Ej: el llanto del niño que a veces es reforzado o tras no, es difícil de erradicar. El efecto del reforzamiento parcial aumenta la resistencia al cambio. La magnitud del reforzador y la inmediatez de la recompensa son otras variables que influyen en la persistencia de la respuesta durante la extinción. Cuando la magnitud de la recompensa es alta y se administra de forma continua, la resistencia disminuye. Si es intermitente o parcial , la resistencia será alta. Lo mismo ocurre con el tiempo que tarda en caer la bolita. La disminución de respuesta puede que sea debida al olvido debido al paso del tiempo. La extinción no revierte lo ocurrido, sino que implica un nuevo aprendizaje. La renovación: consiste en la recuperación de la respuesta extinguida en un contexto diferente al que se llevo a cabo la extinción. La restauración: es igual pero en el mismo contexto de la extinción. El restablecimiento: respuestas extinguidas vuelven a aparecer sin que esta de lugar al reforzador. FENOMENOS DEL CONDICIONAMIENTO OPERANTE La conducta supersticiosa Una respuesta sin motivo aparente sea seguida depor un reforzador da lugar a una conducta reforzada accidentalemente. El experimento de supersticion de Skinner demostró las consecuencias del reforzamiento accidental en el aprendizaje. Palomas, un grano cada 15 segundos, presentaban pautas de comportamiento que parecía indicar que su conducta controlaba la entrega y lo llamo reforzamiento accidental o adventicio. Si se da el grano cuando alza la cabeza, lo relacionará y esta conducta quedará reforzada, con lo que repetirá la conducta aumentando la probabilidad que se de la ocurrencia y quede reforzado la relación de conducta-respuesta. Satddon y simmelhag llegaron a la conclusion que las respuestas de los animales se podían englobar en dos grupos: Las conductas interin que son aquellas que tenían lugar en medio del intervalo, cuando aún faltaba tiempo para la aparicion del reforzador. Como su respuesta no variaba de una paloma a otra, concluyeron que las conductas se producen de forma innata y no por reforzamiento accidental cuando la probabilidad de reforzamiento es baja. Las conductas terminales ocurrian al funal del intervalo, proximas a la aparicion del reforzador. Su aparicion no estaría relacionada con un reforzamiento accidental. Esther González UNED 2014 Página 21 Por consecuencia, no todas las conductas que aparecen cuando se entregan reforzadores de forma periodica son el resultado de un emparejamiento aleatorio entre respuesta y reforzador, siendo algunas respuestas conductas innatas con alta probabilidad de aparicion cuando el sujeto espera la aparicion de un reforzador. Por lo que algunas conductas se podrían explicar que son supersticiosas y otras tienen que ver con conductas innatas relacionadas con reforzadores en ambientes naturales. En los humanos ocurren conductas supersticiosas, cuando en las situaciones no tenemos ningun tipo de control sobre las consecuencias de las acciones, como juegos de azar. Habitual en deportistas, jugadores. Las personas controladoras, que necesitan el control sobre los eventos, son supersticiosas. Herstein estableció: Las supersticiones idiosincráticas: motivadas por la experiencia propia de siutaciones anteriores de reforzamiento (me pongo calcetines rojos con los que he aprobado los examenes anteriores) Las supersticiones sociales típicas: que se mantiene a lo largo del tiempo ( el nº 13, pasar debajo escalera…) que tienen sus inicios en creencias populares que ya no son efectivas. (encender 3 cigarros con la misma cerilla viene de la guerra mundial, porque una cerilla encendida daba al enemigo tu posición). La deriva instintiva y el concepto de relevancia o petinencia en el condicionamiento instrumental. El condicionamiento instrumental no condiciona siempre la misma forma de respuesta. Existen situaciones que la relacion de pertinencia o relevancia entre respuestas y reforzadores dependen del tipo de reforzador. Por tanto el condicionamienot depende del reforzador que usenos y de la historia evolutiva del animal. Marion y keller descubrieron que las conductas innatas interferían con las respuestas operantes pretendidas. A esto lo llamaron deriva instintiva: frotar moneda mapaches, relinchar caballos, son respuestas naturales muy fuertes relacionadas con la comida y que compiten con las que requiere el entrenador para el condicionamiento operante. Los cambios en la cantidad y calidad de recompensa: El efecto de la recompensa depende de la experiencia pasada con otros reforzadores. Dependiendo de la motivacion y efectividad de un reforzador para controlar una conducta puede verse modificada por la experiencia previa. Esto es el CONTRASTE CONDUCTUAL. El aumento de sueldo pone contenta a la gente, una bajada nos enfada porque tiene que ver con el valor del reforzador. Los efectos de la recompensa dependen de la experiencia previa con otras recompensas. 1600 euros te quitan 100 contraste conductual negativo trabajo menos 1400 euros te dan 100 contraste conductual positivo trabajo mas. Contrabilidad de las consecuencias aversivas y el efecto de indefension aprendida. Experimento del video de la clase y auschvic Las situaciones incontrolabes desarrollan una reaccion emocional en la que se manifiesta un comportamiento pasibo ante las circunstancias. Es similar a la depresion humana. Las conductas no tienen efectos por lo que la aparicion de la descarga es independiente de la conducta: hipotesis de la indefension aprendida. Para reducir el efecto de la indefension es reforzando las expectativs de que toma el control de la conducta sobre las consecuencias. Inmunicion: (seligman): proceso que se desarrolla cuando un sujeto teien una primera experiencia con descargas escapables que bloquea el desarrollo de la indefension aprendida cuando se presentan descargas inescapables en una fase posterior. Los efectos de la demora del reforzador en el condicionamiento isntrumental: el precedimiento de marcado. La entrega de la recompensa aumenta la probabilidad de respuesta, si es inmediato en el tiempo. La demora del reforzamiento puede aumentar o disminuir la conducta. Muchas teorias asociativas del aprendizaje defienden que dos eventos deben ser contiguos para que sean asociados. Si marcamos la respuesta la podemos diferenciar de otros eventos que ocurren durante el periodo de demora. El marcado evita los efectos de la demora en la entrega del reforzador. Marcamos la respuesta haciendo que esta pueda diferenciarse. Ratas brazo lateral negro o blanco y caja de demora. Devaluacion del reforzador: consiste en asociar al reforzador (comida) un estímulo de naturaleza contraria ( sustancia aversiva que da dolor de barriga) . bolitas con gustos. Los animales aprenden acerca de las consecuencias de su conducta durante el condicionamiento operante. Pero la respuesta instrumental puede llegar a automatizarse con la practica (habitos) podemos conducir y hablar. Esther González UNED 2014 Página 22 Tema 5 PROGRAMAS Y TEORIAS DEL REFORZAMIENTO. Programas basicos de reforzamiento: vinculado al condicionamiento operante, donde se aprecia la relacion entre estímulo discriminativo y respuesta operante o reforzador. Los programas de reforzamiento especifican las regals que determinan las condiciones en que una respuesta puede ser reforzada. No se refuerzan todas las respuestas, solo algunas y se llama programa intermintente de reforzamiento que en comparacion con el continuo, produce un aprendizaje mas duradero y dificil de extinguir. Basandose en la adquisicon y no en la extincion se consideran efectos diferenciales de los programas de reforzamiento. Diferentes formas de programar los reforzadores de forma intermitente son: Programas de razon: estipulan que se debe emitir un determinado numero de respuestas antes de que la última de ellas sea reforzada. Esther González UNED 2014 Página 23 De razon fija: el numero de respuestas requerido es siempre el mismo De razon variable: El numero de respuestas varia de una ocasión a la siguiente de manera irregular. Se hacen promedios. Programas de intervalo: establecen que debe pasar un determinado tiempo desde la consecucion del reforzador anterior antes de que la respuesta requerida sea de nuevo reforzada De intervalo fijo, mantienen constante el tiempo requerido para que se entregue el siguiente reforzador, y reforzaran la respuesta despues de que haya ocurrido un tiempo siempre igual desde que se dispensó el anterior reforzador. De intervalo variable: varia la cantidad de tiempo que debe transcurrir entre un reforzador y el siguiente antes de que la respuesta sea reforzada dando lugar a promedios de intervalos entre reforzdores. Cada programa produce una ejecucion conductual diferente, apreciable a simple vista según como se distribuyen las respuestas. Un registrador acumulativo registra las respuesta de manera automatica. Consite en un rollo de papel, que gira a velocidad constante con dos plumillas, una mide respuestas y el tiempo transcurrido entre respuestas y dejar constancia de otros sucesos ambientales como presentacion de estimulos, registros discriminativos y reforzadores. Mide respuestas incluso las que son muy rapidas y estructuras complejas de comportamientos sin perder detalles de cambios relativamente pequeños en la conducta. Las respuestas variables proporcionan programas de perseverancia muy elevado. Las respuestas fijas inicialmente tienen una tasa elevada de respuesta. La duracion de la pausa post-reforzamiento en los programs de RF depende del valor de la razon. TENSION DE LA RAZON: dejar de responder por completo si el requisito de la razon es elevado. La tasa de respuesta aumenta progresivamente en cada uno de los intervalos a mendida que avanza el tiempo y es es tipico de los programas IF. Estos programas reflejan la discriminacion temporal y los animales reponden cuando “subjetivamente” consideran que es probable la consecucion del reforzador. La diferencia entre los programas fijos (RF y IF) y los variables (RV y IV) es que en los fijos suele aparecer una pausa despues de cada reforzamiento. En RF la pausa post-reforzamiento es alta y estable de respuesta, en IF se pasa de la pausa a una aceleracion gradual en la tasa de respuesta hasta alcanzar una tasa alta al final del intervalo. para conseguir un reforzador se puede limitar el tiempo. Duracion limitada: cuando la recompensa se esta disponible un tiempo limitado. La duracion de la pausa post reforzamiento que ocurre en los programas de RF se incrementa a medida que aumenta el requisito de la razon y su duracion está relacionada con la longitud del programa de IF, de manera que a mayor duracion del intervalo, mayor pausa. En los programas de razón a mayor numero de respuestas, mayor intervalo entre reforzadores, dado que se tarda mas en completar las respuestas necesarias para conseguri el reforzador. Las transiciones de uno a otro programa de RF pueden ser: corta-corta, larga-larga, corta-larga y larga-corta. Mirar cuando se dan cada uno de los casos (pag. 224) Aunque parezca paradojico, las variables de control sobre la longitud de la pausa post-reforzamiento no son tan diferentes en programas de razon e intervalo, aunque en los de razon, el dejar de responder lleva a una perdida efectiva de reforzaores, (cuanto mas rapido se responda) mas reforzadores se obtendràn), siendo la frecuencia de reforzamiento y el programa que se acaba de iniciar determinantes fundamientales. Programas de razón frente a programas de intervalo: funciones de retroalimentacion. Cuando se igualan las tasas de reforzamiento la respuesta es mayor en los programas de razon que en los de intervalo. Para equiparar los dos programas en cuanto al nº de reforzadores y distribucion de los mismos, se usa un procedimiento en el que se asigna un valro de intervalo a un programa de reforzamiento en funcion de lo que tarden los animales en completar previametne un programa de razón. En los programas de intervalo, la tasa de respuesta no influye directamente sobre la frecuencia de administracion de los reforzadores, mientras que la tasa de reforzamiento varia de manera directa con los cmaibos en la tasa de respuesta en programas de razon. Es porque los programas de intervalos refuerzan TER largos, ya que el paso del tiempo lleva a un incremento en la probabilidad de reforzamiento. Esther González UNED 2014 Página 24 En los programas de razon RV, no presentan la tendencia de reforzar un TER en particualr, por lo que no favorecen la ocurrencia de TER largos. Es mas al responder en rafagas es probable que el reforzador actue sobre TER cortos. En los programas de RV existe una correlacion directa entre la tasa de respuesta y la de reforzamiento. La tasa de respuesta aumentará para maximinar la tasa de reforzamiento. En los programas IV no esixte relacion entre tasa de respuesta y tasa de reforzamiento, por lo que las variaciones de una no afectan a la otra. Baum ha denominado esta explicacion como MOLAR, porque las variables efectivas ( la tasa de reforzamiento y su dependencia de la tasa de respuesta) son fenomenos temporalemtne extensos, haciendo enfasis en la correlacion frente a la contigüidad. La relacion entre conducta y ambiente, establecidad como programas de reforzamiento, se pueden describir en FUNCIONES DE RETROALIMENTACION: correlaciones entre la tasa de respuesta y de reforzamiento. La forma en que actua el ambiente como la frecuencia de reforzamiento, la magnitud del reforzador, la demora. Las funciones de retroalimentacion no asumen que la conducta este bajo el control de una VI, sino que la conducta afecta a algun aspecto del ambiente. La tasa de reforzamiento es proporcional a la tasa de respuesta realizada y la proporcionalidad es el requisito de la razon. Cuanto mas rapido se responda, mayor sera la tasa de reforzamiento y el nº de respuestas requeridas para producir incrementos en la tasa de reforzamiento debe aumentar conforme se incrementa el requisito de la razón. Las areas aplanadas de las funciones de retroalimentacion en los programas de intervalos indican que el control diferencial de la conducta es bastante débil, las contingencias de reforzamiento no empujan la conducta en ninguan direccion. Esto significa que el punto en el que la VD y VI llegan a la semiestabilidad es bastante impredecibe la tasa de reforzamiento. Es por esto que los programas de intervalos generan mauor variabilidad entre los sujetos en la tasa de respuesta, por diferencias indiduales entre unos animales y otros. Sin entrenamiento los animales desarrollan conductas innatas especificas de cada especie, que puedn considerarse resultado de la operación de historias conductuales remotas. Programas de reforzamiento diferencial de tiempos entre respuestas. El diseño básico de los TER es elegir un tiempo determinado y reforzar únicamente los TER que sean largos en ese tiempo. RDB : (TER largos en tiempo) REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS DE RESPUESTA. RDA : (TER cortos en tiempo) REFORZAMIENTO DIFERENCIAL DE TASAS ALTAS DE RESPUESTA. Ej de RDA: contestar un cuestionario con tiempo limite para cada pregunta o saltar a la siguiente; tiempo para el saque en un partido de tenis; Ej. De RDB: retirar la comida del horno antes de que se cueza; coordinar pasos de baile, tocar instrumentos musicales, Cualquier aceleracion en la conducta que lleve aun resultado no reforzado, sino castigado. Los programas RDB se diferencian de los IF que en RDB se refuerza la respuesta si ha transcurrido un tiempo especifico desde la anterior respuesta. ( TER) y en los IF desde el anterior reforzador. Los RDB añaden castigo si la respuesta ocurre antes del tiempo especificado. Para obtener reforzador hay que esperar para emitir respuesta. En el programa RDA se obtiene el reforzador si se respinde antes de que transcurra el tiempo especificado por lo que se obtienen tasas altas de respuestas. Este programa es mas facil de ejecutar ya que en el RDB es mas dificil el entrenamiento de reforzar una respuesta que no se haga de forma repetida y espaciada y la degradacon del valor del reforzador por encontrarse demorado desde la emision de la respuesta criterio. Teoria del reforzamietno diferencial de los tiempos entre respuestas. Los reforzadores ademas de reforzar la respuesta refuerzan tambien el ritmo espaciamiento entre respuestas. Los programas de RDB y RDA estan diseñados para reforzar respectivamente, TER de larga y corta duración, sin embargo los programas de reforzamiento operante el sujeto puede responder libremente en los preiodos entre reforzadores por lo que los sujetos y el tipo de programas fijos o variables, de razon o de intervalos son interdependientes. Los programas RV y IV consiguen respuestas constantes, sin post-reforzamiento, y la duracion del TER es homogénea. Los programas de RF y IF tienen pausas post reforzamientos, y los TER deberían ser cortos puesto que los reforzadores se presentan al final cunado los sujetos estan respondiendo a una tasa alta. Esther González UNED 2014 Página 25 Programas compuestos de reforzamiento: Programas alternantes y secuenciales: el control por el estímulo y el reforzamietno condicionado. Mejor leer los ejemplos para entender diferencias: PROGRAMA MIXTO: 2 o mas programas básicos alternados al azar. El cambio de unió a otro es independiente de la conducta, pero si de la duración de un tiempo establecido PROGRAMA MULTIPLE: igual que el mixto con la diferencia de que cada componente se señala con una clave discriminativa distinta, una luz, un sonido, etc y el sujeto es informado en que parte del programa se encuentra. PROGRAMA TANDEM: 2 programas simples que se presentan en el mismo orden. Se debe completar el primer programa para iniciar el segundo, para conseguir el reforzador. PROGRAMA ENCADENADO :igual que el tándem pero los dos programas se señalan de manera diferente, de forma que el sujeto conoce que en que momento del programa se encuentra. Cuando acaba un programa se enciende una luz o un sonido que permanece en funcionamiento durante el segundo programa hasta la consecución del reforzador. Una luz puede adquirir capacidades reforzantes de segundo orden por su emparejamiento con la comida. En los programas encadenados, el cambio en el ambiente por la finalización del primer programa adquiere propiedades reforzantes por su asociación con el reforzador que consigue en el segundo programa. Programas simultáneos: programas concurrentes y programas combinados. PROGRAMA CONCURRENTE: se caracterizan por disponer simultáneamente de al menos dos programas básicos de reforzamiento. Se puede cambiar de un programa a otro sin que se haya completado un tiempo o un numero de respuestas. PROGRAMA ALTERNATIVO.: Se refuerza una respuesta cada vez que se cumple con el requisito del programa de razón o intervalo, existiendo así dos formas de conseguir el reforzador PROGRAMA CONJUNTIVO. Se refuerza una respuesta cada vez que se cumple al mismo tiempo con el requisito de la razón y el intervalo. PROGRAMA ENTRELAZADO: La respuesta que se refuerza bien determinada por dos programas, pero la disposición de uno de ellos se altera por el desarrollo del otro. Esther González UNED 2014 Página 26 CONDUCTA DE ELECCION: Elección o preferencia entre las alternativas de respuestas se calcula por la tasa relativa de respuesta y se presenta por el cociente: Ra/ra+rb donde ra y rb presentan la tasa de respuesta alternativa a y b. Los premios concurrentes se dan a elegir entre dos actividades diferentes como comer o beber y así se conocían las inferencias preferidas, En los programas concurrentes los sujetos no eligen entre diferentes premios, sino entre diferentes alternativas, que requieren la misma respuesta pero pueden llevar a diferentes premios esto se llama respuestas instrumentales concurrentes. Ley de igualación: el Hernstein utilizo un programa concurrente donde las alternativas diferían en la tasa o frecuencia de reforzamiento, con cada alternativa proporcionaba reforzamiento con un programa independiente de IV. Observó que las palomas distribuían su respuesta en función de la frecuencia de reforzamiento en cada una de las alternativas. Esto se llama la ley de igualación donde se afirma que la tasa relativa de respuesta entre dos alternativas de respuestas concurrentes es igual a la tasa (frecuencia) relativa de reforzamiento asociada con casa una de dichas alternativas de respuesta Ra/Ra+Rb=Fa/Fa+Fb. Donde Ra y Rb representan las tasas alternativas y Fa y Fb la tasa (frecuencia) de reforzamiento asociada a las alternativas a y b respectivamente. Lo que Hernstein encontró en sus experimentos es que variando la frecuencia de reforzamiento asociada a las alternativas de respuesta en distintos programas de IV, los animales se ajustaban bien a una relación lineal de manera que si la alternativa a ofrecia una mayor frecuencia de reforzamiento que la b, los animales elegian mas la a que la b y al contrario. Además de igualar la tasa relativa de respuesta con la tasa relativa de reforzamiento, observo que los animales igualan la tasa relativa de respuesta con otros parametos que definen al reforzador como la magnitud o inmediatez. De manera que en la formulación de la ley de igualación se pueden incluir todos los parámetros de reforzamiento. Esther González UNED 2014 Página 27 Lo esencial de la ley de igualación es que establece igualdad entre la tasa relativa de respuesta y la tasa relativa de reforzamiento de manera que la proporción entre las respuestas emitidas en las alternativas debe ser igual a la proporción de los reforzadores obtenidos en dichas alternativas. EN ESA LEY NO SE EQUIPARAN TASAS ABSOLUTAS, SOLO RELATIVAS. Maximización: elección entre programas concurrentes de razón. Se intento generalizar la ley de igualación a otras situaciones, variando el programa de reforzamiento asociado a las alternativas de respuesta evaluando la elección cuando las diferentes alternativas consistían en programas de razón. En este caso los sujetos tienden a elegir la alternativa de respuesta que tiene una razón mas baja, describiéndose dicho resultado como MAXIMIZACION. Esta es un comportamiento adaptativo,elige en exclusiva la alternativa mas favorable sin contradecir la ley de la igualación. Es el único comportamiento que en una situación de programa concurrente de razón cumple con la ley de igualación. Igualación temporal: además de la tasa relativa de reforzamiento y de respuesta, igualan el tiempo de estancia en las alternativas de respuesta. Se puede formalizar Ta/Ta+Tb=Fa/Fa+Fb. Ley generalizada de la igualación: cuando se tiene que elegir entre dos o mas alternativas de respuesta se produce el comportamiento denominado de alternancia, caracterizado por el cambio intermitente de una alternativa de respuesta a otra sin que guarde relación con los reforzadores asociados a cada una de dichas alternativas de respuesta. En las situaciones de laboratorio no existe el reforzamiento accidental que refuerza el comportamiento natural en situaciones de vida en libertad. En el laboratorio se tiene que controlar la influencia extraña que se introduce con el comportamiento alternante en los animales experimentales para lo que se añade la limitación de que no se refuerce la respuesta de cambio de alternativa por tiempo, este procedimiento se llama DEMORA POR EL CAMBIO y consiste en introducir un periodo temporal breve de 2/3 segundos después de la primera respuesta a una de las alternativas para que pueda entrar en funcionamiento el programa de reforzamiento asociado a dicha respuesta alternativa de respuestas. Otras influencias no deseables en los experimentos de elección son los sesgos como el color, fuerza requerida de respuesta, disposición espacial. No siempre es posible que todos los factores permanezcan iguales, por lo que Baum ideo un método para corregir la influencia de los sesgos o fuentes de influencia desconocida. Consiste en tres pasos: Se equiparan los factores de reforzamiento entre las alternativas de respuesta. La frecuencia, magnitud y demora de los reforzadores deben ser iguales. Se debe medir las preferencias, si la respuesta se distribuye de forma igual no hay influencia de sesgos, pero si no es así dicha elección indicaría la contribución de los sesgos que se puede determinar cuantitativamente por el valor de la tasa relativa de respuesta. Una vez conocido el valor de los sesgos relativos, se deben variar los factores de reforzamiento asociados con las alternativas de respuestas. Los sesgos de respuesta pueden incidir en la elección y conviene corregirlos o evitarlos. En los casos de programas concurrentes, sucede lo mismo. A veces la alternativa de respuesta es sobrevalorada o infravalorada. Este cálculo de reforzador es la generalidad. La sobreigualacion es cuando la mejor alternativa es valorada por encima de la preferencia establecida por la igualación perfecta. La infraigualacion es cuando la mejor alternativa es valorada por debajo de la preferencia establecida por debajo de la igualación perfecta. Es mas común la infraigualacion debido principalmente a la tendencia a cambiar de alternativa cuando se ha obtenido reforzamiento en una de ellas, lo que disminuye el ajuste perfecto a la igualación. la infraigualacion y la sobreigualacion hace referencia a la tasa de respuesta en la alternativa mas favorable ( mayor frecuencia de reforzamiento) en el contexto de las predicciones de la ley de igualación. ello implica que de las dos alternativas de Esther González UNED 2014 Página 28 respuesta, una sea siempre mas favorable. Por lo que la ley de igualación hace predicciones de preferencias relativas de los sujetos. Los sesgos también pueden intervenir en facilitar la sobreigualacion y la infraigualacion. Teorías de la igualación: hay dos enfoques principales: Aproximación molecular. Afirma que el cambio de una alternativa de respuesta a otra se realiza en el momento en que la probabilidad momentánea de reforzamiento sea mayor en la otra alternativa. Se basa en el calculo de probabilidades relativas de reforzamiento en cada momento, de ahí que se llame molecular. Aproximación de corte mas molar. Al contrario de la molecular, afirma que los animales distribuyen sus respuestas de acuerdo a un calculo global de las tasas relativas de reforzamiento entre las dos alternativas de respuesta, eligiendo mas aquella alternativa que proporciona una mayor tasa de reforzamiento. A través de un calculo general, los animales ajustan proporcionalmente sus respuestas entre los reforzadores disponibles en las diferentes alternativas, cumpliendo la ley de igualación. Aunque las predicciones de la teoría molecular y el mecanismo propuesto parecen demasiado precisas, justo en su precisión está la virtud, puesto que es comprobable y se ha visto que los animales responden de manera aproximada a como predice la teoría. Pero no explica porqué los animales prefieren reforzadores variables antes que los fijos aunque tengan la misma tasa de reforzamiento, sin embargo no existe tal preferencia por responder de forma variada frente a repetitiva si se mantienen los reforzadores fijos. La aproximación molar tiene problemas para explicar el resultado. El mejoramiento. Es una síntesis de las aproximaciones molecular y molar. Dice que los organismos eligen entre dos fuentes de premio de manera que se igualen las tasas locales de reforzamiento, respondiendo a la alternativa que en un momento dado presenta una mejor tasa local de reforzamiento. Así los resultados tienen un alcance a mas largo plazo que la teoría molecular, pero no es refiere a tasas globales de reforzamiento como en la teoría molar. Al obtener mayor tasa de reforzamiento se mantienen mas tiempo con la misma alternativa de respuesta. Por lo que las tasas locales de respuesta y de reforzamiento serán las iguales o parecidas entre diferentes alternativas de respuesta, se responde menos a la alternativa menos favorable, se obtiene menos reforzador pero se le dedica menos tiempo. La teoría de la mejora se deriva de la igualación: teniendo en cuenta el tiempo empleado en responder a cada alternativa se puede derivar con lógica que los animales al igualar están equiparando tasas locales de respuesta y de reforzamiento entre alternativas de respuestas. Impulsividad y autocontrol: la elección con compromiso. Las cadenas concurrentes de respuesta: no mide la elección entre premios ni entre respuestas instrumentales concurrentes, sino que se mide la elección entre diferentes fuentes de premio. Pueden ser simples o encadenados. En el simple se dan a elegir a los animales dos alternativas de respuesta, cada una acompañada de un programa de reforzamiento particular. El encadenado, es de dos pasos, un eslabón inicial donde el sujeto tiene que elegir entre dos alternativas idénticas y otro eslabón terminal donde se proporcionan los reforzadores por responder en la alternativa de respuesta elegida durante el eslabón inicial. Luego se vuelve a presentar el eslabón inicial hasta que el sujeto elija otra alternativa que le lleve al eslabon final. Esto permite que los sujetos sean consecuentes con sus decisiones y separa el aprendizaje de los eslabones iniciales de los terminales. Estos programas se asemejan a la vida cotidiana., donde optar por una alternativa te compromete por un tiempo hasta poder cambiar de opción, pero no se puede cambiar de forma caprichosa en cada momento. Ej un estudiante se apunta a un nº determinado de asignaturas y a medio curso se da cuenta que no se debía apuntar a tantas, pero no puede cambiar porque ha adquirido un compromiso de permanencia. IMPULSIVIDAD: Programa concurrente simple: se prefiere la opción de un premio pequeño inmediato. AUTOCONTROL: Programa concurrente encadenado: tiene un tiempo constante de espera para acceder al reforzamiento de la respuesta y entonces se opta por un reforzador mayor pero mas demorado. Al introducir una demora, la fuerza de la inmediatez se debilita y la elección se guía por la magnitud del reforzador. La noción de valor de los reforzadores. El valor de una alternativa de respuesta aumenta con la magnitud del reforzador y disminuirá con la demora para la entrega del reforzador. Por lo que el valor del reforzador vendrá determinado por el cociente magnitud/demora. Esto nos permite predecir fenómenos complejos en apariencia. Esther González UNED 2014 Página 29 Mazur propone que el cambio de un comportamiento impulsivo a uno autocontrolado se puede expresar mediante una función hiperbólica: Va= Ma/1+kDa El valor del reforzador seria mayor a medida que su magnitud fuese mayor y la demora para la obtención menor, pero la relación no seria lineal sino hiperbólica. Por ejemplo: para una magnitud dada, el valor del reforzador aumentaría en una proporción creciente a medida que sea menor la demora. En el reforzamiento inmediato el valor del reforzador vendría determinado por su magnitud. Cuando un reforzador grande y otro pequeño son demorados, el valor del reforzador grande será superior al pequeño (autocontrol), el valor del reforzador pequeño será mayor que el del grande, cuando la espera para el primero sea pequeña (impulsividad) . El valor aversivo del castigo, tambien cambia mediante una función hiperbolica semejante a la recompensa. La tasa de respuesta en relación a la ley de igualación. Hernstein amplió la leu de igualación al considerar que cualquier situación implica una elección. Y pueden elegir entre responder o no, o elegir responder como requiere el experimentador o realizar otras actividades. Por lo que el reforzamiento total de la situación comprende reforzadores programados o no explícitamente programados. Además valoro que la tasa de conducta total implica aceptar la idea que los organismos siempre están haciendo algo, aunque sea descansar. Por tanto la suma de la tasa de respuesta criterio mas cualquier otra actividad debe ser siempre igual. Un respuesta implica una redistribución de respuestas alternativas. Una forma de aumentar la tasa de respuesta seria aumentar la tasa de reforzamiento asociada a esa conducta y otra seria disminuir la tasa de reforzamiento alternativo. Esther González UNED 2014 Página 30 > LA NATURALEZA DE LA ASOCIACION EN EL APRENDIZAJE INSTRUMENTAL: La formulación de la ley de igualación (Skinner, Hull) y la teoría de la igualación (Hernestein) se basaron en le constructo de fuerza de respuesta. Constructo que responde a un conjunto de cantidades medibles de conducta. Thorndike dentro del ambiente darwinista construyo cajas –problema que permitían estudiar de manera experimental la conducta de los animales hambrientos y tenían que resolver el problema de obtener la comida que estaban viendo, pero que no les era accesible. Por casualidad accionaban el dispositivo que abría la puerta. Los siguientes intentos actuaban con mas rapidez hasta que cuando los metía en la caja eran capaces de salir inmediatamente. Así formulo leyes para explicar el aprendizaje como la ley del efecto donde dice que varias respuestas que se dan en la misma situación aquellas que van acompañadas o seguidas de satisfacción, tienen la probabilidad de que vuelvan a ocurrir, y las respuestas que van acompañadas de malestar, tiene menos probabilidad de volver a ocurrir. Cuanto mayor sea la satisfacción o el malestar mayor el fortalecimiento o debilitamiento del vinculo. Esta ley postula la fuerza de la asociación. E-R, que depende de la propia consecuencia de la acción. En los años 30-40 en pleno auge del aprendizaje, en eeuu, los investigadores se centraron en la naturaleza asociativa del aprendizaje. Guthrie continuador de Watson, opinaba que la función del reforzador en el aprendizaje facilita la formación de una asociación entre E-R. distinguió entre actos y movimientos musculares discretos (comportamiento). Cada gato escapa de la caja accionando la palanca de una forma diferente. Esther González UNED 2014 Página 31 Hull dice que la consecución del reforzador refuerza la formación de la asociación E-R , introduciendo el concepto de motivación. Para que los animales ejecuten una acción es necesaria una necesidad biológica. Desarrollo la primea teoría formal sobre la formación de hábitos y el neoconductismo. Introdujo el incentivo Tolman se erige como defensor de E-E contrario al E-R. Con sus ratas nadadoras, los mapas cognitivos y el aprendizaje de donde ir y no solo activar los músculos concretos, intentaba demostrar que los cambios en la conducta atribuidos al aprendizaje son el resultado de la intervención de procesos como la expectativa de recompensa, además de distinguir entre aprendizaje y ejecución, no resultando necesario el reforzador para el aprendizaje, pero si para la ejecución. El aprendizaje latente es cuando se hace recorrer a los animales un laberinto pero no se les da recompensa. Luego vuelven a recorrer el laberinto y si se les da recompensa. Los animales aprenden a efectuar la respuesta correcta ya que han aprendido a recorrer el laberinto antes de recibir el premio. Por lo que según tolman la recompensa no es necesaria para el aprendizaje, pero imprescindible para que se ejecute la respuesta aprendida. Tanto tolman como hull coinciden que aprendizaje y ejecución son separables. Los mecanismos asociativos E-R E-E pueden estar implicados en el aprendizaje instrumental, siendo E-R el mas especifico en cuanto que establece formas precisas para producir las respuestas, no solo la adquisición de la asociación. A través del E-R, se pueden entender por qué determinadas respuestas son mas adecuadas a determinados estímulos antecedentes y en función de las consecuencias que hayan seguido a las respuestas con anterioridad, un mecanismo que establece reglas de ejecución y no solo de aprendizaje. REGLAS DE EJECUCION OPERANTE. Pero la asociación no es solo lo que marca la fuerza de la respuesta y algunos psicólogos han propuesto aproximaciones conductuales siguiendo las teoría de Skinner donde propone que en el condicionamiento operante los reforzadores seleccionan respuestas sin asociación concreta. Los estímulos ambientales son moduladores de las reacciones entre respuestas y reforzadores. Según esta concepción hacemos distinción entre estímulos condicionado (condicionamiento clásico) y estimulo discriminativo (condicionamiento operante) Teoría de la probabilidad diferencial Premack señalo que las respuestas que acompañan a los estímulos reforzadores son altamente probables, las de actividades instrumentales, son menos probables. Para que una respuesta se convierta en reforzadora viene determinada por su probabilidad de ocurrencia en la línea base.” Ante dos respuestas en un procedimiento instrumental la respuesta mas probable reforzará a la menos probable y la respuesta menos probable no reforzara a la mas probable. PRINCIPIO DE REFORZAMIENTO DE PREMARK. Tiene dos supuestos fundamentales para que una actividad se convierta en reforzador eficaz. Primero: dicha actividad debe ser preferida en la línea base. Segundo: la probabilidad de ocurrencia de la actividad preferida debe ocurrir de forma contingente con la realización de una actividad menos preferida, que se convierte en instrumental. Como resultado de la operación de reforzamiento la actividad reforzadora ocurre a menor probabilidad que en condiciones de libre acceso y la actividad instrumental aumenta su probabilidad de ocurrencia, como ocurre generalmente en el condicionamiento operante. Dos grupos de niños según si les gusta mas comer golosinas o jugar a la play. Los niños que preferían comer golosinas jugaban mas para conseguir dulces, los que preferían jugar a la play no aumentaron su tasa de juego. También dijo que la actividad de mas baja probabilidad puede castigar a la de mayor probabilidad y las actividades mas preferidas no pueden castigar a las menos preferidas. Pero en una prueba de libre elección no podemos saber la razón última de porqué los sujetos prefieren una actividad mas que otra por lo que nos remitimos al corte biológico. La teoría de la probabilidad tiene un gran poder predictivo. Para predecir si una conducta reforzara a otra basta con medir sus probabilidades bajo la línea base donde las dos conductas no tienen limitaciones. Una actividad reforzara a la otra siesta es mas probable que la otra en la situación de línea base. Pero es compleja en cuanto a la medida de la probabilidad de la respuesta. Se puede medir la frecuencia si es accionar una palanca, pero no si es comer un bocado o toda una ración. Premarck sugirió que la probabilidad e respuesta debería considerarse en una dimensión temporal según el tiempo dedicado a una actividad particular sobre el tiempo total, pero como las probabilidades de respuesta varían con el tiempo, sugirió que la medida de la respuesta mas apropiada es la probabilidad momentánea. Esther González UNED 2014 Página 32 Teoría de la privación de respuesta: En el condicionamiento operante la probabilidad momentánea de respuesta reforzadora es alta. Según la hipótesis de privación de respuesta para que una actividad funcione como reforzador eficaz solo es necesario restringir la realización de dicha actividad en relación con su ocurrencia en el punto de bienestar, pero no es necesario que dicha actividad sea mas preferida que la que se va a convertir en actividad instrumental. Rata con dos actividades de libre acceso. El punto de bienestar es cuando bebe 400 veces y realiza 200 giros en la rueda. Si se le restringe beber, correr es la respuesta instrumental y beber la contingente o reforzada. Con un programa de reforzamiento donde cada giro de rueda permite beber se pretende determinar cómo se ajusta la rata a la contingencia aceptando las limitaciones impuestas por el medio. Aumenta la probabilidad de ocurrencia y disminuye la actividad contingente en relación al punto de bienestar. Cuando se restringe la actividad de correr, de menor probabilidad que la de beber, el animal tiene que dar lametones para hacer girar la rueda, en este caso la actividad instrumental (beber) aumenta y la contingente (correr) disminuye. Según la ley de igualación a una mayor frecuencia de reforzamiento se debe esperar una mayor tasa de respuesta, es decir, cuanto mas largo sea el intervalo entre reforzadores, la tasa de respuesta deberá ser menor. Según la hipótesis de privación de respuesta, predice la tasa de respuesta y la de reforzamiento como una U invertida y no lineal, a medida que disminuya la frecuencia de reforzamiento, la tasa de rpta instrumental aumenta para posteriormente disminuís a intervalos entre reforzadores aun mayores. Tema 6 CONTROL DE LA CONDUCTA POR ESTIMULO. La psicología estudia la conducta: la pública, privada, refleja, operante, consciente, inconsciente. La psicología científica establece relaciones causales entre eventos y conducta. Esto nos permite predecir causas y comportamientos y manipularlos. Las relaciones funcionales es cuando un evento depende del otro, es decir que la aparición de B está controlada por la aparición anterior de A. El control del estímulo implica ajuste al ambiente. El organismo depende de su capacidad para adaptarse a la exigencias del ambiente y del control por los estímulos juega un papel fundamental en esa adaptación. Un organismo ante las variaciones del estímulo puede mantener el control o perderlo. Una posición o otra depende del ambiente. CONTROL PAVLOVIANO Y CONTROL OPERANTE. Las especies han evolucionado desarrollando ciertas respuestas innatas ante estímulos EI EI y el EC funcionan como estímulos control para respuestas (RC y RI). La conducta operante no se activa automáticamente ante un estimulo. La respuesta depende de múltiples factores y su predicción es probabilística. La conducta operante no está controlada por un estimulo antecedente. Esther González UNED 2014 Página 33 Los eventos de control de la conducta operante, se denominan estímulos discriminativos y se dividen en positivos (discriminativos) y negativos (delta). El ambiente selecciona en cada momento la respuesta=consecuencia adecuada. Los estímulos discriminativos: 1. Modifican la probabilidad de emisión de conducta, no son exclusivos. 2. No modifica la probabilidad de cualquier operante, solo las que han tenido reforzamiento, castigo o extinción. 3. La presencia de un discriminativo, no implica aparición de reforzador, solo la posibilidad de conducta reforzada. 4. Si la conducta esta bajo un discriminativo positivo debe haber uno negativo para esa conducta. 5. Igual que el control del EC puede extinguirse, el control discriminativo puede desaparecer El control pavloviano usa dos términos (EI=RI o EC=RC) , la operante tres porque cuenta con los estímulos discriminativos que la controlan. GENERALIZACION Y DISCRIMINACION. Un estímulo puede ser cualquier evento que produzca una reacción en el sujeto, es decir, que cumpla la función de estimulo. Como preguntar la hora. Un estimulo puede ser exteroceptivo si proviene del medio externo al organismo (el sonido de un claxon) interoceptivo si proviene del medio interno (malestar gástrico). propioceptivos son los generados por posición y movimiento del cuerpo relacionales es cuando dos o mas elementos mantienen relación y no significan nada por si solos. Los estímulos están compuestos por rasgos o propiedades (un círculo rojo, puede ser grande, brillante, con olor, con movimiento, con dirección) y estas propiedades pueden ser compartidas por otros eventos, que cada observador puede etiquetas como estímulos diferentes. La novedad no es absoluta. No existen dos estímulos iguales, ni completamente diferentes. Dos figuras iguales no comparten espacio-temporal. Para que un individuo se comporte de la misma manera ante estímulos semejantes, se han desarrollado dos capacidades complementarias y contrarias: la generalización y la discriminación. Cuando un estimulo adquiere control sobre la conducta todos los rasgos del estimulo adquieren control, aunque no en la misma medida, por lo que los estímulos que comparten los mismos rasgos, adquieren cierto control ¿rojo= peligro, pasión). Debido al valor adaptativo, nos comportamos de una manera efectiva ante estímulos nuevos. Pero no siempre generalizamos, en ocasiones pequeñas diferencias entre estímulos comportan diferentes conductas. Mi llave del coche es igual que la de la casa, pero ante las dos llaves mi conducta es diferente, en función del estimulo que esté presente. La discriminación es responder de manera diferente ante estímulos diferentes y requiere de entrenamiento que se denomina condicionamiento discriminativo o respuesta diferencial. Ejemplos de entrenamiento discriminativo: Control pavloviano: se presenta un sonido (EC1) y una descarga (EI). La luz (EC2) se mantiene con la descarga. Si el sujeto dicrimina entre el EC1 y el EC2 y la rspuesta condicionada se emite ante los dos estumulos o ante ninguno, concluiriamos que no exite control. Control operante: Reforzamiento positivo de una conducta correlaciona con una luz roja (E1) y negativo con una verde (E2) si el sujeto emite respeusta con mayor frecuencia en E1 que en presencia de E2 consideramos la luz roja como discriminativo positivo para esa conducta. El sujeto discrimina entre ambos estímulos, si conducta se encuentra bajo el control de estos. El control del estimulo es un continuo con extremos de generalizacion y discriminacion en posiciones opuestas. Ante alta generalizacion baja discriminacion y vicerversa. Mayor control del estímulo mayor es la discriminacion.alto grado de generalizacon bajo control del estímulo. La generalizacion y la adaptacion son igual de adaptativas. El grado de adaptacion depende del ambiente. Discriminar entre tonalidades de blanco puede estar bien en el polo norte, no en el cairo. Cuanto mauor discriminacion tengamos entre est´`imulos, mas fino es nuestro ajuste al medio, ya que emitimos respuestas ante peuqeñas variaciones del contexto. La generalizacion y la discriminacion, se pueden producir con todos los estímulos que ejercen control sobre la conducta, incluso los discriminativos. MEDICION DEL CONTROL POR ESTIMULO: LOS GRADIENTES DE GENERALIZACION. Esther González UNED 2014 Página 34 Pavlov describio la generalizacion como un proceso neurologico primario en el que la activacion de ciertas areas cerebrales, provocada por la presencia del EC, se extiende a areas proximas asociadas a otros estímulos similares. Lashley y wade conciben la generalizacion como un fallo en la discriminacion. Las pruebas de generalizacion en las que se presentas estímulos nuevos, crean confusion en los individuos, de manera que guian su respuesta en funcion del parecido con el E entrenado. El estimulo no entrenado será el estimulo prueba o generalizado y eherce sobre la conducta contol directamente proporcional a su semejanza con el estimulo que adquirió ese control durante el condicionamiento. Metodos para comparar la relacion entre E original que adquiere el control y otros semejantes: Estimulo unico: consiste en entrenar para que un estimulo adquiera el control (E+o E-)y luego someterlo a un estimulo diferente per parecido al original. Se observa que cuanto mayor es el parecido, mayor es la fuerza de respuesta. Son los mas costosos. Mayor control de las variables individuales. Estímulos multiples: es estimulo que adquiere el control se presenta junto con otros estímulos diferentes, uno cada vez. Se mide la fuerza de respuesta de las combinaciones. Esta deberia decrecer en funcion de lo distinto que sea el estimulo prueba del original. Generalizacion mantenida: alternamos ensayos reforzados con el estimulo control, con ensayos donde el estimulo prueba está en extincion. Así el sujeto tiene contacto con todos los estímulos prueba generalizados varias veces y en otden aleatorio. El orden es importante porque puede alterar la respuesta. La presentacion repetida o el contrabalanceo del roden, es una forma de controlar ese efecto. El gradiente de generalizacion es la representacion grafica del decremento en la fuerza de la respuesta en funcion del alejamiento en cuanto al parecido con el estimuolo criterio. Silencio conductual, cuando los estímulos condicionados inhibitorios que ejercen control sobre la respuesta, y no se puede medir directamente. Cuando la mauor cantidad de respuesta se observa en los valores ceracanos al E+ original y van decreciendo según se alejan de el, tanto si disminuye como si aumenta el valor del rasgo, la grafica tiene forma de U. La forma del gradiente no solo informa de la naturaleza del estimulo, sino que además en función de la pendiente del gradiente, informa del grado de generalización/discriminación que muestra el sujeto. Cuanto mas plana es la pendiente mas generalización se ha producido y menos discriminación y al contrario. No solo nos permite confirmar la existencia o no de respuestas diferenciales, sino también determinar cuanto tiene que modificarse el ambiente para producir un cambio en la conducta del individuo. CONTROL CONDICIONAL: Cuando el control lo ejercen ciertos estímulos sobre nuestra conducta o depende de la presencia de otros eventos, estamos ante un caso de control condicional. Estos eventos no afectan directamente a la conducta sino a través de estímulos de control simple modificando su función. El control condicional necesita un MODULADOR, requiriendo una contingencia mínima de 3 términos (Ed-R-Er), el nuevo evento control denominado ESTIMULO CONDICIONAL, aumentaría el número de elementos a 4. MODULACION: FACILITACION , ESTABLECIMIENTO DE LA OCASIÓN. Es lo mismo con diferente terminología. Robert rescorla y peter Holland, empezaron a estudiar el control condicional pavloviano. Si una luz va tras un sonido y la aparición de comida, pero en ausencia de luz el mismo sonido no va seguido de comida, la luz terminará modulando la función del sonido como estimulo condicionado excitatorio apetitivo. Podemos observar que: Esther González UNED 2014 Página 35 La contingencia EC-EI es positiva tras la luz pero negativa cuando no aparece. EC es excitatoria apetitiva si aparece la luz y la EC es inhibitoria apetitiva si no aparece la luz. La luz (el modulador) no mantiene relación de contingencia con el EI, ni negativa ni positiva. La aparición de la luz predice la presentación de comida en un 50 % y la no presentación en un 50 %, por lo que no predice nada en absoluto ya que mantiene una relación de acontingencia a correlación nula. Los estímulos que adquieren propiedades moduladoras no elicitan por si mismo respuestas excitatorias ni inhibitorias, sino que modifican la función de los EC con los que se han asociado. El efecto de un modulador no se pierde por su exposición frecuente siempre que no se quiebre la conexión que mantuvo con la relación EC-EI durante la fase de adquisición. DISCRIMINACION CONDICIONAL: Lashley fue de los primeros en identificar las propiedades físicas de los estímulos controladores. Experimento de 2 triángulos, ratas, cajas y el fondo de diferente color cada 20 ensayos. Con este experimento se comprobó que la dirección o sentido de la reacción era condicional con respecto a un estimulo adicional “REACCION CONDICIONAL”. El fondo podía ser alterado aleatoriamente de un ensayo a otro sin perjudicar la ejecución de los sujetos que mantenían el control adquirido. Las discriminaciones condicionales son aquellas situaciones de control operante en las que la función de los estímulos discriminativos depende de la presencia de otro evento, el estimulo condicional. La contingencia operante aumenta de tres a cuatro EC-E-R-C. La presencia de un estimulo condicional determina la función del estimulo discriminativo y por tanto su control sobre la conducta. el estimulo condicional por si solo no controla ninguna respuesta sino la interaccion entre el condicional y el discriminativo. Las medidas típicas de ejecución en una discriminación condicional son la velocidad de adquisición (nº de ensayos o sesiones hasta un determinado criterio de aprendizaje)y la precisión (porcentaje de ensayos con rpta correcta). Otra medida es la latencia. El criterio de igualación que determina el estimulo de segundo orden puede ser de igualdad, de semejanzas de diferencia. FACTORES QUE AFECTAN AL CONTROL POR EL ESTIMULO Cuanto mas se diferencian dos situaciones mas sencillo es distinguirlas y cuanto mas se diferencian los elementos que las componen, mayor será la diferencia global. RELACIONADOS CON LOS ESTÍMULOS: Capacidad sensorial: solo reaccionamos ante sonidos, colores olores y no ante un evento completo. Los órganos sensoriales se han desarrollado para la supervivencia según cada especie y permite que el organismo reacciones ante las propiedades de un evento y ante otras no. Esto también pasa entre individuos de una misma especie, ya que el desarrollo de estos órganos esta sujeto a variabilidad. Una pirámide es un triangulo si no podemos ver las otras caras. El tamaño es diferente en función de la distancia que separa el objeto del observador. Un evento es único, el estimulo diferente para cada individuo. Facilidad relativa de condicionamiento de los elementos de un compuesto: si un estimulo discriminatorio está compuesto de dos componentes la adquisición del control por parte de componente menos saliente puede ser impedida por un componente mas eficaz. El fenómeno de Ensombrecimiento indica que los estímulos pueden competir por adquirir el control sobre la conducta de manera que los mas intensos dificultan el condicionamiento de los mas débiles. Modalidad sensorial: los estímulos visuales han sido los mas comunes en experimentos de discriminación. El sistema visual de las palomas las hace apropiadas para discriminar este tipo de estímulos, suponemos que debido a la navegación, forrajeo y elección de pareja. Esto nos ha permitido afirmar que hay ciertas características de las imágenes que son mas efectivas que otras en el entrenamiento de discriminación. Es mas discriminativo los colores que las figuras geométricas. Discriminabilidad: entre dos estímulos cuanto mayor las diferencias de las características físicas de lso estímulos, mas sencilla es la tarea de discriminarlos. Pero las tareas mas simples no nos garantiza una medida fiable de discriminalidad. Factores inherentes a una situación experimental como la asociación y la respuesta, son efectos que se mezclan haciendo que la discriminalidad entre dos estímulos sea un índice que solo pueda averiguarse a posteriori. Intensidad de los estímulos discriminativos: la mayoría de los gradientes generados por estímulos de prueba intensos suelen responder a una función monotonica en lugar de una curva de máxima respuesta. Esta función es creciente. Cuando el E+ es mas intenso que el E- y decreciente en caso inverso. Esther González UNED 2014 Página 36 Aprendizaje del rasgo positivo: cuando el elemento predictivo que distingue al E- del E+, los sujetos aprenden con mayor facilidad E+ Palomas y teclas verdes con cuadrados blancos como rasgo positivo aprenden antes. RELACIONADOS CON LA RESPUESTA: Relacion respuesta- reforzador: otro factor que puede adquirir el control es la naturaleza de la respuesta requerida para obtener el reforzador. La respuesta de los perros ante sonidos derecha-izquierda era controlada por la posición de los sonidos pero actuar o no actuar era controlada por la naturaleza de los sonidos. Esto nos lleva a la conclusión que las respuestas que están diferenciadas por la localización quedan bajo el control de la posición de los estímulos discriminativos, y las respuestas que están diferenciadas por su naturaleza, quedan bajo el control del tipo de estímulo. Respuesta de observación a la muestra: cuando se refuerza alguna conducta del sujeto orientada al estimulo condicional. Ej: retener la aparición de los estímulos de comparación hasta que el sujeto toca la muestra. Otro efecto es que parece influir en el nivel asintónico de la discriminación. Se comprobó que después de la adquisición de una discriminación en la que se requería picar a la muestra, el porcentaje de aciertos bajo entre un 10 y 25 % cuando se elimino este requisito. La propia conducta es el elemento muestra a discriminar porque el nº de respuestas puede facilitar la adquisición del aprendizaje. Respuesta diferencial: puede ser que se den respuestas diferentes ante cada estimulo control, bien como requisito del entrenamiento, o bien como algo espontaneo de conductas diferenciales. Estas respuestas pueden aparecer aunque las contingencias del experimento no lo requieran e incluso aunque se castigue por ello. RELACIONADOS CON LA EXPERIENCIA PREVIA La historia del sujeto, no solo influye en la velocidad sino en el grado de generalización. Disposiciones de aprendizaje: aprendizaje con monos que premiaba la respuesta correcta y ocultaba los objetos ante la incorrecta. Al principio el aprendizaje fue lento, pero a mayor numero de problemas resueltos, el aprendizaje aumentaba con lo que del problema 257 al 312, los animales respondieron correctamente al segundo ensayo el 97% de las veces. En ratas la velocidad de aprendizaje es mayor en los que tienen experiencia. Según Lawrence se debe a la atención. Seraganian no cree que sea la atención lo que mejora sino la capacidad general para resolbver problemas de discriminación y no solo el hecho de atender a un rasgo concreto. La experiencia favorece las habilidades generales de resolución de problemas. Los cambios intradimensionales se aprenden mejor que los interdimensionales. Efecto del sobreaprendizaje en la inversión: Mackinstosh entreno ratas para realizar discriminación con el mismo criterio de eficacia, uno de los grupos tuvo 100 ensayos adicionales. Luego entreno a los dos grupos en discriminación inversa. Los de sobreaprendizaje aprendieron la discriminación inversa antes. Experiencia de reforzamiento no diferencial: ratas, fondo gris o a rayas. Reforzamiento 100 % o 50 % no hay diferencias entre grupos de fondo gris independientemente del reforzamiento. Si hay diferencia entre fondo a rayas a los del reforzamiento al 50 % les costo el doble aprender la discriminación. El reforzamiento diferencial en fase 2 mantuvo la atención de los sujetos expuestos a el. Los entrenamientos discriminativos potencian la atención, reduciendo la generalización. RELACIONADOS CON EL ENTRENAMIENTO DISCRIMINATIVO: Tipos de entrenamientos discriminativos: debemos saber si los estímulos discriminativos van a aparecer juntos o por separado. Si aparecen juntos se considera un entrenamiento simultaneo. Con entrenamiento los sujetos solo responden al estimulo discriminativo positivo. El procedimiento de discriminación de respuesta o no respuesta es cuando el sujeto no aparecen los estímulos antecedentes al mismo tiempo y el sujeto acaba respondiendo solo al estimulo discriminativo y no al delta. La adquisición de discriminaciones simples son mas lentas cuando el procedimiento es simultaneo. La demora en la presentación del estimulo muestra y los estímulos comparativos afecta a los índices de ejecución en discriminaciones condicionales. La duración máxima de demora que se puede tolerar, depende de las diferencias entre especies. Eliminar la muestra en el momento en que aparecen las comparaciones aumenta el número de ensayos necesarios para aprender la discriminación con respecto a una discriminación condicional simultánea. Eficacia relativa de los elementos del estimulo como señales para el reforzamiento: Luz+tono 1 reforzado 50%; luz+tono 2 reforzado 50%) ( luz +tono 1 reforzado 100%; luz + tono 2 reforzado 0%). Esther González UNED 2014 Página 37 Los resultados sugieren que los estímulos discriminativos tienen un poderoso efecto sobre la conducta, no solo porque están emparejados con el reforzador, sino que señalan la forma y el momento en que se va a producir el reforzamiento. Si un estimulo es mejor predictor de la disponibilidad del reforzamiento que otro, es mas probable que adquiera el control de la conducta operante. Tipo de reforzamiento: el control por el estímulo depende de la eficacia relativa del estimulo como señal para el reforzamiento y de la naturaleza del reforzador utilizado. Unos ejercen mas control sobre la conducta con reforzamiento positivo que negativo. La luz consigue mas control que el sonido dando comida. Dando descarga eléctrica, el sonido consigue mas control que la luz. El control esta determinado por el tipo de reforzamiento que se utilice. Los estímulos visuales tienen mas probabilidad de control sobre conducta reforzada positivamente y los auditivos mas control sobre la conducta negativamente reforzada. Consecuencia diferencial: las tareas de discriminación simple con palomas y ratas demuestran que si se usan consecuencias diferenciales para cada combinación entre el estimulo discriminativo y la respuesta mejroa la discriminación. Ante el estimulo E1 tiene que emitir respuesta R1 para recibir consecuencia C1 e igual con el E2. El reforzamiento diferencial favorece la adquisición de la discriminación condicional. Duración del intervalo entre ensayos: entre 0 y 60 segundos entre ensayos muestran que un intervalo 0 muestra una ejecución de niveles al aza, mientras que los de 26-60 segundos exhibían mejores desempeños de tarea. Pero la duración del intervalo ejerce poco efecto sobre la presión, excepto cuando el intervalo se elimina por completo. Grado de entrenamiento: cuanto mayor el entrenamiento para la adquisición de la discriminación mas acusado es el gradiente formado en la prueba de generalización, es decir menor generalización se observa. Los gradientes de generalización se acusan mas en función del nº de sesiones de entrenamiento. Entrenamiento en discriminación “sin errores”: minimiza las respuestas al E-, reduciendo el nº de errores cometidos por el sujeto como las reacciones emocionales asociadas a la aplicación de extinción o castigo. Terrace palomas luz roja E+ misma intensidad siempre: E- luz verde intensidad baja en aumento hasta equipararse con E+. los sujetos pueden adquirir discriminación simple sin cometer errores es decir sin responder al E-. Intervalo entrenamiento prueba: el paso del tiempo aumenta la generalización, los estímulos diferentes al E+ ejercen mayor control cuanto mas lejana la finalización del entrenamiento. INTERACCIONES EXCITATORIAS- INHIBITORIAS: Desplazamiento del máximo: Hanson, 1959, discriminación de sonidos de longitud de onda con Palomas. Se comprobó la respuesta ante diferentes estímulos de prueba. Spence dice que el entrenamiento en discriminación incide tanto en el discriminativo positivo como negativo (excitatorio como inhibitorio) por lo que ambos estímulos adquieren el control del comportamiento que puede generalizarse a otros estímulos semejantes, de manera que los estímulos prueba mantienen parecido con el E+ i el E-. destaca que todos los estímulos tanto condicionados como generalizados, tienen efecto excitatorio como inhibitorio de manera que el efecto ( la conducta provocada) se entiende como la suma de ambas tendencias. Para calcularlo se toman las medidas hipotéticas del E+ y E- como si se hubiera entrenado una discriminación intradimensional. El gradiente solo está mostrando la fuerza excitatoria de cada estimulo de prueba presentado, pero para realizar la suma de tendencias es necesario contemplar la fuerza inhibitoria y tomaremos como valor de referencia el máximo de respuesta observada en cada gradiente. Efecto de tendencia central: define que la respuesta generalizada no se basaría en respuestas a las características fijas absolutas de los estímulos, sino a sus referencias relativas en función de los estímulos con los que tiene experiencia. Solo se ha comprobado en sujetos humanos y no todas las investigaciones obtienen resultados coherentes, en algunos casos se usan reconocimientos de caras y no se observa esta respuesta relacional. TEORIAS SOBRE LA GENERALIZACION. ¿Por qué un estimulo que nunca ha participado en una contingencia de aprendizaje puede ejercer control sobre la conducta de un individuo? PAVLOV la irradiación, semejante al efecto onda al tirar un objeto al agua. Cada estimulo produce excitación en una zona concreta del cortex cerebral, de manera que estímulos parecidos pueden activar zonas adyacentes, la Esther González UNED 2014 Página 38 irradiación se volvía mas débil a medida que aumenta la distancia del centro de excitación correspondiente al E+ original. HULL el cerebro no percibe los estímulos como algo único, sino que cada rasgo era registrado con una horquilla de valores. Cuando un estimulo adquiere control sobre cierta conducta, ese control no es exclusivo del valore de las dimensiones sino es comparado con otros estímulos Hipotesis inversa: Blough: mantiene que la generalización se debe a que los sujetos no pueden discriminar entre estímulos de prueba a los que son expuestos, es decir, la capacidad de los sujetos para discriminar ciertos estímulos determina si mostraran o no generalización. Concluyo que la visión de las palomas es especialmente sensible a variaciones, por lo que son capaces de distinguir mejor colores que otros. Teoria atencional: shutherland y mackintosh: el fallo en la discriminación (responsable de la generalización) se debe a la falta de atención hacia el rasgo pertinente del estimulo discriminativo, del que correlaciona con el reforzamiento. Siguen dos procesos: El cerebro recibe y procesa la información sensorial a través de analizadores específicos que representan cada dimensión del estimulo por separado (color, brillo, tamaño… ) al inicio del entrenamiento antes del reforzamiento diferencial, la fuerza de cada analizador dependerá de la saliencia de la dimensión. El reforzamiento afectaría a la fuerza de los analizadores activos, de manera que la dimensión mas aliente, a la que estamos prestando atención se condicionaría mas que el resto. Se desarrolla un vinculo entre la respuesta especifica y un analizador, por ejemplo, el reforzamiento establecería una unión entre elegir la tecla roja en lugar de la verde y el analizador correspondiente al color. Respuesta múltiple: staddon: en un experimento de psicología la VD es la conducta del sujeto. Los estudios con animales requieren otras variables que delimitan los eventos de observación. Por ejemplo se refuerza la respuesta (picar techa, presión palanca, corredor y se miden los parámetros de frecuencia, latencia, intensidad ante los estímulos y se observa la conducta objetivo. Esta teoría propone romper con esta concepción y analizar el resto de conductas. Staddon diferencia entre dos categorías de conductas: las terminales controladas por la presencia del E+ y fortalecidas por aparición del reforzador y las de interin ausencia de E+ o presencia de E- y que son reforzadas por otros eventos diferentes. Esther González UNED 2014 Página 39 Tema 7 CONTROL AVERSIVO EN EL CONDICIONAMIENTO OPERANTE. El miedo y el control afectan a nuestra manera de actuar. Se ha estudiado como respuesta física (pavlov) o biológica ( cannon). Ante una amenaza si existe una salida, la reacción mas probable es la huida, si no la tiene es la parálisis. La variedad de estímulos aversivos es amplia, pero podemos definirlos como aquellos que elicitan algún reflejo defensivo. También afecta a las reacciones del futuro (semáforo rojo, claxon). En ambientes mas salvajes los estímulos aversivos son mas adaptativos y el sujeto dispone de mecanismos de aprendizaje. También afecta el ambiente, el tiempo, la sorpresa, es probable que no siempre aparezca el EI-. Estimulacion aversiva en el condicionamiento operante. Procedimiento del condicionamiento operante: se pueden clasificar según: El efecto sobre la conducta si aumenta la probabilidad de conducta se llama reforzamiento, si la reduce, se llama castigo. Si la correlación respuesta-consecuencia es directa se dice es positivo, si es inversa, se le añade negativo. Hay 4 procedimientos: o Entrenamiento de recompensa o reforzamiento positivo: respuesta + contingencia +, consecuencia += aumenta probabilidad de conducta. o Entrenamiento evitación/escape o reforzamiento negativo: respuesta -, contingencia -, consecuencia -= aumenta probabilidad de conducta. o Castigo o castigo positivo: respuesta y consecuencia+ consecuencia -= reduce la emisión de respuesta operante. o Entrenamiento de omisión o castigo negativo: respuesta y contingencia – consecuencia+= no emisión de respuesta en el futuro. Castigo, escape y evitación: Para el reforzamiento negativo hay dos variantes: evitación y escape. Aunque tienen características en común muestran importantes diferencias: En el escape la consecuencia aversiva está presente y no desaparece hasta la emisión de la conducta operante. Que es reforzada por supresión del evento aversivo en curso. En la evitación, el sujeto es expuesto a la presentación periódica de alguna consecuencia aversiva y la emisión de la operante impide o retrasa su aparición. La respuesta operante no se emite mientras el estimulo aversivo se encuentra presente sino antes de que haya desaparecido. (llamamos para avisar que llegamos tarde) En el castigo todos los procedimientos son para reducir la conducta. no mantiene relación con la aparición de estimulación aversiva. Castigo positivo, es decir la conducta va seguida de un estimulo aversivo. La efectividad del castigo depende de la supresión de la respuesta. Procedimientos de condicionamiento operante y estados emocionales. Una orden de siéntate a la mascota que reforzamos con comida, el sentarse es un discriminativo positivo, pero la comida es consecuencia que provoca salivación y convierte los eventos antecedentes en estímulos condicionados excitatorios apetitivos. Los discriminativos positivos como las conductas de evitación o escape, generan estados de alivio en los sujetos, Los estímulos delta (respuestas castigadas) como las propias conductas castigadas producen ansiedad. Un estimulo incondicionado aversivo provoca miedo. El castigo (sobretodo el positivo) tiene efectos emocionales que inhiben la conducta apetitiva y cualquier operante en general. La estimulación aversiva producida por la respuesta es mucho mas eficaz que la estimulación aversiva independiente de la respuesta para suprimir la conducta. TEORIA DE LA RESPUESTA EMOCIONAL CONDICIONADA: Estes (1944) Un EC excitatorio aversivo provoca respuestas emocionales (como la paralización) por el hecho de estar emparejadas con una descarga. Estas respuestas Esther González UNED 2014 Página 40 emocionales condicionadas son incompatibles con la respuesta de la presión de la palanca ( no se puede quedar paralizado al mismo tiempo que pulsa la palanca). Po lo que la presión de la palanca se suprime durante las presentaciones del EC. No obstante a diferencia de la supresión condicionada, los procedimientos de castigo no incluyen un EC explicito que señale la administración de la descarga. Estes sugirió que cumplen esta función los diversos estímulos ( visuales, táctiles y propioceptivos) que el sujeto experimenta antes de dar la respuesta castigada como la visión de la palanca, los discriminativos (luces, sonidos), orientación del cuerpo o postura antes de responder, etc. CONDUCTA DE EVITACION: (luz de reserva en el coche, buscas gasolinera). La velocidad de adquisición como el nivel de ejecución de la supuesta RC era mayor en el grupo que podía evitar la descarga que en el que no. Esto demostraba que había diferentes conductas de aprendizaje. Procedimientos de evitación: Evitación discriminada: hay claves que señalan el acontecimiento aversivo, (una descarga). El resultado depende de lo que haga el sujeto: No emite respuesta para la evitación entre la señal y el EI aversivo se llama ensayo escape. Si emite respuesta antes del EI aversivo, la señal cesa y se omite el EI, se llama evitación con éxito. En un procedimiento de evitación discriminada hay tres elementos: la señal de aviso, la respuesta operante y la consecuencia aversiva. Contingencia respuesta-señal de aviso: la emisión de respuesta operante conlleva la desaparición de la señal de aviso, la contingencia será de escape. Contingencia respuesta-consecuencia: la contingencia será por evitación Contingencia señal de aviso-consecuencia: antes que el sujeto adquiera la respuesta de evitación la señal de aviso y la consecuencia ocurren conjuntamente. Cuando el sujeto consigue evitar con su respuesta la descarga programada, se rompe la contingencia y aparece la señal de aviso, pero no la consecuencia. Esto requiere gran cantidad de ensayos. Las ratas y palomas aprenden rápido y otros lentos, por lo que la elección de la operante que se pretende reforzar determina el tiempo necesario para adquirirla y cuanto mas se asemeje a la respuesta elicitada de la especie mayor es la velocidad de aprendizaje. TEORIA BIFACTORIAL : Mowrer (1947), dice que en el aprendizaje de evitación están implicados dos procesos interdependientes: el condicionamiento clásico de mido al EC y el reforzamiento operante de la respuesta de evitación a través de la reducción del miedo. Reducción del miedo y no por impedir el EI. esta teoría predice una interacción entre el proceso clásico y el operante, con cambios cíclicos en la respuesta de evitación: La señal se condiciona de forma excitatoria aversiva mientras el sujeto no emite la respuesta de evitación El sujeto emite la respuesta para escapar del miedo generado por el EC, impidiendo aparezca el EI Una vez extinguido el EC deja de emitir respuesta volviendo a presentarse el EI. Schoenfeld dice que la señal adquiere, por condicionamiento clásico funciones de consecuencia aversiva secundaria o condicionada. La evitación es una situación de reforzamiento negativo secundario o condicionado. Schoerfeld no considera necesario aludir al efecto emocional en proceso. Evitación no discriminada del operante libre de Sidman. La descarga se programa para que ocurra periódicamente sin aviso cada 10 segundos y se obtiene como respuesta de evitación una determinada conducta y la aparición de respuesta impide la administración de la descarga durante un periodo fijo de por ejemplo 30 segundos. Se utilizan dos intervalos de tiempo: Intervalo E-E, Er-Er o reloj choque-choque: intervalo entre descargas en ausencia de una respuesta. Intervalo R-E, E-Er o reloj respuesta-choque: que es el intervalo entre la respuesta y la descarga programada, es decir, el periodo de seguridad. Las respuesta de evitación se dan en cualquier momento, ya que reinician el intervalo R-Ei por eso se llama evitación de operante libre. Se diferencia de la evitación discriminada: Periodos mas largos de entrenamiento que en evitación discriminada. Después del entrenamiento, los animales nunca aprenden a evitar todas las descargas. Los sujetos se diferencian de la forma de responder ante el mismo procedimiento de evitación operante libre. La HIPOTESIS PROPIOCEPTIVA, siguiere que el aviso lo ocupa la propia conducta de operante libre. Todas las conductas que realiza el sujeto en la situación experimental, quedan asociadas a la aplicación de la descarga, por lo Esther González UNED 2014 Página 41 que sufrirá la misma ansiedad que el sijeto con procedimiento de evitación discriminada ante la señal de aviso . la única manera de escapar de la ansiedad es emitiendo la operante reforzada. HIPOTESIS INTEROCEPTIVO-TEMPORAL seria el paso del tiempo el que produciría la ansiedad que conduce al sujeto a responder. HIPOTESIS DE LA SEÑAL DE SEGURIDAD: los estímulos asociados a los periodos de seguridad provocados por la respuesta de evitación se convierten en estímulos condicionados inhibitorios aversivos por su contingencia negativa con la descarga. Por lo que los estímulos que siguen a la respuesta de evitación acaban funcionando como un reforzador para esta. La evitación de descarga aleatoria de Hernstein-hineline La evitación de sidman es discriminativa, aunque el experimentador no programe ninguna señal de aviso al presentar las descargas en intervalos temporales fijos los estímulos internos pueden adquirir esa función. El reforzamiento de la conducta de evitación no tanto como el resultado de omitir la presentación de la estimulación aversiva,l sino como el debido a la reducción de su frecuencia total o densidad, entendida como una contingencia molar negativa entre tasas de respuesta y de consecuencia aversivas. Variables que afectan al reforzamiento negativo: Cuanto mayor es la intensidad de la estimulación aversiva, mayor la velocidad de adquisición de la conducta reforzada negativamente. Conducta de escape, la intensidad determina la rapidez con al que semita. La familiaridad del sujeto con la estimulación y la saciedad puede reducir la efectividad del reforzador y de las consecuencias aversivas tanto para la adquisición como para la supresión. Según Sidman en la evitación libre, la tasa de respuesta esta determinada por los intervalos e-e y r-e. cuanto mayor la frecuencia de las descarga en ausencia de respuestas y mayores los periodos de seguridad mayor la probabilidad de que aprenda la respuesta de evitación. La evitación de descarga aleatoria, nunca será absoluta. Algunas respuestas pueden ir seguidas de descargas. CASTIGO: THORDINKE : el reforzamiento positivo y el castigo implican procesos opuestos. El reforzamiento fortalece la conducta, el castigo la debilita. ESTES: Teoría de la respuesta emocional condicionada. DINSMOOR: TEORIA DE LAS RESPUESTAS COMPETITIVAS REFORZADAS NEGATIVAMENTE: esta teoría explica el castigo en términos de la adquisición de respuesta de evitación incompatibles con la respuesta castigada. La supresión de una conducta no se considera un reflejo del debilitamiento de la respuesta castigada, sino que explica las respuestas competitivas que evitan la estimulación aversiva. Variables que afectan al castigo: El castigo positivo consiste en presentar un estimulo aversivo contingente después de una respuesta específica para la supresión de la respuesta. Variables de efectividad de castigo: Intensidad del estimulo aversivo: cuanto mas intensa sea la estimulación aversiva, mas eficaz suprimir las respuestas. Puede que la respuesta reaparezca mas tarde, porque la supresión de la respuesta deja de tener contacto con la consecuencia aversiva la contingencia de castigo no está activa. Esto hace pensar que el castigo no es un método eficaz para suprimir la respuesta. Inmediatez y demora del estimulo aversivo: la alta contigüidad es favorecedor. El aumento de intervalo entre R-Er produce menor supresión de la conducta. pero se han encontrado los resultados muy parecidos tanto si el castigo se aplica de manera demorada como inmediata tras la respuesta. Cambios graduales en la intensidad de los estímulos aversivo. La forma que se introduce la consecuencia aversiva, por ejemplo si se utiliza una descarga de alta intensidad al inicio del procedimiento, la operante se verá suprimida. Si se utiliza un castigo suave al inicio y poco a poco se va aumentando la supresión será menos. Si la exposición inicial es intensa, aumenta los efectos supresores de un castigo suave posterior. Experiencia previa: los efectos del castigo son menores ante un reforzamiento largo y volumen grande. Esther González UNED 2014 Página 42 - Efectos discriminativos del estimulo aversivo: si la respuesta se castiga en presencia de un estimulo discriminativo, pero no cuando el estimulo está ausente. Los efectos supresores del castigo se limitan a la presencia del estimulo. Programa de castigo: igual que el reforzamiento que no tenía que administrarse cada vez que se produjera la respuesta instrumental, el castigo puede administrarse intermitentemente o después de un número fijo de respuestas (programa de castigo de razón fija) o variable (programa de castigo de razón variable) así como la aparición de la consecuencia aversiva tras la emisión de la primera respuesta tras un intervalo de tiempo ( programa de castigo de intervalo, fijo o variable) . todos los programas de castigo continuos son mas efectivos que los intermitentes. Programa de reforzamiento compuesto: todo castigo es mixto, ya que castigar requiere que la conducta sea reforzada. Castigo sobre líneas base apetitivas: actúan simultáneamente castigo y reforzamiento positivo sobre la misma respuesta. Castigo sobre líneas base defensivas: concurren castigo y reforzamiento negativo (escape/evitación). Castigo sobre líneas base de extinción: se castiga una respuesta previamente reforzada, pero que al aplicar el castigo está siendo extinguida. La eficacia del castigo se verá reducida por la eficacia relativa del procedimiento o aumentada por la eficacia del proceso de extinción de la misma conducta. Existencia de una conducta alternativa reforzada: a veces la respuesta castigada es la única respuesta que el sujeto puede realizar para obtener un reforzamiento positivo. Manipulaciones motivacionales: si se reduce la motivación para realizar la respuesta, es mayor la eficacia de suprimir la conducta. La eficacia relativa del castigo para suprimir la conducta. El castigo tiene que tener en cuenta la consecuencia sobre la conducta y no solo los aspecto s morfológicos de la misma. Solo podemos hablar de castigo cuando la consecuencia suprime la conducta. puede que al reprender no solo no estemos suprimiendo, sino que reforzamos la conducta. la reprimenda asociada con una mayor atención suele ser un reforzador generalizado por lo que hablamos de reforzamiento positivo. El castigo es un método de control del comportamiento, las leyes, la educación y las reglas sociales, prestan un cuidado especial a la ética, eficacia de los castigos programados. El castigo es capaz de modelar la conducta pero puede reaparecer en el futuro. El castigo conlleva ventajas y desventajas que hay que valorar antes de ponerlo en práctica como técnica de supresión de la conducta. el castigo es lento y difícil si es la primera vez que se aplica y puede producir ansiedad, agresión, neurosis, o reajuste de conductas. Cuando aplicamos un castigo, la intensidad del estímulo determina la efectividad del procedimiento, pero el contexto ambiental puede provocar ansiedad y el efecto se puede extender a otros estímulos que nunca estuvieron presentes a través del fenómeno de generalización y trastornos en el comportamiento. Los eventos ansiógenos disminuyen la tasa de respuesta operante. El castigo no solo puede disminuir la conducta que anteriormente se ha sometido a algún procedimiento de refuerzo, sino afectar al comportamiento general del sujeto. El refuerzo depende de muchas variables como nivel de saciedad privación, etc. Suprimir que un niño interrumpa (conducta reforzada por nuestra atención) mediante castigo puede fortalecer otras respuestas como subirse a un lugar peligroso ( conducta reforzada por nuestra atención) . La agresión elicitada es cuando aparece la agresión como respuesta refleja. Esta agresión también puede ser operante. Efectos no descartados: fenómenos paradójicos en el castigo: Cuando lejos de reducir la conducta el castigo la aumenta o tiene un efecto completamente diferente al esperado. - LA CONDUCTA MASOQUISTA: El discriminativo negativo o estimulo delta, asociado al castigo no es eficaz para suprimir la conducta. cuando el reforzamiento positivo solo esta disponible cuando se castiga la operante. El castigo se convierte en una señal o estimulo discriminativo para el reforzamiento positivo. Niño que hace algo malo, se le da reprimenda y luego cariño del progenitor arrepentido. Si la privación de cariño es elevada, por lo que aumenta la conducta en lugar de reducirla. La conducta masoquista es mediante el contracondicionamiento de la consecuencia aversiva. Descargas de poca intensidad las relacionamos con comida y vamos aumentando las descargas y disminuyendo la conducta, por lo que la descarga adquiere Esther González UNED 2014 Página 43 propiedades de Ec excitatorio apetitivo, y se convierte en reforzador de conductas operantes y su presentación actúa como reforzamiento positivo en lugar de castigo. - CIRCULO VICIOSO: Cuando se entrena una conducta de escape ante un evento aversivo, el propio evento adquiere funciones discriminativas positivas, por lo que el castigo no tenda efecto de supresión de respuesta, sino lo contrario. OTRAS ESTRATEGIAS DE SUPRESION DE LA CONDUCTA: algunas conductas no requieren de castigo para su supresión. Entrenamiento de omisión: la probabilidad de que se emita un reforzador es menor si el sujeto emite la respuesta que si no la emite. Por lo que la forma que tiene el sujeto de conseguir el reforzador es omitiendo la respuesta. Las variables de la eficacia redactora del entrenamiento por omisión, se parecen a la de evitación. Para que desaparezca la respuesta los intervalos de presentación de ausencia de respuesta deben ser de menor duración que tras la respuesta. el entrenamiento por omisión tiene como efecto inmediato sobre el mantenimiento residual de la respuesta. Modificación de la fuerza de conductas alternativas: centramos la atención de manera concreta. Cualquier comportamiento es una conducta de elección pero siempre hay alternativas incluso en situaciones que etiquetamos de forzadas. Podemos fortalecer una conducta en lugar de castigar, por ejemplo, para suprimir la conducta de levantarse del asiento en clase, aplicamos un procedimiento de castigo o reforzamos la conducta de estar sentados. Extinción: de la operante es romper la contingencia positiva o negativa respuesta –consecuencia en presencia de los respectivos discriminatorios que hará que descienda la operante ante los discriminatorios. La extinción del control de los discriminativos positivos es un procedimiento muy eficaz para suprimir la operante per requiere la identificación del reforzador y control sobre la aparición de los reforzadores. La extinción no implica desaprendizaje ni olvido, es un nuevo aprendizaje que sustituye al anterior pero un cambio de contexto o la exposición con el reforzador puede restaurar la capacidad de control de los discriminativos que habíamos extinguidos y por tanto la emisión de la conducta que habíamos suprimido. Modificaciones motivacionales: el porque sí, porque quiero, porque me apetece, esconden las verdaderas causas del comportamiento o la falta de motivación de exponerlas. Los reflejos incondicionados son efecto de la presentación de estímulos incondicionados, los estímulos condicionados causan los reflejos condicionados, la emisión de las conductas operantes dependen del estado motivacional, historia del reforzamiento y castigo del sujeto, estimulación presente, y todos los eventos para la emisión de respuesta. La tasa de emisión depende de la interacción de estas variables y la manipulación de cada una de ellas por separado puede reducir la fuerza de la operante. La motivación se refiere a la fuerza de una determinada conducta y esta depende de múltiples variables. La motivación se operativiza atendiendo a la privación/ saciedad respecto al reforzador o bien al valor del propio reforzador. En el castigo, la motivación se relaciona con el valor del estimulo aversivo. Es posible suprimir una conducta sin castigo, aplicando la manipulación de variables relacionadas con la motivación. Un reforzador puede ser primario o secundario, según las propiedades reforzantes si requieren o no aprendizaje por parte del sujeto. La sobreexposición al EI con el que se condiciona el EC reduce la capacidad reforzante del EC. Si asociamos un reforzador positivo con uno aversivo provocamos descenso de la emisión de conductas reforzadas con dicho estimulo. La capacidad reforzante de un reforzador secundario puede anularse con la extinción y el contracondicionamiento. El reforzador secundario es susceptible a perder su capacidad elicitadora si se presenta sin ir emparejado con el EI. La saciedad y la extinción del reforzador son útiles con reforzadores secundarios, pero si estamos saciados de comida el dinero va a seguir relacionado con otros eventos reforzantes y aunque el transporte sea gratis, el dinero seguirá manteniendo contingencia con otros reforzadores. Por lo que la sensibilidad a la saciedad y al a extinción de las conductas mantenidas por reforzadores secundarios generalizados, es prácticamente nula. PROGRAMAS CONCURRENTES Y ESTIMULACION AVERSIVA. Conducta de elección: medida como la localización de sus respuestas en una u otra opción, eran función de la frecuencia relativa de reforzamiento de cada una de las alternativas. Los resultados llevaron a definir la LEY DE IGUALACION (B1/B2)= (r1/r2) donde 1 es una alternativa y 2 el sumatorio, B son las elecciones y r el valor del reforzador. Elección y reforzamiento negativo: Baurn comprobó cómo se ajustaba la Ley de Igualación a la conducta controlada por escape usando descargas como evento aversivo y el tiempo de estancia en una localización de la caja como conducta de elección. El ajuste de elección de los sujetos a la frecuencia de reforzamiento de cada alternativa fue aumentando. Se comprobó que las tasas de refuerzo negativo funcionaban de la misma forma que la reducción de reforzamiento positivo, pero solo se comprobó en 2 de las 4 palomas. Esther González UNED 2014 Página 44 Hutton, Gardner y Lewis también entrenaron palomas para responder ante el reforzamiento positivo para mantener respuesta de programa concurrente sin y con periodos de descargas. Los resultados mostraron en función de la frecuencia alternativa de reforzamiento negativo de cada alternativa, un importante ajuste a la Ley de la Igualación, pero no fue un ajuste perfecto. Longue y de Villiers, lo intentaron con ratas, pero estos experimentos eran mas complicado porque la respuesta de esta especie ante una descarga es la parálisis. Los resultados mostraron un buen ajuste en las elecciones en función de la frecuencia de escape. Elección y castigo: los trabajos de los efecto del castigo en programas concurrentes indican que los sujetos son capaces de ajustar su elección a ciertas características del castigo. Holz comprobó que aunque la tasa de respuesta decrece, la tasa relativa se ajusta a la frecuencia relativa del castigo en cada alternativa. Deluty entrenó ratas llegando a la conclusión que el incremento de la tasa relativa de castigo en una alternativa reducía la tasa relativa con la que era elegida. Conducta auto-controlada y conducta impulsiva: una conducta en contraposición de la otra, se ha concebido como la elección de la alternativa con mayor valor relativo de reforzamiento, pero mas demorada. Esto implica 2 programas concurrentes donde se manipula el tiempo entre la emisión de la respuesta y la aparición de la consecuencia y el valor del reforzador. Se considera RESPUESTA IMPULSIVA cuando la elección de la alternativa con un reforzamiento de menos valor relativo pero más inmediato es comportarse de manera impulsiva. El uso de procedimientos de reforzamiento negativo convierte la conducta impulsiva o autocontrolada en conducta de escape o evitación. Elegir el escape del evento aversivo con menor valor relativo (menor intensidad, menor tiempo) pero mas inmediato. Solmik, kannenbeg Eckerman y Waller, con humanos y sonidos molestos como evento aversivo encontraron una mayor proporción de elecciones impulsivas pero cuando el procedimiento es el castigo, se hace necesario un camibo en la demora. Respuesta impulsiva cuando la elección del castigo con mayor valor (intensidad o duración) pero mas demorado. Comportamiento autocontrolado cuando se elige el castigo mas leve e inmediato. Deluty en los experimentos con ratas llego a la conclusión que cuanto mayor era la demora mayor era el numero de elecciones auto-controladas. Esther González UNED 2014 Página 45