1. TEMAS INTRODUCTORIOS Aproximación al concepto de Aprendizaje. Definición de Aprendizaje.

Anuncio
1. TEMAS INTRODUCTORIOS
• Aproximación al concepto de Aprendizaje.
• Definición de Aprendizaje.
2.1 Análisis de la definición.
2.2 Aprendizaje y ejecución.
2.3 Comentarios de la definición.
• Procesos relacionados con aprendizaje.
3.1 En relación a relativamente permanente vs. transitorio: fatiga, habituación y sensibilización.
3.2 En relación con el efecto (o no efecto) de la práctica: maduración, instintos y reflejos.
• Aprendiz, tarea y contexto.
• Algunas cuestiones clave en las posiciones teóricas sobre aprendizaje.
• RESUMEN
• APROXIMACIÓN AL CONCEPTO DE APRENDIZAJE
Definición diccionario:
Aprendizaje− Adquirir el conocimiento de alguna cosa por medio del estudio o la experiencia.
⋅ El aprendizaje implica cambio.
Diccionario etimológico: Aprender viene del latín prendere. (Coger o retener).
⋅ El aprendizaje es el proceso, no el resultado final.
⋅ El aprendizaje se refiere tanto a cosas positivas como negativas.
• DEFINICIÓN DE APRENDIZAJE
Hilgard y Marquis (1940) Conditioning and learning:
Se entiende por APRENDIZAJE
el cambio conductual relativamente permanente que resulta de la práctica.
Kimble (1961) reedición del Conditioning and learning:
Se entiende por APRENDIZAJE
un cambio relativamente permanente en la potencialidad de la conducta que ocurre como resultado de la
práctica forzada.
1961: En lo relativo a las definiciones fácticas siempre ha existido un acuerdo general entre las autoridades en
1
la materia de que se entiende por Aprendizaje ...
1967: Sería posible decir que hay un acuerdo general, aunque ocasionalmente este acuerdo sea con poca
disposición ente los psicólogos del Aprendizaje de que es término puede ser definido como ...
1985: El fenómeno del aprendizaje es tan variado y diverso que no puede garantizarse su inclusión en una sola
categoría. Aunque la definición es útil, todavía deja problemas sin resolver.
1995: Anderson Learning and memory: ....:
Se entiende por APRENDIZAJE: proceso por el que los cambios relativamente permanentes ocurren en el
potencial conductual como resultado de la experiencia.
• ANÁLISIS DE LA DEFINICIÓN
PROCESO INFERIDO (o variable interviniente)
A
Variable
independiente
Variable
Dependiente
• APRENDIZAJE Y EJECUCIÓN
⋅ La ejecución se puede ver afectada por diversos factores: motivación, fatiga
....
⋅ La ejecución nunca puede ser superior al aprendizaje.
⋅ La exactitud de la ejecución como índice del aprendizaje depende de la
medida en que conozcamos estos hechos o factores y controlemos sus
efectos.
⋅ La práctica tiene que considerarse en sentido amplio para dar cabida a todos
esos factores del aprendizaje que no requieren que se ensaye por completo la
respuesta a ejecutar.
⋅ Hay un inicio conductual de la adquisición.
• APRENDIZAJE Y PROCESOS RELACIONADOS
• EN RELACIÓN A RELATIVAMENTE PERMANENTE VS. TRANSITORIO: FATIGA,
HABITUACIÓN Y SENSIBILIZACIÓN
! Cambios conductuales debidos a la práctica que no manifiestan permanencia:
• Habituación.
• Sensibilización.
2
• Fatiga.
(R.O.! Respuesta de orientación. Primera respuesta de orientación ante un estímulo).
HABITUACIÓN
• Es una
SENSIBILIZACIÓN
disminución
en la
disposición a
responder
ante un
estímulo
específico
debido a la
experiencia
repetida.
• Refleja
cambios en la
R1 ante un
estímulo
específico.
• Cambios en
las
propiedades
del estímulo
específico.
• Algunas
veces no es
transitoria.
• Es un
incremento
en la
reacción ante
los estímulos
ambientales.
• Aumento no
específico de
la respuesta a
responder a
cualquier
estímulo.
• Intensidad y
frecuencia
del estímulo
afecta a la
sensibilización.
• Siempre
transitoria.
FATIGA
Cuando una respuesta motora se repite con rapidez se hace progresivamente más lenta y débil en amplitud
hasta que deja de producirse.
• EN RELACIÓN CON EL EFECTO (O NO EFECTO) DE LA PRÁCTICA:
MADURACIÓN, INSTINTOS Y REFLEJOS
! Cambios conductuales no atribuibles a la práctica, que manifiestan permanencia:
• Maduración.
• Conducta específica de la especie.
• Instintos y reflejos.
INSTINTOS Y REFLEJOS, CONDUCTA TÍPICA DE LA ESPECIE
3
Instinto− Designa complejas acciones vitales de origen predominantemente innato que se expresan en
cambios conductuales donde la práctica juega un papel secundario.
Notas características que comparten estas acciones:
⋅ Desarrollarse de acuerdo a unas pautas fijas en su forma y su orden de
ejecución.
⋅ Ser compartidas por todos los miembros de una especie.
⋅ Tendencia a consumarse una vez desencadenadas.
⋅ Tener un valor funcional de supervivencia para el sujeto que las ejecuta y/o
para su especie.
La generalidad de estas características se matiza según el nivel filogenético (de evolución de la especie) del
que estemos hablando.
Conductas puramente innatas hay muy pocas. En general el patrón de acción fija que comporta un instinto se
ajusta a los detalles exactos del ambiente.
La especifidad de la conducta instintiva ofrece ciertas variantes entre los miembros de una misma especie.
El carácter de tendencia a la consumación se aplica mejor a conductas más simples y fijas que a acciones más
complejas como la agresión y la reproducción.
Reflejos.− Es una reacción determinada del organismo ante un agente definido.
Pavlov − El instinto es una cadena de reflejos.
• APRENDIZ, TAREA Y CONTEXTO
Elementos básicos en un procedimiento de aprendizaje.
CONTEXTO SITUACIONAL (Instrucciones, situación física, ...)
MOTIVACIÓN.− Si el sujeto no está motivado no comenzará el proceso de aprendizaje. Con una motivación
baja, le costará más el proceso de aprendizaje.
• Hay una fase previa de preentrenamiento.
• Entrenamiento: fase en la que el sujeto se enfrenta a la tarea y comienza su proceso adquisitivo.
• Los tipos de medida que se utilizan para verificar que se están produciendo cambios son muy
variados. Ejemplos:
• Medir el número de errores que comete.
• Medir las respuestas correctas.
• Medir la intensidad de la respuesta.
• Medir la latencia de respuesta (tiempo que transcurre desde que se presenta el estímulo hasta que se
produce la respuesta).
• Fase postentrenamiento. Se evalúa los efectos de haber estado expuesto a la práctica.
Con las instrucciones se puede modificar la forma de afrontar la tarea.
5. ALGUNAS CUESTIONES CLAVE EN LAS POSICIONES TEÓRICAS SOBRE APRENDIZAJE
4
EL CONTENIDO DEL APRENDIZAJE ¿Cuáles son las unidades del aprendizaje?
Unos dicen que son las ideas o cogniciones.
Otros, los conexionistas dicen que las unidades son nuevas conexiones entre un hecho ambiental, que
denominaremos estímulo y otro hecho ambiental que llamamos estímulo o respuesta.
MECANISMO POR EL QUE SE CONECTAN LOS ELEMENTOS
Unos hablan de la contigüidad, proximidad o asociación estrecha entre los elementos.
Otros dicen que se conecta por las consecuencias agradables o desagradables; están relacionados con las
teorías del hedonismo, y los efectos que el dolor y el placer tienen sobre el comportamiento humano. Se les
llama teóricos del refuerzo.
DEBATE HERENCIA / AMBIENTE
Los asociacionistas tienden a primar el ambiente, y a considerar el cerebro como una tábula rasa, mientras que
los más biologistas tienden a primar las predisposiciones del organismo para ciertas tareas y ciertos
aprendizajes.
CONTINUIDAD / DISCONTINUIDAD DEL PROCESO DE APRENDIZAJE
Para la mayoría de los conductistas el aprendizaje de las conexiones es un proceso gradual y continuo, y la
fuerza de la conexión aumenta según la práctica. Para la mayoría de los cognitivos una conexión o una
cognición acerca de las relaciones entre elementos puede presentarse súbitamente (aprendizaje de un solo
ensayo).
GENERALIZABILIDAD DE LAS LEYES DEL APRENDIZAJE
¿Rigen las mismas leyes para todos? ¿Se trata de diferencias cualitativas o cuantitativas?
Hay quien señala que las pautas de la evolución han generado algunas diferencias en como las leyes del
aprendizaje se aplican a las distintas especies.
2. CONDICIONAMIENTO CLÁSICO
• INTRODUCCIÓN
Problema científico que plantea.
Método y técnica.
Resultados.
• DEFINICIÓN Y CONCEPTO
• ADQUISICIÓN DE LA RESPUESTA CONDICIONADA (RC)
• EL PROCEDIMIENTO DE CONDICIONAMIENTO CLÁSICO
Componentes básicos
Técnicas de medida de la RC
5
Técnica de anticipación
Técnica del ensayo de prueba
• PARADIGMAS PRINCIPALES DEL CONDICIONAMIENTO CLÁSICO
Condicionamiento demorado
Condicionamiento de huella
Condicionamiento simultáneo
Condicionamiento retrógrado
Condicionamiento temporal
• FACTORES QUE DETERMINAN LA ADQUISICIÓN DE RC TRAS LOS EMPAREJAMIENTOS
La contigüidad temporal
La intensidad del EC y del EI
El papel de la saliencia del estímulo
El valor informativo de los estímulos
• EXTINCIÓN DE LA RESPUESTA CONDICIONADA
• PROCEDIMIENTOS DE EXTINCIÓN
• FACTORES QUE AFECTAN A LA EXTINCIÓN
La fuerza de la RC
El porcentaje de ensayos EC − EI
Duración de la exposición al EC en la extinción
• DESARROLLOS DEL CC
• AVANCES DEL PERIODO SOVIÉTICO
Condicionamiento interoceptivo
Condicionamiento semántico y verbal
• DESARROLLOS ESTADOUNIDENSES
La respuesta emocional condicionada (REC)
Precondicionamiento sensorial
Sombreado y bloqueo
• NATURALEZA DEL CC
6
• UNA PROPUESTA: EL MODELO ASOCIATIVO DE RESCORLA Y WAGNER
Supuestos
Aplicación al fenómeno del bloqueo
• RESUMEN
• INTRODUCCIÓN
Condicionamiento clásico o pavloviano.
IVAN PETROVICH PAVLOV 1849 − 1936
Reflejos condicionados, condicionales según Pavlov.
Era hijo de un sacerdote ortodoxo.
Recibió una beca para la universidad, donde se graduó en ciencias naturales. Tras trabajar en fisiología se
graduó en medicina.
1890− Organiza y dirige el instituto de ÇÇÇÇÇÇ experimental.
Premio nobel en medicina por sus investigaciones sobre la digestión.
Problema científico que plantea
La actividad nerviosa de un animal superior está representada en primer lugar por reflejos innatos.
Reflejos innatos (desde Descartes)− Conexiones determinadas entre acciones fijas a agentes definidos.
Los agentes externos definidos son pocos, están en las inmediaciones del organismo y tienen carácter general.
La supervivencia del organismo se garantiza hasta cierto punto por los reflejos innatos, pero cada vez se
garantiza menos, cuanto más ascendemos en la escala filogenética.
Un animal que sólo dispone de reflejos innatos moriría, porque la vida diaria exige relaciones más flexibles y
especializadas, ya que el medio varía y estas relaciones se establecen gracias a la corteza cerebral (según
Pavlov, los grandes hemisferios).
Hay muchos y variados agentes del mundo exterior que señalan de manera temporal y oscilante los factores
fundamentales que provocan los reflejos incondicionados. Así se asegura el equilibrio entre organismo y
medio. Por tanto, la actividad fundamental de los grandes hemisferios es la señalizadora, porque señala al
organismo todas las oscilaciones del medio a través de múltiples señales.
Método y técnica
¿Sobre qué órgano y con qué procedimiento?
Sobre cualquier reflejo. Pavlov escoge el reflejo alimentario, estudiar la salivación de los perros ante
determinados estímulos, siempre en condiciones controladas por él.
• DEFINICIÓN Y CONCEPTO
7
Se llama CC al proceso adquisitivo por el que un estímulo originariamente neutro en relación a una respuesta,
llega a poderla provocar gracias a la conexión asociativa de este estímulo con el estímulo que normalmente la
provoca.
• ADQUISICIÓN DE LA RESPUESTA CONDICIONADA (RC)
• EL PROCEDIMIENTO DE CONDICIONAMIENTO CLÁSICO
Componentes básicos
Reflejo innato:
EI − RI
EI− regular, no aprendida y uniforme
EC − RC
EC − EI − RI
( sonido) ( comida ) ( respuesta )
EC − RC
TÉCNICAS DE MEDIDA DE LA RC
• Técnica de anticipación. Presentas la campanilla (EC), mides la salivación (RC) y a continuación
presentas la comida (EI).
• Técnica de ensayo de prueba. En uno de los ensayos sólo se presenta el EC, sin el EI, y medimos la
RC.
• PARADIGMAS PRINCIPALES DEL CONDICIONAMIENTO CLÁSICO
EI
SIMULTÁNEO EC
DEMORADO EC
DE HUELLA EC
HACIA ATRÁS EC
CONDICIONAMIENTO TEMPORAL.− No hay EC distintivo
• FACTORES QUE DETERMINAN LA ADQUISICIÓN DE RC TRAS LOS EMPAREJAMIENTOS
• El emparejamiento del EC y el EI no asegura automáticamente la adquisición de la RC.
• Contigüidad. Que el EC preceda al EI.
• Hay intervalos óptimos para el condicionamiento entre el EC y el EI, según el sistema de respuesta
que se utilice.
8
No obstante hay algunos procedimientos por los cuales se puede condicionar aunque no exista contigüidad,
introduciendo otro EC entre los dos primeros (puente).
Hay una excepción, el efecto García. Se refiere a la aversión gustativa condicionada (o aprendizaje de
aversión al sabor). Los animales y las personas son capaces de asociar un sabor (EC) con una experiencia de
malestar (EI) producida varias horas después de la ingesta. Se trata de un caso de aprendizaje demorado.
Intensidad del EC
Los primeros estudios indicaban que la intensidad de la EC no afectaba. Pero a través de las nuevas
experimentaciones se ha descubierto que la intensidad del EC si que puede afectar a la magnitud de la RC,
cuando el sujeto tiene experiencia con dos estímulos condicionados de manera que si tu utilizas dos Ecs, uno
más intenso y otro más débil, el intenso consigue un mayor condicionamiento.
Intensidad del EI
Generalmente se asume que la magnitud de la RC se incrementa con la intensidad del EI. ( !EI !RC ).
Saliencia
Según la especie a la que pertenece el individuo hay más o menos preparación para asociar algunos estímulos
con un EI. Si tenemos dos EC's con un EI, se va a condicionar el EC más saliente para la especie. El más
intenso interfiere al más débil, de manera que el menos saliente queda ensombrecido.
Hay veces que un estímulo no saliente produce una RC más fuerte de la que sería de esperar si ese estímulo se
emparejara con un EI él solo.
Valor informativo del estímulo
La contigüidad por si sola no es suficiente, tiene que haber también una relación por la cual la señal (EC)
prediga fiablemente la aparición del EI. Si esta predicción no es sistemática, no se producirá la RC.
Cuando se presentan dos o más estímulos con el EI, solamente se asociará con el EI aquel que prediga más
fiablemente su aparición.
EC
SI
EI
SI
SI
SI
:
NO
:
SI
NO
SI
:
EC
SI
:
EI
SI
SI
SI
9
:
SI
:
NO
SI
NO
:
:
En ninguno de estos dos casos se produciría el condicionamiento, porque no hay una relación constante.
Redundancia
Ejemplo: El castigo de un padre. Podría ser que a un niño no le hiciese falta una amenaza de castigo, porque la
figura del padre ya puede recordarle al castigo.
• EXTINCIÓN DE LA RC
La extinción es un método para eliminar RCs.
• PROCEDIMIENTO DE EXTINCIÓN
Se produce cuando se presenta el estímulo condicionado sin ir seguido del estímulo incondicionado.
La fuerza de la RC disminuye al incrementar el número de presentaciones del EC solo hasta que finalmente el
EC no provoca la RC.
• FACTORES QUE AFECTAN A LA EXTINCIÓN
• Fuerza de la RC.
• Influencia del valor informativo.
• Duración de la exposición al EC durante el proceso de extinción.
• Fuerza de la RC.
Fuerza de la RC. Consecuencia más importante: La extinción difiere de la adquisición, no es una imagen en
espejo. Se pensaba que cuanto más fuerte era la RC más difícil era la extinción (más lenta). Sin embargo, hay
discrepancias sobre el hecho de que adquisición y resistencia a la extinción correlacionen punto por punto.
Una de las explicaciones es que el nivel motivacional del sujeto cambia del proceso de adquisición al proceso
de extinción.
Influencia del valor informativo.
Grupo 1: 48: EC−EI Grupo 2: 96: EC−EI
48: EC−X
Grupo 3: 48: EC−EI
¿En cuál de los tres grupos resultaría más difícil la extinción?
En el grupo 1 se produce una mayor resistencia a la extinción, ya que durante los ensayos, ya estaban
acostumbrados a que unas veces el EI seguía al EC y otras no, luego es más fácil que conserven la esperanza
de que el EI vuelva a aparecer alguna vez.
10
Duración de la exposición al EC en el proceso de extinción
Al incrementar el grado de experiencia con el EC solo, la magnitud de la RC disminuye. Sin embargo hay
estudios que demuestran que la tasa de extinción está determinada por la duración de la exposición el EC solo,
y no por el número de ensayos de extinción.
G1
G2
Tono EC
25''
100''
200''
8 ensayos
2 ensayos
400''
16 ensayos
4 ensayos
800''
32 ensayos
8 ensayos
Lo que afecta a la extinción es la duración total de la exposición. Al aumentar la duración de la exposición al
EC se debilita la fuerza de la RC.
NATURALEZA DE LA EXTINCIÓN
Pavlov consideraba que la extinción se debe a la inhibición de la RC. Esta inhibición se desarrolla como
consecuencia de la activación de un estado inhibitorio central que se produce al presentar el EC sin el EI. La
presentación repetida del EC sin el EI intensifica este estado inhibitorio e impide la aparición de la RC.
La presentación de un EC solo activa un estado inhibitorio central (inhibición interna).
La exposición al EC masiva produce una mejor extinción que la exposición espaciada.
Es probable que en la extinción intervenga más de un proceso. Al menos uno de los procesos de la extinción
es la inhibición, y juega un papel importante.
• DESARROLLOS DEL CONDICIONAMIENTO CLÁSICO
• AVANCES DEL PERIODO SOVIÉTICO
Condicionamiento interoceptivo. Es aquel condicionamiento clásico en que el EC o el EI se aplica
directamente sobre alguna mucosa de un órgano
Tres tipos:
TIPO 1
EC
INT
EI
INT
TIPO 2
EXT
INT
TIPO 3
INT
EXT
Por mucho tiempo la psicología occidental consideró que las vísceras no eran accesibles al S.N.C., pero si que
lo son.
Aplicaciones para comprender algunos de los desarrollos de los problemas psicosomáticos.
Con este tipo de estudios se muestra el control que el S.N.C. ejerce sobre las vísceras.
Condicionamiento semántico y verbal. Los psicólogos rusos nunca excluyeron como tema de investigación el
lenguaje y la conciencia, mientras que para los estadounidenses no se podía estudiar la conciencia.
11
Los rusos se centraron en el significado de las palabras como ECs para una variedad de respuestas externas e
internas.
1er. sistema de señales: todos los estímulos que no tienen que ver con el lenguaje.
2º sistema de señales: el lenguaje.
También se centraban en el uso de la instrucción verbal y la función directiva que tiene el lenguaje sobre la
conducta.
Condicionamiento semántico. Condicionamiento efectivo de un reflejo a una palabra u oración en cuanto a su
significado independientemente del aspecto visual o del sonido. En los estudios se condicionaba el
significado, ya que cuando se nombraba algún sinónimo la salivación también se producía, pero con palabras
homónimas no se producía la salivación.
Pavlov afirmaba que se podía condicionar con el 1er. y 2º sistema de señales, y los estudios han demostrado
que estaba en lo cierto.
El condicionamiento con el 1er. sistema de señales es más rápido que con el 2º.
El condicionamiento basado en el significado tiene una limitación temporal, y sólo se da a partir de la edad
escolar.
Para niños muy pequeños (0 a 8 años) el condicionamiento se basa en estímulos físicos.
Hay un proceso desde el nacimiento hasta la edad adulta según el cual cada vez nos vamos fijando más en
aspectos de significado y cada vez menos en lo físico.
Cuando se emplean palabras como ECs se condicionan características del estímulo, tanto físicas como de
significado. El condicionamiento del significado se llama condicionamiento semántico y la intensidad relativa
del condicionamiento de este tipo aumenta con la edad, el número de ensayos y la ausencia de drogas que
interfieran con las funciones corticales superiores.
RAZRAN examinó la generalización de una respuesta de salivación condicionada a palabras como style
(estilo) y urn (tetera) después de emparejar las palabras entrenadas con estímulos tales como pretzels (galleta)
y candy (bombón). Razran comprobó que las palabras sinónimas y homófonas a los estímulos entrenados
producían también la respuesta de salivación y que la cantidad de generalización aumentaba con el grado de
semejanza semántica.
• DESARROLLOS ESTADOUNIDENSES
Respuesta emocional condicionada (REC).
Se utiliza como una técnica de medida de la RC. Lo desarrollan Estes y Skinner.
Hipoactividad prolongada o respuesta de paralización ante un EC emparejado con un estímulo doloroso.
Pasos para provocar una REC:
1º MOLDEAMIENTO (shaping). Hace falta coger la respuesta que quieres conseguir y fragmentarla en
pequeños pasos o componentes. Ir administrando una consecuencia positiva hasta que se de la respuesta
deseada.
12
2º TONO − SHOCK
(EC) (EI)
3º DISMINUYE TASA de oprimir la palanca cuando suena el tono. Hasta que suceda el shock, después
vuelve a presionar la palanca.
El SREC o procedimiento de supresión condicionada mide los decrementos de las tasas de respuesta
instrumental en presencia de un EC − EI adverso en relación con las tasas de respuesta dadas en ausencia del
EC.
Precondicionamiento sensorial.
Brodgen obtuvo el fenómeno por primera vez en 1939.
Utiliza un paradigma pavloviano, pero con el método de Betcherev (tono − shock pata − flexión de la pata).
Luz − sonido Luz ! shock (EI) ! flexión (RI)
EC2 EC 1
RC
Ejemplo de precondicionamiento sensorial: un vecino tiene un perro, que un día te ataca. Tras el suceso, la
simple visión del vecino (sin el perro) provoca nerviosismo.
Consiste en aparear dos señales durante varios ensayos. Una de ellas, después se aparea a un EI; se comprueba
posteriormente que la respuesta condicionada también se da al segundo estímulo.
Una explicación es que al presentar luz y sonido juntos, ambos funcionan como un solo estímulo compuesto.
Este condicionamiento se da mejor cuando el EC2 precede en varios segundos al EC1, y cuando este par se
presenta en un número reducido de ensayos. El mecanismo que parece que está operando ahí es un mecanismo
de mediación, porque cuando se extingue la RC a una de las señales, también se extingue en la otra.
Sombreado y bloqueo.
Aunque en laboratorio manejamos estímulos aislados, en el mundo real el condicionamiento clásico
mayoritariamente se produce por estímulos compuestos. Por eso también en laboratorio una de las cosas que
se ha estudiado es el papel relativo que tienen los integrantes de los estímulos compuestos. Se ha comprobado
que en los estímulos compuestos los componentes dinámicos o intermitentes (destellos luminosos, sonidos
penetrantes) sobresalen más (tienen más poder) para provocar RCs que los estímulos estáticos.
El sombreado es cuando un estímulo más saliente se condiciona más que otro no saliente que se presenta a la
vez. Las señales verbales son más fuertes que las de otro tipo, de tal manera que la señal verbal en un estímulo
compuesto ensombrece los componentes no verbales.
El bloqueo es un sombreado provocado por un condicionamiento previo.
KAMIN:
Hizo un experimento que utilizaba una REC (respuesta emocional condicionada). Quería demostrar que el
13
sombreado se podía manipular.
1º) Presión palanca − alimento
2º) luz − descarga (G1)
EC EI
3º) Divide el grupo en dos:
G1a. Luz − tono − descarga.
G1b. Tono − descarga.
4º) G1a. El tono queda ensombrecido y no provoca RC. Sólo la luz provoca RC.
G1b. La luz provoca RC.
Con el experimento demostró que se podían ensombrecer estímulos mediante la manipulación.
Factor sorpresa: Mackintosh explica el fenómeno del sombreado por el efecto sorpresa.
• Presión palanca − comida
• EC1 EI EI (G1)
• (G1A) EC1 EC2 EI ; (G1B) EC1 EC2 EI EI
• (G1A) EC2 si RC; (G1B) EC2 bloqueado, no RC
En el grupo G1A ha habido un cambio (un elemento sorpresivo), la supresión de uno de los 2 EI, por lo cual
ha habido factor sorpresa y si que ha condicionado el EC2
OTROS ASPECTOS DEL CONDICIONAMIENTO CLÁSICO
• Condicionamiento de orden superior.
• Generalización.
• Condicionamiento vicario.
Condicionamiento de orden superior
Una vez se ha asociado un EC con un EI, la presentación del EC junto con otro estímulo neutro (EC2), dota a
este último estímulo con la capacidad de provocar la RC. Este tipo de condicionamiento de orden superior se
denomina de segundo orden.
La RC producida por el EC2 es más débil (la mitad, aproximadamente). La de tercer orden aún es más débil.
Es muy difícil conseguir el condicionamiento de orden superior. Rescorla lo explica diciendo que durante el
emparejamiento EC1 − EC2, también se condiciona la inhibición de la respuesta, ya que se presentan los EC
con ausencia de EI.
Generalización
La generalización hace que respondamos con una RC ante estímulos similares al EC, aunque no totalmente
iguales. Por ejemplo: condicionamos un tono de unos determinados db. Presentamos otro tono con otras
14
características diferentes, para ver si también produce RC. Cuanto más se alejan las características del tono
presentado a las del tono condicionado, menos RC se produce, creando un gráfico llamado gradiente de
generalización.
Condicionamiento vicario
Una persona puede aprender a responder ante un estímulo como consecuencia de la observación de las
experiencias de otras personas. La adquisición a través de la observación de la capacidad de un EC para
provocar la RC se denomina condicionamiento vicario.
No siempre adquirimos una RC después de observar las experiencias de otras personas. Para que se produzca
el condicionamiento vicario tenemos que responder emocionalmente ante la escena que presenciamos.
Tenemos que encontrarnos en un estado de activación (tampoco demasiado alto) para adquirir respuesta
condicionada a través de la observación de las experiencias de otras personas.
• NATURALEZA DEL CONDICIONAMIENTO CLÁSICO
• MODELO ASOCIATIVO DE RESCORLA Y WAGNER
Es una de las propuestas para explicar el mecanismo por el cual el valor informativo del estímulo afecta al
CC.
• Hay una fuerza asociativa máxima (fasoc) que puede desarrollarse entre un EC y un EI. Cada EI aporta
diferentes niveles máximos de condicionamiento.
• Aunque la fuerza asociativa aumenta en cada ensayo de condicionamiento, la cantidad de fuerza asociativa
adquirida en un ensayo de entrenamiento particular está determinada por el nivel de entrenamiento previo.
Se acumulará más fuerza asociativa en los primeros ensayos de entrenamiento que en los posteriores. El
incremento disminuye con los emparejamientos EC − EI.
• La tasa de condicionamiento varía dependiendo del EC y del EI utilizados. Algunos estímulos acumulan
rápidamente fuerza asociativa, otros la adquieren lentamente. Algunos EIs producen un aprendizaje más
rápido que otros.
• El nivel de condicionamiento en un ensayo particular está determinado no sólo por la cantidad de
condicionamiento previo de ese estímulo, sino también por el nivel de condicionamiento previo de otros
estímulos asociados con el mismo EI. Un EI particular puede aportar solamente una cierta cantidad de
condicionamiento aun cuando se empareje más de un estímulo con ese EI. Cuando se presentan dos o más
estímulos, éstos deben compartir la fuerza asociativa que aporta el EI.
Ecuación matemática de Rescorla y Wagner
Cambio producido en la fuerza asociativa en un ensayo determinado EC − EI:
VA = K ( − VAX)
• VA ! Cambio producido en la fuerza asociativa entre el ECa y el EI.
• K ! La tasa de condicionamiento que está determinada por la naturaleza del EC y por la intensidad del
EI. El valor de K puede descomponerse en:
♦ = poder del ECA y = intensidad del EI.
• ! nivel máximo de condicionamiento que puede aportar el EI.
• VAX ! nivel de condicionamiento que ha acumulado conjuntamente el EC y demás estímulos
presentes durante el condicionamiento. (Por tanto Vax = Va + Vx).
Ejemplo del modelo aplicado al fenómeno del bloqueo.
15
• Sea K = 0.50.
• Sea = 90
• Sea Va = 0
• Ensayo 1: Va = 0.50 (90 − 0) = 45
• Ensayo 2: Va = 0.50 (90 − 45) = 22.5
• Ensayo 3: Va = 0.50 (90 − 67.5) = 11.3
• Ensayo 4: Va = 0.50 (90 − 78.8) = 5.6
• Ensayo 5: Va = 0.50 (90 − 84.4) = 2.8
• = 87.2
Tras 5 ensayos sólo restan 2.8 unidades asociativas. Es como si se fuera sustrayendo fuerza asociativa.
ANOTACIONES RESPECTO A LA NATURALEZA DEL CONDICIONAMIENTO
Las teorías más tradicionales asumen que el nivel de aprendizaje se mantiene constante después del
entrenamiento. Sobre este presupuesto están Rescorla, Wagner, Mackintosh. Se les ha llamado también teorías
basadas en el input.
Esto es suponer que el aprendizaje es una representación estática del grado de correlación entre los estímulos.
Hay otra perspectiva acerca del tema, que viene a decir que el nivel de condicionamiento de un EC puede
cambiar aunque no haya más emparejamientos EC − EI. Esta teoría asume que se puede producir
procesamiento retroactivo, es decir, que aparezca nueva información que hace que el sujeto reevalúe la
experiencia pasada y se forme una nueva representación de la relación entre el EC y el EI.
3. EL CONDICIONAMIENTO OPERANTE
• NOCIONES INTRODUCTORIAS
• INTRODUCCIÓN
El aprendizaje por las consecuencias.
Antecedentes. La ley del efecto de Thorndike.
Skinner y la noción de probabilidad de respuesta.
Método y técnica de moldeamiento.
• DEFINICIÓN Y CONCEPTO
• Términos básicos.
Operante.
Refuerzos: tipos.
• Relación entre respuestas y refuerzo.
Relaciones de contingencia.
Paradigmas de Condicionamiento Operante.
16
• Programas de Refuerzo.
Según criterios de frecuencia de respuesta.
Según criterios temporales.
• CONDICIONAMIENTO DE RECOMPENSA
• FACTORES QUE INFLUYEN EN LA ADQUISICIÓN DE LA CONDUCTA INSTRUMENTAL
La demora de recompensa.
La magnitud de la recompensa.
• EL PRINCIPIO DE PREMACK Y LA NATURALEZA DEL REFORZAMIENTO
• LA EXTINCIÓN Y LOS FACTORES QUE CONTRIBUYEN A LA RESISTENCIA A LA EXTINCIÓN
La magnitud de la recompensa durante la adquisición.
La demora de la recompensa durante la adquisición.
La consistencia del reforzamiento durante la adquisición.
• CONDICIONAMIENTO DE ESCAPE
• FACTORES QUE AFECTAN A LA EFICACIA DE LA CONDUCTA DE ESCAPE
La intensidad del estímulo aversivo.
La magnitud de la recompensa.
Demora de la recompensa.
• EXTINCIÓN
Por supresión del Refuerzo Negativo.
Por ausencia del estímulo aversivo.
• CONDICIONAMIENTO DE EVITACIÓN
• CARACTERÍSTICAS
• FACTORES QUE AFECTAN LA EXTINCIÓN
Intensidad del estímulo aversivo.
Intervalo entre estímulos.
• CASTIGO
• EL CASTIGO Y SUS TIPOS
• FACTORES QUE AFECTAN A LA EFICACIA DEL CASTIGO
• EFECTOS DEL CASTIGO
• RESUMEN
• NOCIONES INTRODUCTORIAS
• INTRODUCCIÓN
17
El aprendizaje por las consecuencias
Los antecedentes del condicionamiento operante están en Thorndike. Se sitúa en la época en la que se produce
el gran impacto de la teoría evolucionista, que coloca a las especies en una escala evolutiva, incluida la
especie humana.
Thorndike− La caja problema. Utilizaba gatos hambrientos, a los que ponía la comida en el exterior de la caja.
Los introducía en la caja, y al final, por ensayo y error, el animal conseguía salir. Trazó una curva con lo que
el animal tardaba en salir de la caja en cada ensayo. Al final, el gato salía automáticamente
Ley del efecto de Thorndike
La asociación E − R se establecía debido a que el gato era recompensado. Thorndike denominó ley del efecto
a este fortalecimiento de la asociación debido a un acontecimiento satisfactorio o recompensa. Su
complementaria es la ley del ejercicio: cuando a una determinada situación le sigue frecuentemente una cierta
respuesta o grupo de respuestas, el vínculo entre el estímulo y la respuesta se fortalece por la práctica.
Skinner y la noción de probabilidad de respuesta
El trabajo de Skinner se basa en estudios anteriores, como el de Thorndike.
Para llegar a las últimas consecuencias de la ley del efecto de Thorndike, necesitamos poner en claro la noción
de probabilidad de respuesta, que salva un problema que se da en la ley del efecto de Thorndike. Este último
afirma que la respuesta, o se da o no se da. Skinner, con la probabilidad de respuesta, permite que haya una
oscilación entre darse y no darse. Basa la probabilidad de respuesta en la frecuencia.
CAJA DE SKINNER
Moldeamiento− Técnica para la adquisición de una conducta deseada que consiste en seleccionar primero una
conducta operante con una tasa alta y posteriormente ir cambiando la contingencia (relación establecida entre
una conducta particular y el reforzamiento) hasta que se aprende la conducta deseada.
• DEFINICIÓN Y CONCEPTO
Skinner no era partidario de utilizar el término respuesta, pero en la actualidad si que se utiliza. Él utilizaba el
término operante para denominar a un determinado tipo de respuesta.
En el condicionamiento operante fortalecemos una operante, en el sentido de hacer que la respuesta sea más
probable o frecuente mediante el refuerzo.
En el condicionamiento pavloviano incrementamos la magnitud de la respuesta provocada por el EC y
acortamos el tiempo que trascurre entre el estímulo y la respuesta.
SKINNER: Hay un gran repertorio de conductas dadas por el equipo biológico, es decir, conductas innatas.
Muchas de estas conductas se adquieren porque van seguidas de una consecuencia, que si es positiva, refuerza
el comportamiento.
El condicionamiento no es sólo los antecedentes y las consecuencias, también influye el orden de las
consecuencias, que podemos manipular. No es lo mismo dar una bola de comida por cada picoteo que por
cada 10.
Fases en el condicionamiento operante
18
• Habituación.
• Moldeamiento. Moldear la conducta del animal, para que sepa que si realiza una determinada acción,
obtendrá el alimento.
• Reforzamiento continuo. Se le da comida cada vez que repite la conducta.
Según cual sea el orden de la conducta cambiará también el comportamiento, por ejemplo, si se le da comida
cuando ha apretado 50 veces la palanca, apretará muchas más veces que si se le da la comida cada vez que
aprieta la palanca.
El 4º paso sería la extinción, que consiste en que desaprenda lo aprendido. Este es un proceso más difícil.
También depende del orden de consecuencia con que se haya llevado a cabo el aprendizaje.
Consecuencia a la emisión de la conducta:
PRESENTACIÓN
(contingente)
Estímulo + (apetitivo)
RECOMPENSA
(procedimiento de refuerzo
positivo)
ENTRENAMIENTO
EN OMISIÓN
RETIRADA
(CASTIGO NEGATIVO)
(contingente)
SUPRESIÓN
COSTE RESPUESTA (por
ejemplo: una multa)
Estímulo − (aversivo)
CASTIGO
(castigo punitivo)
ESCAPE
EVITACIÓN
(procedimiento de refuerzo
negativo)
TIEMPO FUERA (por ejemplo:
castigar al niño en su cuarto)
Condicionamiento de recompensa ! función que define el incremento en la frecuencia o en el vigor de una
respuesta por seguirse de ella una contingencia positiva.
Condicionamiento de escape ! función que define el incremento o frecuencia o vigor de una respuesta por
seguirse de ella desaparición o supresión de estimulación aversiva.
Condicionamiento de evitación ! función que define el incremento o frecuencia o vigor de una respuesta por
seguirse de ella la evitación de la aparición de estimulación aversiva.
Condicionamiento de castigo ! función que define la supresión de una respuesta por seguirse de ella
presentación de estimulación aversiva.
Castigo negativo, entrenamiento en omisión ! función que define la supresión de una respuesta por seguirse de
ella la desaparición o ausencia o disponibilidad del estímulo positivo.
PARADIGMAS DE REFORZAMIENTO
• Si la conducta aumenta se tratará de recompensa o refuerzo negativo.
• Si la conducta disminuye se tratará de castigo u omisión.
No se puede determinar a priori lo que es positivo o negativo. Depende del sujeto del que estemos hablando.
19
Reforzamiento:
• Continuo. Se da la recompensa cada vez que se produce la conducta.
• Intermitente. Sólo se da la recompensa en algunos momentos en los que se da la conducta. Ejemplo:
las máquinas tragaperras.
Refuerzo negativo:
• Evitación. Un estímulo indica que se va a producir una situación aversiva. Ejemplo: un semáforo
indica que no puedes pasar.
• Escape. El sujeto se encuentra en situación aversiva y mediante su conducta puede hacer que esta
cese.
Registro acumulativo ! Aparato para determinar la frecuencia de la conducta operante. La tasa de respuesta de
la conducta operante depende del tipo de refuerzo y de la contingencia existente (si es fuerte o débil).
Condicionamiento operante:
• De razón. El refuerzo se presenta en función del número de respuestas.
• De intervalo. El refuerzo se produce cuando pasa un determinado intervalo de tiempo
ESQUEMA PARA CLARIFICAR LOS PARADIGMAS DE CONDICIONAMIENTO OPERANTE
Si la consecuencia a la emisión de la conducta es la PRESENTACIÓN contingente:
• De un estímulo +: CONDICIONAMIENTO DE RECOMPENSA O PROCEDIMIENTO DE
REFUERZO POSITIVO.
• De un estímulo −: CASTIGO (castigo positivo) o CASTIGO PUNITIVO.
Si la consecuencia a la emisión de la conducta es la RETIRADA contingente:
• De un estímulo + (apetitivo): ENTRENAMIENTO EN OMISIÓN O CASTIGO NEGATIVO (coste
de respuesta).
• De un estímulo − (aversivo): CONDICIONAMIENTO DE ESCAPE, EVITACIÓN. También
llamado refuerzo negativo.
Condicionamiento de recompensa: Función que define el incremento en la frecuencia o en el vigor de una
respuesta por seguirse de ella una contingencia positiva.
Condicionamiento de escape: Función que define el incremento en frecuencia o vigor de una respuesta por
seguirse de ella una supresión o desaparición de estimulación aversiva.
Condicionamiento de evitación: Función que define el incremento en frecuencia o en vigor de una respuesta
por seguirse de ella la evitación de la aparición de estimulación aversiva.
Castigo: Función que define la supresión de una respuesta por seguirse de ella presentación de estimulación
aversiva.
Castigo negativo: Función que define la supresión de una respuesta por seguirse de ella la desaparición,
ausencia o disponibilidad del estímulo positivo.
Estímulo discriminativo ! indica la disponibilidad del refuerzo. Puede indicar que está disponible o no
20
disponible. El estímulo discriminativo no provoca la respuesta (entonces sería un EC). Sólo muestra la
disponibilidad para que la operante se emita o no se emita.
Refuerzos positivos ! añaden algo a la situación. Una actividad cuya realización aumenta la frecuencia de la
conducta que la precede.
Refuerzos negativos ! aquellos cuya supresión refuerza la conducta. La terminación de un estímulo aversivo
refuerza la conducta que pone fin a dicho estímulo.
Contingencia ! relación establecida entre la conducta y el reforzamiento. Según Skinner, el ambiente
determina las contingencias y las personas deben realizar la conducta apropiada para obtener el reforzador.
Refuerzo condicionado ! El hecho de que determinados estímulos se asocien con refuerzos positivos
primarios. Estos estímulos se transforman en refuerzos positivos secundarios. El refuerzo secundario más
importante es el dinero.
Diferencia entre condicionamiento operante y aprendizaje instrumental:
Lo que distingue al condicionamiento operante del aprendizaje instrumental es que el sujeto tenga control o no
sobre la frecuencia de las respuestas. Si no tiene control, es instrumental; si sí que tiene control, es operante.
El experimentador limita las posibilidades de la respuesta en el instrumental, mientras que en el operante no
las limita.
PAUTAS DE PRESENTACIÓN DEL ESTÍMULO
PROGRAMAS DE REFORZAMIENTO
Simples: CONTÍNUO
INTERMITENTE: Criterio frecuencia Razón fija (RF)
(programas de razón) Razón variable (RV)
Criterio temporal Intervalo fijo (IF)
(programas de intervalo) Intervalo variable (IV)
Compuestos. Un ejemplo de programa compuesto sería RF 3 IV5. Son combinaciones de los simples.
RF: Por ejemplo RF 5: øøøøø!øøøøø! . Como la rata del video, que cada 5 presiones de palanca, le daríamos
una bolita de comida
RV: RV 5: øøø!øøøøøøø!øøøøøø!øøøø! . El promedio de número de respuestas que se debe dar es 5.
IF 1: Durante 1 minuto, el comedero no está disponible. Pasado ese minuto, cuando el animal da la primera
respuesta, obtiene la comida. Con este reforzamiento se da el festoneo ( Gráfica de la Pág. 156 del Klein)
IV 3: El promedio de tiempo que transcurre el dispositivo bloqueado es 3.
En la gráfica: cuanto más perpendicular quede la línea, más número de respuestas hay.
• CONDICIONAMIENTO DE RECOMPENSA
21
• Factores que influyen en la adquisición de la conducta instrumental
La importancia de la contigüidad. La demora de la recompensa: La contigüidad tiene un efecto importantísimo
sobre la conducta instrumental: cuanto más próximos en el tiempo estén la respuesta y la recompensa, mayor
es el condicionamiento. El aprendizaje instrumental se deteriora si se demora la recompensa. A mayor
demora, menor condicionamiento, y se necesita un mayor número de ensayos.
La magnitud de la recompensa: a mayor magnitud de la recompensa, mayor es el nivel de la respuesta
instrumental. La probabilidad y la intensidad de una respuesta instrumental dependen de la magnitud de la
recompensa.
Para comprobar si esto sucede por aprendizaje o por motivación, se sigue unos procedimientos. Primero se
comienza con una recompensa baja y la vamos subiendo poco a poco. Otra opción es empezar con una
recompensa alta e ir bajando poco a poco. Si se produce un cambio gradual en la respuesta, se trata de
aprendizaje. Si el cambio es brusco, hablamos de motivación.
Efecto de DEPRESIÓN. Proceso por el cual un cambio en la magnitud de la recompensa de un valor alto a
uno bajo produce un nivel de conducta instrumental menor del que sería de esperar si la recompensa siempre
hubiese sido baja.
Efecto de ELACIÓN. Aumento en la ejecución producido al cambiar la recompensa de baja a alta, en
comparación con la producida con una recompensa alta y constante.
Ver gráfica Pág. 167.
El contraste negativo se explica mediante la frustración, que genera una ansiedad que interfiere en la
ejecución de la tarea. Al administrar barbitúricos, esta ansiedad desaparece, y también desaparece el contraste
negativo. Para el contraste positivo no hay explicación.
• El principio de Premack y la naturaleza del reforzamiento
El principio de Premack está encuadrado en todo lo que es estudiar las condiciones bajo las cuales un evento
ambiental es reforzante.
Skinner nunca habló de la naturaleza del reforzamiento, él era totalmente ateórico.
TEORÍA DE LA PROBABILIDAD DIFERENCIAL DE PREMACK
El reforzamiento no son cosas, son las actividades las que son reforzantes.
Un reforzador es cualquier actividad cuya probabilidad es mayor que la de la conducta reforzada.
Premack afirma que el reforzante no es la comida, sino la acción de consumir la comida.
Dado que comer es una conducta más probable que presionar la palanca, comer puede reforzar la respuesta de
presión de palanca.
Este trabajo está dentro del contexto de trabajo de investigación que estudia la naturaleza del reforzamiento, y
ha tenido mucha repercusión.
Es importante recordar que las actividades pueden ser reforzantes.
22
Este trabajo también se utiliza para reducir conductas no deseadas, como por ejemplo gritar.
• LA EXTINCIÓN y los factores que contribuyen a la resistencia a la extinción.
La respuesta operante y la instrumental se puede extinguir si el refuerzo deja de darse. Si se suprime el
refuerzo, la respuesta poco a poco va perdiendo fuerza hasta que deja de darse.
Cuando se interrumpe el reforzamiento por primera vez, la tasa de respuesta aun sigue siendo alta, por tanto es
sólo cuando se persiste en no presentar el reforzamiento cuando la respuesta deja de producirse.
Recuperación espontánea: En un principio, una inhibición reactiva transitoria (Ir) suprime la respuesta debido
a la fatiga producida cuando la conducta no obtiene refuerzo. La conducta instrumental reaparece cuando la
fatiga se disipa. Si la conducta continúa sin ser reforzada, se desarrolla una inhibición condicionada
permanente.
La extinción no tiene como único efecto la inhibición. También existen efectos aversivos, como la frustración.
La frustración, como todo lo aversivo, tiende a evitarse.
Resistencia a la extinción de una respuesta instrumental
3 factores:
• Magnitud de la recompensa durante la adquisición.
• Demora de la recompensa durante la adquisición.
• Consistencia del reforzamiento durante la adquisición.
• Magnitud de la recompensa durante la adquisición.
Depende del nivel de entrenamiento:
• Si entrenamiento mínimo, a mayor magnitud, mayor resistencia.
• Si entrenamiento prolongado, a más magnitud, menor resistencia.
Explicación del fenómeno:
Cuando estamos con la recompensa pequeña, durante la adquisición, un mecanismo que se llama respuesta
anticipatoria de meta se desarrolla lentamente. Cuando llega el momento de la extinción, como la recompensa
ha sido pequeña, hay muy poca frustración, y así, cuanto más ensayos de adquisición, más resistencia.
Cuando estamos con la recompensa grande, al comenzar la extinción, el sujeto experimenta una gran
frustración, que ayuda a la extinción.
• Demora de la recompensa durante la adquisición.
Cuando el tiempo de demora es variable, la resistencia a la extinción es mayor, pues el sujeto está
acostumbrado a que la recompensa a veces tarda un poco más, y se queda esperando.
Si la demora está entre 20−30 segundos, la extinción es más difícil, aunque también depende de la especie, la
recompensa...
• La consistencia del reforzamiento.
23
El refuerzo intermitente o parcial, provoca una mayor resistencia a la extinción, que cuando se trata de un
refuerzo continuo. A eso se le llama efecto del refuerzo parcial. Pág. 183.
RESUMEN
La frecuencia e intensidad de la respuesta instrumental se incrementa durante la adquisición y disminuye
durante la extinción.
La ausencia del refuerzo lleva a una inhibición de la respuesta instrumental, y además también da lugar a
frustración.
La frustración se relaciona con conductas de escape y evitación ante estímulos asociados con la situación de
ausencia de refuerzo.
Hay 3 factores que afectan a la ausencia de la extinción:
• Recompensa. Su efecto depende del nivel de entrenamiento.
• Demora variable. Más resistencia a la extinción.
• El refuerzo intermitente o parcial, más resistencia a la extinción.
CONDICIONAMIENTO AVERSIVO
La recompensa consiste en la eliminación del estímulo aversivo.
El condicionamiento aversivo consiste básicamente en escapar de un estímulo aversivo, es decir, el sujeto
aprende que haciendo una tarea evita el estímulo aversivo que se proporciona como recompensa.
Ejemplo: cuando en un lugar te ocurre algo malo, después evitar pasar por allí, porque ese sitio te provoca
ansiedad.
La fobia es un miedo adquirido. Los estímulos que lo rodean son como señales de que viene el estímulo
fóbico, es decir, que el individuo buscará conductas de evitación.
Desensibilización sistemática. Relajación del sujeto mientras se imagina escenas que producen ansiedad.
Inundación. Mantiene al sujeto expuesto al estímulo aversivo para que se de cuenta de que no pasa nada, de
que no debe tener miedo. Finalmente, se extingue el miedo.
En el condicionamiento aversivo se pueden dar dos tipos de situación:
• Situación de escape.
• Situación de evitación.
** Mucho cuidado en no confundir refuerzo negativo con aplicación de la estimulación aversiva. El refuerzo
negativo está indicando que se elimina, se quita una conducta. El refuerzo negativo es una recompensa.
Factores que afectan a la adquisición de la respuesta de escape
3 factores:
• Intensidad del estímulo aversivo.
• Mayor reducción de estimulación aversiva (en relación con intensidad).
24
• Demora en la terminación del aversivo.
• Intensidad del estímulo aversivo.
Yo puedo manipular la intensidad del estímulo aversivo, y así comprobar como afecta al comportamiento.
A mayor intensidad del estimulo aversivo, más rápido se adquiere la respuesta de escape.
• Mayor reducción de la intensidad del aversivo.
Esto es equivalente a una mayor recompensa. Si eliminas una descarga de 300, esto es percibido como una
recompensa mayor que si eliminas uno de 150.
• Demora en la terminación del aversivo.
A más demora, la adquisición es más lenta.
La demora no afecta cuando hay claves secundarias que indican que viene la recompensa. Los refuerzos
secundarios tienen un papel muy importante en neutralizar los efectos de la demora del refuerzo primario.
Extinción de la respuesta de escape.
Existen 2 vías para la extinción:
• Supresión del reforzamiento negativo o supresión de la recompensa. Consiste en mantener la intensidad del
estímulo aversivo; entonces la respuesta de escape deja de ser funcional para reducir o eliminar la
estimulación aversiva.
A mayor número de entrenamientos, mayor número de respuestas en la fase de extinción.
• Ausencia del estímulo aversivo. Aunque desaparezca el estímulo aversivo, la respuesta de escape seguirá
dándose durante algún tiempo. Esto se debe al miedo condicionado (respuesta anticipatoria de dolor).
EVITACIÓN
Lo que se suele hacer es evitar la estimulación aversiva cuando se sabe que ésta se va a producir.
2 tipos de evitación:
• Activa. Hacer algo para evitar algo. Ejemplo: las excusas.
• Pasiva. Dejar de hacer algo para evitar. Ejemplo: no presentarse a un examen.
El condicionamiento aversivo se puede producir con un solo ensayo.
Teoría bifactorial de Mowrer
Afirma que la conducta de evitación no está motivada para prevenir un acontecimiento aversivo. En realidad
escapan de un estímulo que provoca miedo. Su conducta es una respuesta de escape ante un estímulo que
produce miedo y no una respuesta para evitar un acontecimiento aversivo.
Viene a decir que no es una conducta de escapar de algo, sino que es una conducta para evitar el miedo que le
produce un estímulo. Este miedo se produce por condicionamiento clásico; la segunda parte de la respuesta, es
25
decir, la conducta de evitación, se produce por condicionamiento operante.
2 factores:
• Se condiciona como una respuesta de miedo.
• Escapar de la estimulación aversiva.
Ejemplo: condicionas luz como EC, como si fuera un estímulo aversivo, como una descarga eléctrica. El
animal evitará la luz para evitar la situación de miedo que le produce la descarga eléctrica.
4 problemas surgidos de esta teoría:
• Los experimentos demuestran que aunque el EC deje de ser seguido de la estimulación aversiva, es muy
difícil la extinción de lo aprendido. En realidad, lo lógico sería que una vez descondicionado el EC a la
situación aversiva, desapareciese la conducta de evitación o de escape del miedo; pero esto no es lo que
ocurre.
• Ausencia aparente de miedo cuando la respuesta de evitación está bien establecida. En este nivel ¿cómo
funcionan? Aquí ya no responden al condicionamiento de evitación porque escapen del miedo.
• Paradigma de evitación de Sidman.
Sidman quería saber como conseguir un condicionamiento de evitación sin que hay señal (EC).
2 factores a tener en cuenta para conseguir esto:
♦ La distancia o intervalo entre estímulos.
♦ El intervalo de tiempo fijado que tiene que transcurrir después de que la rata de respuesta por
1ª vez a un estímulo.
El animal recibe exposiciones periódicas al acontecimiento aversivo, a no ser que la rata responda impidiendo
su presentación. La respuesta hace que se demore la aparición del siguiente estímulo aversivo durante un
periodo de tiempo determinado. El intervalo entre las presentaciones del acontecimiento aversivo se denomina
E−E, y el tiempo durante el cual se demora el estímulo aversivo sería el intervalo R−E. Si el animal responde
consistentemente antes de que finalice el intervalo R−E, no experimentará el estímulo aversivo. En este
procedimiento no se presenta ningún estímulo condicionado que provoque miedo antes de la respuesta de
evitación, lo cual se supone que impediría el aprendizaje de evitación. No obstante, se ha observado que los
animales aprenden bajo estas circunstancias.
• Trabajo de Kamin. Tiene 4 grupos:
• Evitación tono−shock. Interrupción EC, impedía aparición EI.
• Hace que la conducta del sujeto pare el tono, pero el shock persiste. Paran EC, pero persiste EI.
• La conducta para el shock, pero el tono persiste. Desaparece EI, pero persiste EC.
• Condicionamiento clásico EC−EI. (tono−shock).
Al contrario de lo que predice la teoría de Mowrer, el grupo que mostró una mayor conducta de evitación fue
el 3 (evitación del EI, persistencia EC).
Con este trabajo estudió el papel que tiene la señal y el papel del estímulo aversivo. Vio que estos 2 factores
también son importantes, además del miedo y la evitación del miedo.
Factores que afectan a la adquisición de la respuesta de evitación
• Intensidad del estímulo aversivo.
26
Conducta de evitación pasiva. Cuanto más intensa es la estimulación aversiva, más rápido se produce la
adquisición.
Conducta de evitación activa de un sentido. Al incrementar intensidad, más rápida es la adquisición y el nivel
de ejecución es mayor.
Conducta de evitación activa de dos sentidos. Adquisición y ejecución se deterioran cuando aumenta la
intensidad del estímulo aversivo; se produce un conflicto de intereses entre alejarse del estímulo que provoca
el miedo y dirigirse al lugar donde se presentó el estímulo aversivo
• Intervalo de demora entre el EC y el EI. El nivel de condicionamiento del miedo depende del intervalo
EC−EI; cuanto más largo es el intervalo, menor es el condicionamiento de la respuesta de miedo.
La adquisición de la conducta de evitación es más lenta cuanto más largo es el intervalo EC−EI.
Aplicación. Extinción de las fobias.
Watson sugirió que las fobias son conductas de evitación aprendidas. En las fobias, los estímulos que rodean
al sujeto son como señales que anuncian el estímulo fóbico; por eso el sujeto realizará conductas de evitación.
Por ello, cabe suponer que las técnicas de extinción de la respuesta de evitación son válidas para tratar las
fobias.
Existen dos tratamientos diferentes para las fobias: desensibilización sistemática (consiste en el
condicionamiento de una respuesta de relajación ante estímulos que están provocando la ansiedad) y la técnica
de inundación.
La inundación mantiene al sujeto en contacto con el estímulo fóbico para que establezca la conexión de que
no pasa nada. La eficacia de la inundación aumenta al incrementar el tiempo de exposición al estímulo de
miedo. Es más eficaz que el procedimiento de extinción.
La extinción de la respuesta de miedo no es por completo responsable de la eficacia del procedimiento, ya que
se puede extinguir una respuesta de evitación, aunque no aparezca una reducción del miedo. La extinción de
la contingencia de evitación puede producirse sin la extinción del condicionamiento pavloviano del miedo.
CASTIGO
Dos tipos de castigo: castigo positivo o punitivo y castigo negativo (tiempo fuera o coste de respuesta).
En el castigo positivo se refiere a la utilización de un evento físico o psicológicamente doloroso como castigo.
En el castigo negativo el reforzamiento se pierde o no está disponible como consecuencia de la realización de
una conducta inapropiada (también llamado entrenamiento de omisión). Existen dos tipos: coste de respuesta
y tiempo fuera.
Coste de respuesta: la respuesta no deseada hace que se retire o que no se pueda obtener el reforzamiento.
Ejemplo: un empleado pierde su empleo por llegar tarde.
Tiempo fuera: tras la respuesta no deseada, se produce un período de tiempo durante el cual el reforzamiento
no está disponible. Ejemplo: un soldado que es enviado al calabozo por ausentarse del cuartel.
La eficacia del castigo ha sido muy cuestionada
27
Factores que afectan al castigo
Intensidad. Cuanto más intenso es el castigo, más intensa es la supresión. También es importante para
determinar si la supresión de la conducta será permanente o temporal.
Consistencia. Un castigo no producirá la supresión de la conducta por intenso que sea si a su vez no es
consistente. Para que el castigo elimine eficazmente la conducta inapropiada, esta se debe castigar cada vez
que ocurra.
Demora. El castigo es menos eficaz cuanto mayor es la demora entre conducta inapropiada y castigo.
Consecuencias del castigo
Agresión inducida por el dolor. Al recibir el castigo, los sujetos experimentan dolor. Este dolor puede
producir una emoción de ira, que a su vez activa una conducta de agresión. La condición agresiva subsecuente
reduce el nivel de activación.
El castigo no siempre produce agresión. Cuando a ese mismo sujeto se le ha reforzado por mostrar reacciones
no agresivas ante la estimulación aversiva o cuando han sido previamente castigados por mostrar respuestas
agresivas.
Todas las personas no reaccionan emocionalmente igual ante estímulos aversivos.
Modelado de la agresión. Los niños imitan las conductas que ven. Por ello, un niño castigado también puede
aplicar el castigo que él ha recibido a otros niños. También existen estudios que demuestran una relación entre
el uso del castigo por parte de los padres y el nivel de conducta agresiva de sus hijos.
Propiedades aversivas del que administra el castigo. El niño puede adquirir un miedo condicionado a la
persona que le castiga, lo que le lleva a mostrar conductas de evitación. Esto se ve reducido si la misma
persona que administra el castigo reparte recompensas cuando el niño muestra una conducta positiva.
Otros efectos del castigo.
Los efectos supresores del castigo pueden generalizarse a otras conductas que no son tan indeseables.
Si el sujeto no relaciona la conducta con el castigo (por ejemplo, con la demora), se crea un estado de
indefensión, y conducir a un estado depresivo, si el sujeto no percibe que tenga control.
Aplicación del castigo
Castigo punitivo. Se ha utilizado con eficacia para suprimir una amplia variedad de conductas no deseadas
(vómitos, ideación obsesiva, alucinaciones, automutilación y rabieta en niños autistas y retrasados...).
Coste de respuesta. Ha eliminado conductas como fumar, comer de forma excesiva, tartamudeo, habla
psicótica, agresividad, tardanza, habla perseverante, ansiedad y conductas depresivas e hiperactivas.
Tiempo fuera. Pérdida del reforzamiento durante un periodo de tiempo. Elimina sólo conductas que provocan
la retirada del reforzamiento.
Empleo ético de castigo. El castigo corporal tiene riesgo de desviarse y llegar a ser un abuso físico.
Existen numerosos estudios para delimitar qué es abuso físico y que no.
28
El castigo punitivo (pegar) ha creado numerosos debates éticos.
TEMA 4. CONTROL CONDUCTUAL
• CONTROL CONDUCTUAL POR EL ESTIMULO
GENERALIZACIÓN
Responder ante estímulos similares al presentado durante el entrenamiento.
En algunos casos es deseable (por ejemplo, afición a los libros), y otros indeseable (ejemplo: racismo)
Gradientes de generalización
Representación gráfica de la fuerza de la respuesta producida por distintos estímulos que varían en cuanto a su
grado de semejanza con el estímulo presentado durante el entrenamiento. Muestran el nivel de generalización
producido ante estímulos similares al presentado durante el condicionamiento.
Un gradiente de generalización inclinado indica que el sujeto sólo responde a los estímulos que son muy
similares al estímulo presentado en el entrenamiento.
Un gradiente de generalización plano muestra que la respuesta se produce incluso ante estímulos que son muy
diferentes al condicionado.
Hay dos tipos de generalización:
Excitatoria: Estímulos que se asocian con la presencia del estímulo ! RESPONDER
Inhibitoria: Estímulos que se asocian con la no presencia del estímulo!NO RESPOND.
La naturaleza del proceso de generalización
Según Lashley y Wade, los animales y las personas responden ante estímulos diferentes al del entrenamiento
debido a que no logran distinguir entre el estímulo presentado durante la prueba de generalización y el
estímulo condicionado. La generalización del estímulo se debe a una incapacidad para discriminar entre los
dos estímulos.
4 evidencias sostienen la afirmación:
• Cuando no hay reforzamiento diferencial y sólo se utiliza un estímulo de entrenamiento hay generalización
a cualquier estímulo. Gradiente de generalización plano.
• Cuando hay reforzamiento diferencial, y por tanto entrenamiento en discriminación, entonces se produce
generalización sólo ante estímulos muy próximos al estímulo de entrenamiento. (Gradiente de
generalización más agudo)
• Cuando la discriminación es fácil entre el estímulo que está indicando disponibilidad y el que no está
indicando disponibilidad, la generalización es muy poca o ninguna. (Gradiente de generalización agudo)
• Los niveles de experiencia perceptiva afectan a la generalización. Baja experiencia perceptiva ! baja
discriminación ! mayor generalización.
DISCRIMINACIÓN
Se trata de aprender a discriminar los estímulos que indican disponibilidad y los que no indican
29
disponibilidad.
3 tipos de discriminación:
• Con 2 alternativas: se están utilizando 2 estímulos de la misma modalidad sensorial. Ejemplo:
discriminar entre dos colores. Al principio la tasa de respuesta ante cada color es semejante, pero poco
a poco va aumentando la discriminación.
Fenómeno de contraste conductual. Un niño se porta mal en su casa y en la escuela. El maestro comienza a
castigar su mala conducta, y el niño se porta bien en el colegio. Pero entonces, como en casa no le castigan, se
porta todavía peor allí. Al dejar de portarse mal en clase, empieza a portarse aun peor que antes en casa.
• Condicional: No hay un estímulo específico que siempre señala disponibilidad. Hay una condición
para que el estímulo señale disponibilidad. Ejemplo: un niño que sabe que sus padres sólo le dan
dinero si lo pide delante de algún otro familiar.
Discriminación irresoluble
Pavlov observó que si primero enseñaba a sus perros a discriminar entre dos estímulos diferentes (círculo,
indica disponibilidad; elipse, no disponibilidad), y después hacía que estos dos estímulos fuesen tan parecidos
que el animal no pudiese distinguir entre ellos, el perro caía en un estado de ansiedad. Pavlov llamó a este
estado provocado por la incapacidad para discriminar neurosis experimental.
También puede ocurrir cuando el animal percibe la diferencia entre los 2 estímulos, pero la recompensa se
asocia aleatoriamente con uno de ellos.
Cuando una tarea es irresoluble, el sujeto queda fijado en este molde, y es incapaz de resolver la tarea, incluso
cuando esta se convierte en resoluble.
Esto indica la importancia del valor informativo de los estímulos para la discriminación. Hay necesidad
informativa, y cuando esta no se produce, se producen grandes trastornos, debidos únicamente a la
incertidumbre, sin que existe dolor físico.
Fases de la discriminación:
• Diferenciación del estímulo.
• Atención selectiva. Tienen que atender a las dimensiones relevantes de los estímulos.
• Selección por el estímulo. Los estímulos discriminativos tienen que ganar control sobre la conducta de los
sujetos.
• CONTROL DE LA CONDUCTA POR LA COGNICIÓN
Cognición: conocimiento que un sujeto tiene sobre el ambiente y su estructura. Estos conocimientos
gobiernan nuestra conducta.
TOLMAN Y EL CONDUCTISMO PROPOSITIVO
Dice que hay determinantes comportamentales de las respuestas, y que estos determinantes son el propósito y
las cogniciones.
La conducta está motivada por propósitos y expectativas.
Para inferir propósito en la conducta, debemos observar que existe:
30
• Persistencia (observar que hay insistencia).
• Docilidad (flexibilidad en seleccionar los mejores medios).
Infiere cogniciones por las conexiones que establece el sujeto entre medios y fines (mapa cognitivo). También
infiere las cogniciones por las expectativas.
A un organismo le impulsa la necesidad, pero el comportamiento propositivo (persistente y flexible) es guiado
por las cogniciones (relaciones medio−fin) y los incentivos.
3 bloques de experimentos para demostrar esto:
• Aprendizaje de lugar.
• Aprendizaje latente.
• Mostrar las expectativas.
• Estudios sobre aprendizaje de lugar.
Experimentos con laberintos en T. En uno de los estudios se intentaba diferenciar entre la conducta basada por
los hábitos y la basada por la localización espacial.
El grupo de la condición aprendizaje de respuesta, recibía la recompensa si giraba hacia una dirección
específica, independientemente del lugar (ejemplo: recompensa sólo cuando gira a la izquierda,
independientemente del punto de partida). El grupo de aprendizaje de lugar, la recompensa siempre estaba en
el mismo lugar, y la rata debía girar a un lado u otro dependiendo del punto de partida. El grupo de
aprendizaje de respuesta obtuvo malos resultados; tardaron mucho en aprender, y aun después de haber
contestado correctamente, seguían cometiendo errores.
Cuando existen claves extralaberínticas, se produce el aprendizaje de lugar.
La conducta bien aprendida se rige habitualmente por procesos mecánicos y no por procesos cognitivos. (Se
automatiza la conducta). También llamado sobreaprendizaje.
• Aprendizaje latente.
Tolman pensaba que no era necesaria la recompensa para aprender.
De la simple exploración del ambiente se aprende, con ausencia de recompensa, pero que es la recompensa lo
que motiva que la conducta se lleve a cabo.
Aprender sin darse cuenta.
El concepto de expectativa.
Una expectativa es una representación mental de las contingencias entre acontecimientos ambientales. Esta
representación contiene información tanto de las relaciones entre los estímulos experimentados previamente
como de las relaciones entre la conducta y sus consecuencias.
Dickinson.
Hay dos tipos de conocimiento declarativo en una expectativa:
♦ Expectativa de una conexión asociativa. Permite que uno de los estímulos excite o inhiba la
representación del otro estímulo.
31
♦ Representación de la creencia conductual. Representaciones proposicionales como creencias
según las cuales la acción A causa el resultado B. Creencia de que una acción causa un efecto.
Conclusión:
La conducta está controlada tanto por hábitos como por expectativas.
Ejemplo: conducir al principio está controlado por la cognición, pero luego se automatiza y es controlado por
hábitos.
5. APRENDIZAJE SOCIAL
• INTRODUCCIÓN
El aprendizaje social vicario o por observación.
Imitación, identificación y modelado.
• EFECTOS DEL MODELADO PSICOSOCIAL
• Instructor
• Inhibidor y desinhibidor.
• Facilitación de la respuesta.
• Incremento de la estimulación ambiental.
• Activación emocional.
• EL APRENDIZAJE POR OBSERVACIÓN Y SUS PROCESOS CONSTITUYENTES
• Procesos de atención.
• Procesos de retención.
• Procesos de producción.
• Procesos de motivación.
• EL MODELADO ABSTRACTO Y LA ADQUISICIÓN DE REGLAS DE CONDUCTA
• EL APRENDIZAJE POR EJECUCIÓN DESDE LA TEORÍA COGNITIVA
• La influencia de las creencias sobre las consecuencias.
• Las contingencias ilusorias.
• RESUMEN
• INTRODUCCIÓN
APRENDIZAJE SOCIAL
Todo lo que aprendemos por estar con los demás. El modelado es un medio muy poderoso. Aquí también
entra lo que aprendemos a través de lo que otros han escrito.
Se transmiten patrones, valores... Cada generación nueva parte de lo que ha adquirido la anterior; si no, cada
generación tendría que partir desde cero, y esto no es así.
BANDURA
IMITACIÓN
Reproducir actos específicos de otro. Proceso por el cual un organismo imite los actos de otro organismo, en
un período de tiempo, por lo general corto.
MODELADO
32
Se refiere a concepciones y reglas aplicables a un rango amplio. En la adquisición de una habilidad el
modelado constituye una regla de aprendizaje, más que un acto imitativo.
IDENTIFICACIÓN
Según Bandura es la incorporación general de patrones de personalidad. Pero no existe acuerdo acerca de en
que consiste la identificación, sino que encontramos varias líneas.
IDENTIFICACIÓN
IMITACIÓN
• Requiere un vínculo con el modelo.
• Se mantiene por una motivación intrínseca
(similitudes que percibes entre tú y el
modelo).
• Se producen a veces en ausencia del modelo.
• No requiere ningún vínculo con el modelo.
• Mantenimiento por recompensas externas.
• Imitación en presencia del modelo.
Hay autores que dicen que la imitación produce identificación y hay quien dice que la identificación produce
imitación. En la realidad empírica estos 2 bloques no están tan diferenciados. Las distinciones están poco
apoyadas empíricamente, debido a:
• Los factores que intervienen en el aprendizaje observacional son los mismos con conductas específicas que
con conjuntos de conductas.
• Toda información modelada que haya de retenerse como guía de la conducta tiene que representarse
simbólicamente.
• La presencia o ausencia de modelo no comporta procesos distintos de aprendizaje.
• Si la influencia moderada es lo suficientemente fuerte o poderosa, puede modificar a la vez conductas,
pensamientos y respuestas emocionales. Por ello, Bandura dice que llamar a unos cambios identificación y
a otros imitación lo único que hace es confundir, ya que no hay base empírica para llegar a esas
conclusiones.
En la teoría cognitivo−social, el término genérico modelado se utiliza para caracterizar los procesos
psicológicos de imitación.
Hay varios fenómenos de modelado, cada uno regulado por distintos determinantes y mecanismos operativos.
• EFECTOS DEL MODELADO PSICOSOCIAL
Efecto instructor
Es el caso en el que el modelo está instruyendo al aprendiz.
Toda conducta que antes del modelado tenga una probabilidad de aparición nula y después del modelado se
incrementa, decimos que es una conducta adquirida por modelado debido al efecto del instructor.
Se pueden aprender aspectos cognitivos y conductuales.
Para que sea posible el aprendizaje por modelado es necesario un buen aprendiz y un buen modelo.
Además de las habilidades componentes, también se adquieren las reglas para organizar la conducta en nuevas
estructuras.
Efecto inhibidor y desinhibidor
33
No es una cuestión de aprendizaje, es de conductas ya aprendidas. Es el efecto que tiene ver algo sobre una
conducta mía que ya sabía; se trata de adquirir algo nuevo de esa conducta.
desinhibidor: tu sabes que no debes hablar en clase, pero observas que todo el mundo está hablando. Entonces,
ese hecho actúa como efecto desinhibidor de esa conducta ya aprendida (hablar), y empiezas a hablar con los
compañeros.
Desinhibidor: vas por la autopista conduciendo tu coche. Entonces ves un accidente ocurrido y reduces tu
velocidad.
Efectos de facilitación de la respuesta
Este efecto no conlleva aprendizaje de nada nuevo.
Al observar a otros realizar una conducta, nos animamos a llevarla a cabo. Se distingue del efecto
desinhibidor en que la conducta que se realiza es aceptada socialmente, aunque no se lleve a cabo.
Los tipos de modelos que prevalecen en una sociedad determinarán en parte las cualidades que serán
activadas, en lugar de otras.
Efectos de incremento de estimulación ambiental
La conducta de los modelos no sólo actúa como inductora de comportamientos similares, sino que a su ve
dirige la atención del observador hacia objetos o entornos preferidos por éstos.
Cuando la conducta del modelo dirige la atención del observador hacia objetos y entornos.
El hecho de que el modelo utilice un determinado objeto hace que el sujeto se fije en el objeto que está
empleando el modelo.
Ejemplo: cuando ves a un compañero comiendo, es posible que tu también quieras comer, porque has
centrado tu atención en el plato, el tenedor, incluso la misma comida.
Efectos de activación emocional
El ver a otros expresar sus emociones te activa emocionalmente.
Ejemplo: en una película el estado de ánimo de los personajes principales te afecta y te impacta
emocionalmente.
Las distintas funciones del modelado pueden funcionar por separado, pero muchas veces operan de forma
conjunta, lo cual dificulta la clarificación de conceptos, y provoca que existan dudas sobre si una conducta se
produce por un efecto u otro.
• EL APRENDIZAJE POR OBSERVACIÓN Y SUS PROCESOS CONSTITUYENTES
El aprendizaje por observación está regulado por 4 procesos: procesos de atención, que regulan la exploración
y la percepción de las actividades modeladas. Procesos de retención, mediante él, las experiencias transitorias
son convertidas por la memoria en conceptos simbólicos que sirven de modelos internos para la emisión de
respuestas y de criterios para la corrección de las mismas. Los procesos de producción regulan la
organización de las subhabilidades componentes en nuevos patrones de respuesta. Por último, los procesos de
motivación determinan que las competencias adquiridas por observación se pongan o no en práctica.
34
• Procesos de atención
Propiedades de las actividades modeladas.
La rapidez y el nivel de aprendizaje por observación dependen de la saliencia, la discriminabilidad y
complejidad de las actividades modeladas.
Determinantes del observador.
Las competencias cognitivas del observador y las tendencias preceptúales le inclinan a observar unas cosas y
no otras, y eso afecta al resultado final de aprendizaje.
Cuanto mayores son las habilidades cognitivas y los conocimientos previos, más sutil será la percepción del
observador. Como resultado de la familiarización y del entrenamiento, los sujetos experimentados son capaces
de reconocer diferencias en la ejecución que un novato no apreciaría.
Valor funcional.
La atención selectiva se mantiene por varias razones:
• Por las expectativas de que el observador tenga que hacer algo semejante.
• Los beneficios que se anticipan.
• Por las consecuencias que le siguen al modelo.
• Por la reputación del modelo.
Poder de atracción del modelo.
La atención hacia determinados modelos no sólo está determinada por el valor funcional de su conducta, sino
también por el grado de atractivo que posean.
La atención puede fallar:
• Porque hay un déficit en las habilidades cognitivas
• Porque el aprendizaje previo es imperfecto.
• Porque hay distracciones.
• Porque no hay suficientes incentivos.
Para mejorar la atención:
♦ Que el modelo acentúe de forma física las características de la ejecución.
♦ Diferenciar claramente lo que está bien de lo que está mal.
♦ Fraccionar la práctica en partes pequeñas para facilitar el aprendizaje y la retroalimentación.
◊ Si se presenta una frecuencia masiva no puedes coger lo esencial, y puedes mezclar
instrucciones y acabar realizando algo equivocado.
Estructuras sociales y observabilidad de los patrones de conducta.
Las personas con las que uno interacciona de forma habitual, delimitan los patrones de conducta que se
observarán de forma repetida, y que por tanto, tienen más probabilidad de ser aprendidas, ya que el modelo
está más disponible.
La forma en que está organizada una sociedad determina en gran parte los tipos de modelos a los que sus
35
miembros tendrán acceso.
• Procesos de retención
Retención: transformación activa de lo que estás viendo en representaciones cognitivas. Es particularmente
importante al principio del aprendizaje, ya que cuando se hace automático las representaciones cognitivas ya
no son importantes.
Las representaciones cognitivas pueden variar en 3 aspectos:
• Modalidad. Puede tratarse de imágenes o de símbolos verbales
• Concisión. La concisión puede ser reductora o incluir largas elaboraciones.
• Estructura. Puede ser isomórfica (una copia mental de lo que está pasando fuera) o puede ser la
estructura subyacente.
Si la representación cognitiva que te haces es en imágenes es una construcción de imágenes, que se consideran
equivalentes a las percepciones. Cuando se desarrolla la imagen, ya no es necesario que el modelo esté delante
para que se haga la acción; la imagen se forma para retener la información.
La representación cognitiva con símbolos verbales predomina sobre el de las imágenes y consiste en codificar
la acción de la actividad con palabras.
Los mejores son los que hacen representaciones cognitivas con representaciones verbales concisas e imágenes
vívidas. (Las mejores son las representaciones con significado, si no son con significado no funcionan bien).
Las representaciones cognitivas tienen que ir acompañadas de práctica, sino no sirven de nada.
Otro de los factores que influyen para adquirir un nuevo patrón más eficazmente es tener familiaridad con los
elementos del nuevo patrón.
En el aprendizaje observacional, lo nuevo se relaciona con lo ya existente.
La práctica
La práctica aumenta el aprendizaje y la retención.
2 tipos de práctica:
• Práctica real: ejecución de la conducta; proporciona la oportunidad para organizar y comprobar los propios
conocimientos. También ayuda a canalizar la atención a los puntos más conflictivos para perfeccionar la
representación simbólica.
• Práctica cognitiva: Cuando lo repasas mentalmente (repasar mentalmente los acontecimientos modelados).
Puede darse de dos formas:
• Sin procesamientos adicionales (mera repetición).
• Con procesamiento adicional (Elaborar más, y de esa manera retienes).
Muy recomendable para habilidades deportivas, físicas y cognitivas, porque facilita la retención de
habilidades motoras aprendidas.
Lo mejor es combinar ambas prácticas, ya que da los mejores resultados.
La práctica cognitiva fortalece la organización psiconeurológica del patrón de conducta. Esto quiere decir que
36
con la práctica cognitiva aunque no te menees estás impulsando eléctricamente los músculos implicados en la
acción.
La práctica física real proporciona retroalimentación informativa, por eso complementa a la práctica
cognitiva.
Se necesita una buena organización de la conducta modelada, y práctica real y cognitiva para obtener buenos
resultados en el aprendizaje observacional.
• Procesos de producción
Hay que convertir las representaciones simbólicas en las acciones adecuadas. Para esto hay que conocer los
mecanismos conceptuales y motores.
Cuando la conducta se lleva a cabo, se tiene que organizar espacial y temporalmente.
Para la teoría cognitivo−social el proceso de aprendizaje observacional se produce a nivel central.
Cuando finalmente se da la reproducción de la representación cognitiva de la acción son necesarios una serie
de pasos:
• Organización cognitiva de patrones de respuesta.
• Iniciar la acción guiada por esto.
• Observación de la ejecución de la respuesta.
• Comparar la acción que estás produciendo con la idea que tienes de ello, lo que te permite hacer
correcciones.
Si hay déficits motores hay que hacer un buen análisis del problema.
Esquema del análisis:
• Si el problema está en las habilidades componentes hay que fraccionar en elementos sencillos y
ampliarlos gradualmente.
• Si el problema está en la secuencia hay que coordinar las acciones según cual sea específicamente el
problema.
Hay problemas que son de tipo estructural (falta de crecimiento para desarrollar una acción).
Cuando ejecutamos la actividad, la retroalimentación puede ser de dos tipos:
• Intrínseca, cuando tu mismo percibes tus propias acciones.
• Extrínseca, cuando alguien te observa desde fuera y te dice como lo estás haciendo.
Con la retroalimentación el observador va a mejorar su ejecución.
Según Bandura el aprendizaje por observación se puede medir con distintos indicadores:
• Por producción verbal, describiéndolo.
• Por pruebas de reconocimiento.
• Cuando el observador manifiesta las reglas subyacentes de la actividad modelada.
• Pruebas de potencia (eliminando todas las restricciones para diferenciar entre aprendizaje y ejecución)
37
La producción de conducta se ve favorecida por dos cosas:
♦ La adquisición de la representación mental de la actividad.
♦ La retroalimentación que se produce de observar las propias actuaciones. El sujeto no
depende de la retroalimentación simultánea, la necesitan para ir perfeccionando la actividad,
pero no es totalmente necesaria para que el sujeto haga la actividad.
Cuanto más informativa es esta retroalimentación, mejor es el resultado final del aprendizaje.
Pasos para enseñar a alguien mediante observación:
• Segmentar la actividad.
• Modelar los aspectos problemáticos.
• Los observadores tienen que repetir esas subhabilidades hasta que lleguen a dominarlas.
• Finalmente hace falta retroalimentación para fortalecer el dominio de los componentes.
• Procesos de motivación
Distinguir entre aprendizaje y ejecución.
Los procesos motivacionales son más evidentes cuando la conducta que se aprende tiene poco valor funcional
o bien tiene un alto riesgo de castigo.
Si hay un buen incentivo ejecutas la conducta, y si no lo hay, no la ejecutas.
3 tipos de incentivos para la motivación:
♦ Directos. Incentivos que recibe el aprendiz. Resultados que se obtienen por aprender lo que
hace el modelo.
♦ Vicarios. Incentivos que recibe el modelo. El aprendiz ve que el modelo obtiene resultados y
por eso él hace lo mismo.
♦ Autoproducidos. El propio sujeto los genera para sí mismo. Criterios personales de
autoevaluación.
La conducta está regulada principalmente por las consecuencias anticipadas de los actos futuros (en el
aprendizaje por observación).
LOS MEDIOS DE TRANSMISIÓN DE INFORMACIÓN
• Modelado conductual. El que se da en vivo y en el que se hace una representación física de cómo se hace.
Ejemplo: los gestos.
• Modelado verbal. Se hace una descripción verbal, que puede ser escrita.
• Modelado simbólico. Todo lo que se hace por los medios de comunicación. Tiene mucho poder porque un
solo modelo retransmite a muchos espectadores. Lo que se enseña básicamente son actitudes, patrones de
pensamiento y estilos de conducta. Esto hace que tu puedas saber de una cosa a través de la experiencia de
otro. Cuanto más depende la imagen que el individuo tiene de la realidad del entorno simbólico creado por
los medios, mayor será el impacto social de éstos.
• Automodelado computerizado de ejecuciones óptimas. Ejemplo: te graban una secuencia entera de cómo
nadas y un experto casa de esa secuencia todos los fragmentos donde tu actividad estaba bien hecha, y te
montan una secuencia perfecta, y trabajas sobre eso. Tiene gran potencial a nivel terapéutico.
• Modelado cinestésico. Lo que estás modelando son respuestas musculares que a veces sólo son observables
por el tacto. Para personas sordas, por ejemplo, que tienen que modelar el habla a través de tocar los
movimientos de los músculos de la laringe, para poder repetir esos movimientos con su laringe.
38
• MODELADO ABSTRACTO Y LA ADQUISICIÓN DE REGLAS DE CONDUCTA
Mediante el modelado abstracto, los observadores extraen las reglas que subyacen a las ejecuciones
específicas para generar una conducta que trasciende lo que han visto u oído. Las habilidades de
enjuiciamiento y las reglas generalizables se aprenden por observación.
Se comprueba el aprendizaje de las reglas por parte de los observadores en unas condiciones en las que
su comportamiento puede ser conceptual y estilísticamente similar al del modelo, pero que son lo
suficientemente nuevas y desconocidas como para obligarle a emitir unas respuestas que no pueden
reproducir de una forma simplemente mimética a respuesta específicas previamente observadas.
La adquisición de reglas comprende 3 procesos:
• Extraer las características relevantes a partir de los ejemplos sociales.
• Integrar la información en una regla compuesta.
• Utilizar la regla para producir nuevos ejemplos de conducta.
Cuando para el modelo, únicamente las respuestas que se ciñen a esas reglas comportan al éxito, los
aspectos comunes a estos ejemplos resultan mucho más evidentes para el observador.
Cuando el observador actúa en base a lo aprendido, la retroalimentación informativa también le ayuda
a perfeccionar las reglas y a aplicarlas correctamente en las situaciones nuevas.
Las reglas complejas han de descomponerse en reglas subordinadas y han de dominarse en primer
lugar con la ayuda de referencias concretas.
Los observadores no sólo han de extraer los factores relevantes a partir de los acontecimientos
modelados sino que también han de combinarlos para dar lugar a una regla funcional compuesta.
Generalmente, el modelado combinado con la verbalización de las reglas suele ser más eficaz que
cualquiera de los dos procedimientos por separado para suscitar una conducta regulada por una regla.
Conocer una regla no asegura que la ejecución vaya a ser correcta.
• EL APRENDIZAJE POR EJECUCIÓN DESDE LA TEORÍA COGNITIVA
• La influencia de las creencias sobre las consecuencias.
Los estudios tratan de averiguar si lo cognitivo puede influir o modificar la conducta.
Si los resultados influyen en la conducta; papel de lo cognitivo en eso.
Para ponerlo de manifiesto hace falta contrastar como influyen las creencias en las consecuencias
realmente experimentadas. Estas creencias pueden ser acerca de la frecuencia que se supone o con la
que se supone que se va a recibir la recompensa; también pueden ser creencias sobre el significado de la
consecuencia.
Los estudios muestran que las creencias sobre la relación entre resultados y acciones debilitan,
distorsionan e incluso anulan los efectos de las consecuencias sobre las respuestas.
RESPUESTAS CONSECUENCIAS
CREENCIAS (respecto a la frecuencia). Pueden llegar a anular o modificar la relación.
39
Experimento:
3 grupos. Se les informaba:
IV 1´
IF 1´
RV 150
65
6
259
En realidad todos los grupos estaban bajo el mismo programa. X es el número de respuestas emitidas.
Si el refuerzo se administra con IF, pero no se le informa, el sujeto puede pensar que se le recompensa
por el logro, y el sujeto produce 4 veces más de respuestas que si piensa que la recompensa viene a IF.
El sujeto regula el nivel de sus esfuerzos según los efectos que espera que produzcan sus acciones.
Otro aspecto de la influencia de las creencias es que si el sujeto cree que el resultado (aunque sea
aversivo), viene dado porque lo ha hecho bien, el sujeto incrementa la acción, cuando teóricamente
debería cesar. Eso es porque el significado de la conducta es positivo. Según la expectativa que tu
generes, guías tu conducta.
• Contingencias ilusorias.
Para la adaptación es necesario realizar inferencias sobre las consecuencias de los propios actos. Los
sujetos buscamos regularidades en los acontecimientos. Esto es muy difícil; hay una tendencia a
percibir regularidades incluso cuando no las hay. En ello hay muchos aspectos a analizar. Tenemos una
tendencia a recordar los casos confirmatorios, y a ignorar las veces en que no se cumple la relación.
A veces hay casualidades que elevamos a la categoría de causalidades.
Las contingencias ilusorias pueden llegar a ser tan eficaces como las reales, y pueden llegar a crear
patrones de conducta.
Si alguien desarrolla una creencia ilusoria sobre su eficacia causal, desarrollan una gran confianza en sí
mismos, confianza en sus habilidades, y por ello es más probable que tengan un éxito real. Por tanto, el
control ilusorio, en parte, se puede convertir en control conductual del resultado.
También existe una faceta negativa: las profecías autocumplidas. Cuando una persona cree que su
conducta no puede cambiar nada, y que todo le sale mal, al final, por su propia falta de motivación
acaba cumpliéndose. Además, el sujeto suele estar esperando a que pase algo malo, y cualquier cosa sin
importancia le parece horrible.
Condiciones por las que acontecimientos fortuitos tienen más probabilidad de asociarse a causalidad:
• Acontecimientos muy frecuentes.
• Acontecimientos muy potentes (sobre todo los dolorosos).
• Acontecimientos que tienen características que los hacen llamativos y excepcionales.
Aprendizaje
PRÁCTICA
40
CAMBIO
Relativamente
permanente en
la potencialidad de la conducta
Sujeto:
Motivación
Probabilidad percibida
• de éxito / fracaso
• de autosuficiencia
• de dificultad
Hábitos previos
Disposición física
Tarea:
Grado real de dificultad
Distribución ensayos
Presentación material
Semejante a la RI
Originariamente neutro
Tras muchas presentaciones
41
Descargar