Tema III. Introducción al escalamiento INDICE o Introducción

advertisement
Tema III. Introducción al escalamiento
INDICE
o Introducción
o Concepto de escalamiento y escala de
medida
o Aproximaciones al escalamiento
o Métodos centrados en los sujetos:
Modelo de Likert
o Métodos
centrados
en
los
estímulos:
Ley
del
Juicio
Comparativo
o Métodos
centrados
en
las
respuestas:
Análisis
de
Escalogramas
y
Técnica
de
Despliegue
BIBLIOGRAFÍA RECOMENDADA
Muñiz, J. (1991). Introducción a los métodos psicofísicos. Madrid:
PPU. Capítulo 1.
Pérez, C.; Padilla, J. L.; González, A. y Rojas, A. J. (1996). El uso de
las técnicas de escalamiento para la definición y medida del
continuo psicosocial "individualismo-colectivismo". Boletín de
Psicología, 25, 7-14.
2
Introducción
Tal y como se apuntó en el tema anterior, el "escalamiento" es
uno de los contenidos propios de la Psicometría. A grandes rasgos, se
puede afirmar que el escalamiento se ocupa de la elaboración de
instrumentos de medida; de forma más precisa, un instrumento de
medida es la plasmación de una escala de medida, que permite la
cuantificación de la variable objeto de la medición.
Este
tema
presenta
las
perspectivas
generales
o
aproximaciones al escalamiento y los procedimientos más
significativos de cada una de ellas. Para entender el alcance de los
diferentes procedimientos, el lector puede intentar responder a tres
preguntas genéricas: ¿quién o qué "posee" el atributo psicológico que
se pretende medir?, ¿qué tarea plantea el procedimiento? y ¿qué tipo
de interpretación se puede hacer a partir de los valores numéricos
asignados?.
Aunque el tema tiene un fuerte carácter teórico, no debe pasar
desapercibido que se analizan los procedimientos básicos con los que
se elaboran la mayoría de los instrumentos de medición disponibles
en Psicología.
Concepto de escalamiento y escala de
medida
La elaboración de un instrumento de evaluación psicológica o
educativa implica la adopción de una serie de suposiciones, explícitas o
implícitas, sobre el constructo objeto de la medición. Se suele hacer
referencia al conjunto de estas suposiciones como hipótesis sobre la
“escalabilidad” de las mediciones, aunque sería más correcto hablar de
la “mensurabilidad” del objeto de medición. La primera hipótesis
plantea que el constructo es “una propiedad que ocurre en cantidades
diferentes” de forma que puede cuantificarse utilizando una regla de
escalamiento,
propuesta,
habitualmente,
sobre
un
continuo
unidimensional teórico. A este continuo se le denomina "continuo
3
psicológico". La segunda hipótesis tiene que ver con el tipo
interpretación (escala de medida) que se puede realizar de
mediciones obtenidas. Algunos de los procedimientos disponibles
escalamiento permiten examinar la escala de medida en que
encuentran las mediciones.
de
las
de
se
En principio, la escalabilidad del objeto de medida no es más que
una suposición y, por tanto, puede darse el caso de que los datos no
sean en absoluto escalables y que, como consecuencia, no exista tal
continuo psicológico unidimensional que represente al constructo.
El concepto de “escalamiento” parte de la propia definición de
medición: medir es asignar números a las propiedades de los objetos
de acuerdo con ciertas reglas. Pues bien, el escalamiento es el proceso
por el que desarrollan reglas sistemáticas de asignación numérica y se
determinan unidades de medida significativas.
El resultado de un proceso de escalamiento es una “escala de
medida”. La escala de medida debe incluir:
(1) el conjunto de valores posibles que pueden asignarse durante
el proceso de medición, y,
(2) una regla de asignación explícita entre las cantidades del
atributo y los números que las representan. Esta regla de
asignación debe incluir (o al menos implicar) la unidad de la
escala de medida.
Recurriendo a los conceptos expuestos en el tema dedicado a la
teoría de la medida, la escala de medida es la regla que establece la
correspondencia entre los elementos de los sistemas relacionales
empírico y numérico. La regla permite asignar valores numéricos a los
elementos del sistema relacional empírico. Los valores numéricos
asignados reciben el nombre de “valores de escala” o “valores
escalares”.
Resulta frecuente el uso del término “escala” para nombrar
instrumentos de medición particulares (e. g., Escala Wechsler de
Inteligencia para Adultos). Tales instrumentos cumplen los requisitos
establecidos para ser considerados “tests”, por lo que no se debería
utilizar el término “escala”, evitando así la confusión con el significado
que a dicho término se da en este tema.
4
Aproximaciones al escalamiento
Hay disponibles diferentes clasificaciones de los métodos de
escalamiento en función de distintos criterios. Una de las clasificaciones
más utilizadas fue propuesta por Torgerson (1958). Este autor agrupa
los métodos en función del “objeto” que se pretende escalar. El término
“objeto” tiene un significado amplio ya que puede referirse a estímulos,
personas o respuestas. Aunque más adelante se detalla su alcance, por
ahora sirva la recomendación de que por “objeto” se puede entender la
respuesta a la cuestión de ¿qué o quién posee el atributo objeto de la
medición?. Torgenson (1958) identificó tres grandes aproximaciones al
escalamiento:



Métodos centrados en los sujetos. Los objetos que se
pretenden escalar son personas. El objeto de la medición es un
atributo de las personas. Los métodos centrados en las personas
proporcionan los valores escalares con los que localizar a las
personas en el continuo psicológico. Por ejemplo, las mediciones
habituales de la inteligencia se obtienes con métodos centrados
en las personas.
Métodos centrados en los estímulos. El término estímulo
tiene un significado amplio ya que puede hacer referencia a
objetos físicos, frases que expresen opiniones o actitudes,
personas que se pretenda evaluar respecto de algún atributo,
etc. En cualquier caso, estos métodos pretenden localizar
“objetos” a partir de sus valores escales en un continuo
psicológico, siendo las personas que proporcionan los datos
“meros instrumentos de medida”.
Métodos centrados en las respuestas. El objeto de medición
tiene sentido tanto para las personas como para los estímulos;
de ahí que, se pretendan localizar ambos en el continuo
psicológico a partir de sus respectivos valores escalares.
De forma general, los métodos centrados en los estímulos y las
respuestas son más rigurosos que permiten examinar incluso el nivel
de medida de los valores escalares. Por el contrario, los métodos
centrados en los sujetos ponen el acento en la sistematicidad del
proceso de elaboración de instrumentos, supliendo la falta de examen
de los niveles de medición con la preocupación por la fiabilidad y
validez de las mediciones.
5
A continuación, se presentan de forma detallada algunos de los
métodos de escalamiento más representativo de cada aproximación.
Métodos centrado en los sujetos: El método de
Likert
El objetivo principal es localizar personas en diferentes puntos del
continuo psicológico. Se trata de cuantificar las diferencias individuales
respecto a algún atributo. Este es el propósito general de la mayoría de
las mediciones aptitudinales, de rendimiento y actitudinales; de hecho,
los métodos de escalamiento propios de esta aproximación son los más
empleados para la elaboración de instrumento psicológicos de medida.
El método de escalamiento propuesto por Renis Likert a finales
de los años veinte es un ejemplo de este tipo de aproximación.
Habitualmente, con este método se presenta a las personas una lista
de frases que expresan opiniones, sentimientos, creencias, etc.,
sobre un tema, y se les pide que respondan a cada una de las frases
en función de su grado de acuerdo con lo que dice la frase. Por
ejemplo, imaginemos que un psicólogo social elabora con este
método un cuestionario para medir la autoestima. El psicólogo escribe
un conjunto de 10 enunciados con sentimientos reveladores del nivel
de autoestima. Para responder a los ítems, la persona dispone de 5
alternativas de respuesta: desde “muy en desacuerdo” con el
sentimiento expresado en el enunciado hasta “muy de acuerdo”. A
continuación, decide que la respuesta "muy en desacuerdo" reciba 1
punto, la siguiente alternativa de respuesta 2 puntos y, así
sucesivamente, hasta la respuesta "muy de acuerdo" que recibe 5
puntos. La puntuación total del sujeto (valor escalar) es la suma de
las respuestas dadas a cada uno de los ítems. De esta forma,
aquellos que tengan una autoestima "más alta" obtienen las
puntuaciones más altas, y los que tienen una menor autoestima las
puntuaciones más bajas. Tanto las puntuaciones de las respuestas a
cada ítem, como el "peso" del ítem para obtener la puntuación del
sujeto, son elegidos de forma arbitraria por el autor del cuestionario.
No se concede ninguna importancia a las posibles diferencias entre
los ítems a los que responde el sujeto, dado que el único objetivo es
"escalar" sujetos. La "regla" de sumar el valor de las respuestas a
cada uno de los ítems para obtener el "valor escalar" de los sujetos
es tan popular en Psicología, que incluso da nombre a un tipo de
instrumentos: “escalas sumativas”.
Los métodos de escalamiento centrado en los sujetos realizan
supuestos que no comprueban: 1) los ítems miden una única
variable, es decir, forman una escala unidimensional; y 2) las
6
variaciones sistemáticas en las respuestas de las personas a los ítems
se deben únicamente a las diferencias entre las personas. Es decir,
los ítems no aportan nada a la variabilidad sistemática de las
respuestas, de modo que cada ítem es considerado una replica de los
otros. A la ausencia de comprobación de los supuestos, hay que
añadir que estos métodos no proporcionan medios para examinar el
nivel de medida de los valores escalares. La práctica habitual es dar
por supuesto un nivel ordinal o de intervalos.
Para paliar estas deficiencias, los usuarios de estos métodos
recurren a un amplio análisis de la fiabilidad y la validez de los
instrumentos de medida. Sin embargo, esta solución no hace más
que demorar el problema, ya que si el análisis de las propiedades
métricas no es satisfactorio, el autor del instrumento no sabrá si
atribuir el resultado negativo a las deficiencias en la escala de medida
o a problemas con la fiabilidad o validez del instrumento.
Métodos centrados en los estímulos: La Ley del
Juicio Comparativo
El propósito de la medición es localizar estímulos en el continuo
psicológico. Pensemos, por ejemplo, que pedimos a un grupo de
personas que juzguen la dulzura de un conjunto de caramelos. En
este caso, son los objetos –caramelos– los que son cuantificados con
respecto al atributo –dulzura–. De lo que se trata en este apartado es
de introducir los esfuerzos por ubicar en un continuo psicológico
“estímulos” sin un referente físico, por ejemplo, enunciados de ítems
actitudinales.
Los antecedentes de los métodos de escalamiento centrados en
los estímulos son las investigaciones experimentales realizadas por los
psicólogos perceptúales alemanes en el siglo XIX. Investigadores
como Fechner y Weber reciben la denominación genérica de
"psicofísicos", dado su interés en proponer relaciones cuantitativas
entre las respuestas a los estímulos físicos y los estímulos en sí. Por
ejemplo, para medir la percepción del peso presentaban dos objetos
con pesos diferentes y la tarea del sujeto era decidir cuál pesaba más.
Investigaciones como estas permitían averiguar cuál era la diferencia
más pequeña entre los pesos que detectan las personas.
L. L. Thurstone fue el primero en mostrar que los métodos de
escalamiento psicofísico se podían adaptar para la medición de
actitudes. Por ejemplo, mostró que era posible ubicar un conjunto de
7
delitos en un continuo psicológico de “gravedad percibida”, pidiéndole
a un grupo de jueces que examinaran todas las parejas posibles entre
los delitos de una lista (e. g., asesinato y robo; asesinato y violación,
etc.). Thurstone también desarrolló procedimientos estadísticos que
permitían examinar si los valores escalares de los estímulos estaban
en una escala de intervalos. Los procedimientos más conocidos de
Thurstone se articulan en dos modelos conocidos como “Ley de Juicio
Comparativo” y “Ley del Juicio Categórico”.
La presentación detallada de los modelos queda fuera del
alcance de estos apuntes. Sólo se hará una introducción breve a la
“Ley del Juicio Comparativo”. La Ley de Thurstone es un sistema de
ecuaciones que permite estimar los valores escalares de un conjunto
de estímulos, a partir de los juicios comparativos realizados sobre
todas las parejas posibles de estímulos. Veamos como funciona este
sistema de ecuaciones, empezando por sus supuestos.
Thurstone supone que cuando se presenta un estímulo “i” a una
persona para que lo juzgue, se produce en su organismo una reacción
que denomina “proceso discriminativo”. Imaginemos que el estímulo
es una “profesión” y la tarea que debe realizar la persona es juzgar su
“prestigio social”. Thurstone afirma que si repitiésemos la
presentación del estímulo “i” a esta persona o lo hiciésemos sólo una
vez a un grupo de personas, los juicios se distribuirían a lo largo del
continuo psicológico formando una distribución normal. Esta
distribución, que no es directamente observable, recibe el nombre de
“distribución discriminativa”. La mejor forma de describir esta
distribución es recurriendo a dos parámetros estadísticos: la media
(  i ) y la desviación típica (  i ). Ambos elementos son importantes
para comprender el modelo:
 Media de la distribución. Recibe el nombre de “proceso
discriminativo modal”. Su valor es el valor escalar del estímulo
en el continuo, por tanto, la cantidad que se pretende estimar.
Para el ejemplo, el proceso discriminativo modal determinará la
posición de cada profesión en continuo de “prestigio social”. Se
trata del valor que más veces es asignado por los jueces, por
tanto, la moda de la distribución que al ser normal coincide con
los valores de la media y la mediana.
 Desviación típica de la distribución. Recibe el nombre de
“dispersión discriminativa”. Permite conocer la “ambigüedad” o
confusión que el estímulo genera para el sujeto o grupo de
sujetos. Por ejemplo, una profesión como la de “abogado”
puede generar juicios más heterogéneos que la de
“neurocirujano”, dando lugar a que la desviación típica de la
primera sea mayor que la de la segunda.
8
Thurstone pensó que para las personas resultaría más fácil
hacer comparaciones entre estímulos que juicios individuales. Por lo
que, en lugar de pedir a las personas que estimaran la posición de
cada estímulo por separado en el continuo, les pedía que indicarán
cual de cada pareja posible entre los estímulos, “tenía más..” o “era
más...” respecto a la variable objeto de la medición. De ahí que, el
modelo tuviese que formalizar la relación entre parejas de estímulos.
Comparar dos estímulos implica juzgar la distancia entre ellos
en el continuo. Así, si tenemos dos estímulos “i” y “j”, cada uno con
sus respectivas medias y desviaciones típicas, podemos representar la
distancia entre ellos como:
 i   j 
Esa diferencia se denomina "diferencia discriminativa". Si
repetimos la presentación conjunta de los dos estímulos para que los
jueces realicen la comparación, obtendremos una distribución de
diferencias discriminativas ya que estas no tendrá siempre el mismo
valor. Esta distribución de diferencias discriminativas también es
normal y su media será la diferencia entre las medias de las
distribuciones discriminativas de cada estímulo. Formalmente:
i j  i   j
La desviación típica de esta distribución es la desviación típica
de una distribución que resulta de restar otras dos distribuciones.
Formalmente:
 i  j   i2   j2  2  ij i j
Dentro de la raíz cuadrada, los dos primeros términos son las
varianzas de los procesos discriminativos de los dos estímulos y el
último es la covarianza.
A estas alturas de la presentación del modelo, no se debe
olvidar que el propósito es localizar los estímulos en un continuo
psicológico, por lo que la pregunta inmediata debe ser: ¿qué papel
desempeñan las distancias entre los estímulos para ese objetivo?. La
estrategia de Thurstone es de una sencillez admirable: si conocemos
las distancias entre los estímulos bastará con fijar un punto de
partida para determinar la localización de los estímulos en el
continuo. El proceso es semejante a lo que haríamos si nos pidiesen
ordenar a lo largo de una línea, las capitales de provincia a partir de
su distancia con respecto a Madrid. Pero esta estrategia plantea un
problema que se necesita resolver: las distancia entre las ciudades
9
podemos medirlas en kilómetros, ahora bien, cuál es la unidad
genérica de medida en el caso de los estímulos. La respuesta al
interrogante también hay que buscarla en la Estadística: la desviación
típica.
La desviación típica sirve de unidad de medida para definir las
distancias entre los estímulos "i" y "j" en el continuo psicológico.
Formalmente:
 i   j 
z ij 
 i  j
Esta expresión es la diferencia "estandarizada" (medida en
unidades de desviación típica) entre  i y  j ; por tanto, la distancia
estandarizada entre el estímulo "i" y "j" en el continuo. Esta distancia
estandariza es la que permite determinar la localización de los
estímulos en el continuo. Sin embargo, tanto  i y  j como la
desviación típica, son cantidades inobservables (parámetros), por lo
que necesitamos estimarlas. Para estimarlas necesitamos una
expresión lo más sencilla posible. Veamos como obtener la expresión
más simple posible para los valores escalares de los estímulos.
Expresión de los valores
distancias entre estímulos.
escalares
en
términos
de
Imaginemos que necesitamos localizar tres estímulos en el
continuo. Primero, debemos formular las distancia entre todas las
parejas de estímulos. Formalmente:
z12 
z13 
z 23 

1
 2

 1 2 

1
 3

 1  3 

2
 3 
  2 3 
Para calcular los valores escalares de los estímulos, es
necesario fijar un origen arbitrario. El procedimiento consiste en
hacer que el valor escalar de un estímulo sea el origen de la escala,
por ejemplo: 1  0 . Así, de manera arbitraria, el valor escalar del
ítem 1 se establece en 0. Esta decisión tiene un precio: el nivel de
10
medida de los valores escalares ya no podrá ser de razón. Ahora, las
tres distancias estandarizadas quedarían como:
z12 
z13 
z 23 
0   2 
 12 
0   3 
 13

2
 3 
  2 3 
El siguiente paso comienza organizando las ecuaciones
anteriores para presentarlas en términos de los valores escalares.
Formalmente:
 2  z12 12
3   z13 13
 2  3  z23 23
Resulta fácil caer en la cuenta de que tenemos aún demasiadas
incógnitas en las anteriores ecuaciones; de hecho, más adelante se
verá como es posible estimar las distancias estandarizadas, pero no
es posible hacer lo mismo con las desviaciones típicas. Para
solucionar este inconveniente es necesario recurrir a una doble
simplificación, que ilustra la forma de operar con modelos formales.
La primera consiste en suponer que las desviaciones típicas son
iguales. Si notamos el valor común de las desviaciones típicas con la
letra K, las ecuaciones anteriores quedarían así:
1
2
3
K
0
K
  z12
K
  z13
La segunda transformación recurre a las propiedades de las
escalas de intervalos. Con este tipo de escalas es posible transformar
los valores originales "  i " por el resultado de la expresión "a(  i )+b".
Ahora sólo se trata de encontrar los valores de "a" y "b" que permitan
11
simplificar las tres ecuaciones anteriores. Estos valores son "b=0" y
"a=1/K". Si se realiza esta transformación, las tres ecuaciones
anteriores quedarían como:
1*  0
 2*   z12
 3*   z13
Los valores transformados  i* son los valores escalares de cada
estímulo con respecto al valor escalar del estímulo establecido como
origen arbitrario. Sin embargo, aún queda una tarea por afrontar la
estimación de las diferencias estandarizadas. Se trata de conectar los
datos empíricos de los juicios comparativos con las cantidades que se
necesita estimar, para el caso de los tres estímulos estas cantidades
son: z12 y z13.
Lógica de la estimación de las distancias a partir de datos
empíricos
Thurstone propuso el procedimiento de juicios comparativos
para estimar las distancias estandarizadas entre los estímulos y
examinar si dichas estimaciones cumplían los requisitos de una escala
de intervalos. Sólo se describirá la lógica del procedimiento de juicios
comparativos, para una presentación más detallada acompañada de
un ejemplo se pueden consultar las lecturas recomendadas para el
tema.
Imaginemos que dos estímulos “i” y “j” están situados en el
mismo punto del continuo. Si le pidiéramos a un grupo de jueces que
indicasen cuál de los dos “tiene más...” de la variable, resulta
probable que dudasen en la decisión. De manera más precisa, se
esperaría que el 50% de los jueces eligieran la respuesta i>j,
mientras que el otro 50% se decidiera por j>i. Esta situación podría
ocurrir en el ejemplo con el que iniciamos el apartado, si
presentamos a los jueces dos profesiones con un prestigio social muy
similar, por ejemplo, “neurocirujano” y “cirujano cardiovascular”.
Ahora imaginemos que la distancia entre los dos estímulos aumenta,
las dudas reflejadas en los porcentajes de elección disminuirían de
forma que tal vez, el 75% de los jueces elegiría i>j, mientras que el
25% haría la elección contraría. Esta diferencia podría ocurrir en el
ejemplo si las profesiones enfrentadas fuesen “neurocirujano” y
“maestro de escuela”.
12
Por tanto, se puede plantear la existencia de una relación entre
pij la probabilidad de que un juez seleccionado al azar decida que i>j,
y la distancia  i   j  . La Ley del Juicio Comparativo supone que la
distribución de los juicios comparativos es normal. Así, las pij pueden
transformarse a puntuaciones típicas utilizando la tabla de la normal.
Por ejemplo, cuando pij = .50, zij = .00; pij = .75, zij = .68; y pij =
.95, zij = 1.64. De esta forma, podamos transformar las proporciones
de elección a “distancias tipificadas”, siempre bajo el supuesto
distribución normal de las diferencias discriminativas.
El procedimiento de juicios comparativos o "pares comparados"
proporciona, por tanto, un conjunto de zij para cada pareja de ítems.
Estas estimaciones proceden de un conjunto de ecuaciones
desarrolladas para obtener un conjunto de distancias estimadas que
satisfagan el siguiente principio de aditividad:
Distancias entre
estímulos
z12
z23
z34
Localización de
Los estímulos
Continuo
z14
Se trata de obtener las mejores estimaciones de las distancias
entre estímulos, de manera que la suma de las distancias entre
estímulos contiguos sea igual a la distancia entre el primer y último
estímulo en el continuo. Este principio de aditividad sólo se puede
cumplir si hay una unidad de medida de tamaño constante, por lo que
se debe concluir que los valores escales forman una "escala de
intervalos".
El procedimiento proporciona tests estadísticos para determinar
si las distancias estimadas cumplen el principio de aditividad y, por
tanto, se ajustan al modelo teórico para una "escala de intervalos".
Una vez obtenidos los valores escalares de los estímulos, el
conjunto de estímulos puede ser utilizado para ubicar personas. Por
ejemplo, resulta habitual si los estímulos son frases actitudinales,
13
presentarlas a un grupo de personas para que indiquen con cuales de
ellas están de acuerdo. A continuación, el valor escalar de las
personas se obtiene por la media de los ítems con los que han estado
de acuerdo.
Métodos centrados en las respuestas
Son los métodos de escalamiento más complejos. Las
respuestas son utilizadas para localizar al mismo tiempo personas y
estímulos en un continuo psicológico. A diferencia de las
aproximaciones anteriores, la variabilidad de las respuestas de las
personas ante los estímulos se atribuye tanto a las diferencias entre
las personas como a las diferencias entre los estímulos. Se presentan
dos métodos de escalamiento para ilustrar esta aproximación.
Análisis de Escalogramas
Guttman (1950) propuso un método de escalamiento al que
denominó “análisis de escalogramas”, como una alternativa a los
propuestos por Thurstone y Likert. El modelo pretende la
"ordenación" conjunta de personas y estímulos a partir de sus
respectivos valores escalares. Habitualmente, el método se utiliza con
un número reducido de ítems que hacen la función de estímulos.
Aunque el método se puede emplear con ítems de actitud, aptitud o
rendimiento, se hará la presentación sólo para ítems actitudinales.
El supuesto principal del modelo es que se pueden ordenar los
ítems a lo largo de un continuo de forma que si una persona
responde que está de acuerdo con un ítem (a partir de aquí, se
utilizará la expresión da una "respuesta favorable"), debe hacer lo
mismo con todos los ítems que estén por debajo de ese ítem en el
continuo. Para facilitar que el supuesto se cumpla, los ítems se
redactan de forma que expresen de forma creciente una actitud
favorable hacia la variable representada en el continuo.
Veamos un ejemplo. Imagine que se desea conocer la actitud
hacia los derechos de los inmigrantes. Los ítems que se han
redactado son:
1. Los inmigrantes deben acceder a la medicina general en los
centros de salud.
2. Los hijos de inmigrantes deben tener derecho a la educación no
universitaria.
3. Los inmigrantes deben poder votar en las elecciones
municipales.
14
4. Los inmigrantes tienen derecho a participar en las elecciones
generales como los ciudadanos españoles.
Los ítems han sido redactados de forma que expresen una
actitud cada uno más favorable hacia los derechos de los inmigrantes.
La tarea de las personas es indicar para cada ítem si están “de
acuerdo” o “en desacuerdo” con la idea expresada en el enunciado.
La serie de respuestas de las personas a los ítems se denominan
“patrones de respuesta”. Los patrones de respuesta que se ajustan al
supuesto del modelo reciben el nombre de “patrones permisibles de
respuesta”. ¿Qué patrones de respuesta son permisibles para los
cuatro ítems del ejemplo?. La Tabla 1 muestra de la forma habitual
cuales son esos patrones:
Patrones
permisibles
Tabla 1. Patrones permisibles de respuesta.
Items
Puntuación
total
1
2
3
4
1
2
3
4
5
1
1
1
1
0
1
1
1
0
0
1
1
0
0
0
1
0
0
0
0
4
3
2
1
0
El número (1) indica que la persona ha dado una respuesta
favorable al ítem, y el número (0) que la respuesta es desfavorable.
La última columna muestra las puntuaciones totales correspondientes
a cada patrón. La puntuación total es el valor escalar de la persona
que ha dado cada patrón de respuesta. El lector puede observar que
los unos están agrupados por encima de la diagonal principal y los
ceros por debajo. La matriz de unos y ceros mostrada en la tabla
muestra lo que se denomina una escala de Guttman perfecta.
Suponiendo que los ítems están ordenados desde el que expresa una
actitud menos favorable hasta el que expresa la más favorable,
resulta posible saber las respuestas que han dado las personas a
cada uno de los ítems a partir de su puntuación total. Así, por
ejemplo, la persona que obtiene una puntuación total de 2 ha dado
una respuesta favorable a los dos primeros ítems y una respuesta
desfavorable al resto.
Una escala como la representada en la Tabla 1 forma lo que se
denomina "escala de entrelazamiento". Esta escala permite localizar a
los ítems y las personas a lo largo de un continuo. Cada sujeto está
situado entre dos estímulos y su posición será la inmediata superior
al último ítem que ha contestado favorablemente, e inmediatamente
por debajo del primer ítem al que ha dado una respuesta
desfavorable. La Figura 1 representa este tipo de localización:
15
Posición del
sujeto con el
patrón B
E
D
C
B
A
continuo
-
+
1
2
3
4
Posición
del ítem 2
Así, el escalagroma de Guttman permite la ordenación conjunta
de personas e ítems a partir de sus respectivos valores escalares, que
por lo dicho conforman una escala "ordinal".
En la práctica resulta difícil formar escalas de Guttman
perfectas, ya que es poco probable que las personas den siempre
patrones de respuesta permisibles. De hecho, el autor de la escala
una vez administrados los ítems persigue dos objetivos relacionados:
1) determinar la localización de los ítems y las personas en el
continuo; y 2) calcular el grado en el que los ítems se ajustan o, al
contrario, se alejan de la escala de Guttman perfecta. Para ello hay
que seguir una serie de pasos que se verán en el siguiente
subapartado.
Elaboración de la escala de Guttman y evaluación del ajuste
Se presenta el proceso de elaboración de la escala para ítems
dicotómicos. Los ítems dicotómicos son aquellos que utilizan un
sistema de puntuación de las respuestas sólo con dos valores
numéricos: acierto (1) y fallo (0); o acuerdo (1) y desacuerdo (0).
Aunque el escalograma de Guttman también tiene extensiones
politómicas.
Ya se apuntó que con datos reales la determinación de si un
conjunto de respuesta forma una escala perfecta de Guttman es
compleja. Piense que con ítems dicotómicos el número de posibles
16
patrones distintos de respuesta es 2n, siendo n el número de ítems de
la escala. Claro que no todos esos patrones son compatibles con el
supuesto del modelo. El objetivo de la elaboración de la escala es
determinar cuantos patrones “inconsistentes” con el supuesto hay en
los datos. La “inconsistencia” del patrón depende del número de
“errores” que contenga. Se consideran errores las respuestas
incompatibles con el supuesto general del modelo. También se han
propuesto diferentes métodos pero la más utilizada parte de la
comparación entre el “patrón permisible de respuesta” y el patrón
real producido por el sujeto. La Tabla 2 presenta un ejemplo del
método más utilizado para calcular los errores:
Patrones
Permisible
"real"
Inversiones
Tabla 2. Cálculo de los errores.
Items
Puntuación
total
1
2
3
4
1
1
1
0
3
1
1
0
1
3
X
X
Errores
0
2
Por ejemplo, la Tabla 2 muestra una persona da este patrón de
respuestas a un conjunto de 4 ítems: 1101. La puntuación total que
le corresponde es 3. Suponiendo que los ítems están ordenados, el
patrón "permisible" es: 1110. El número total de errores es el
resultado de sumar las inversiones necesarias para obtener un patrón
permisible, en este caso, 2.
Ahora que se dispone de un método para contar los errores,
veamos con un ejemplo los pasos que se deben seguir para
determinar la “escalabilidad” de los datos. Imaginemos que la matriz
de datos de partida es la mostrada en la Tabla 3:
Tabla 3. Ejemplo de evaluación de la escala.
Sujetos
Items
Puntuación
sujetos
A
B
C
D
1
0
0
0
0
0
2
1
1
1
1
4
3
0
0
1
0
1
4
0
1
1
1
3
5
0
0
1
1
2
Proporción
0.20
0.40
0.80
0.60
respuesta
a los ítems
Los pasos para determinar la "escalabilidad" de los datos son:
1) Determinar para cada sujeto el número de respuestas
“favorables” en su patrón de respuestas. La Tabla 3
17
muestra en la columna con el título “Puntuación sujetos”, el
número total de respuestas “favorables” obtenidas por cada
sujeto. Este valor es la suma de las respuestas favorables
dadas a cada uno de los ítems.
2) Calcular
la
proporción
de
sujetos
que
responde
favorablemente a cada ítem. La Tabla 3 presenta estos
valores en la fila titulada “Proporción respuesta a los ítems”.
3) Ordenar las columnas de la tabla de forma que los estímulos
queden ordenados en función de la mayor o menor
proporción de respuestas favorables. La práctica habitual es
ordenarlos desde el estímulo que haya tenido una mayor
proporción de respuestas favorables hasta el que haya
tenido la menor.
4) Reordenar las filas correspondientes a los sujetos. Se trata
de que los sujetos queden ordenados desde el que obtuvo
una mayor puntuación hasta el que tuvo la puntuación más
baja.
La Tabla 4 resulta de reordenar la tabla anterior de la
forma descrita en los pasos 3) y 4).
Tabla 4. Reordenación de ítems y sujetos
Sujetos
Items
Puntuación
sujetos
C
D
C
D
2
1
1
1
1
4
4
1
1
1
0
3
5
1
1
0
0
2
3
1
0
0
0
1
1
0
1
0
0
1
Proporción
0.80
0.80
0.40
0.20
respuesta
a los ítems
5) Una vez ordenada la tabla el siguiente paso es determinar el
ajuste a la escala perfecta. La inspección visual de la tabla
revela que la respuesta de los sujetos no ha dado lugar a
una matriz triangular perfecta con todos los unos por encima
de la diagonal principal y todos los ceros por debajo. Por
tanto, no estamos ante una escala de Guttman perfecta. La
inspección visual se debe completar con un índice numérico.
Se han propuesto diferentes índices, uno de los más
utilizados es el coeficiente de reproductibilidad. La expresión
que permite calcular el coeficiente de reproductibilidad es:
C.R.  1 
Númerode errores
Número totalde respuestas
18
Para los datos del ejemplo, el valor del coeficiente
de reproductibilidad sería:
C.R.  1 
2
 0.90
20
El criterio habitual es considerar que los datos se
ajustan al modelo de Guttman a partir de valores de C. R.
iguales o superiores a .90. De ahí que, debamos interpretar
que los datos del ejemplo se ajustan al modelo.
Técnica de Despligue
El modelo de Coombs es un modelo de escalamiento centrado
en la respuesta, por lo que su propósito es la localización conjunta de
personas y estímulos en un continuo psicológico. Inicialmente el
modelo se desarrolló para el escalamiento unidimensional
(localización de sujetos y estímulos en un único continuo), aunque
después se generalizó a situaciones multidimensionales.
La tarea que se plantea a los sujetos es la ordenación de un
conjunto de estímulos en función de sus preferencias hacia ellos.
Coombs plantea que las relaciones entre sujetos y estímulos son
relaciones de proximidad: un sujeto pondrá en primer lugar un
estímulo "A" en lugar de otro estímulo "B", siempre que esté más
próximo en el continuo al estímulo "A" que al "B". De esta forma, el
orden de las preferencias del sujeto está determinado por la distancia
entre su posición en el continuo y cada uno de los estímulos.
En términos formales, si simbolizamos con S(A), S(B) y S(I) los
valores escalares de los estímulos A, B y del sujeto I, el supuesto
general del modelo se puede expresar como:
S A  S I   S B  S I   d AI   d BI 
La ecuación expresa que si la diferencia en valor absoluto entre
los valores escalares del estímulo A y del sujeto I es menor que la
diferencia entre los valores escalares del estímulo B y del sujeto I, el
sujeto I pondrá en primer lugar el estímulo A y después el B cuando
se le pida que los ordene.
Dado que los sujetos pueden ocupar diferentes posiciones en el
continuo es común encontrar diferentes ordenaciones de los
estímulos. Las ordenaciones diferentes realizadas por los sujetos
reciben el nombre de "escalas I". Por el contrario, los estímulos
19
ocupan una única posición en el continuo. La localización de los
estímulos en el continuo junto con la ubicación de los sujetos se
denomina "escala J". Para explicar la relación entre las ordenaciones
y la posición de los estímulos, supongamos que conocemos la
verdadera localización de cuatros estímulos (A, B, C y D) en un
continuo. La posición de los estímulos es la representada en la Figura
2(a):
Escala J
A
B
C
D
(a) Localización de cuatro estímulos en la escala J
AB
AC
AD BC BD
CD
Escala J
A
B
C
D
(b) Localización de los puntos medios entre estímulos en la escala J
La Figura 2(b) añade los puntos medios entre cada pareja de
estímulos, así el punto medio representado por AB es el punto medio
entre los estímulos A y B. Hay seis parejas de estímulos por lo que
también se han marcado seis puntos medios en el continuo (el
número de puntos medios se puede calcular utilizando la formula n(n1)/2). Los puntos medios dividen el continuo en una serie de
regiones. El número de regiones siempre es el número de puntos
medios más 1, para el caso representado en la figura 2(b) el continuo
queda dividido en 7 regiones.
Las regiones en que queda dividido el continuo son las “zonas”
en que se pueden localizar los sujetos. La técnica de despliegue
localiza a los sujetos en regiones del continuo más que en
ubicaciones puntuales. La Figura 3 muestra la división del continuo en
7 regiones:
AB
(1)
AC
(2)
AD BC BD
(3) (4) (5)
CD
(6)
(7)
X
Escala J
A
B
C
D
Localización del sujeto “X” en la región 2 de la escala J
20
La ordenación que hace el sujeto de los estímulos está en
función de la región del continuo en que se encuentre. Por ejemplo,
un sujeto localizado en la región 1, de acuerdo con el supuesto
general del modelo, producirá la ordenación ABCD; un sujeto situado
en la región 2 dará la ordenación BACD y así sucesivamente.
Suponiendo que se dispusiera de un conjunto perfectamente
escalable de estímulos y sujetos, habría siete ordenaciones que se
ajustarían a la lógica del modelo, una por cada una de las regiones.
La Tabla 5 muestra las siete ordenaciones posibles para los estímulos
del ejemplo:
Tabla 5. Escalas I permisibles para cuatro ítems
Ubicación de los sujetos
Escalas I “permisibles”
Región 1
ABCD
Región 2
BACD
Región 3
BCAD
Región 4
BCDA
Región 5
CBDA
Región 6
CDBA
Región 7
DCBA
El análisis de las ordenaciones proporciona algunos principios
que serán de ayuda a la hora de ubicar estímulos y personas en el
continuo con datos reales, situación en la que no conoceremos la
verdadera ubicación de los estímulos en el continuo. Los principios
son:
 Sólo hay dos ordenaciones que son simétricas. Se trata
de las correspondientes a la región 1 y 7, las regiones
extremas del continuo. Las ordenaciones simétricas sirven
para determinar el orden de los estímulos en el continuo.
El sentido del orden es arbitrario.
 Todas las ordenaciones terminan en alguno de los dos
estímulos extremos. Para el ejemplo, todas las
ordenaciones terminan en el estímulo “A” o en el “D”.
Piense que las ordenaciones que no terminen en un
estimulo extremo no se ajustan al supuesto general del
modelo.
 El paso de la ordenación de una región a la siguiente
supone el cambio de dos estímulos adyacentes. Examine,
por ejemplo, las ordenaciones de las regiones 1, 2 y 3.
Los estímulos que varían de posición al cambiar de la
región 1 a la 2 son la pareja AB que alternan su orden por
BA; el paso de las 2 a la 3, supone el cambio de orden en
21
la pareja AC por CA, y así sucesivamente al cambiar de
una región a la contigua.
Estos principios sirven para hacer inferencias a partir de las
ordenaciones encontradas en los datos reales sobre la localización de
personas y estímulos en el continuo.
Veamos como se aplica el modelo con datos reales a partir de
un ejemplo del libro de Crocker y Algina (1986). Imagine que se
desea conocer la localización en un continuo de actitud hacia el
derecho a la huelga de cuatro categorías de empleados públicos. Las
categorías de empleados son los estímulos. También a partir de la
ordenación que hagan los sujetos de los estímulos se pretende inferir
su actitud hacia el derecho a la huelga de los empleados públicos. Los
estímulos son: administrativos (A), profesores (B), enfermeras (C) y
bomberos (D).
La práctica tradicional es escribir en una tarjeta una profesión.
A continuación, se presentarían los bloques de cuatro tarjetas a una
muestra, por ejemplo, de 200 sujetos para que realizaran la tarea de
ordenación. Se instruye a los sujetos para que pongan en primer
lugar la tarjeta con la profesión que mejor representa su actitud, en
segundo lugar, la siguiente tarjeta, y así hasta ordenar las cuatro.
Una vez obtenidos los datos, el análisis comienza construyendo
una tabla de frecuencias en la que se registran las ordenaciones
encontradas y el número total de veces que ha aparecido cada una.
La Tabla 6 presenta los datos que se podrían haber obtenido en el
ejemplo:
Tabla 6. Ordenaciones y frecuencias de escalas I
Ordenaciones
Frecuencia
ABCD
41
BCAD
32
CBDA
30
CDBA
29
BACD
24
DCBA
20
BCDA
18
BDAC
3
CDAB
2
BADC
1
Recuerde que de acuerdo con el modelo para cuatro estímulos
sólo hay 7 escalas I, una para cada región. En aplicaciones reales lo
más probable es que se encuentren más ordenaciones de las
permisibles. Cuanto más supere el número de ordenaciones
22
encontradas la 7 permisibles, mayores deben ser las dudas sobre la
escalabilidad de estímulos y personas.
La Tabla presenta sólo dos ordenaciones que son simétricas:
ABCD y DCBA. Encontrar dos ordenaciones simétricas permite inferir
el orden de los cuatro estímulos en el continuo. La decisión de que
estímulo poner el primero o el último es arbitraria y se debe tomar
teniendo en cuenta el significado del continuo. Una vez ordenados los
estímulos, las escalas I permisibles se identifican siguiendo los
principios generales apuntados arriba.
Determinado el orden se pueden hacer algunas inferencias
sobre las distancias relativas entre los estímulos. Con cuatro
estímulos, se puede responder a la pregunta: ¿es mayor la distancia
que hay entre los estímulos A y B, que la que separa a los estímulos
C y D?. La respuesta hay que buscarla en la localización de la región
4, la región central, ya que su posición dependerá de que la distancia
entre los estímulos A y B sea mayor o menor que la de los estímulos
C y D.
AB
AC AD BC BD
(1)
(2)
(3) (4) (5)
CD
(6)
(7)
Escala J
A
B
C
D
La distancia AB > CD y la escala I para (4) es BCDA
AC
AB
(1)
(2)
BC
AD
(3) (4)
(5)
BD
CD
(6)
(7)
Escala J
A
B
C
D
La distancia AB < CD y la escala I para (4) es CBAD
La figura anterior muestra la localización de los estímulos en las
dos situaciones comentadas. La decisión de optar por una localización
u otra estará en función de que ordenación BCDA ó CBAD sea la que
haya obtenido una mayor frecuencia. Por ejemplo, si la ordenación
BCDA es la obtenido una frecuencia más alta podremos concluir que
la distancia entre los estímulos AB es mayor que la de CD, o
viceversa.Queda pendiente la cuestión del nivel de medida de los
valores escalares que proporciona la técnica de despliegue. El modelo
de Coombs proporciona valores escalares con un nivel de medida “a
caballo” entre el nivel ordinal y de intervalos: los estímulos y las
personas quedan ordenadas, pero además es posible hacer
inferencias sobre “distancias” entre estímulos.
Descargar