Tema III. Introducción al escalamiento INDICE o Introducción o Concepto de escalamiento y escala de medida o Aproximaciones al escalamiento o Métodos centrados en los sujetos: Modelo de Likert o Métodos centrados en los estímulos: Ley del Juicio Comparativo o Métodos centrados en las respuestas: Análisis de Escalogramas y Técnica de Despliegue BIBLIOGRAFÍA RECOMENDADA Muñiz, J. (1991). Introducción a los métodos psicofísicos. Madrid: PPU. Capítulo 1. Pérez, C.; Padilla, J. L.; González, A. y Rojas, A. J. (1996). El uso de las técnicas de escalamiento para la definición y medida del continuo psicosocial "individualismo-colectivismo". Boletín de Psicología, 25, 7-14. 2 Introducción Tal y como se apuntó en el tema anterior, el "escalamiento" es uno de los contenidos propios de la Psicometría. A grandes rasgos, se puede afirmar que el escalamiento se ocupa de la elaboración de instrumentos de medida; de forma más precisa, un instrumento de medida es la plasmación de una escala de medida, que permite la cuantificación de la variable objeto de la medición. Este tema presenta las perspectivas generales o aproximaciones al escalamiento y los procedimientos más significativos de cada una de ellas. Para entender el alcance de los diferentes procedimientos, el lector puede intentar responder a tres preguntas genéricas: ¿quién o qué "posee" el atributo psicológico que se pretende medir?, ¿qué tarea plantea el procedimiento? y ¿qué tipo de interpretación se puede hacer a partir de los valores numéricos asignados?. Aunque el tema tiene un fuerte carácter teórico, no debe pasar desapercibido que se analizan los procedimientos básicos con los que se elaboran la mayoría de los instrumentos de medición disponibles en Psicología. Concepto de escalamiento y escala de medida La elaboración de un instrumento de evaluación psicológica o educativa implica la adopción de una serie de suposiciones, explícitas o implícitas, sobre el constructo objeto de la medición. Se suele hacer referencia al conjunto de estas suposiciones como hipótesis sobre la “escalabilidad” de las mediciones, aunque sería más correcto hablar de la “mensurabilidad” del objeto de medición. La primera hipótesis plantea que el constructo es “una propiedad que ocurre en cantidades diferentes” de forma que puede cuantificarse utilizando una regla de escalamiento, propuesta, habitualmente, sobre un continuo unidimensional teórico. A este continuo se le denomina "continuo 3 psicológico". La segunda hipótesis tiene que ver con el tipo interpretación (escala de medida) que se puede realizar de mediciones obtenidas. Algunos de los procedimientos disponibles escalamiento permiten examinar la escala de medida en que encuentran las mediciones. de las de se En principio, la escalabilidad del objeto de medida no es más que una suposición y, por tanto, puede darse el caso de que los datos no sean en absoluto escalables y que, como consecuencia, no exista tal continuo psicológico unidimensional que represente al constructo. El concepto de “escalamiento” parte de la propia definición de medición: medir es asignar números a las propiedades de los objetos de acuerdo con ciertas reglas. Pues bien, el escalamiento es el proceso por el que desarrollan reglas sistemáticas de asignación numérica y se determinan unidades de medida significativas. El resultado de un proceso de escalamiento es una “escala de medida”. La escala de medida debe incluir: (1) el conjunto de valores posibles que pueden asignarse durante el proceso de medición, y, (2) una regla de asignación explícita entre las cantidades del atributo y los números que las representan. Esta regla de asignación debe incluir (o al menos implicar) la unidad de la escala de medida. Recurriendo a los conceptos expuestos en el tema dedicado a la teoría de la medida, la escala de medida es la regla que establece la correspondencia entre los elementos de los sistemas relacionales empírico y numérico. La regla permite asignar valores numéricos a los elementos del sistema relacional empírico. Los valores numéricos asignados reciben el nombre de “valores de escala” o “valores escalares”. Resulta frecuente el uso del término “escala” para nombrar instrumentos de medición particulares (e. g., Escala Wechsler de Inteligencia para Adultos). Tales instrumentos cumplen los requisitos establecidos para ser considerados “tests”, por lo que no se debería utilizar el término “escala”, evitando así la confusión con el significado que a dicho término se da en este tema. 4 Aproximaciones al escalamiento Hay disponibles diferentes clasificaciones de los métodos de escalamiento en función de distintos criterios. Una de las clasificaciones más utilizadas fue propuesta por Torgerson (1958). Este autor agrupa los métodos en función del “objeto” que se pretende escalar. El término “objeto” tiene un significado amplio ya que puede referirse a estímulos, personas o respuestas. Aunque más adelante se detalla su alcance, por ahora sirva la recomendación de que por “objeto” se puede entender la respuesta a la cuestión de ¿qué o quién posee el atributo objeto de la medición?. Torgenson (1958) identificó tres grandes aproximaciones al escalamiento: Métodos centrados en los sujetos. Los objetos que se pretenden escalar son personas. El objeto de la medición es un atributo de las personas. Los métodos centrados en las personas proporcionan los valores escalares con los que localizar a las personas en el continuo psicológico. Por ejemplo, las mediciones habituales de la inteligencia se obtienes con métodos centrados en las personas. Métodos centrados en los estímulos. El término estímulo tiene un significado amplio ya que puede hacer referencia a objetos físicos, frases que expresen opiniones o actitudes, personas que se pretenda evaluar respecto de algún atributo, etc. En cualquier caso, estos métodos pretenden localizar “objetos” a partir de sus valores escales en un continuo psicológico, siendo las personas que proporcionan los datos “meros instrumentos de medida”. Métodos centrados en las respuestas. El objeto de medición tiene sentido tanto para las personas como para los estímulos; de ahí que, se pretendan localizar ambos en el continuo psicológico a partir de sus respectivos valores escalares. De forma general, los métodos centrados en los estímulos y las respuestas son más rigurosos que permiten examinar incluso el nivel de medida de los valores escalares. Por el contrario, los métodos centrados en los sujetos ponen el acento en la sistematicidad del proceso de elaboración de instrumentos, supliendo la falta de examen de los niveles de medición con la preocupación por la fiabilidad y validez de las mediciones. 5 A continuación, se presentan de forma detallada algunos de los métodos de escalamiento más representativo de cada aproximación. Métodos centrado en los sujetos: El método de Likert El objetivo principal es localizar personas en diferentes puntos del continuo psicológico. Se trata de cuantificar las diferencias individuales respecto a algún atributo. Este es el propósito general de la mayoría de las mediciones aptitudinales, de rendimiento y actitudinales; de hecho, los métodos de escalamiento propios de esta aproximación son los más empleados para la elaboración de instrumento psicológicos de medida. El método de escalamiento propuesto por Renis Likert a finales de los años veinte es un ejemplo de este tipo de aproximación. Habitualmente, con este método se presenta a las personas una lista de frases que expresan opiniones, sentimientos, creencias, etc., sobre un tema, y se les pide que respondan a cada una de las frases en función de su grado de acuerdo con lo que dice la frase. Por ejemplo, imaginemos que un psicólogo social elabora con este método un cuestionario para medir la autoestima. El psicólogo escribe un conjunto de 10 enunciados con sentimientos reveladores del nivel de autoestima. Para responder a los ítems, la persona dispone de 5 alternativas de respuesta: desde “muy en desacuerdo” con el sentimiento expresado en el enunciado hasta “muy de acuerdo”. A continuación, decide que la respuesta "muy en desacuerdo" reciba 1 punto, la siguiente alternativa de respuesta 2 puntos y, así sucesivamente, hasta la respuesta "muy de acuerdo" que recibe 5 puntos. La puntuación total del sujeto (valor escalar) es la suma de las respuestas dadas a cada uno de los ítems. De esta forma, aquellos que tengan una autoestima "más alta" obtienen las puntuaciones más altas, y los que tienen una menor autoestima las puntuaciones más bajas. Tanto las puntuaciones de las respuestas a cada ítem, como el "peso" del ítem para obtener la puntuación del sujeto, son elegidos de forma arbitraria por el autor del cuestionario. No se concede ninguna importancia a las posibles diferencias entre los ítems a los que responde el sujeto, dado que el único objetivo es "escalar" sujetos. La "regla" de sumar el valor de las respuestas a cada uno de los ítems para obtener el "valor escalar" de los sujetos es tan popular en Psicología, que incluso da nombre a un tipo de instrumentos: “escalas sumativas”. Los métodos de escalamiento centrado en los sujetos realizan supuestos que no comprueban: 1) los ítems miden una única variable, es decir, forman una escala unidimensional; y 2) las 6 variaciones sistemáticas en las respuestas de las personas a los ítems se deben únicamente a las diferencias entre las personas. Es decir, los ítems no aportan nada a la variabilidad sistemática de las respuestas, de modo que cada ítem es considerado una replica de los otros. A la ausencia de comprobación de los supuestos, hay que añadir que estos métodos no proporcionan medios para examinar el nivel de medida de los valores escalares. La práctica habitual es dar por supuesto un nivel ordinal o de intervalos. Para paliar estas deficiencias, los usuarios de estos métodos recurren a un amplio análisis de la fiabilidad y la validez de los instrumentos de medida. Sin embargo, esta solución no hace más que demorar el problema, ya que si el análisis de las propiedades métricas no es satisfactorio, el autor del instrumento no sabrá si atribuir el resultado negativo a las deficiencias en la escala de medida o a problemas con la fiabilidad o validez del instrumento. Métodos centrados en los estímulos: La Ley del Juicio Comparativo El propósito de la medición es localizar estímulos en el continuo psicológico. Pensemos, por ejemplo, que pedimos a un grupo de personas que juzguen la dulzura de un conjunto de caramelos. En este caso, son los objetos –caramelos– los que son cuantificados con respecto al atributo –dulzura–. De lo que se trata en este apartado es de introducir los esfuerzos por ubicar en un continuo psicológico “estímulos” sin un referente físico, por ejemplo, enunciados de ítems actitudinales. Los antecedentes de los métodos de escalamiento centrados en los estímulos son las investigaciones experimentales realizadas por los psicólogos perceptúales alemanes en el siglo XIX. Investigadores como Fechner y Weber reciben la denominación genérica de "psicofísicos", dado su interés en proponer relaciones cuantitativas entre las respuestas a los estímulos físicos y los estímulos en sí. Por ejemplo, para medir la percepción del peso presentaban dos objetos con pesos diferentes y la tarea del sujeto era decidir cuál pesaba más. Investigaciones como estas permitían averiguar cuál era la diferencia más pequeña entre los pesos que detectan las personas. L. L. Thurstone fue el primero en mostrar que los métodos de escalamiento psicofísico se podían adaptar para la medición de actitudes. Por ejemplo, mostró que era posible ubicar un conjunto de 7 delitos en un continuo psicológico de “gravedad percibida”, pidiéndole a un grupo de jueces que examinaran todas las parejas posibles entre los delitos de una lista (e. g., asesinato y robo; asesinato y violación, etc.). Thurstone también desarrolló procedimientos estadísticos que permitían examinar si los valores escalares de los estímulos estaban en una escala de intervalos. Los procedimientos más conocidos de Thurstone se articulan en dos modelos conocidos como “Ley de Juicio Comparativo” y “Ley del Juicio Categórico”. La presentación detallada de los modelos queda fuera del alcance de estos apuntes. Sólo se hará una introducción breve a la “Ley del Juicio Comparativo”. La Ley de Thurstone es un sistema de ecuaciones que permite estimar los valores escalares de un conjunto de estímulos, a partir de los juicios comparativos realizados sobre todas las parejas posibles de estímulos. Veamos como funciona este sistema de ecuaciones, empezando por sus supuestos. Thurstone supone que cuando se presenta un estímulo “i” a una persona para que lo juzgue, se produce en su organismo una reacción que denomina “proceso discriminativo”. Imaginemos que el estímulo es una “profesión” y la tarea que debe realizar la persona es juzgar su “prestigio social”. Thurstone afirma que si repitiésemos la presentación del estímulo “i” a esta persona o lo hiciésemos sólo una vez a un grupo de personas, los juicios se distribuirían a lo largo del continuo psicológico formando una distribución normal. Esta distribución, que no es directamente observable, recibe el nombre de “distribución discriminativa”. La mejor forma de describir esta distribución es recurriendo a dos parámetros estadísticos: la media ( i ) y la desviación típica ( i ). Ambos elementos son importantes para comprender el modelo: Media de la distribución. Recibe el nombre de “proceso discriminativo modal”. Su valor es el valor escalar del estímulo en el continuo, por tanto, la cantidad que se pretende estimar. Para el ejemplo, el proceso discriminativo modal determinará la posición de cada profesión en continuo de “prestigio social”. Se trata del valor que más veces es asignado por los jueces, por tanto, la moda de la distribución que al ser normal coincide con los valores de la media y la mediana. Desviación típica de la distribución. Recibe el nombre de “dispersión discriminativa”. Permite conocer la “ambigüedad” o confusión que el estímulo genera para el sujeto o grupo de sujetos. Por ejemplo, una profesión como la de “abogado” puede generar juicios más heterogéneos que la de “neurocirujano”, dando lugar a que la desviación típica de la primera sea mayor que la de la segunda. 8 Thurstone pensó que para las personas resultaría más fácil hacer comparaciones entre estímulos que juicios individuales. Por lo que, en lugar de pedir a las personas que estimaran la posición de cada estímulo por separado en el continuo, les pedía que indicarán cual de cada pareja posible entre los estímulos, “tenía más..” o “era más...” respecto a la variable objeto de la medición. De ahí que, el modelo tuviese que formalizar la relación entre parejas de estímulos. Comparar dos estímulos implica juzgar la distancia entre ellos en el continuo. Así, si tenemos dos estímulos “i” y “j”, cada uno con sus respectivas medias y desviaciones típicas, podemos representar la distancia entre ellos como: i j Esa diferencia se denomina "diferencia discriminativa". Si repetimos la presentación conjunta de los dos estímulos para que los jueces realicen la comparación, obtendremos una distribución de diferencias discriminativas ya que estas no tendrá siempre el mismo valor. Esta distribución de diferencias discriminativas también es normal y su media será la diferencia entre las medias de las distribuciones discriminativas de cada estímulo. Formalmente: i j i j La desviación típica de esta distribución es la desviación típica de una distribución que resulta de restar otras dos distribuciones. Formalmente: i j i2 j2 2 ij i j Dentro de la raíz cuadrada, los dos primeros términos son las varianzas de los procesos discriminativos de los dos estímulos y el último es la covarianza. A estas alturas de la presentación del modelo, no se debe olvidar que el propósito es localizar los estímulos en un continuo psicológico, por lo que la pregunta inmediata debe ser: ¿qué papel desempeñan las distancias entre los estímulos para ese objetivo?. La estrategia de Thurstone es de una sencillez admirable: si conocemos las distancias entre los estímulos bastará con fijar un punto de partida para determinar la localización de los estímulos en el continuo. El proceso es semejante a lo que haríamos si nos pidiesen ordenar a lo largo de una línea, las capitales de provincia a partir de su distancia con respecto a Madrid. Pero esta estrategia plantea un problema que se necesita resolver: las distancia entre las ciudades 9 podemos medirlas en kilómetros, ahora bien, cuál es la unidad genérica de medida en el caso de los estímulos. La respuesta al interrogante también hay que buscarla en la Estadística: la desviación típica. La desviación típica sirve de unidad de medida para definir las distancias entre los estímulos "i" y "j" en el continuo psicológico. Formalmente: i j z ij i j Esta expresión es la diferencia "estandarizada" (medida en unidades de desviación típica) entre i y j ; por tanto, la distancia estandarizada entre el estímulo "i" y "j" en el continuo. Esta distancia estandariza es la que permite determinar la localización de los estímulos en el continuo. Sin embargo, tanto i y j como la desviación típica, son cantidades inobservables (parámetros), por lo que necesitamos estimarlas. Para estimarlas necesitamos una expresión lo más sencilla posible. Veamos como obtener la expresión más simple posible para los valores escalares de los estímulos. Expresión de los valores distancias entre estímulos. escalares en términos de Imaginemos que necesitamos localizar tres estímulos en el continuo. Primero, debemos formular las distancia entre todas las parejas de estímulos. Formalmente: z12 z13 z 23 1 2 1 2 1 3 1 3 2 3 2 3 Para calcular los valores escalares de los estímulos, es necesario fijar un origen arbitrario. El procedimiento consiste en hacer que el valor escalar de un estímulo sea el origen de la escala, por ejemplo: 1 0 . Así, de manera arbitraria, el valor escalar del ítem 1 se establece en 0. Esta decisión tiene un precio: el nivel de 10 medida de los valores escalares ya no podrá ser de razón. Ahora, las tres distancias estandarizadas quedarían como: z12 z13 z 23 0 2 12 0 3 13 2 3 2 3 El siguiente paso comienza organizando las ecuaciones anteriores para presentarlas en términos de los valores escalares. Formalmente: 2 z12 12 3 z13 13 2 3 z23 23 Resulta fácil caer en la cuenta de que tenemos aún demasiadas incógnitas en las anteriores ecuaciones; de hecho, más adelante se verá como es posible estimar las distancias estandarizadas, pero no es posible hacer lo mismo con las desviaciones típicas. Para solucionar este inconveniente es necesario recurrir a una doble simplificación, que ilustra la forma de operar con modelos formales. La primera consiste en suponer que las desviaciones típicas son iguales. Si notamos el valor común de las desviaciones típicas con la letra K, las ecuaciones anteriores quedarían así: 1 2 3 K 0 K z12 K z13 La segunda transformación recurre a las propiedades de las escalas de intervalos. Con este tipo de escalas es posible transformar los valores originales " i " por el resultado de la expresión "a( i )+b". Ahora sólo se trata de encontrar los valores de "a" y "b" que permitan 11 simplificar las tres ecuaciones anteriores. Estos valores son "b=0" y "a=1/K". Si se realiza esta transformación, las tres ecuaciones anteriores quedarían como: 1* 0 2* z12 3* z13 Los valores transformados i* son los valores escalares de cada estímulo con respecto al valor escalar del estímulo establecido como origen arbitrario. Sin embargo, aún queda una tarea por afrontar la estimación de las diferencias estandarizadas. Se trata de conectar los datos empíricos de los juicios comparativos con las cantidades que se necesita estimar, para el caso de los tres estímulos estas cantidades son: z12 y z13. Lógica de la estimación de las distancias a partir de datos empíricos Thurstone propuso el procedimiento de juicios comparativos para estimar las distancias estandarizadas entre los estímulos y examinar si dichas estimaciones cumplían los requisitos de una escala de intervalos. Sólo se describirá la lógica del procedimiento de juicios comparativos, para una presentación más detallada acompañada de un ejemplo se pueden consultar las lecturas recomendadas para el tema. Imaginemos que dos estímulos “i” y “j” están situados en el mismo punto del continuo. Si le pidiéramos a un grupo de jueces que indicasen cuál de los dos “tiene más...” de la variable, resulta probable que dudasen en la decisión. De manera más precisa, se esperaría que el 50% de los jueces eligieran la respuesta i>j, mientras que el otro 50% se decidiera por j>i. Esta situación podría ocurrir en el ejemplo con el que iniciamos el apartado, si presentamos a los jueces dos profesiones con un prestigio social muy similar, por ejemplo, “neurocirujano” y “cirujano cardiovascular”. Ahora imaginemos que la distancia entre los dos estímulos aumenta, las dudas reflejadas en los porcentajes de elección disminuirían de forma que tal vez, el 75% de los jueces elegiría i>j, mientras que el 25% haría la elección contraría. Esta diferencia podría ocurrir en el ejemplo si las profesiones enfrentadas fuesen “neurocirujano” y “maestro de escuela”. 12 Por tanto, se puede plantear la existencia de una relación entre pij la probabilidad de que un juez seleccionado al azar decida que i>j, y la distancia i j . La Ley del Juicio Comparativo supone que la distribución de los juicios comparativos es normal. Así, las pij pueden transformarse a puntuaciones típicas utilizando la tabla de la normal. Por ejemplo, cuando pij = .50, zij = .00; pij = .75, zij = .68; y pij = .95, zij = 1.64. De esta forma, podamos transformar las proporciones de elección a “distancias tipificadas”, siempre bajo el supuesto distribución normal de las diferencias discriminativas. El procedimiento de juicios comparativos o "pares comparados" proporciona, por tanto, un conjunto de zij para cada pareja de ítems. Estas estimaciones proceden de un conjunto de ecuaciones desarrolladas para obtener un conjunto de distancias estimadas que satisfagan el siguiente principio de aditividad: Distancias entre estímulos z12 z23 z34 Localización de Los estímulos Continuo z14 Se trata de obtener las mejores estimaciones de las distancias entre estímulos, de manera que la suma de las distancias entre estímulos contiguos sea igual a la distancia entre el primer y último estímulo en el continuo. Este principio de aditividad sólo se puede cumplir si hay una unidad de medida de tamaño constante, por lo que se debe concluir que los valores escales forman una "escala de intervalos". El procedimiento proporciona tests estadísticos para determinar si las distancias estimadas cumplen el principio de aditividad y, por tanto, se ajustan al modelo teórico para una "escala de intervalos". Una vez obtenidos los valores escalares de los estímulos, el conjunto de estímulos puede ser utilizado para ubicar personas. Por ejemplo, resulta habitual si los estímulos son frases actitudinales, 13 presentarlas a un grupo de personas para que indiquen con cuales de ellas están de acuerdo. A continuación, el valor escalar de las personas se obtiene por la media de los ítems con los que han estado de acuerdo. Métodos centrados en las respuestas Son los métodos de escalamiento más complejos. Las respuestas son utilizadas para localizar al mismo tiempo personas y estímulos en un continuo psicológico. A diferencia de las aproximaciones anteriores, la variabilidad de las respuestas de las personas ante los estímulos se atribuye tanto a las diferencias entre las personas como a las diferencias entre los estímulos. Se presentan dos métodos de escalamiento para ilustrar esta aproximación. Análisis de Escalogramas Guttman (1950) propuso un método de escalamiento al que denominó “análisis de escalogramas”, como una alternativa a los propuestos por Thurstone y Likert. El modelo pretende la "ordenación" conjunta de personas y estímulos a partir de sus respectivos valores escalares. Habitualmente, el método se utiliza con un número reducido de ítems que hacen la función de estímulos. Aunque el método se puede emplear con ítems de actitud, aptitud o rendimiento, se hará la presentación sólo para ítems actitudinales. El supuesto principal del modelo es que se pueden ordenar los ítems a lo largo de un continuo de forma que si una persona responde que está de acuerdo con un ítem (a partir de aquí, se utilizará la expresión da una "respuesta favorable"), debe hacer lo mismo con todos los ítems que estén por debajo de ese ítem en el continuo. Para facilitar que el supuesto se cumpla, los ítems se redactan de forma que expresen de forma creciente una actitud favorable hacia la variable representada en el continuo. Veamos un ejemplo. Imagine que se desea conocer la actitud hacia los derechos de los inmigrantes. Los ítems que se han redactado son: 1. Los inmigrantes deben acceder a la medicina general en los centros de salud. 2. Los hijos de inmigrantes deben tener derecho a la educación no universitaria. 3. Los inmigrantes deben poder votar en las elecciones municipales. 14 4. Los inmigrantes tienen derecho a participar en las elecciones generales como los ciudadanos españoles. Los ítems han sido redactados de forma que expresen una actitud cada uno más favorable hacia los derechos de los inmigrantes. La tarea de las personas es indicar para cada ítem si están “de acuerdo” o “en desacuerdo” con la idea expresada en el enunciado. La serie de respuestas de las personas a los ítems se denominan “patrones de respuesta”. Los patrones de respuesta que se ajustan al supuesto del modelo reciben el nombre de “patrones permisibles de respuesta”. ¿Qué patrones de respuesta son permisibles para los cuatro ítems del ejemplo?. La Tabla 1 muestra de la forma habitual cuales son esos patrones: Patrones permisibles Tabla 1. Patrones permisibles de respuesta. Items Puntuación total 1 2 3 4 1 2 3 4 5 1 1 1 1 0 1 1 1 0 0 1 1 0 0 0 1 0 0 0 0 4 3 2 1 0 El número (1) indica que la persona ha dado una respuesta favorable al ítem, y el número (0) que la respuesta es desfavorable. La última columna muestra las puntuaciones totales correspondientes a cada patrón. La puntuación total es el valor escalar de la persona que ha dado cada patrón de respuesta. El lector puede observar que los unos están agrupados por encima de la diagonal principal y los ceros por debajo. La matriz de unos y ceros mostrada en la tabla muestra lo que se denomina una escala de Guttman perfecta. Suponiendo que los ítems están ordenados desde el que expresa una actitud menos favorable hasta el que expresa la más favorable, resulta posible saber las respuestas que han dado las personas a cada uno de los ítems a partir de su puntuación total. Así, por ejemplo, la persona que obtiene una puntuación total de 2 ha dado una respuesta favorable a los dos primeros ítems y una respuesta desfavorable al resto. Una escala como la representada en la Tabla 1 forma lo que se denomina "escala de entrelazamiento". Esta escala permite localizar a los ítems y las personas a lo largo de un continuo. Cada sujeto está situado entre dos estímulos y su posición será la inmediata superior al último ítem que ha contestado favorablemente, e inmediatamente por debajo del primer ítem al que ha dado una respuesta desfavorable. La Figura 1 representa este tipo de localización: 15 Posición del sujeto con el patrón B E D C B A continuo - + 1 2 3 4 Posición del ítem 2 Así, el escalagroma de Guttman permite la ordenación conjunta de personas e ítems a partir de sus respectivos valores escalares, que por lo dicho conforman una escala "ordinal". En la práctica resulta difícil formar escalas de Guttman perfectas, ya que es poco probable que las personas den siempre patrones de respuesta permisibles. De hecho, el autor de la escala una vez administrados los ítems persigue dos objetivos relacionados: 1) determinar la localización de los ítems y las personas en el continuo; y 2) calcular el grado en el que los ítems se ajustan o, al contrario, se alejan de la escala de Guttman perfecta. Para ello hay que seguir una serie de pasos que se verán en el siguiente subapartado. Elaboración de la escala de Guttman y evaluación del ajuste Se presenta el proceso de elaboración de la escala para ítems dicotómicos. Los ítems dicotómicos son aquellos que utilizan un sistema de puntuación de las respuestas sólo con dos valores numéricos: acierto (1) y fallo (0); o acuerdo (1) y desacuerdo (0). Aunque el escalograma de Guttman también tiene extensiones politómicas. Ya se apuntó que con datos reales la determinación de si un conjunto de respuesta forma una escala perfecta de Guttman es compleja. Piense que con ítems dicotómicos el número de posibles 16 patrones distintos de respuesta es 2n, siendo n el número de ítems de la escala. Claro que no todos esos patrones son compatibles con el supuesto del modelo. El objetivo de la elaboración de la escala es determinar cuantos patrones “inconsistentes” con el supuesto hay en los datos. La “inconsistencia” del patrón depende del número de “errores” que contenga. Se consideran errores las respuestas incompatibles con el supuesto general del modelo. También se han propuesto diferentes métodos pero la más utilizada parte de la comparación entre el “patrón permisible de respuesta” y el patrón real producido por el sujeto. La Tabla 2 presenta un ejemplo del método más utilizado para calcular los errores: Patrones Permisible "real" Inversiones Tabla 2. Cálculo de los errores. Items Puntuación total 1 2 3 4 1 1 1 0 3 1 1 0 1 3 X X Errores 0 2 Por ejemplo, la Tabla 2 muestra una persona da este patrón de respuestas a un conjunto de 4 ítems: 1101. La puntuación total que le corresponde es 3. Suponiendo que los ítems están ordenados, el patrón "permisible" es: 1110. El número total de errores es el resultado de sumar las inversiones necesarias para obtener un patrón permisible, en este caso, 2. Ahora que se dispone de un método para contar los errores, veamos con un ejemplo los pasos que se deben seguir para determinar la “escalabilidad” de los datos. Imaginemos que la matriz de datos de partida es la mostrada en la Tabla 3: Tabla 3. Ejemplo de evaluación de la escala. Sujetos Items Puntuación sujetos A B C D 1 0 0 0 0 0 2 1 1 1 1 4 3 0 0 1 0 1 4 0 1 1 1 3 5 0 0 1 1 2 Proporción 0.20 0.40 0.80 0.60 respuesta a los ítems Los pasos para determinar la "escalabilidad" de los datos son: 1) Determinar para cada sujeto el número de respuestas “favorables” en su patrón de respuestas. La Tabla 3 17 muestra en la columna con el título “Puntuación sujetos”, el número total de respuestas “favorables” obtenidas por cada sujeto. Este valor es la suma de las respuestas favorables dadas a cada uno de los ítems. 2) Calcular la proporción de sujetos que responde favorablemente a cada ítem. La Tabla 3 presenta estos valores en la fila titulada “Proporción respuesta a los ítems”. 3) Ordenar las columnas de la tabla de forma que los estímulos queden ordenados en función de la mayor o menor proporción de respuestas favorables. La práctica habitual es ordenarlos desde el estímulo que haya tenido una mayor proporción de respuestas favorables hasta el que haya tenido la menor. 4) Reordenar las filas correspondientes a los sujetos. Se trata de que los sujetos queden ordenados desde el que obtuvo una mayor puntuación hasta el que tuvo la puntuación más baja. La Tabla 4 resulta de reordenar la tabla anterior de la forma descrita en los pasos 3) y 4). Tabla 4. Reordenación de ítems y sujetos Sujetos Items Puntuación sujetos C D C D 2 1 1 1 1 4 4 1 1 1 0 3 5 1 1 0 0 2 3 1 0 0 0 1 1 0 1 0 0 1 Proporción 0.80 0.80 0.40 0.20 respuesta a los ítems 5) Una vez ordenada la tabla el siguiente paso es determinar el ajuste a la escala perfecta. La inspección visual de la tabla revela que la respuesta de los sujetos no ha dado lugar a una matriz triangular perfecta con todos los unos por encima de la diagonal principal y todos los ceros por debajo. Por tanto, no estamos ante una escala de Guttman perfecta. La inspección visual se debe completar con un índice numérico. Se han propuesto diferentes índices, uno de los más utilizados es el coeficiente de reproductibilidad. La expresión que permite calcular el coeficiente de reproductibilidad es: C.R. 1 Númerode errores Número totalde respuestas 18 Para los datos del ejemplo, el valor del coeficiente de reproductibilidad sería: C.R. 1 2 0.90 20 El criterio habitual es considerar que los datos se ajustan al modelo de Guttman a partir de valores de C. R. iguales o superiores a .90. De ahí que, debamos interpretar que los datos del ejemplo se ajustan al modelo. Técnica de Despligue El modelo de Coombs es un modelo de escalamiento centrado en la respuesta, por lo que su propósito es la localización conjunta de personas y estímulos en un continuo psicológico. Inicialmente el modelo se desarrolló para el escalamiento unidimensional (localización de sujetos y estímulos en un único continuo), aunque después se generalizó a situaciones multidimensionales. La tarea que se plantea a los sujetos es la ordenación de un conjunto de estímulos en función de sus preferencias hacia ellos. Coombs plantea que las relaciones entre sujetos y estímulos son relaciones de proximidad: un sujeto pondrá en primer lugar un estímulo "A" en lugar de otro estímulo "B", siempre que esté más próximo en el continuo al estímulo "A" que al "B". De esta forma, el orden de las preferencias del sujeto está determinado por la distancia entre su posición en el continuo y cada uno de los estímulos. En términos formales, si simbolizamos con S(A), S(B) y S(I) los valores escalares de los estímulos A, B y del sujeto I, el supuesto general del modelo se puede expresar como: S A S I S B S I d AI d BI La ecuación expresa que si la diferencia en valor absoluto entre los valores escalares del estímulo A y del sujeto I es menor que la diferencia entre los valores escalares del estímulo B y del sujeto I, el sujeto I pondrá en primer lugar el estímulo A y después el B cuando se le pida que los ordene. Dado que los sujetos pueden ocupar diferentes posiciones en el continuo es común encontrar diferentes ordenaciones de los estímulos. Las ordenaciones diferentes realizadas por los sujetos reciben el nombre de "escalas I". Por el contrario, los estímulos 19 ocupan una única posición en el continuo. La localización de los estímulos en el continuo junto con la ubicación de los sujetos se denomina "escala J". Para explicar la relación entre las ordenaciones y la posición de los estímulos, supongamos que conocemos la verdadera localización de cuatros estímulos (A, B, C y D) en un continuo. La posición de los estímulos es la representada en la Figura 2(a): Escala J A B C D (a) Localización de cuatro estímulos en la escala J AB AC AD BC BD CD Escala J A B C D (b) Localización de los puntos medios entre estímulos en la escala J La Figura 2(b) añade los puntos medios entre cada pareja de estímulos, así el punto medio representado por AB es el punto medio entre los estímulos A y B. Hay seis parejas de estímulos por lo que también se han marcado seis puntos medios en el continuo (el número de puntos medios se puede calcular utilizando la formula n(n1)/2). Los puntos medios dividen el continuo en una serie de regiones. El número de regiones siempre es el número de puntos medios más 1, para el caso representado en la figura 2(b) el continuo queda dividido en 7 regiones. Las regiones en que queda dividido el continuo son las “zonas” en que se pueden localizar los sujetos. La técnica de despliegue localiza a los sujetos en regiones del continuo más que en ubicaciones puntuales. La Figura 3 muestra la división del continuo en 7 regiones: AB (1) AC (2) AD BC BD (3) (4) (5) CD (6) (7) X Escala J A B C D Localización del sujeto “X” en la región 2 de la escala J 20 La ordenación que hace el sujeto de los estímulos está en función de la región del continuo en que se encuentre. Por ejemplo, un sujeto localizado en la región 1, de acuerdo con el supuesto general del modelo, producirá la ordenación ABCD; un sujeto situado en la región 2 dará la ordenación BACD y así sucesivamente. Suponiendo que se dispusiera de un conjunto perfectamente escalable de estímulos y sujetos, habría siete ordenaciones que se ajustarían a la lógica del modelo, una por cada una de las regiones. La Tabla 5 muestra las siete ordenaciones posibles para los estímulos del ejemplo: Tabla 5. Escalas I permisibles para cuatro ítems Ubicación de los sujetos Escalas I “permisibles” Región 1 ABCD Región 2 BACD Región 3 BCAD Región 4 BCDA Región 5 CBDA Región 6 CDBA Región 7 DCBA El análisis de las ordenaciones proporciona algunos principios que serán de ayuda a la hora de ubicar estímulos y personas en el continuo con datos reales, situación en la que no conoceremos la verdadera ubicación de los estímulos en el continuo. Los principios son: Sólo hay dos ordenaciones que son simétricas. Se trata de las correspondientes a la región 1 y 7, las regiones extremas del continuo. Las ordenaciones simétricas sirven para determinar el orden de los estímulos en el continuo. El sentido del orden es arbitrario. Todas las ordenaciones terminan en alguno de los dos estímulos extremos. Para el ejemplo, todas las ordenaciones terminan en el estímulo “A” o en el “D”. Piense que las ordenaciones que no terminen en un estimulo extremo no se ajustan al supuesto general del modelo. El paso de la ordenación de una región a la siguiente supone el cambio de dos estímulos adyacentes. Examine, por ejemplo, las ordenaciones de las regiones 1, 2 y 3. Los estímulos que varían de posición al cambiar de la región 1 a la 2 son la pareja AB que alternan su orden por BA; el paso de las 2 a la 3, supone el cambio de orden en 21 la pareja AC por CA, y así sucesivamente al cambiar de una región a la contigua. Estos principios sirven para hacer inferencias a partir de las ordenaciones encontradas en los datos reales sobre la localización de personas y estímulos en el continuo. Veamos como se aplica el modelo con datos reales a partir de un ejemplo del libro de Crocker y Algina (1986). Imagine que se desea conocer la localización en un continuo de actitud hacia el derecho a la huelga de cuatro categorías de empleados públicos. Las categorías de empleados son los estímulos. También a partir de la ordenación que hagan los sujetos de los estímulos se pretende inferir su actitud hacia el derecho a la huelga de los empleados públicos. Los estímulos son: administrativos (A), profesores (B), enfermeras (C) y bomberos (D). La práctica tradicional es escribir en una tarjeta una profesión. A continuación, se presentarían los bloques de cuatro tarjetas a una muestra, por ejemplo, de 200 sujetos para que realizaran la tarea de ordenación. Se instruye a los sujetos para que pongan en primer lugar la tarjeta con la profesión que mejor representa su actitud, en segundo lugar, la siguiente tarjeta, y así hasta ordenar las cuatro. Una vez obtenidos los datos, el análisis comienza construyendo una tabla de frecuencias en la que se registran las ordenaciones encontradas y el número total de veces que ha aparecido cada una. La Tabla 6 presenta los datos que se podrían haber obtenido en el ejemplo: Tabla 6. Ordenaciones y frecuencias de escalas I Ordenaciones Frecuencia ABCD 41 BCAD 32 CBDA 30 CDBA 29 BACD 24 DCBA 20 BCDA 18 BDAC 3 CDAB 2 BADC 1 Recuerde que de acuerdo con el modelo para cuatro estímulos sólo hay 7 escalas I, una para cada región. En aplicaciones reales lo más probable es que se encuentren más ordenaciones de las permisibles. Cuanto más supere el número de ordenaciones 22 encontradas la 7 permisibles, mayores deben ser las dudas sobre la escalabilidad de estímulos y personas. La Tabla presenta sólo dos ordenaciones que son simétricas: ABCD y DCBA. Encontrar dos ordenaciones simétricas permite inferir el orden de los cuatro estímulos en el continuo. La decisión de que estímulo poner el primero o el último es arbitraria y se debe tomar teniendo en cuenta el significado del continuo. Una vez ordenados los estímulos, las escalas I permisibles se identifican siguiendo los principios generales apuntados arriba. Determinado el orden se pueden hacer algunas inferencias sobre las distancias relativas entre los estímulos. Con cuatro estímulos, se puede responder a la pregunta: ¿es mayor la distancia que hay entre los estímulos A y B, que la que separa a los estímulos C y D?. La respuesta hay que buscarla en la localización de la región 4, la región central, ya que su posición dependerá de que la distancia entre los estímulos A y B sea mayor o menor que la de los estímulos C y D. AB AC AD BC BD (1) (2) (3) (4) (5) CD (6) (7) Escala J A B C D La distancia AB > CD y la escala I para (4) es BCDA AC AB (1) (2) BC AD (3) (4) (5) BD CD (6) (7) Escala J A B C D La distancia AB < CD y la escala I para (4) es CBAD La figura anterior muestra la localización de los estímulos en las dos situaciones comentadas. La decisión de optar por una localización u otra estará en función de que ordenación BCDA ó CBAD sea la que haya obtenido una mayor frecuencia. Por ejemplo, si la ordenación BCDA es la obtenido una frecuencia más alta podremos concluir que la distancia entre los estímulos AB es mayor que la de CD, o viceversa.Queda pendiente la cuestión del nivel de medida de los valores escalares que proporciona la técnica de despliegue. El modelo de Coombs proporciona valores escalares con un nivel de medida “a caballo” entre el nivel ordinal y de intervalos: los estímulos y las personas quedan ordenadas, pero además es posible hacer inferencias sobre “distancias” entre estímulos.