UNIVERSIDAD NACIONAL ABIERTA DIRECCIÓN DE INVESTIGACIONES Y POSTGRADO MAESTRÍA EN EDUCACIÓN ABIERTA Y A DISTANCIA Epistemología e Investigación Unidad Curricular: Metodología de la Investigación II Capítulo 25: Fundamentos de la Medición Kerlinger, F. (1988). Investigación del Comportamiento. Segunda Edición. México: Editorial McGraw-Hill. (compilación con fines instruccionales) Capítulo 25 Fundamentos de la medición “En su sentido más amplio, la medición es la asignación de valores numéricos a objetos o eventos de acuerdo con reglas”1. Esta definición expresa en forma sucinta la naturaleza básica de le medición. Sin embargo, para entenderla se requiere de la definición y la explicación de cada término importante –tarea a la cual se dedica gran parte de este capítuloSupóngase que se solicita a un juez que se sitúe a siete pies de distancia de un grupo de estudiantes. Se pide al juez mirar a los estudiantes y luego estimar el grado en el cual cada uno de ellos posee cinco atributos: amabilidad, fuerza de carácter, personalidad, habilidad musical e inteligencia. Las estimaciones deberán darse en forma numérica con una escala de números que va de 1 a 5, indicando con 1 una cantidad muy pequeña de la característica en cuestión y con 5 una gran cantidad de ella. En otras palabras, el juez, con sólo mirar a los estudiantes, deberá evaluar qué tan “amables” son, qué tan “fuertes” son sus caracteres, etc., mediante el uso de los números 1,2,3,4 y 5 para indicar las cantidades de cada característica que los estudiantes poseen. Este ejemplo puede ser un poco ridículo. Sin embargo, la mayoría de la gente pasa por gran parte del mismo procedimiento durante su vida. Con frecuencia, uno juzga qué tan “amables”, qué tan “fuertes”, qué tan “inteligentes” son las personas con tan sólo mirándolas y hablando con ellas. Esto parece en verdad ridículo cuando se da como ejemplo serio de medición. Ridículo o serio, es un ejemplo de medición, puesto que satisface la definición. El juez asignó valores numéricos a “objetos” de acuerdo con las reglas. Se especificaron los objetos, los valores numéricos y las reglas para la asignación de los valores numéricos a los objetos. Los valores numéricos fueron 1, 2, 3, 4 y 5; los objetos fueron los estudiantes; las reglas para la asignación de los valores numéricos a los objetos estaban contenidas en las instrucciones del juez. De este modo, el producto terminado del trabajo, los valores numéricos, podrían usarse para calcular medidas de relación, análisis de varianza y demás aspectos similares. 1 S. Stevens, “Mathematics, Mathematics, Measurements, and Psychophysics”. In S. Stevens, ed., Handbook of Experimental Psychology. New York:1951, p. 1; S. Stevens, “Measurement, Statistic, and the Schemapiric View, Science, 161 (1968), 849-856. 444 MEDICIÓN La definición de medición no incluye una explicación acerca de la calidad del procedimiento de medición. Solamente afirma que, de alguna manera, los valores numéricos son asignados a objetos o eventos. Por supuesto que el “de alguna manera” es importante, pero no para la definición. La medición es un juego realizado con objetos y valores numéricos. Los juegos tienen reglas. Desde luego, es importante por otras razones que las reglas sean “buenas” reglas, pero independientemente de si las reglas son “buenas” o “malas”, el procedimiento es todavía una medición. ¿Por qué se da este énfasis a la definición de medición y a la calidad de sus “reglas”? Existen tres razones. Primero, la medición es mal entendida en especial la psicológica y educativa. No es difícil entender ciertas mediciones que se usan en las ciencias naturales: por ejemplo, longitud, peso y volumen. Aun las mediciones más alejadas del sentido común pueden entenderse sin deformar demasiado ciertas nociones elementales e intuitivas. Pero es mucho más difícil entender que la medición de características de los individuos y grupos como inteligencia, agresividad, cohesividad y ansiedad implica básica y esencialmente el mismo pensamiento y procedimiento general. En efecto, muchos dicen que no puede hacerse. Saber y entender que la medición es la asignación de valores numéricos a objetos o eventos a través de reglas, ayuda a borrar ciertas concepciones erróneas y engañosas de la medición psicológica y educativa. Segundo, la definición nos dice que, si se pueden establecer reglas sobre alguna base empírica o racional, la medición de cualquier cosa es teóricamente posible. Esto amplía en gran medida los horizontes de la medición para el científico. El no rechaza la posibilidad de medir alguna propiedad aunque la propiedad sea compleja y elusiva; entiende que la medición es un juego que puede el ser o no capaz de jugar con esta o aquella propiedad en este momento. Pero nunca rechaza la posibilidad de jugar el juego, aunque puede entender sus dificultades en forma realista. Tercero, la definición pone en estado de alerta respecto del núcleo esencial de la medición y de los procedimientos de medición, y respecto de la necesidad de establecer “buenas” reglas cuya virtud pueda ser probada en forma empírica. Ningún procedimiento de medición es mejor que sus reglas. Las reglas dadas en el ejemplo anterior eran deficientes. El procedimiento fue un procedimiento de medición; la definición fue satisfecha. Pero era un procedimiento deficiente por razones que deberán parecer evidentes mas tarde. DEFINICIÓN DE MEDICION Se repetirá la definición: “la medición es la asignación de valores numéricos a objetos o eventos de acuerdo con reglas”. Un valor numérico es un símbolo de la forma 1, 2, 3, . . ., o I, II, III, . . . No tiene significado cuantitativo a menos que se le dé tal significado; es un simple símbolo de un tipo especial. Puede ser usado para marcar objetos como jugadores de béisbol, bolas de billar o individuos extraídos de una muestra a partir de un universo. También se podría utilizar la palabra “símbolo” en la definición. Es del todo posible, e incluso necesario, asignar símbolos a objetos o conjuntos de objetos de acuerdo con reglas. El “valor numérico” se emplea porque la medición de ordinario usa cifras que, después de asignárseles un significado cuantitativo, se convierten en números. Un numero, entonces, es un valor numérico al que se ha dado un significado cuantitativo. El término “asignado” en la definición quiere decir mapeo o presentación. Recuérdese que ya se hablo acerca de mapear los objetos de un conjunto dentro de los FUNDAMENTOS DE LA MEDICIÓN 445 objetos de otro conjunto. Una función, f, es una regla, una regla de correspondencia. Es una regla que asigna a cada miembro de un conjunto algún miembro de otro conjunto. Los miembros de los dos conjuntos pueden ser cualesquiera objetos del todo. En matemáticas, los miembros son por lo general números y símbolos algebraicos. En investigación, los miembros de un conjunto pueden ser individuos, o símbolos que representan individuos, y los miembros del otro conjunto pueden ser valores numéricos o números. En la mayor parte de las mediciones psicológicas y educativas, los valores numéricos y los números son mapeados sobre individuos o asignados a estos.2 El más interesante –y más difícil- trabajo de medición es la regla. Una regla es una guía, un método, un mandato que dice que hacer. Una regla matemática es f, una función; f es una regla para asignar los objetos de un conjunto a los objetos de otro. En la medición, una regla podría especificar: “Asigne los valores numéricos 1 a 5 a individuos de acuerdo con qué tan amables sean. Si un individuo es muy, muy amable, asígnele el número 5. Si un individuo no es del todo amable, asígnele el número 1. Asigne, a los individuos entre estos límites, números entre los límites”. Otra regla es aquella que ya se ha planteado varias veces: “Si un individuo es hombre, asígnele 1. Si un individuo es mujer, asígnele 0”. Desde luego, sería necesario tener una regla o conjunto de reglas anteriores que definieran a los hombres y mujeres. Supóngase que se tiene un conjunto, A, de cinco personas, tres hombres y dos mujeres: a1, a3 y a4 son hombres; a2 y a5 son mujeres. Se desea medir la variable sexo. Suponiendo que se tiene una regla anterior que nos permite sin ambigüedades determinar el sexo, se utiliza la regla dada en el párrafo anterior: “Si una persona es hombre, asígnele 1; si es mujer, asígnele 0”. Sean 0 y 1 un conjunto. Llámese B. Entonces B = {0, 1}. El diagrama de medición se muestra en la figura 25-1. Este procedimiento es el mismo que el utilizado en el capitulo 5 para analizar las relaciones y las funciones. Es evidente que la medición es una relación. Puesto que a a1 a2 0 a3 a4 1 a5 Figura 25-1 2 Por lo general, en un mapeo se dice que los miembros del dominio se ubican sobre los miembros del rango. Para mantener la consistencia con la definición de medición dada antes y para poder concebir siempre el procedimiento de medición como una función, “se ha dado la vuelta” al mapeo. Esta concepción del mapeo, además, es consistente con la definición anterior de función como una regla que asigna a cada miembro el dominio de un conjunto alguno de los miembros del rango. La regla plantea la forma en la que deben ordenarse los pares. 446 MEDICIÓN cada miembro de A, el dominio, se asigna uno y tan sólo un objeto de B, el rango, la relación es una función. ¿Son entonces funciones todos los procedimientos de medición? Sí lo son, siempre que los objetos que estén siendo medidos se consideren el dominio y que los valores numéricos que estén siendo asignados a los objetos, o representados por ellos, se consideren el rango. He aquí otra forma de unir las ideas de conjunto, relación-función y medición. Recuérdese que una relación es un conjunto de pares ordenados. Así lo es también una función. Cualquier procedimiento de medición, entonces, establece un conjunto de pares ordenados, siendo el primer miembro de cada par el objeto medido y el segundo miembro el valor numérico asignado al objeto de acuerdo con la regla de medición, cualquiera que ésta sea. Por lo tanto, es posible escribir una ecuación general para cualquier procedimiento de medición: f = {(x, y)}; x = cualquier objeto, y y = un valor numérico} Esto se lee: “La función, f, o la regla de correspondencia, es igual al conjunto de pares ordenados (x, y) de tal forma que x es un objeto y cada y correspondiente es un valor numérico”. Esta es una regla general y podrá ajustarse a cualquier caso de medición. Se citará otro ejemplo para hacer más concreto el análisis. Los eventos a ser medidos, las x, son cinco niños. Los valores numéricos, las y, son los rangos 1, 2, 3, 4 y 5. Supóngase que f es una regla que instruye al profesor de la siguiente manera: “Dé el rango de 1 al niño que tenga la mayor motivación por hacer el trabajo escolar. Dé el rango de 2 al niño que tenga la siguiente mayor motivación por hacer el trabajo escolar, y así sucesivamente hasta el rango de 5, el cual deberá usted asignar al niño que tenga la menor motivación para hacer el trabajo escolar”. La medición o la función se muestra en la figura 25-2. Nótese que f, la regla de correspondencia, podría haber sido: “Si un niño tiene una alta motivación por el trabajo escolar, dele un 1, pero si un niño tiene una baja motivación por el trabajo escolar, dele un 0”. Entonces el rango se convierte en {0, 1}. Esto sencillamente significa que el conjunto de cinco anos ha sido dividido en dos subconjuntos, a cada uno de los cuales se asignaran, por medio de f, los valores X1 1 X2 2 X3 3 X4 4 X5 5 Dominio (niños) Rango (rangos) Figura 25-2. FUNDAMENTOS DE LA MEDICIÓN 447 numéricos de 0 y 1. Un diagrama de esto se vería como la figura 25-1, con el conjunto A como el dominio y el conjunto B como el rango. Se regresará a las reglas. Aquí es donde la evaluación toma forma. Las reglas pueden ser “buenas” o “malas”. Con “buenas” reglas se tienen mediciones, “buenas”, o sólidas, manteniendo constante todo lo demás. Con “malas” reglas se tienen mediciones “malas”, o deficientes. Muchas cosas son fáciles de medir, porque las reglas son fáciles de redactar y medir. Medir sexo es fácil, por ejemplo, puesto que se deben usar varios criterios sencillos y bastantes claros para determinar el sexo y para indicar al investigador cuando asignar un 1 y cuando un 0. También es fácil medir otras características humanas: el color del pelo, el color de los ojos, la estatura, el peso. Por desgracia, casi todas las características humanas son mucho más difíciles de medir, sobre todo porque es difícil diseñar reglas claras que sean “buenas”. Sin embargo, siempre se deben tener reglas de algún tipo para medir algo. ISOMORFISMO ENTRE MEDICIÓN Y “REALIDAD” Como ya se ha visto, la medición puede ser algo sin significado alguno. ¿Cómo puede evitarse esto? La definición de los conjuntos de objetos que se están midiendo, la definición de los conjuntos numéricos a partir de los cuales se asignan valores numéricos a los objetos que se están midiendo, y las reglas de asignación y correspondencia tienen que estar ligadas con la “realidad”. Cuando se mide la dureza de los objetos, existe poca dificultad. Si una sustancia a puede rasgar a b (y no al revés), entonces a es mas dura que b. En forma semejante, si a puede rasgar a b, y b puede rasgar a c, entonces (quizá) a puede rasgar a c. Estos son aspectos empíricos que pueden probarse con facilidad, de manera que es posible encontrar un orden de rango de dureza. Un conjunto de objetos puede ser medido respecto de su dureza mediante algunas pruebas de rasgueo, y se pueden asignar valores numéricos para indicar los grados de dureza. Se dice que el procedimiento de medición y el sistema de números son isomórficos respecto de la realidad. El isomorfismo significa identidad o similitud de forma. Se hace esta pregunta: ¿Es este conjunto de objetos isomórfico respecto de aquel conjunto de objetos? ¿Son los dos conjuntos el mismo o son similares en algún aspecto formal? Por ejemplo, los dos conjuntos de la figura 25-3 son isomórficos respecto de los números cardinales: los dos tienen la característica de “tres”. En la medición, debe hacerse esta pregunta: ¿Tienen los procedimientos de medición A B C Figura 25-3. 448 MEDICIÓN que están empleándose alguna correspondencia racional y empírica con la “realidad”? Para mostrar la naturaleza de este fenómeno del isomorfismo, se puede utilizar de nuevo la idea de la correspondencia de los conjuntos de objetos. Se podría desear medir la persistencia de siete individuos. Supóngase también que yo soy un ser omnisapiente. Sé de manera exacta cuánta persistencia posee cada individuo, es decir, conozco los “verdaderos” valores de persistencia de cada individuo (supóngase que la persistencia ha sido definida en forma adecuada). Pero la persona que hace la medición no conoce estos “verdaderos” valores: es necesario que evalúe la persistencia de los individuos en alguna forma falible y que piense que ha encontrado tal forma. Por ejemplo, el investigador podría evaluar la persistencia dando a los individuos tareas a ejecutar y anotando el tiempo total que cada individuo requiere para completar una tarea, o podría anotar el número total de veces que él trata de hacer una tarea antes de que cambie a alguna otra actividad.3 El investigador usa su método, mide la persistencia de los individuos y termina con, por ejemplo, los valores 6, 6, 4, 3, 3, 2, 1. Ahora yo conozco los “verdaderos” valores. Estos son: 8, 5, 2, 4, 3, 3, 1. Este conjunto de valores es “realidad”. La correspondencia de su conjunto con la “realidad” se muestra en la figura 25-4. En dos casos, se han evaluado los valores “verdaderos” en forma exacta. Se han “descartado” todos los demás. Sin embargo, solo uno de estos valores “descartados” es serio, y existe una justa correspondencia entre los dos órdenes de rango de los valores. Nótese también que en mi omnisapiencia yo sabía que los valores “verdaderos” de persistencia iban de 0 a 8, mientras que el sistema de medición solo abarca de 1 a 7. Aunque este ejemplo es un poco fantasioso, muestra en una forma aproximada el problema referente a la naturaleza del isomorfismo. La pregunta final que debe hacerse respecto de cualquier procedimiento de medición es: ¿El procedimiento de medición es isomórfico respecto de la realidad? No se estuvo muy alejado de medir la persistencia. El único problema es que rara vez se descubre en una forma tan sencilla el grado de correspondencia respecto de la “realidad” de las mediciones. ¡De hecho, con frecuencia ni siquiera se sabe si se esta midiendo lo que se trata de medir! A pesar de esta dificultad, los científicos deben comprobar, de alguna manera, el isomorfismo con la “realidad” de los números de medición de los juegos que juegan. “Realidad” 0 1 2 3 4 5 6 7 Medición 1 2 3 4 5 6 7 Figura 25-4. 3 N. Feather, “The Study of Persistence”, Psychological bulletin, 59 (1962), 94. 8 FUNDAMENTOS DE LA MEDICIÓN 449 PROPIEDADES, PROYECCIONES, E INDICADORES DE OBJETOS Se dice que se miden objetos, pero esto no es del todo cierto. Se miden las propiedades, o las características, de esos sujetos. Sin embargo, aun esta clasificación no es del todo cierta. En realidad, se miden los indicadores de las propiedades de los objetos, de modo que cuando se dice que se miden objetos en realidad se está diciendo que se miden los indicadores de las propiedades de los objetos, de modo que cuando se dice que se miden objetos en realidad se esta diciendo que se miden los indicadores de las propiedades de los objetos. Esto por lo general es cierto en toda la ciencia, aunque las propiedades de algunos objetos naturales están mas cerca de la observación directa que otros. Por ejemplo, la propiedad referente al sexo asociado con objetos animales está relacionada en forma estrecha con la observación directa. Tan pronto como las propiedades físicas relativamente sencillas se quedan atrás y surgen propiedades más complejas y elusivas –que son de mucho mayor interés para los científicos sociales y los educadores- la observación directa de las propiedades es imposible. La hostilidad no puede ser observada en forma directa, ni tampoco pueden serlo la moral, la ansiedad, la inteligencia, la creatividad y el talento. Siempre se debe inferir estas propiedades o características a partir de la observación de los indicadores supuestos de las propiedades. Indicador es solo una palabra conveniente que se usa para designar algo que se refiere a otra cosa. Si un muchacho molesta en forma continua a otos chicos, es posible decir que su conducta es un indicador de su hostilidad fundamental. Si las manos de alguien sudan en exceso, se puede decir que esa persona es ansiosa. Una niña toca un impromptu de Schubert en forma hermosa, se dice que tiene talento. Si un niño marca de manera correcta cierto numero de partidas de tipo objetivo en una prueba de logro, se dice que tiene cierto nivel de logro. En cada uno de estos casos, algún comportamiento identificable es un indicador de una propiedad fundamental. Resulta obvio que es un terreno más movedizo cuando se hacen tales inferencias a partir de un comportamiento observado que cuando se observan de modo directo propiedades como el dolor de la piel, la estatura y el sexo. Medir la cooperatividad, la dependencia y la imaginación de un niño es muy diferente de medir su altura, su peso o el desarrollo de sus muñecas. El proceso fundamental de medición es el mismo, pero las reglas son mucho más difíciles de prescribir. Además, las observaciones de las propiedades psicológicas están mucho más alejadas de las propiedades reales de lo que están de las propiedades físicas. Esta es quizá la dificultad individual más grande de la medición psicológica y educativa. Los indicadores a partir de los cuales se infieren las propiedades, son especificadas mediante definiciones operacionales, que especifican las actividades o las “operaciones” necesarias para medir variables o constructos. Un constructo es un nombre inventado para una propiedad. Muchos contructos han sido usados en capítulos anteriores: autoritarismo, logro, clase social, inteligencia, persistencia y otros4. Los constructos, denominados común e inadecuadamente variables, se definen en dos formas generales en la ciencia: mediante otros constructos y por procedimientos experimentales y de medición. Estas se llamaban antes definiciones constitutivas y operacionales. Una definición operacional es necesaria para medir una pro4 Los conceptos o constructos que se analizan también se denominan “variables latentes”. Esta es una importante expresión que esta siendo utilizada de manera fructífera en lo que se ha llamado análisis de estructuras de covarianza, o el llamado análisis casual. Una variable latente es un constructo, una variable no observada, que se presume fundamenta diversos comportamientos y que se usa para “explicar” estos comportamiento. La “habilidad verbal”, el “conservadurismo” y la “ansiedad”, por ejemplo, son variables latentes. Su uso será estudiado mas adelante, cuando se estudie el análisis factorial y el análisis de estructuras de covarianza 450 MEDICIÓN piedad o un constructo. Esto se hace mediante la especificación de las observaciones de los indicadores de comportamiento de las propiedades. Los valores numéricos se asignan a los indicadores conductuales de las propiedades. Así, después de hacer observaciones de los indicadores, los números (valores numéricos) son sustituidos por los indicadores y analizados de manera estadística. Como ejemplo, considérese a los investigadores que trabajan en la relación entre inteligencia y honestidad. Ellos definen operacionalmente inteligencia como el marcador de una prueba de inteligencia. La honestidad se define, desde el punto de vista operacional, como las observaciones hechas en una situación ideada que permite a los alumnos hacer o no trampa. Los valores numéricos de inteligencia asignados a los alumnos pueden ser el numero total de respuestas correctas en una prueba, o alguna otra forma de calificación. Los valores numéricos de honestidad asignados a los alumnos son el número de veces que no hicieron trampa cuando podrían haberlo hecho. Los dos conjuntos de números que pueden estar correlacionados o pueden analizarse de alguna otra forma. El coeficiente de correlación, por ejemplo, es .55, significativo al nivel de .01. Todo esto es muy sencillo y del todo familiar. Lo que no es tan sencillo y tan familiar es esto: si los investigadores llegan a la conclusión de que existe una relación positiva significativa entre inteligencia y honestidad, estarán dando un “brinco” inferencial considerable de los indicadores conductuales bajo la forma de marcas sobre papel y de observaciones de conducta “tramposa”, a propiedades psicológicas. Debe ser obvio que pueden estar equivocados. NIVELES DE MEDICIÓN Y DE ESCALAS Los niveles de medición, las escalas asociadas con los niveles y las estadísticas apropiadas a los niveles son problemas complejos, e incluso polémicos. Las dificultades surgen sobre todo del desacuerdo en cuanto a las estadísticas que pueden utilizarse en forma legitima en los diferentes niveles de medición. El concepto de medición de Stevens y su posición, ya citados, son un panorama amplio que, con un punto de vista liberal, se sigue en este libro5 En el análisis que se presenta a continuación, se considera primero el fundamental problema científico y de medición referente a la clasificación y a la enumeración. 5 Una posición más restrictiva –y sin embargo defendible- exige que las diferencias entre las mediciones sean interpretables como diferencias cuantitativas en la propiedad medida. “Cuantitativo”, desde el punto de vista de algunos expertos, significa que una diferencia de magnitud entre dos valores de atributos representa una correspondiente diferencia cuantitativa en los atributos. Véase L. Jones “The Nature of Measurement”. In R. Thorndike, ed., Educational Measurements, 2d ed. Washington, D.C.: American Council on Education, 1971, pp. 553-355. En un sentido estricto, este punto de vista descarta, como medición, las escalas ordinales y nominales. Pienso que las experiencias reales de medición en las ciencias del comportamiento y de la educación justifican una posición mas relajada. Una vez más, no es algo de suma importancia, siempre y cuando el estudiante entienda las ideas generales que se están presentando. Recomiendo que los estudiantes mas avanzados lean las excelentes presentaciones de Torgerson y de Nunnally: W. Torgerson, Theory and Methods of Scaling. New York: Wiley, 1958, caps. 1 and 2; J. Nunnaly, Psychometric Theory, 2ª ed. New York: McGraw-Hill, 1978, cap. 1. Un sobresaliente y mas antiguo tratado que ha influido en forma determinante en este texto es: J. Guilford, Psychometric Methods. 2ª. Ed. New York: McGraw-Hill, 1954, cap. 1. El estudiante curioso disfrutará la serie de artículos sobre esta controversia publicados en R. Kirk, ed., Statistical Issues: A Reader for the Behavioral Sciences. Monterrey, Calif.: Brooks/Cole, 1972, cap. 2. Los lectores que pretendan realizar investigaciones y que siempre deberán enfrentarse a los problemas de medición deberían leer cuidadosa y repetidamente la excelente presentación de Nunnaly acerca de los problemas y su solución: Nunnally, op. cit., p. 24-33. FUNDAMENTOS DE LA MEDICIÓN 451 El primero y más elemental paso en cualquier procedimiento de medición consiste en definir los objetos del universo de información. Supóngase que U, el conjunto universal, se define como todos los alumnos del décimo grado de una preparatoria. A continuación, deben ser definidas las propiedades de los objetos de U. Toda medición requiere que U se divida por lo menos en dos subconjuntos. La forma más elemental de medición sería clasificar o categorizar todos los objetos en función de si poseen o no cierta característica. Supóngase que esta característica es la condición masculina. Se divide U en masculinos y no masculinos, o masculinos y femeninos. Estos son, desde luego, dos subconjuntos de U, o una partición de U (recuérdese que la partición de un conjunto consiste en dividirlo en subconjuntos que sean mutuamente excluyentes y exhaustivos. Es decir, cada objeto del conjunto debe ser asignado a uno y sólo a un subconjunto, y todos los objetos el conjunto de U deben ser asignados así). Lo que se hizo es clasificar los objetos de interés. Se han puesto en categorías: se ha hecho con ellos una partición. La obvia simplicidad de este procedimiento parece causar dificultades a los estudiantes. Los individuos pasan gran parte de sus vidas categorizando cosas, eventos y personas. La vida no podría seguir sin tal categorización; sin embargo, parece difícil asociar el proceso con la medición. Después de encontrar un método de clasificación se tiene, en efecto, una regla para determinar qué objetos de U deben quedar dentro de qué clases, subconjuntos o particiones. Se utiliza esta regla y los objetos del conjunto son puestos dentro de los subconjuntos. Aquí están los chicos; aquí están las chicas. Fácil. Aquí están los chicos de clase media; aquí están los chicos de clase trabajadora. No tan fácil, pero no tan difícil. Aquí están los delincuentes; aquí están los no delincuentes. Más difícil. Aquí están los sobresalientes; aquí están los de nivel promedio; aquí están los perezosos. Mucho más difícil. Aquí están los creativos; aquí están los no creativos. Muchísimo más difícil. Después de que han sido clasificados los objetos del universo en subconjuntos designados, es posible contar a los miembros de los conjuntos. En caso de dicotomía, la regla para contar se dio en el capitulo 14: Si un miembro de U tiene la característica en cuestión, por ejemplo, cualidad de masculino, entonces asígnesele un 1. Si el miembro no tiene la característica, asígnele un 0 (véase la fig. 25-1). Cuando los miembros del conjunto son contados en esa forma, todos los objetos de un subconjunto se consideran iguales entre sí y desiguales respecto de los miembros de otros subconjuntos. Medición Nominal Existen cuatro niveles generales de medición: nominal, ordinal, de intervalo y de razón. Estos cuatro niveles conducen a cuatro tipos de escalas. Algunos autores admiten solo las mediciones ordinal, de intervalo y de razón, mientras que otros dicen que las cuatro pertenecen a la familia de la medición. No es necesario preocuparse mucho por ello, en tanto se entiendan las características de las diferentes escalas y niveles. Las reglas utilizadas para asignar valores numéricos a objetos definen el tipo de escala y nivel de medición. El nivel mas bajo de medición es la medición nominal (véase la anterior exposición de categorización). Los números asignados a los obje- 452 MEDICIÓN tos son valores numéricos sin un significado numeral; no pueden ser ordenados o añadidos. Son etiquetas muy similares a las letras que se usan para designar conjuntos. Si se asigna a los individuos o a los grupos los valores 1, 2, 3, . . ., estos valores numéricos son solo nombres. Por ejemplo, a los jugadores de béisbol y fútbol se les asignan tales números. A los teléfonos también. A los grupos se les pueden dar las etiquetas I, II, III o A1, A2 Y A3. En el pensamiento cotidiano y en la vida diaria se utiliza una medición nominal. Uno identifica a los demás como “hombres”, “mujeres”, “protestantes”, “australianos”, etcétera. En cualquier caso, los símbolos asignados a los objetos, o más bien a los conjuntos de objetos, constituyen escalas nominales. Algunos expertos piensan que esto no es una medición, como ya se comentó. Tal exclusión de la medición nominal habría evitado que gran parte del procedimiento de la investigación social científica se llama medición. Puesto que la definición de medición es satisfecha, y puesto que los miembros de los conjuntos etiquetados pueden ser contados y comparados, parecería que los procedimientos nominales son medición. Los requerimientos de la medición nominal son sencillos. A todos los miembros de un conjunto se le asigna el mismo valor numérico, y no se asigna el mismo valor numérico a dos conjuntos. La medición nominal –por lo menos en una forma sencilla- se expreso en la figura 25-1, donde los objetos del rango, {0, 1}, fueron representados en las a, los objetos de U, las cinco personas, por la regla: si x es masculino, asígnesele 1; si x es femenino, asígnesele 0. Esta es la forma de cuantificar una medición nominal cuando se tiene sólo una dicotomía. Cuando la partición contiene mas de dos categorías, debe utilizarse algún otro método. Básicamente, la cuantificación de medición nominal equivale a contar los objetos situados dentro de las celdillas de los subconjuntos o particiones. Medición ordinal La medición ordinal requiere que los objetos de un conjunto puedan tener un rango y ser ordenados con base en alguna característica o propiedad definida de manera operacional. Debe satisfacerse el llamado postulado de transitividad: si a es mayor que b, y b es mayor que c, entonces a es mayor que c. Otros símbolos o palabras pueden sustituirse por “mayor que”, “menor que”, “precede”, “domina”, etc.; la mayor parte de la investigación del comportamiento depende de este postulado. Debe ser posible hacer afirmaciones ordinales o con rango y orden similares a las que se acaba de emplear. Es decir, supóngase que se tienen tres objetos, a, b, y c, y que a es mayor que b, y b es mayor que c. Si podemos, es posible decir con justificación que también a es mayor que c, entonces la principal condición para la medición ordinal queda satisfecha. Sin embargo, hay que tener cuidado. Puede parecer que una relación satisface el postulado de transitividad, pero en realidad puede no hacerlo. Por ejemplo, es posible decir siempre: a domina a b, y b domina a c: por lo tanto, ¿a domina a c? Piénsese en un esposo, en una esposa y en un niño. Piénsese también en las relaciones “ama”, “gusta”, “es amigable con” o “acepta”. En tales casos, la transitividad debe ser demostrada por el investigador. El procedimiento puede generalizarse en tres formas. Una, cualquier numero de objetos de cualquier tipo puede medirse ordinalmente por una mera extensión a a, b, c, . . ., n (aunque dos objetos puedan algunas veces ser iguales, la medición ordinal seria aun posible). Solo se necesita ser capaz de decir a > b > c > . . . > n respecto de alguna propiedad. FUNDAMENTOS DE LA MEDICIÓN 453 La segunda extensión consiste en utilizar propiedades o criterios combinados. En lugar de usar sólo una propiedad, se pueden emplear dos o más. Por ejemplo, en vez de ordenar a un grupo de estudiantes universitarios respecto de sus logros académicos mediante promedio de sus calificaciones, es posible ordenarlos con base en los criterios combinados de promedios de calificaciones y puntuaciones de pruebas. (Los promedios de calificaciones también son puntuaciones compuestas). La tercera extensión se logra mediante criterios distintos a los de “mayor que”. El “menor que” se le ocurre a uno inmediatamente. “Precede a”, “está por arriba de” y “es superior a” pueden ser criterios útiles. De hecho, se podría sustituir un símbolo distinto a “>” o “<”. Uno de tales símbolos es “!”. Puede ser usado para designar cualquier operación, como las que se acaban de nombrar, en la cual el postulado de transitividad quede satisfecho: a ! b podría significar “a precede a b” o “a esta subordinada a b” y a ! b ! c podría significar “a es superior a b, b es superior a c, y a es superior a c”. Los valores numéricos asignados a objetos ordenados se denominan valores de rango. Sea R igual al conjunto de objetos ordenados: R = {a > b > . . . > n}. Sea R* igual al conjunto de valores ordenados R* = {1, 2, . . ., n}. Se asignan los objetos de R* a los objetos de R en la siguiente forma: al objeto más grande se le asigna 1, al siguiente en tamaño se le asigna 2, y así sucesivamente hasta el objeto más pequeño, al cual se le asigna el ultimo valor numérico de la serie particular. Si se usa este procedimiento, los valores de rango asignados están en el orden inverso. Si, por ejemplo, existen cinco objetos, siendo a el más grande, b el siguiente, hasta e, el más pequeño, entonces se tiene: Objetos a b c d e R 1 2 3 4 5 R* 5 4 3 2 1 Desde luego, es posible saltarse un paso al asignar R* en forma directa: se asigna 5 a a, 4 a b, hasta 1 a e. Los números ordinales indican un orden de rango y nada más. Los números no indican cantidades absolutas, ni tampoco indican que los intervalos entre los números son iguales. Por ejemplo, no puede suponerse que, debido a que los valores numéricos se encuentran igualmente espaciados, las propiedades fundamentales que representan sean espaciadas en forma igual. Si dos sujetos tienen los rangos 8 y 5, y otros dos sujetos tienen los rangos 6 y 3, no se puede decir que las diferencias entre el primero y el segundo pares son iguales. Tampoco hay forma de saber si cualquiera de estos individuos no tiene ninguna de las propiedades que se están midiendo. Las escalas de orden de rango no son escalas con intervalos iguales ni tienen puntos absolutos de cero. Medición de intervalo (escalas) Las escalas de intervalo o de intervalos iguales poseen las características de escalas nominales y ordinales, en especial el orden de rango. Además, las distancias numéricamente iguales en las escalas de intervalo representan distancias iguales en la pro 454 MEDICIÓN piedad que se está midiendo. Así, supónganse que se hubieran medido cuatro objetos en una escala de intervalo y que se hubieran obtenido los valores 8, 6, 5 y 3. Entonces, se puede decir de manera legitima que la diferencia entre el primero y el tercer objetos en la propiedad medida, 8 – 5 = 3, es igual a la diferencia entre el segundo y el cuarto objeto, 6 – 3 = 3. Otra forma de expresar la idea de intervalos iguales consiste en decir que los intervalos pueden ser añadidos o sustraídos. Una escala de intervalo se supone de la siguiente manera: a 1 b 2 c 3 d 4 e 5 El intervalo de a a c es 3 – 1 = 2. El intervalo de c a d es 4 – 3 = 1. Se pueden añadir estos dos intervalos: (3 – 1) + (4 – 3) = 2 + 1 = 3. Expresado en una ecuación: (d – a) = (c – a) + (d – c). Si estos intervalos fuesen cinco estudiantes medidos con una escala de intervalo de logro, entonces las diferencias en logro entre los estudiantes a y c, y b y d serían iguales. Sin embargo, seria imposible decir que el logro de d fue dos veces más grande que el del alumno b (tal afirmación requeriría de un nivel mas elevado de medición). Obsérvese que no son las cantidades o los montos lo que se añade o sustrae; son los intervalos o distancias. Medición de razón (escalas) El nivel mas alto de medición es la medición de razón, y la medición ideal del científico es la escala de razón. Esta, además de poseer las características de las escalas nominales, ordinales y de intervalo, tiene un cero absoluto o natural que tiene significado empírico. Si una medición es de cero en una escala de razón, entonces existe una base para decir que algún objeto no tiene ninguna de las propiedades que se están midiendo. Puesto que existe un cero absoluto o normal, todas las operaciones aritméticas son posibles, incluyendo la multiplicación y la división. Los números de la escala indican las cantidades reales de la propiedad que se mide. Si existiera una escala de razón para medir el logro, entonces sería posible decir que un alumno que tuviera una puntuación de 8 en la escala tiene un nivel de logro dos veces mayor que el de un alumno con una puntuación de 4. COMPARACIÓN DE ESCALAS: CONSIDERACIONES PRACTICAS Y ESTADÍSTICAS Se han analizado ya las características básicas de los cuatro tipos de medición y sus escalas acompañantes. ¿Qué tipos de escalas se usan en la investigación educativa y del comportamiento? Se utilizan sobre todo las nominales y ordinales, aunque existe una buena probabilidad de que muchas escalas y pruebas empleadas en la medición psicológica y educativa aproximen bastante bien la medición de intervalo para propósitos prácticos, como se verá. Primero, considérese la medición nominal. Cuando los objetos se dividen en dos, tres o más categorías con base a la membresía de grupo –sexo, identificación étnica, casado-soltero, protestante-católico-judío, etcétera- la medición es nominal. FUNDAMENTOS DE LA MEDICIÓN 455 Cuando las variables continuas son convertidas a atributos, por ejemplo cuando se dividen los objetos en alto-bajo y viejo-joven, se tiene lo que puede llamarse una medición cuasinominal. Aunque los valores se pueden ordenar por lo menos en cuanto a rango, en efecto se ven reducidos a 1 y 0. Es instructivo estudiar las operaciones numéricas que son, en sentido estricto, legitimas en cada tipo de medición. Con la medición nominal, el conteo de números de casos en cada categoría y subcategoría es, desde luego, permisible. Pueden utilizarse estadísticas de frecuencia como x², porcentajes y ciertos coeficientes de correlación (coeficientes de contingencia). Esto suena muy vago. En realidad es algo bueno. Un buen principio que se debe recordar es éste: si no se puede usar ningún otro método, casi siempre se pueden hacer una partición o partición cruzada con los sujetos. Si se están estudiando las relaciones entre dos variables y no se tiene ningún modo de medirlas adecuadamente en una forma ordinal o de intervalo, quizá se pueda encontrar alguna forma de dividir los objetos de estudio por lo menos en dos grupos. Por ejemplo, al estudiar la relación entre la motivación de los miembros de la junta educativa para ser miembros de la junta y su religión, como lo hicieron Gross y colegas, se pueden tener juicios bien fundados para dividir la muestra de los miembros de la junta en aquellos que tienen una “buena” motivación y que tienen una “mala” motivación. De este modo, es posible hacer una partición cruzada entre la religión y la dicotomía de la motivación, y estudiar así la relación. Los puntajes de las pruebas de inteligencia, de aptitudes y de personalidad son, hablando en forma estricta y básica, ordinales. Indican con mayor o menor exactitud no las cantidades de inteligencia, aptitudes y rasgos de personalidad de los individuos, sino más bien las posiciones de orden por rango de los individuos. Para ver esto, uno se debe dar cuenta de que las escalas ordinales no poseen las características deseables de intervalos iguales o ceros absolutos. Los puntajes de pruebas de inteligencia son algunos ejemplos. No es posible decir que un individuo tiene una inteligencia de cero. Si está vivo, debe tener una puntuación por arriba de cero. Pero no existe el cero absoluto en una escala de pruebas de inteligencia. El cero es arbitrario, y sin un cero absoluto, la adición de las cantidades de inteligencia tiene poco significado, porque los puntos arbitrarios de cero pueden conducir a sumas diferentes. En una escala con un punto arbitrario de cero se realiza la siguiente suma: 2 + 3 = 5. Así, la suma está cinco unidades de escala por arriba de cero. Pero si el punto arbitrario de cero es inexacto y punto “real” de cero está, en la posición de la escala, cuatro puntos mas abajo que la posición arbitraria de cero, entonces los 2 y 3 anteriores deben en realidad ser 6 y 7, y 6 + 7 = 13. La falta de un cero real en las escalas ordinales no es tan seria como la falta de intervalos iguales. Aun sin un cero real, se pueden añadir las distancias dentro de una escala, siempre que esas distancias sean iguales (empíricamente). La situación podría ser un tanto como se indica en la figura 25-5. La escala de la parte superior (escala “verdadera”) indica los valores “verdaderos” de una variable. La escala de la parte inferior (escala ordinal) indica la escala de orden por rango usada por un investigador. En otras palabras, el investigador ha ordenado muy bien el rango de siete personas, pero sus valores numéricos ordinales, que se ven iguales en el intervalo, no son “verdaderos”, aunque pueden ser representaciones muy exactas de los hechos empíricos. De manera estricta, las estadísticas que pueden ser utilizadas con las escalas ordinales incluyen medidas de orden por rango como el coeficiente de correlación de orden por rango, p, la W de Kendall y el análisis de varianza de orden por rango, las medianas y los percentiles. Si sólo estos estadísticos (y otros iguales a ellos) son 456 MEDICIÓN Escala “verdadera” 1 Escala ordinal 2 3 1 2 4 3 5 4 6 5 6 7 7 Figura 25-5. legítimos, ¿cómo pueden usarse estadísticos del tipo de r, t y F con lo que en realidad son medidas ordinales? Y sin embargo se utilizan así, sin escrúpulos por parte de la mayoría de los investigadores. Aunque este no es un punto de discusión, la situación no es tan difícil como parece. Torgerson afirma que algunos tipos de origen natural han sido diseñados para ciertos tipos de medición.6 Al medir las preferencias y aptitudes, por ejemplo, los puntos neutrales (en cualquier lado que se encuentren los grados positivos o negativos de favoritismo, aprobación, gusto y preferencia) pueden considerarse orígenes naturales. Por otra parte, las escalas de razón, aunque deseables, no son por completo necesarias, pues lo principal que se necesita hacer en la medición psicológica puede realizarse con escalas de intervalos iguales. La falta de intervalos iguales es más seria, puesto que las distancias dentro de una escala teóricamente no pueden ser añadidas sin igualdad de intervalos. Sin embargo, aunque la mayor parte de las escalas psicológicas son sobre todo ordinales, es posible, con considerable certeza, suponer a menudo la igualdad de intervalos. El argumento es evidente. Por ejemplo, si se tienen dos o tres medidas de la misma variable, y si todas estas medidas están relacionadas en forma sustancial y lineal, entonces se pueden suponer intervalos iguales. Este supuesto es valido porque entre mas se acerque una relación a la linealidad, mas tenderán a ser iguales los intervalos de las escalas. Esto también se aplica, por lo menos hasta cierto punto, a determinadas medidas psicológicas como las pruebas y las escalas de inteligencia, logro y aptitudes. Un argumento relacionado con este tema es que muchos de los métodos de análisis utilizados funcionan muy bien en la mayor parte de las escalas psicológicas. Es decir, los resultados obtenidos del uso de las escalas y del supuesto de intervalos iguales son del todo satisfactorios. El punto de vista adoptado en este libro es, entonces, pragmático, en el sentido de que el supuesto de igualdad de intervalo funciona. Sin embargo, existe un dilema: si se emplean medidas ordinales como si fuesen medidas de intervalo o de razón, es posible errar al interpretar los datos y las relaciones inferidas a partir de ellos, aunque el peligro quizá no es tan grave como se ha hecho que parezca. No existe problema con los números, como números. Ellos no conocen la diferencia entre p y r, o entre la estadística paramétrica y la no paramétrica, ni tampoco conocen los supuestos que apoyan su uso. Pero uno si sabe, o debe saber, las diferencias y las consecuencias de ignorarlas. Por otra parte, si uno se atiene de manera estricta a las reglas, descarta poderosas formas de medición y análisis y se queda con herramientas inadecuadas para tratar los problemas que desea resolver.7 6 Torgerson, op. cit., p. 30 De nuevo, véase Nunnally, op. cit., pp. 24-33, para una ilustrativa exposición de éste y otros asuntos de la misma naturaleza 7 FUNDAMENTOS DE LA MEDICIÓN 457 ¿Cuál es la respuesta, la solución del conflicto? Parte de la respuesta fue dada antes: es probable que la mayor parte de las escalas psicológicas y educativas se aproximen bastante bien a la igualdad de intervalo. En aquellas situaciones en las que existe seria duda en cuanto a la igualdad de intervalo, existen medios técnicos para tratar algunos problemas. El investigador competente debe saber algo acerca de los métodos de valoración escalar y de ciertas transformaciones que cambian las escalas ordinales en escalas de intervalo8.8 En el estado actual de las técnicas de medición, no es posible estar seguro de que los instrumentos de medición tengan intervalos iguales. Es importante hacer la pregunta: ¿Qué tan serias son las distorsiones y errores originados al tratar las mediciones ordinarias como si fuesen mediciones de intervalo? Con cuidado en la construcción de instrumentos de medición, y en especial con cuidado en la interpretación de los resultados, evidentemente las consecuencias no son serias. El mejor procedimiento parecería ser tratar las mediciones ordinarias como si fuesen mediciones de intervalo, pero es necesario estar siempre alerta ante la imposibilidad de una fuerte desigualdad de intervalos. Debe aprenderse tanto como sea posible acerca de las características de las herramientas de medición. Una gran cantidad de información útil ha sido obtenida mediante este enfoque, y se han producido avances científicos en psicología, sociología y educación. En síntesis, es poco probable que los investigadores se desvíen si toman en cuenta este consejo, si tienen cuidado en su aplicación9.9 (Nota: Las sugerencias para estudio de los tres capítulos de la Parte 8 aparecen al final del capítulo 27). 8 M. Barlett, “The Use of Transformations”, Biometrics, 3 (1947), 39-52 (sobre todo pp. 49-50); Guiford, op.cit.,cap.8. El tema de las transformaciones, sus propósitos y usos es importante, pero no se le ha dado la atención que merece. Dos tratamientos autorizados e informativos son: G. Snedecor andW. Cochran, Statistical Methods, 6ª. Ed. Ames, IowaState University Press, 1967, pp. 325ff.; F. Mosteller and R. Bush, “Selected Quantitative Techiques”. In G. Lindzey, ed., Handbook of Social Psychology, vol. 1 Cambridge, Mass.: Addison – Wesley, 1954, pp. 324-328. 9 Una útil revisión acerca de la literatura sobre el problema de las escalas de medición y de los estadísticos es P. Gardner, “Scales and Statistics”. Review of Educational Research, 45 (1975), 43-57.