Fundamentos de la Medición - Maestría en Educación Abierta y a

Anuncio
UNIVERSIDAD NACIONAL ABIERTA
DIRECCIÓN DE INVESTIGACIONES Y POSTGRADO
MAESTRÍA EN EDUCACIÓN ABIERTA Y A DISTANCIA
Epistemología e Investigación
Unidad Curricular: Metodología de la Investigación II
Capítulo 25:
Fundamentos de la Medición
Kerlinger, F. (1988). Investigación del
Comportamiento. Segunda Edición. México:
Editorial McGraw-Hill.
(compilación con fines instruccionales)
Capítulo 25
Fundamentos de la medición
“En su sentido más amplio, la medición es la asignación de valores numéricos a objetos o
eventos de acuerdo con reglas”1. Esta definición expresa en forma sucinta la naturaleza básica de le
medición. Sin embargo, para entenderla se requiere de la definición y la explicación de cada
término importante –tarea a la cual se dedica gran parte de este capítuloSupóngase que se solicita a un juez que se sitúe a siete pies de distancia de un grupo de
estudiantes. Se pide al juez mirar a los estudiantes y luego estimar el grado en el cual cada uno de
ellos posee cinco atributos: amabilidad, fuerza de carácter, personalidad, habilidad musical e
inteligencia. Las estimaciones deberán darse en forma numérica con una escala de números que va
de 1 a 5, indicando con 1 una cantidad muy pequeña de la característica en cuestión y con 5 una
gran cantidad de ella. En otras palabras, el juez, con sólo mirar a los estudiantes, deberá evaluar qué
tan “amables” son, qué tan “fuertes” son sus caracteres, etc., mediante el uso de los números 1,2,3,4
y 5 para indicar las cantidades de cada característica que los estudiantes poseen.
Este ejemplo puede ser un poco ridículo. Sin embargo, la mayoría de la gente pasa por gran parte
del mismo procedimiento durante su vida. Con frecuencia, uno juzga qué tan “amables”, qué tan
“fuertes”, qué tan “inteligentes” son las personas con tan sólo mirándolas y hablando con ellas. Esto
parece en verdad ridículo cuando se da como ejemplo serio de medición. Ridículo o serio, es un
ejemplo de medición, puesto que satisface la definición. El juez asignó valores numéricos a
“objetos” de acuerdo con las reglas. Se especificaron los objetos, los valores numéricos y las reglas
para la asignación de los valores numéricos a los objetos. Los valores numéricos fueron 1, 2, 3, 4 y
5; los objetos fueron los estudiantes; las reglas para la asignación de los valores numéricos a los
objetos estaban contenidas en las instrucciones del juez. De este modo, el producto terminado del
trabajo, los valores numéricos, podrían usarse para calcular medidas de relación, análisis de
varianza y demás aspectos similares.
1
S. Stevens, “Mathematics, Mathematics, Measurements, and Psychophysics”. In S. Stevens, ed., Handbook
of Experimental Psychology. New York:1951, p. 1; S. Stevens, “Measurement, Statistic, and the Schemapiric
View, Science, 161 (1968), 849-856.
444
MEDICIÓN
La definición de medición no incluye una explicación acerca de la calidad del
procedimiento de medición. Solamente afirma que, de alguna manera, los valores numéricos
son asignados a objetos o eventos. Por supuesto que el “de alguna manera” es importante,
pero no para la definición. La medición es un juego realizado con objetos y valores
numéricos. Los juegos tienen reglas. Desde luego, es importante por otras razones que las
reglas sean “buenas” reglas, pero independientemente de si las reglas son “buenas” o
“malas”, el procedimiento es todavía una medición.
¿Por qué se da este énfasis a la definición de medición y a la calidad de sus “reglas”?
Existen tres razones. Primero, la medición es mal entendida en especial la psicológica y
educativa. No es difícil entender ciertas mediciones que se usan en las ciencias naturales: por
ejemplo, longitud, peso y volumen. Aun las mediciones más alejadas del sentido común
pueden entenderse sin deformar demasiado ciertas nociones elementales e intuitivas. Pero es
mucho más difícil entender que la medición de características de los individuos y grupos
como inteligencia, agresividad, cohesividad y ansiedad implica básica y esencialmente el
mismo pensamiento y procedimiento general. En efecto, muchos dicen que no puede hacerse.
Saber y entender que la medición es la asignación de valores numéricos a objetos o eventos a
través de reglas, ayuda a borrar ciertas concepciones erróneas y engañosas de la medición
psicológica y educativa.
Segundo, la definición nos dice que, si se pueden establecer reglas sobre alguna base
empírica o racional, la medición de cualquier cosa es teóricamente posible. Esto amplía en
gran medida los horizontes de la medición para el científico. El no rechaza la posibilidad de
medir alguna propiedad aunque la propiedad sea compleja y elusiva; entiende que la
medición es un juego que puede el ser o no capaz de jugar con esta o aquella propiedad en
este momento. Pero nunca rechaza la posibilidad de jugar el juego, aunque puede entender
sus dificultades en forma realista.
Tercero, la definición pone en estado de alerta respecto del núcleo esencial de la medición
y de los procedimientos de medición, y respecto de la necesidad de establecer “buenas”
reglas cuya virtud pueda ser probada en forma empírica. Ningún procedimiento de medición
es mejor que sus reglas. Las reglas dadas en el ejemplo anterior eran deficientes. El
procedimiento fue un procedimiento de medición; la definición fue satisfecha. Pero era un
procedimiento deficiente por razones que deberán parecer evidentes mas tarde.
DEFINICIÓN DE MEDICION
Se repetirá la definición: “la medición es la asignación de valores numéricos a objetos o
eventos de acuerdo con reglas”. Un valor numérico es un símbolo de la forma 1, 2, 3, . . ., o I,
II, III, . . . No tiene significado cuantitativo a menos que se le dé tal significado; es un simple
símbolo de un tipo especial. Puede ser usado para marcar objetos como jugadores de béisbol,
bolas de billar o individuos extraídos de una muestra a partir de un universo. También se
podría utilizar la palabra “símbolo” en la definición. Es del todo posible, e incluso necesario,
asignar símbolos a objetos o conjuntos de objetos de acuerdo con reglas. El “valor numérico”
se emplea porque la medición de ordinario usa cifras que, después de asignárseles un
significado cuantitativo, se convierten en números. Un numero, entonces, es un valor
numérico al que se ha dado un significado cuantitativo.
El término “asignado” en la definición quiere decir mapeo o presentación. Recuérdese que
ya se hablo acerca de mapear los objetos de un conjunto dentro de los
FUNDAMENTOS DE LA MEDICIÓN
445
objetos de otro conjunto. Una función, f, es una regla, una regla de correspondencia. Es una
regla que asigna a cada miembro de un conjunto algún miembro de otro conjunto. Los
miembros de los dos conjuntos pueden ser cualesquiera objetos del todo. En matemáticas, los
miembros son por lo general números y símbolos algebraicos. En investigación, los
miembros de un conjunto pueden ser individuos, o símbolos que representan individuos, y los
miembros del otro conjunto pueden ser valores numéricos o números. En la mayor parte de
las mediciones psicológicas y educativas, los valores numéricos y los números son mapeados
sobre individuos o asignados a estos.2
El más interesante –y más difícil- trabajo de medición es la regla. Una regla es una guía,
un método, un mandato que dice que hacer. Una regla matemática es f, una función; f es una
regla para asignar los objetos de un conjunto a los objetos de otro. En la medición, una regla
podría especificar: “Asigne los valores numéricos 1 a 5 a individuos de acuerdo con qué tan
amables sean. Si un individuo es muy, muy amable, asígnele el número 5. Si un individuo no
es del todo amable, asígnele el número 1. Asigne, a los individuos entre estos límites,
números entre los límites”. Otra regla es aquella que ya se ha planteado varias veces: “Si un
individuo es hombre, asígnele 1. Si un individuo es mujer, asígnele 0”. Desde luego, sería
necesario tener una regla o conjunto de reglas anteriores que definieran a los hombres y
mujeres.
Supóngase que se tiene un conjunto, A, de cinco personas, tres hombres y dos mujeres: a1,
a3 y a4 son hombres; a2 y a5 son mujeres. Se desea medir la variable sexo. Suponiendo que
se tiene una regla anterior que nos permite sin ambigüedades determinar el sexo, se utiliza la
regla dada en el párrafo anterior: “Si una persona es hombre, asígnele 1; si es mujer, asígnele
0”. Sean 0 y 1 un conjunto. Llámese B. Entonces B = {0, 1}. El diagrama de medición se
muestra en la figura 25-1.
Este procedimiento es el mismo que el utilizado en el capitulo 5 para analizar las
relaciones y las funciones. Es evidente que la medición es una relación. Puesto que a
a1
a2
0
a3
a4
1
a5
Figura 25-1
2
Por lo general, en un mapeo se dice que los miembros del dominio se ubican sobre los miembros del
rango. Para mantener la consistencia con la definición de medición dada antes y para poder concebir
siempre el procedimiento de medición como una función, “se ha dado la vuelta” al mapeo. Esta
concepción del mapeo, además, es consistente con la definición anterior de función como una regla
que asigna a cada miembro el dominio de un conjunto alguno de los miembros del rango. La regla
plantea la forma en la que deben ordenarse los pares.
446
MEDICIÓN
cada miembro de A, el dominio, se asigna uno y tan sólo un objeto de B, el rango, la relación
es una función. ¿Son entonces funciones todos los procedimientos de medición? Sí lo son,
siempre que los objetos que estén siendo medidos se consideren el dominio y que los valores
numéricos que estén siendo asignados a los objetos, o representados por ellos, se consideren
el rango.
He aquí otra forma de unir las ideas de conjunto, relación-función y medición. Recuérdese
que una relación es un conjunto de pares ordenados. Así lo es también una función. Cualquier
procedimiento de medición, entonces, establece un conjunto de pares ordenados, siendo el
primer miembro de cada par el objeto medido y el segundo miembro el valor numérico
asignado al objeto de acuerdo con la regla de medición, cualquiera que ésta sea. Por lo tanto,
es posible escribir una ecuación general para cualquier procedimiento de medición:
f = {(x, y)}; x = cualquier objeto, y y = un valor numérico}
Esto se lee: “La función, f, o la regla de correspondencia, es igual al conjunto de pares
ordenados (x, y) de tal forma que x es un objeto y cada y correspondiente es un valor
numérico”. Esta es una regla general y podrá ajustarse a cualquier caso de medición.
Se citará otro ejemplo para hacer más concreto el análisis. Los eventos a ser medidos, las
x, son cinco niños. Los valores numéricos, las y, son los rangos 1, 2, 3, 4 y 5. Supóngase que
f es una regla que instruye al profesor de la siguiente manera: “Dé el rango de 1 al niño que
tenga la mayor motivación por hacer el trabajo escolar. Dé el rango de 2 al niño que tenga la
siguiente mayor motivación por hacer el trabajo escolar, y así sucesivamente hasta el rango
de 5, el cual deberá usted asignar al niño que tenga la menor motivación para hacer el trabajo
escolar”. La medición o la función se muestra en la figura 25-2.
Nótese que f, la regla de correspondencia, podría haber sido: “Si un niño tiene una alta
motivación por el trabajo escolar, dele un 1, pero si un niño tiene una baja motivación por el
trabajo escolar, dele un 0”. Entonces el rango se convierte en {0, 1}. Esto sencillamente
significa que el conjunto de cinco anos ha sido dividido en dos subconjuntos, a cada uno de
los cuales se asignaran, por medio de f, los valores
X1
1
X2
2
X3
3
X4
4
X5
5
Dominio
(niños)
Rango
(rangos)
Figura 25-2.
FUNDAMENTOS DE LA MEDICIÓN
447
numéricos de 0 y 1. Un diagrama de esto se vería como la figura 25-1, con el conjunto A
como el dominio y el conjunto B como el rango.
Se regresará a las reglas. Aquí es donde la evaluación toma forma. Las reglas pueden ser
“buenas” o “malas”. Con “buenas” reglas se tienen mediciones, “buenas”, o sólidas,
manteniendo constante todo lo demás. Con “malas” reglas se tienen mediciones “malas”, o
deficientes. Muchas cosas son fáciles de medir, porque las reglas son fáciles de redactar y
medir. Medir sexo es fácil, por ejemplo, puesto que se deben usar varios criterios sencillos y
bastantes claros para determinar el sexo y para indicar al investigador cuando asignar un 1 y
cuando un 0. También es fácil medir otras características humanas: el color del pelo, el color
de los ojos, la estatura, el peso. Por desgracia, casi todas las características humanas son
mucho más difíciles de medir, sobre todo porque es difícil diseñar reglas claras que sean
“buenas”. Sin embargo, siempre se deben tener reglas de algún tipo para medir algo.
ISOMORFISMO ENTRE MEDICIÓN Y “REALIDAD”
Como ya se ha visto, la medición puede ser algo sin significado alguno. ¿Cómo puede
evitarse esto? La definición de los conjuntos de objetos que se están midiendo, la definición
de los conjuntos numéricos a partir de los cuales se asignan valores numéricos a los objetos
que se están midiendo, y las reglas de asignación y correspondencia tienen que estar ligadas
con la “realidad”. Cuando se mide la dureza de los objetos, existe poca dificultad. Si una
sustancia a puede rasgar a b (y no al revés), entonces a es mas dura que b. En forma
semejante, si a puede rasgar a b, y b puede rasgar a c, entonces (quizá) a puede rasgar a c.
Estos son aspectos empíricos que pueden probarse con facilidad, de manera que es posible
encontrar un orden de rango de dureza. Un conjunto de objetos puede ser medido respecto de
su dureza mediante algunas pruebas de rasgueo, y se pueden asignar valores numéricos para
indicar los grados de dureza. Se dice que el procedimiento de medición y el sistema de
números son isomórficos respecto de la realidad.
El isomorfismo significa identidad o similitud de forma. Se hace esta pregunta: ¿Es este
conjunto de objetos isomórfico respecto de aquel conjunto de objetos? ¿Son los dos conjuntos
el mismo o son similares en algún aspecto formal? Por ejemplo, los dos conjuntos de la figura
25-3 son isomórficos respecto de los números cardinales: los dos tienen la característica de
“tres”. En la medición, debe hacerse esta pregunta: ¿Tienen los procedimientos de medición
A
B
C
Figura 25-3.
448
MEDICIÓN
que están empleándose alguna correspondencia racional y empírica con la “realidad”?
Para mostrar la naturaleza de este fenómeno del isomorfismo, se puede utilizar de nuevo
la idea de la correspondencia de los conjuntos de objetos. Se podría desear medir la
persistencia de siete individuos. Supóngase también que yo soy un ser omnisapiente. Sé de
manera exacta cuánta persistencia posee cada individuo, es decir, conozco los “verdaderos”
valores de persistencia de cada individuo (supóngase que la persistencia ha sido definida en
forma adecuada). Pero la persona que hace la medición no conoce estos “verdaderos”
valores: es necesario que evalúe la persistencia de los individuos en alguna forma falible y
que piense que ha encontrado tal forma. Por ejemplo, el investigador podría evaluar la
persistencia dando a los individuos tareas a ejecutar y anotando el tiempo total que cada
individuo requiere para completar una tarea, o podría anotar el número total de veces que él
trata de hacer una tarea antes de que cambie a alguna otra actividad.3 El investigador usa su
método, mide la persistencia de los individuos y termina con, por ejemplo, los valores 6, 6, 4,
3, 3, 2, 1. Ahora yo conozco los “verdaderos” valores. Estos son: 8, 5, 2, 4, 3, 3, 1. Este
conjunto de valores es “realidad”. La correspondencia de su conjunto con la “realidad” se
muestra en la figura 25-4.
En dos casos, se han evaluado los valores “verdaderos” en forma exacta. Se han
“descartado” todos los demás. Sin embargo, solo uno de estos valores “descartados” es serio,
y existe una justa correspondencia entre los dos órdenes de rango de los valores. Nótese
también que en mi omnisapiencia yo sabía que los valores “verdaderos” de persistencia iban
de 0 a 8, mientras que el sistema de medición solo abarca de 1 a 7.
Aunque este ejemplo es un poco fantasioso, muestra en una forma aproximada el
problema referente a la naturaleza del isomorfismo. La pregunta final que debe hacerse
respecto de cualquier procedimiento de medición es: ¿El procedimiento de medición es
isomórfico respecto de la realidad? No se estuvo muy alejado de medir la persistencia. El
único problema es que rara vez se descubre en una forma tan sencilla el grado de
correspondencia respecto de la “realidad” de las mediciones. ¡De hecho, con frecuencia ni
siquiera se sabe si se esta midiendo lo que se trata de medir! A pesar de esta dificultad, los
científicos deben comprobar, de alguna manera, el isomorfismo con la “realidad” de los
números de medición de los juegos que juegan.
“Realidad”
0
1
2
3
4
5
6
7
Medición
1
2
3
4
5
6
7
Figura 25-4.
3
N. Feather, “The Study of Persistence”, Psychological bulletin, 59 (1962), 94.
8
FUNDAMENTOS DE LA MEDICIÓN
449
PROPIEDADES, PROYECCIONES, E INDICADORES DE OBJETOS
Se dice que se miden objetos, pero esto no es del todo cierto. Se miden las propiedades, o las
características, de esos sujetos. Sin embargo, aun esta clasificación no es del todo cierta. En
realidad, se miden los indicadores de las propiedades de los objetos, de modo que cuando se
dice que se miden objetos en realidad se está diciendo que se miden los indicadores de las
propiedades de los objetos, de modo que cuando se dice que se miden objetos en realidad se
esta diciendo que se miden los indicadores de las propiedades de los objetos. Esto por lo
general es cierto en toda la ciencia, aunque las propiedades de algunos objetos naturales están
mas cerca de la observación directa que otros. Por ejemplo, la propiedad referente al sexo
asociado con objetos animales está relacionada en forma estrecha con la observación directa.
Tan pronto como las propiedades físicas relativamente sencillas se quedan atrás y surgen
propiedades más complejas y elusivas –que son de mucho mayor interés para los científicos
sociales y los educadores- la observación directa de las propiedades es imposible. La
hostilidad no puede ser observada en forma directa, ni tampoco pueden serlo la moral, la
ansiedad, la inteligencia, la creatividad y el talento. Siempre se debe inferir estas propiedades
o características a partir de la observación de los indicadores supuestos de las propiedades.
Indicador es solo una palabra conveniente que se usa para designar algo que se refiere a
otra cosa. Si un muchacho molesta en forma continua a otos chicos, es posible decir que su
conducta es un indicador de su hostilidad fundamental. Si las manos de alguien sudan en
exceso, se puede decir que esa persona es ansiosa. Una niña toca un impromptu de Schubert
en forma hermosa, se dice que tiene talento. Si un niño marca de manera correcta cierto
numero de partidas de tipo objetivo en una prueba de logro, se dice que tiene cierto nivel de
logro. En cada uno de estos casos, algún comportamiento identificable es un indicador de una
propiedad fundamental. Resulta obvio que es un terreno más movedizo cuando se hacen tales
inferencias a partir de un comportamiento observado que cuando se observan de modo
directo propiedades como el dolor de la piel, la estatura y el sexo. Medir la cooperatividad, la
dependencia y la imaginación de un niño es muy diferente de medir su altura, su peso o el
desarrollo de sus muñecas. El proceso fundamental de medición es el mismo, pero las reglas
son mucho más difíciles de prescribir. Además, las observaciones de las propiedades
psicológicas están mucho más alejadas de las propiedades reales de lo que están de las
propiedades físicas. Esta es quizá la dificultad individual más grande de la medición
psicológica y educativa.
Los indicadores a partir de los cuales se infieren las propiedades, son especificadas
mediante definiciones operacionales, que especifican las actividades o las “operaciones”
necesarias para medir variables o constructos. Un constructo es un nombre inventado para
una propiedad. Muchos contructos han sido usados en capítulos anteriores: autoritarismo,
logro, clase social, inteligencia, persistencia y otros4. Los constructos, denominados común e
inadecuadamente variables, se definen en dos formas generales en la ciencia: mediante otros
constructos y por procedimientos experimentales y de medición. Estas se llamaban antes
definiciones constitutivas y operacionales. Una definición operacional es necesaria para
medir una pro4
Los conceptos o constructos que se analizan también se denominan “variables latentes”. Esta es una
importante expresión que esta siendo utilizada de manera fructífera en lo que se ha llamado análisis de
estructuras de covarianza, o el llamado análisis casual. Una variable latente es un constructo, una
variable no observada, que se presume fundamenta diversos comportamientos y que se usa para
“explicar” estos comportamiento. La “habilidad verbal”, el “conservadurismo” y la “ansiedad”, por
ejemplo, son variables latentes. Su uso será estudiado mas adelante, cuando se estudie el análisis
factorial y el análisis de estructuras de covarianza
450
MEDICIÓN
piedad o un constructo. Esto se hace mediante la especificación de las observaciones de los
indicadores de comportamiento de las propiedades.
Los valores numéricos se asignan a los indicadores conductuales de las propiedades. Así,
después de hacer observaciones de los indicadores, los números (valores numéricos) son
sustituidos por los indicadores y analizados de manera estadística. Como ejemplo,
considérese a los investigadores que trabajan en la relación entre inteligencia y honestidad.
Ellos definen operacionalmente inteligencia como el marcador de una prueba de inteligencia.
La honestidad se define, desde el punto de vista operacional, como las observaciones hechas
en una situación ideada que permite a los alumnos hacer o no trampa. Los valores numéricos
de inteligencia asignados a los alumnos pueden ser el numero total de respuestas correctas en
una prueba, o alguna otra forma de calificación. Los valores numéricos de honestidad
asignados a los alumnos son el número de veces que no hicieron trampa cuando podrían
haberlo hecho. Los dos conjuntos de números que pueden estar correlacionados o pueden
analizarse de alguna otra forma. El coeficiente de correlación, por ejemplo, es .55,
significativo al nivel de .01. Todo esto es muy sencillo y del todo familiar. Lo que no es tan
sencillo y tan familiar es esto: si los investigadores llegan a la conclusión de que existe una
relación positiva significativa entre inteligencia y honestidad, estarán dando un “brinco”
inferencial considerable de los indicadores conductuales bajo la forma de marcas sobre papel
y de observaciones de conducta “tramposa”, a propiedades psicológicas. Debe ser obvio que
pueden estar equivocados.
NIVELES DE MEDICIÓN Y DE ESCALAS
Los niveles de medición, las escalas asociadas con los niveles y las estadísticas apropiadas a
los niveles son problemas complejos, e incluso polémicos. Las dificultades surgen sobre todo
del desacuerdo en cuanto a las estadísticas que pueden utilizarse en forma legitima en los
diferentes niveles de medición. El concepto de medición de Stevens y su posición, ya citados,
son un panorama amplio que, con un punto de vista liberal, se sigue en este libro5 En el
análisis que se presenta a continuación, se considera primero el fundamental problema
científico y de medición referente a la clasificación y a la enumeración.
5
Una posición más restrictiva –y sin embargo defendible- exige que las diferencias entre las mediciones sean
interpretables como diferencias cuantitativas en la propiedad medida. “Cuantitativo”, desde el punto de vista de
algunos expertos, significa que una diferencia de magnitud entre dos valores de atributos representa una
correspondiente diferencia cuantitativa en los atributos. Véase L. Jones “The Nature of Measurement”. In R.
Thorndike, ed., Educational Measurements, 2d ed. Washington, D.C.: American Council on Education, 1971, pp.
553-355. En un sentido estricto, este punto de vista descarta, como medición, las escalas ordinales y nominales.
Pienso que las experiencias reales de medición en las ciencias del comportamiento y de la educación justifican una
posición mas relajada. Una vez más, no es algo de suma importancia, siempre y cuando el estudiante entienda las
ideas generales que se están presentando. Recomiendo que los estudiantes mas avanzados lean las excelentes
presentaciones de Torgerson y de Nunnally: W. Torgerson, Theory and Methods of Scaling. New York: Wiley,
1958, caps. 1 and 2; J. Nunnaly, Psychometric Theory, 2ª ed. New York: McGraw-Hill, 1978, cap. 1. Un
sobresaliente y mas antiguo tratado que ha influido en forma determinante en este texto es: J. Guilford,
Psychometric Methods. 2ª. Ed. New York: McGraw-Hill, 1954, cap. 1. El estudiante curioso disfrutará la serie de
artículos sobre esta controversia publicados en R. Kirk, ed., Statistical Issues: A Reader for the Behavioral
Sciences. Monterrey, Calif.: Brooks/Cole, 1972, cap. 2. Los lectores que pretendan realizar investigaciones y que
siempre deberán enfrentarse a los problemas de medición deberían leer cuidadosa y repetidamente la excelente
presentación de Nunnaly acerca de los problemas y su solución: Nunnally, op. cit., p. 24-33.
FUNDAMENTOS DE LA MEDICIÓN
451
El primero y más elemental paso en cualquier procedimiento de medición consiste en
definir los objetos del universo de información. Supóngase que U, el conjunto universal, se
define como todos los alumnos del décimo grado de una preparatoria. A continuación, deben
ser definidas las propiedades de los objetos de U. Toda medición requiere que U se divida por
lo menos en dos subconjuntos. La forma más elemental de medición sería clasificar o
categorizar todos los objetos en función de si poseen o no cierta característica. Supóngase que
esta característica es la condición masculina. Se divide U en masculinos y no masculinos, o
masculinos y femeninos. Estos son, desde luego, dos subconjuntos de U, o una partición de U
(recuérdese que la partición de un conjunto consiste en dividirlo en subconjuntos que sean
mutuamente excluyentes y exhaustivos. Es decir, cada objeto del conjunto debe ser asignado a
uno y sólo a un subconjunto, y todos los objetos el conjunto de U deben ser asignados así).
Lo que se hizo es clasificar los objetos de interés. Se han puesto en categorías: se ha hecho
con ellos una partición. La obvia simplicidad de este procedimiento parece causar
dificultades a los estudiantes. Los individuos pasan gran parte de sus vidas categorizando
cosas, eventos y personas. La vida no podría seguir sin tal categorización; sin embargo,
parece difícil asociar el proceso con la medición.
Después de encontrar un método de clasificación se tiene, en efecto, una regla para
determinar qué objetos de U deben quedar dentro de qué clases, subconjuntos o particiones.
Se utiliza esta regla y los objetos del conjunto son puestos dentro de los subconjuntos. Aquí
están los chicos; aquí están las chicas. Fácil. Aquí están los chicos de clase media; aquí están
los chicos de clase trabajadora. No tan fácil, pero no tan difícil. Aquí están los delincuentes;
aquí están los no delincuentes. Más difícil. Aquí están los sobresalientes; aquí están los de
nivel promedio; aquí están los perezosos. Mucho más difícil. Aquí están los creativos; aquí
están los no creativos. Muchísimo más difícil.
Después de que han sido clasificados los objetos del universo en subconjuntos designados,
es posible contar a los miembros de los conjuntos. En caso de dicotomía, la regla para contar
se dio en el capitulo 14: Si un miembro de U tiene la característica en cuestión, por ejemplo,
cualidad de masculino, entonces asígnesele un 1. Si el miembro no tiene la característica,
asígnele un 0 (véase la fig. 25-1). Cuando los miembros del conjunto son contados en esa
forma, todos los objetos de un subconjunto se consideran iguales entre sí y desiguales
respecto de los miembros de otros subconjuntos.
Medición Nominal
Existen cuatro niveles generales de medición: nominal, ordinal, de intervalo y de razón.
Estos cuatro niveles conducen a cuatro tipos de escalas. Algunos autores admiten solo las
mediciones ordinal, de intervalo y de razón, mientras que otros dicen que las cuatro
pertenecen a la familia de la medición. No es necesario preocuparse mucho por ello, en tanto
se entiendan las características de las diferentes escalas y niveles.
Las reglas utilizadas para asignar valores numéricos a objetos definen el tipo de escala y
nivel de medición. El nivel mas bajo de medición es la medición nominal (véase la anterior
exposición
de
categorización).
Los
números
asignados
a
los
obje-
452
MEDICIÓN
tos son valores numéricos sin un significado numeral; no pueden ser ordenados o añadidos.
Son etiquetas muy similares a las letras que se usan para designar conjuntos. Si se asigna a
los individuos o a los grupos los valores 1, 2, 3, . . ., estos valores numéricos son solo
nombres. Por ejemplo, a los jugadores de béisbol y fútbol se les asignan tales números. A los
teléfonos también. A los grupos se les pueden dar las etiquetas I, II, III o A1, A2 Y A3. En el
pensamiento cotidiano y en la vida diaria se utiliza una medición nominal. Uno identifica a
los demás como “hombres”, “mujeres”, “protestantes”, “australianos”, etcétera. En cualquier
caso, los símbolos asignados a los objetos, o más bien a los conjuntos de objetos, constituyen
escalas nominales. Algunos expertos piensan que esto no es una medición, como ya se
comentó. Tal exclusión de la medición nominal habría evitado que gran parte del
procedimiento de la investigación social científica se llama medición. Puesto que la
definición de medición es satisfecha, y puesto que los miembros de los conjuntos etiquetados
pueden ser contados y comparados, parecería que los procedimientos nominales son
medición.
Los requerimientos de la medición nominal son sencillos. A todos los miembros de un
conjunto se le asigna el mismo valor numérico, y no se asigna el mismo valor numérico a dos
conjuntos. La medición nominal –por lo menos en una forma sencilla- se expreso en la figura
25-1, donde los objetos del rango, {0, 1}, fueron representados en las a, los objetos de U, las
cinco personas, por la regla: si x es masculino, asígnesele 1; si x es femenino, asígnesele 0.
Esta es la forma de cuantificar una medición nominal cuando se tiene sólo una dicotomía.
Cuando la partición contiene mas de dos categorías, debe utilizarse algún otro método.
Básicamente, la cuantificación de medición nominal equivale a contar los objetos situados
dentro de las celdillas de los subconjuntos o particiones.
Medición ordinal
La medición ordinal requiere que los objetos de un conjunto puedan tener un rango y ser
ordenados con base en alguna característica o propiedad definida de manera operacional.
Debe satisfacerse el llamado postulado de transitividad: si a es mayor que b, y b es mayor
que c, entonces a es mayor que c. Otros símbolos o palabras pueden sustituirse por “mayor
que”, “menor que”, “precede”, “domina”, etc.; la mayor parte de la investigación del
comportamiento depende de este postulado. Debe ser posible hacer afirmaciones ordinales o
con rango y orden similares a las que se acaba de emplear. Es decir, supóngase que se tienen
tres objetos, a, b, y c, y que a es mayor que b, y b es mayor que c. Si podemos, es posible
decir con justificación que también a es mayor que c, entonces la principal condición para la
medición ordinal queda satisfecha. Sin embargo, hay que tener cuidado. Puede parecer que
una relación satisface el postulado de transitividad, pero en realidad puede no hacerlo. Por
ejemplo, es posible decir siempre: a domina a b, y b domina a c: por lo tanto, ¿a domina a c?
Piénsese en un esposo, en una esposa y en un niño. Piénsese también en las relaciones “ama”,
“gusta”, “es amigable con” o “acepta”. En tales casos, la transitividad debe ser demostrada
por el investigador.
El procedimiento puede generalizarse en tres formas. Una, cualquier numero de objetos de
cualquier tipo puede medirse ordinalmente por una mera extensión a a, b, c, . . ., n (aunque
dos objetos puedan algunas veces ser iguales, la medición ordinal seria aun posible). Solo se
necesita ser capaz de decir a > b > c > . . . > n respecto de alguna propiedad.
FUNDAMENTOS DE LA MEDICIÓN
453
La segunda extensión consiste en utilizar propiedades o criterios combinados. En lugar de
usar sólo una propiedad, se pueden emplear dos o más. Por ejemplo, en vez de ordenar a un
grupo de estudiantes universitarios respecto de sus logros académicos mediante promedio de
sus calificaciones, es posible ordenarlos con base en los criterios combinados de promedios
de calificaciones y puntuaciones de pruebas. (Los promedios de calificaciones también son
puntuaciones compuestas).
La tercera extensión se logra mediante criterios distintos a los de “mayor que”. El “menor
que” se le ocurre a uno inmediatamente. “Precede a”, “está por arriba de” y “es superior a”
pueden ser criterios útiles. De hecho, se podría sustituir un símbolo distinto a “>” o “<”. Uno
de tales símbolos es “!”. Puede ser usado para designar cualquier operación, como las que se
acaban de nombrar, en la cual el postulado de transitividad quede satisfecho: a ! b podría
significar “a precede a b” o “a esta subordinada a b” y a ! b ! c podría significar “a es
superior a b, b es superior a c, y a es superior a c”.
Los valores numéricos asignados a objetos ordenados se denominan valores de rango. Sea
R igual al conjunto de objetos ordenados: R = {a > b > . . . > n}. Sea R* igual al conjunto de
valores ordenados R* = {1, 2, . . ., n}. Se asignan los objetos de R* a los objetos de R en la
siguiente forma: al objeto más grande se le asigna 1, al siguiente en tamaño se le asigna 2, y
así sucesivamente hasta el objeto más pequeño, al cual se le asigna el ultimo valor numérico
de la serie particular. Si se usa este procedimiento, los valores de rango asignados están en el
orden inverso. Si, por ejemplo, existen cinco objetos, siendo a el más grande, b el siguiente,
hasta e, el más pequeño, entonces se tiene:
Objetos
a
b
c
d
e
R
1
2
3
4
5
R*
5
4
3
2
1
Desde luego, es posible saltarse un paso al asignar R* en forma directa: se asigna 5 a a, 4 a b,
hasta 1 a e.
Los números ordinales indican un orden de rango y nada más. Los números no indican
cantidades absolutas, ni tampoco indican que los intervalos entre los números son iguales.
Por ejemplo, no puede suponerse que, debido a que los valores numéricos se encuentran
igualmente espaciados, las propiedades fundamentales que representan sean espaciadas en
forma igual. Si dos sujetos tienen los rangos 8 y 5, y otros dos sujetos tienen los rangos 6 y 3,
no se puede decir que las diferencias entre el primero y el segundo pares son iguales.
Tampoco hay forma de saber si cualquiera de estos individuos no tiene ninguna de las
propiedades que se están midiendo. Las escalas de orden de rango no son escalas con
intervalos iguales ni tienen puntos absolutos de cero.
Medición de intervalo (escalas)
Las escalas de intervalo o de intervalos iguales poseen las características de escalas
nominales y ordinales, en especial el orden de rango. Además, las distancias numéricamente
iguales en las escalas de intervalo representan distancias iguales en la pro
454
MEDICIÓN
piedad que se está midiendo. Así, supónganse que se hubieran medido cuatro objetos en una
escala de intervalo y que se hubieran obtenido los valores 8, 6, 5 y 3. Entonces, se puede
decir de manera legitima que la diferencia entre el primero y el tercer objetos en la propiedad
medida, 8 – 5 = 3, es igual a la diferencia entre el segundo y el cuarto objeto, 6 – 3 = 3. Otra
forma de expresar la idea de intervalos iguales consiste en decir que los intervalos pueden ser
añadidos o sustraídos. Una escala de intervalo se supone de la siguiente manera:
a
1
b
2
c
3
d
4
e
5
El intervalo de a a c es 3 – 1 = 2. El intervalo de c a d es 4 – 3 = 1. Se pueden añadir estos
dos intervalos: (3 – 1) + (4 – 3) = 2 + 1 = 3. Expresado en una ecuación: (d – a) = (c – a) + (d
– c). Si estos intervalos fuesen cinco estudiantes medidos con una escala de intervalo de
logro, entonces las diferencias en logro entre los estudiantes a y c, y b y d serían iguales. Sin
embargo, seria imposible decir que el logro de d fue dos veces más grande que el del alumno
b (tal afirmación requeriría de un nivel mas elevado de medición). Obsérvese que no son las
cantidades o los montos lo que se añade o sustrae; son los intervalos o distancias.
Medición de razón (escalas)
El nivel mas alto de medición es la medición de razón, y la medición ideal del científico es la
escala de razón. Esta, además de poseer las características de las escalas nominales, ordinales
y de intervalo, tiene un cero absoluto o natural que tiene significado empírico. Si una
medición es de cero en una escala de razón, entonces existe una base para decir que algún
objeto no tiene ninguna de las propiedades que se están midiendo. Puesto que existe un cero
absoluto o normal, todas las operaciones aritméticas son posibles, incluyendo la
multiplicación y la división. Los números de la escala indican las cantidades reales de la
propiedad que se mide. Si existiera una escala de razón para medir el logro, entonces sería
posible decir que un alumno que tuviera una puntuación de 8 en la escala tiene un nivel de
logro dos veces mayor que el de un alumno con una puntuación de 4.
COMPARACIÓN DE ESCALAS: CONSIDERACIONES PRACTICAS
Y ESTADÍSTICAS
Se han analizado ya las características básicas de los cuatro tipos de medición y sus escalas
acompañantes. ¿Qué tipos de escalas se usan en la investigación educativa y del
comportamiento? Se utilizan sobre todo las nominales y ordinales, aunque existe una buena
probabilidad de que muchas escalas y pruebas empleadas en la medición psicológica y
educativa aproximen bastante bien la medición de intervalo para propósitos prácticos, como
se verá.
Primero, considérese la medición nominal. Cuando los objetos se dividen en dos, tres o
más categorías con base a la membresía de grupo –sexo, identificación étnica, casado-soltero,
protestante-católico-judío, etcétera- la medición es nominal.
FUNDAMENTOS DE LA MEDICIÓN
455
Cuando las variables continuas son convertidas a atributos, por ejemplo cuando se dividen
los objetos en alto-bajo y viejo-joven, se tiene lo que puede llamarse una medición cuasinominal. Aunque los valores se pueden ordenar por lo menos en cuanto a rango, en efecto se
ven reducidos a 1 y 0.
Es instructivo estudiar las operaciones numéricas que son, en sentido estricto, legitimas en
cada tipo de medición. Con la medición nominal, el conteo de números de casos en cada
categoría y subcategoría es, desde luego, permisible. Pueden utilizarse estadísticas de
frecuencia como x², porcentajes y ciertos coeficientes de correlación (coeficientes de
contingencia). Esto suena muy vago. En realidad es algo bueno. Un buen principio que se
debe recordar es éste: si no se puede usar ningún otro método, casi siempre se pueden hacer
una partición o partición cruzada con los sujetos. Si se están estudiando las relaciones entre
dos variables y no se tiene ningún modo de medirlas adecuadamente en una forma ordinal o
de intervalo, quizá se pueda encontrar alguna forma de dividir los objetos de estudio por lo
menos en dos grupos. Por ejemplo, al estudiar la relación entre la motivación de los
miembros de la junta educativa para ser miembros de la junta y su religión, como lo hicieron
Gross y colegas, se pueden tener juicios bien fundados para dividir la muestra de los
miembros de la junta en aquellos que tienen una “buena” motivación y que tienen una “mala”
motivación. De este modo, es posible hacer una partición cruzada entre la religión y la
dicotomía de la motivación, y estudiar así la relación.
Los puntajes de las pruebas de inteligencia, de aptitudes y de personalidad son, hablando
en forma estricta y básica, ordinales. Indican con mayor o menor exactitud no las cantidades
de inteligencia, aptitudes y rasgos de personalidad de los individuos, sino más bien las
posiciones de orden por rango de los individuos. Para ver esto, uno se debe dar cuenta de que
las escalas ordinales no poseen las características deseables de intervalos iguales o ceros
absolutos. Los puntajes de pruebas de inteligencia son algunos ejemplos. No es posible decir
que un individuo tiene una inteligencia de cero. Si está vivo, debe tener una puntuación por
arriba de cero. Pero no existe el cero absoluto en una escala de pruebas de inteligencia. El
cero es arbitrario, y sin un cero absoluto, la adición de las cantidades de inteligencia tiene
poco significado, porque los puntos arbitrarios de cero pueden conducir a sumas diferentes.
En una escala con un punto arbitrario de cero se realiza la siguiente suma: 2 + 3 = 5. Así, la
suma está cinco unidades de escala por arriba de cero. Pero si el punto arbitrario de cero es
inexacto y punto “real” de cero está, en la posición de la escala, cuatro puntos mas abajo que
la posición arbitraria de cero, entonces los 2 y 3 anteriores deben en realidad ser 6 y 7, y 6 + 7
= 13.
La falta de un cero real en las escalas ordinales no es tan seria como la falta de intervalos
iguales. Aun sin un cero real, se pueden añadir las distancias dentro de una escala, siempre
que esas distancias sean iguales (empíricamente). La situación podría ser un tanto como se
indica en la figura 25-5. La escala de la parte superior (escala “verdadera”) indica los valores
“verdaderos” de una variable. La escala de la parte inferior (escala ordinal) indica la escala de
orden por rango usada por un investigador. En otras palabras, el investigador ha ordenado
muy bien el rango de siete personas, pero sus valores numéricos ordinales, que se ven iguales
en el intervalo, no son “verdaderos”, aunque pueden ser representaciones muy exactas de los
hechos empíricos.
De manera estricta, las estadísticas que pueden ser utilizadas con las escalas ordinales
incluyen medidas de orden por rango como el coeficiente de correlación de orden por rango,
p, la W de Kendall y el análisis de varianza de orden por rango, las medianas y los
percentiles. Si sólo estos estadísticos (y otros iguales a ellos) son
456
MEDICIÓN
Escala “verdadera” 1
Escala ordinal
2
3
1
2
4
3
5
4
6
5
6
7
7
Figura 25-5.
legítimos, ¿cómo pueden usarse estadísticos del tipo de r, t y F con lo que en realidad son
medidas ordinales? Y sin embargo se utilizan así, sin escrúpulos por parte de la mayoría de
los investigadores.
Aunque este no es un punto de discusión, la situación no es tan difícil como parece.
Torgerson afirma que algunos tipos de origen natural han sido diseñados para ciertos tipos de
medición.6 Al medir las preferencias y aptitudes, por ejemplo, los puntos neutrales (en
cualquier lado que se encuentren los grados positivos o negativos de favoritismo, aprobación,
gusto y preferencia) pueden considerarse orígenes naturales. Por otra parte, las escalas de
razón, aunque deseables, no son por completo necesarias, pues lo principal que se necesita
hacer en la medición psicológica puede realizarse con escalas de intervalos iguales.
La falta de intervalos iguales es más seria, puesto que las distancias dentro de una escala
teóricamente no pueden ser añadidas sin igualdad de intervalos. Sin embargo, aunque la
mayor parte de las escalas psicológicas son sobre todo ordinales, es posible, con considerable
certeza, suponer a menudo la igualdad de intervalos. El argumento es evidente. Por ejemplo,
si se tienen dos o tres medidas de la misma variable, y si todas estas medidas están
relacionadas en forma sustancial y lineal, entonces se pueden suponer intervalos iguales. Este
supuesto es valido porque entre mas se acerque una relación a la linealidad, mas tenderán a
ser iguales los intervalos de las escalas. Esto también se aplica, por lo menos hasta cierto
punto, a determinadas medidas psicológicas como las pruebas y las escalas de inteligencia,
logro y aptitudes.
Un argumento relacionado con este tema es que muchos de los métodos de análisis
utilizados funcionan muy bien en la mayor parte de las escalas psicológicas. Es decir, los
resultados obtenidos del uso de las escalas y del supuesto de intervalos iguales son del todo
satisfactorios.
El punto de vista adoptado en este libro es, entonces, pragmático, en el sentido de que el
supuesto de igualdad de intervalo funciona. Sin embargo, existe un dilema: si se emplean
medidas ordinales como si fuesen medidas de intervalo o de razón, es posible errar al
interpretar los datos y las relaciones inferidas a partir de ellos, aunque el peligro quizá no es
tan grave como se ha hecho que parezca. No existe problema con los números, como
números. Ellos no conocen la diferencia entre p y r, o entre la estadística paramétrica y la no
paramétrica, ni tampoco conocen los supuestos que apoyan su uso. Pero uno si sabe, o debe
saber, las diferencias y las consecuencias de ignorarlas. Por otra parte, si uno se atiene de
manera estricta a las reglas, descarta poderosas formas de medición y análisis y se queda con
herramientas inadecuadas para tratar los problemas que desea resolver.7
6
Torgerson, op. cit., p. 30
De nuevo, véase Nunnally, op. cit., pp. 24-33, para una ilustrativa exposición de éste y otros asuntos
de la misma naturaleza
7
FUNDAMENTOS DE LA MEDICIÓN
457
¿Cuál es la respuesta, la solución del conflicto? Parte de la respuesta fue dada antes: es
probable que la mayor parte de las escalas psicológicas y educativas se aproximen bastante
bien a la igualdad de intervalo. En aquellas situaciones en las que existe seria duda en cuanto
a la igualdad de intervalo, existen medios técnicos para tratar algunos problemas. El
investigador competente debe saber algo acerca de los métodos de valoración escalar y de
ciertas transformaciones que cambian las escalas ordinales en escalas de intervalo8.8
En el estado actual de las técnicas de medición, no es posible estar seguro de que los
instrumentos de medición tengan intervalos iguales. Es importante hacer la pregunta: ¿Qué
tan serias son las distorsiones y errores originados al tratar las mediciones ordinarias como si
fuesen mediciones de intervalo? Con cuidado en la construcción de instrumentos de
medición, y en especial con cuidado en la interpretación de los resultados, evidentemente las
consecuencias no son serias.
El mejor procedimiento parecería ser tratar las mediciones ordinarias como si fuesen
mediciones de intervalo, pero es necesario estar siempre alerta ante la imposibilidad de una
fuerte desigualdad de intervalos. Debe aprenderse tanto como sea posible acerca de las
características de las herramientas de medición. Una gran cantidad de información útil ha
sido obtenida mediante este enfoque, y se han producido avances científicos en psicología,
sociología y educación. En síntesis, es poco probable que los investigadores se desvíen si
toman en cuenta este consejo, si tienen cuidado en su aplicación9.9
(Nota: Las sugerencias para estudio de los tres capítulos de la Parte 8 aparecen al final del
capítulo 27).
8
M. Barlett, “The Use of Transformations”, Biometrics, 3 (1947), 39-52 (sobre todo pp. 49-50);
Guiford, op.cit.,cap.8. El tema de las transformaciones, sus propósitos y usos es importante, pero no se
le ha dado la atención que merece. Dos tratamientos autorizados e informativos son: G. Snedecor
andW. Cochran, Statistical Methods, 6ª. Ed. Ames, IowaState University Press, 1967, pp. 325ff.; F.
Mosteller and R. Bush, “Selected Quantitative Techiques”. In G. Lindzey, ed., Handbook of Social
Psychology, vol. 1 Cambridge, Mass.: Addison – Wesley, 1954, pp. 324-328.
9
Una útil revisión acerca de la literatura sobre el problema de las escalas de medición y de los
estadísticos es P. Gardner, “Scales and Statistics”. Review of Educational Research, 45 (1975), 43-57.
Descargar