¿CÓMO JERARQUIZAR DATOS DE DISTINTA NATURALEZA?

Anuncio
¿CÓMO JERARQUIZAR DATOS DE DISTINTA
NATURALEZA?
Pedro Álvarez Martínez
Mª del Mar Guerrero Manzano
Facultad de CC. Económicas y Empresariales
Universidad de Extremadura
Avda. de Elvas s/n
06071 Badajoz
Tfno. & Fax: 924 28 95 56
E-mail: [email protected], [email protected]
RESUMEN:
La diversidad de análisis en los que se ha utilizado la medida de Rasch, ha
motivado una nueva línea conceptual que amplía el campo de aplicación a los
problemas relacionados con el establecimiento de un orden jerárquico.
¿Es posible establecer un orden jerárquico cuando los datos describen diferentes
situaciones con características de distinta naturaleza y estén expresados en unidades de
medida de distinta índole?
El presente trabajo, desarrolla una metodología transformando los datos en otros
que reflejan situaciones análogas a las iniciales, de forma que nos permita compararlos
utilizando un referente común a las circunstancias que las caracterizan, mediante el
Modelo de Rasch como instrumento de medida.
1. INTRODUCCIÓN
Nuestro objetivo es establecer un orden jerárquico sobre distintas situaciones en
base a varios criterios. Supongamos por ejemplo, que queremos jerarquizar distintas
empresas, atendiendo a los siguientes criterios: cifra de ventas, número de empleados,
ámbito de actuación, niveles de productividad, etc.... Entonces obtenemos un ranking de
las empresas con arreglo a su cifra de ventas, otro conforme al número de empleados, y
así sucesivamente. Se tendría una ordenación por cada criterio escogido, pero ¿cómo
sintetizar esas ordenaciones individuales en una global, que permita jerarquizar todas las
empresas ?
Para sintetizar los distintos criterios en uno sólo, es necesario que todos los datos
tengan un referente común, y así, la jerarquización global se realizaría en términos de
este referente común. Sean por ejemplo, las delegaciones de la Agencia Estatal de la
Administración Tributaria, de la que conocemos sus recaudaciones por el Impuesto
sobre la Renta de las Personas Físicas, a lo largo de un período de años. Todas estas
recaudaciones tienen en común que proceden de las rentas percibidas por los
ciudadanos, a los que se le aplica por igual la legislación fiscal, aunque las cantidades
1
percibidas sean distintas. Es decir, un referente común, por ejemplo, sería fidelidad a la
normativa (Guerrero, 2001).
En principio, este referente común es susceptible de ser evaluado, para su
posterior jeraraquización. Una forma de hacerlo es a través de la suma de todos los
criterios individuales, disponiendo los datos en forma de matriz, donde cada columna
exprese los distintos criterios con los que se va a jerarquizar. Si los distintos criterios
están recogidos en las distintas columnas de la matriz, el total de la suma de cada
columna, sería una primera aproximación para la jerarquización.
Ahora bien, si los datos describen situaciones con características de distinta
naturaleza, el llevar a cabo su suma es inviable, al estar expresados en distinta unidad de
medida (por ejemplo, cifras de ventas, número de empleados, etc). No se pueden sumar
cantidades heterogéneas. Se requiere pues, un diseño donde se fundamente la
jerarquización buscada, para lo cual es necesario una transformación de los datos
heterogéneos en otros homogéneos, donde la suma tenga sentido en términos del
referente común.
Se requiere entonces despojar los datos de su especificidad, sin que se pierda la
información que refleja la intensidad de cada magnitud. Una forma de hacerlo es
transformando los datos correspondientes en categorías. Observamos que en todas y
cada una de las columnas se alcanza un valor máximo y un valor mínimo, y entre estos
extremos consideramos el mismo número de valores intermedios (Álvarez 2000).
Asignamos a la mayor cantidad de cada columna, el mayor valor de una escala, y a la
menor cantidad, el menor valor de la escala. El resto de los valores intermedios, los
obtenemos por un proceso de interpolación logarítmica. Este proceso se repite para cada
una de las columnas.
De esta forma nuestra matriz de datos se ha transformado en una nueva matriz,
dónde las cifras originales se han sustituido por niveles o categorías. Así, un nivel 5 en
una determinada columna, coincide con un nivel 5 de otra, aunque las cantidades de las
que procedan estuvieran expresadas en distintas unidades. De igual manera, un nivel 9
en una columna implica una mayor presencia en el referente común, que un nivel 3 de
otra, aunque la cantidad de la que proceda el 9 sea menor que de la que proceda el 3.
Ahora, la suma de niveles sí tiene sentido: una mayor suma supone categorías más altas
que otra de menor suma.
2. REFERENTE COMÚN
Un referente común en un conjunto de datos de diferente naturaleza, nos permite
comparar de forma global situaciones distintas que simultáneamente recogen criterios
distintos. La formulación de Rasch, basándose en la suma, logra comparar estas
situaciones. Pero para obtener una suma que tenga sentido, hay que proceder a una
previa categorización.
Sean por ejemplo, tres países1, de los que conocemos su Producto Interior Bruto,
su Esperanza de vida al nacer y su Tasa de alfabetismo adulto. Si nos planteamos
establecer un orden jerárquico de estos tres países, conforme a estos tres criterios, en
principio lo único que podemos hacer es efectuar una evaluación por cada criterio, y
conoceríamos así el país con mayor Producto Interior Bruto, con mayor Esperanza de
2
vida al nacer, y con mayor Tasa de alfabetismo adulto. Es decir, tendríamos tres
jerarquizaciones distintas:
Cuadro 1: Jerarquizaciones según cada criterio
Criterio 2:
Criterio 1: Producto
Esperanza de vida al
Interior Bruto
nacer
Criterio 3: Tasa de
alfabetismo adulto
País 1
País 3
País 2
País 2
País 1
País 3
País 3
País 2
País 1
¿Cómo se pueden globalizar estas tres ordenaciones en una, a partir de la cual se
pueda obtener una jerarquización de los países con arreglo al Producto Interior Bruto, a
la Esperanza de vida y a la Tasa de alfabetismo?. Lo primero que se necesita es definir
un referente común que globalice y de sentido a los tres anteriores. Un aspecto que se
refleja en todos y cada uno de ellos podría ser por ejemplo, el desarrollo. Se podría
hablar así del país con mayor o menor desarrollo:
Cuadro 2: Jerarquización según un único criterio
Criterio: Desarrollo
País 1
País 2
País 3
Para sintetizar todos los criterios anteriores en un único criterio, que permita
comparar los países según su desarrollo, es necesario encontrar una cifra representativa.
Se podría pensar en la suma de los tres criterios anteriores, pero surge el problema de
que las unidades de medida utilizadas para cada uno de ellos es diferente: el Producto
Interior Bruto está expresado en unidades monetarias, por ejemplo, dólares, la
Esperanza de vida al nacer, en años, y la Tasa de alfabetismo, en porcentaje. Sumar
estas tres cantidades para cada país no tiene ningún sentido, al tratarse de datos
heterogéneos, no expresados en la misma unidad.
Una forma de hacer viable la suma es mediante una transformación de los datos
en niveles de una escala común. Asumiendo que los tres criterios son igual de relevantes
para la concepción del desarrollo, un procedimiento sería el que a continuación se
detalla (Álvarez, 2000). Sea por ejemplo la escala elegida del 1 al 5. Si por cada criterio,
hay un valor máximo y un valor mínimo para todos los países, vamos a equiparar el
mayor nivel de la escala, el 5, con la cifra máxima en uno de los criterios, y el 1, con la
3
mínima. El resto de los valores intermedios, se obtienen por un proceso de interpolación
logarítmica (Álvarez, Morán & Wright, 1993):
De esta forma, se pueden sumar las cifras categorizadas de cada país, al tratarse
de datos ya homogéneos. Se ha dado sentido a la suma, al obtenerse a partir de datos
originales, una cifra total que nos sirve de base para la jerarquzación.
La técnica desarrollada en el Modelo de Rasch, nos permite la jerarquización de
situaciones distintas, utilizando la suma, a partir de la obtención de una medida el
referente común definido en los datos analizados.
Conocida la suma, el referente común, desarrollo en nuestro ejemplo, se puede
concebir como una línea recta, (Álvarez & Pulgarín, 1996a, 1996b, 1997a, 1998a,
1999), a lo largo de la cual se ubican los países βn, (n = 1,2,3), y los distintos criterios δi,
(i =1,2,3), según su medida. Se supone que hay una única dirección, lo cual implica
“más” de la variable. “Más” es más distancia a lo largo de la línea. Así se puede hablar
del país con mayor o menor desarrollo, según su respectiva posición en la línea que la
representa, y del criterio (Producto Interior Bruto, Esperanza de vida o Tasa de
alfabetismo) más relevante en tal desarrollo.
La siguiente representación muestra una forma en la que las ubicaciones de los
βn y los δi, a lo largo de la línea se puede concebir (Wright & Stone, 1979).
β1
β2
β3
β4
_______|________________|_________________|_________________|_______
|
|
|
0
δ1
δ2
δ3
+∞
Menor desarrollo
Mayor desarrollo
Supongamos un nivel h en el desarrollo representado por la línea. El país β1 no
supera ninguno de los niveles fijados en los criterios δ1, δ2 y δ3, por lo que se sitúa a la
izquierda de todos ellos. El país β2 supera el de δ1, y se sitúa a su derecha, pero no así
los de δ2 y δ3, por lo que está a la izquierda de estos. El país β3, sobrepasa a δ1 y δ2, se
coloca a su derecha, al superar los niveles que representan, pero no así a δ3, situándose
por lo tanto a su izquierda. Por último, el país β4, supera todos los niveles en los
criterios δ1, δ2 y δ3, colocándose a la derecha de todos ellos. Se puede entonces afirmar
que β1 es el país con menor medida de desarrollo de todos, está situado más a izquierda
del continuo que representa el referente común, mientras que β4, será el de mayor
medida, por estar situado más a la derecha.
El mismo razonamiento se puede aplicar a los criterios δi, pudiendo señalarse
que el δi con la medida más pequeña, se corresponde con el de mayor frecuencia en los
países, (en la representación anterior sería δ1). Siguiendo un orden creciente, el criterio
que represente el δi con mayor medida, es el de menor frecuencia en las observaciones,
(sería el caso de δ3).
Luego, si se alcanza un determinado nivel en un país βn, en el criterio δi,
entonces, βn es mayor que δi, y si un determinado nivel en δi no ha sido alcanzado por
4
un país βn, entonces, βn es menor que δi. Así, los ítems δi clasifican a los parámetros βn
y viceversa (Wright & Stone, 1979).
Si lo mismo que se ha hecho para un nivel h de desarrollo, se realiza para todos
los niveles definidos, se puede sintetizar, a través de la probabilidad de Rasch, para cada
país, βn, y criterio, δi, respectivamente, una medida del referente común, a partir de la
suma, ubicando los países y criterios a lo largo de la línea que representa el desarrollo
Dicha medida es el criterio único que necesitábamos para proceder a la ordenación
jerárquica de los países, en nuestro ejemplo, respecto a los tres criterios considerados.
La metodología seguida, está plenamente reconocida y avalada en distintos
campos, donde se ha aplicado, tales como el desarrollo, la contaminación, la medicina
en multitud de vertientes, la bibliometría, informetría, eonometría, quimiometría...,
(Álvarez & Blanco, 2000; Álvarez & Galera, 2000; Álvarez & Morán, 2001; Álvarez,
Ortiz, & Ruiz, 2001; Álvarez, Pulgarín & Escalona, 2000, entre otros), cada uno con su
respectivo referente común, con arreglo al cual proceder a la jerarquización de los
respectivos datos analizados.
3. RESULTADOS
Hemos conseguido jerarquizar datos de diferente naturaleza con arreglo a un
aspecto que se da en todos ellos, el referente común. El parámetro que se encuentre en
primera posición, (por ejemplo, en el caso del desarrollo, el país), implica que la suma
de los niveles es la mayor de todas, y por tanto, también lo será su medida del
desarrollo. En el otro extremo, se encontrará el parámetro (país) que con la medida más
pequeña de todas, indica una situación en dónde los niveles alcanzados son los más
bajos.
Cuando se hace un análisis de Rasch, el siguiente paso es analizar el alcance con
que los datos siguen las expectativas de la probabilidad de Rasch, para lo cual, se
calcula un indicador de ajuste para cada parámetro, representado en las respectivas filas
y para cada ítem, representado en las respectivas columnas. Esto resume la extensión
por la cual el panel de datos de la muestra es consistente con la forma en que dichos
datos son manifestaciones del referente común, proporcionando una consistencia de
ajuste estadístico para cada uno de ellos. La validez viene determinada por la
discrepancia entre una determinada observación y su valor esperado. Estos desajustes
vienen expresados por sus residuales. Los desajustes, entonces, vienen a completar el
proceso de obtención de la medida, donde la jerarquización se fundamenta.
4. CONCLUSIONES
La categorización permite la comparación de datos heterogéneos, al reducirlos a
una escala común, permitiendo comparar situaciones expresadas en unidades de distinta
naturaleza.
Esta categorización permite aplicar el modelo de Rasch para la determinación de
una medida de un referente común en el conjunto de los datos, con objeto de encontrar
una jerquización.
5
El Modelo de Rasch, proporciona también los desajustes, que nos permiten
determinar hasta qué punto son coherentes los datos como manifestaciones del
propuesto referente común.
El Modelo de Rasch tuvo su concepción en educación, permitiendo jerarquizar a
los alumnos según sus respectivos conocimientos, a través de las evaluaciones de un test
de inteligencia. Las consideraciones expuestas a lo largo del presente trabajo
contribuyen a ampliar el marco de aplicación del Modelo de Rasch.
REFERENCIAS
Álvarez, P., (2000). “Transforming non-categorical data for Rasch applications”. Third
International Outcomes Measurement Conference: Measurement of healtcare outcomes.
Nortwestern University Medical School. Chicago, Illinois, (USA).
Álvarez, P. & Blanco, M.A. (2000). “Reliability of the sensory data of a panel of
tasters”. Journal of the Science of Food and Agriculture, Vol. 80, pp. 409-418. ISSN
0022-5142.
Álvarez, P., Blanco, M.A. & Guerrero, M.M., (1997b). “Modelo de Rasch: medida de
aspectos cualitativos”. Actas de las V Jornadas de la Asociación Española de Profesores
Universitarios de Matemáticas en la Economía y la Empresa, (ASEPUMA), pp 17 – 28.
Málaga, (España).
Álvarez, P., Blanco, M.A. & Guerrero, M.M., (1997c). “La variable latente calidad
medida a través del Modelo de Rasch”. Actas de las V Jornadas de la Asociación
Española de Profesores Universitarios de Matemáticas en la Economía y la Empresa,
(ASEPUMA), pp 29 – 44. Málaga, (España).
Álvarez, P., Blanco, M.A. & Guerrero, M.M., (1998a). “Análisis de la validez de los
datos a través del Modelo de Rasch”. Actas de la XII Reunión Anual ASEPELTESPAÑA, (en CD-ROM). Córdoba, (España).
Álvarez, P. & Galera, C. (2000). “Industrial Marketing Applications of Quantum
Measurement Techniques”. Industrial Marketing Management, Vol. 30, pp. 13-22. ISSN
0019-8501.
Álvarez, P. y Morán, J.C. (2001). “Medida del desarrollo humano para los países de la
América Latina”. El Trimestre económico, Vol. LXVIII, número 270, pp. 195-208.
Álvarez, P., Morán, J.C. & Wright, B. D., (1993). “Quality of life”. VII Objective
measurement workshop. Emory University, Atlanta, Georgia.
Álvarez, P., Ortiz, R. & Ruiz, R. (2001). “Dry bean cultivar characterisation by
isoelectric focusing eleccctrophoresis in polyacrylamide gel”. Journal of the Science of
Food and Agriculture, Vol. 81, pp. 1126-1131. ISSN 0022-5142.
Álvarez, P. & Pulgarín, A., (1996a). “The Rasch model. Measuring the impact of
scientific journals: Analytical Chemistry”. Journal of the American Society for
Information Science, 47, 458-467.
Álvarez, P. & Pulgarín, A., (1996b). “The Rasch model. Measuring information from
keywords: The diabetes field”. Journal of the American Society for Information Science,
47, 468-476.
6
Álvarez, P. & Pulgarín, A., (1997a). “The diffusion of scientific journals analyzed
through citations”. Journal of the American Society for Information Science, 48, 953958.
Álvarez, P. & Pulgarín, A., (1998a). “Equating research production in different fields”.
Information Processing & Management.
Álvarez, P. & Pulgarín, A., (1999). “Measuring information throug topical subheadings
of the Medline database: a case of study”. Journal of Information Science, Vol. 25, nª 5,
pp. 395-402.
Álvarez, P., Pulgarín, A. & Escalona, I. (2000). “What is wrong with obsolescence?”.
Journal of the American Society for Information Science, Vol.51, nº 9, pp.812 –815.
Andrich, D., (1988). Rasch Model for Measurement. Murdoch University. SAGE.
Guerrero, M.M., (2001). “Diseño de la obtención de una medida en el ámbito del
IRPF”. Tesis Doctoral. Departamento de Economía Aplicada y Organización de
Empresas. Universidad de Extremadura, Badajoz, (España).
Wright, B.D. & Stone M.H., (1979). Best Test of Design. University of Chicago; Mesa
Press.
1
Este ejemplo se ha extraído de una investigación llevada a cabo con la metodología utilizada,
para medir el desarrollo humano de los países de América Latina (Álvarez, P. y Morán, J.C.,
2001)
7
Descargar