Análisis psicométrico de la subescala manipulación de

Anuncio
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Fisioterapia. 2011;33(4):145—156
www.elsevier.es/ft
ORIGINAL
Análisis psicométrico de la subescala manipulación de objetos de
la escala peabody de desarrollo motor segunda edición (PDMS-2)
con el modelo de Rasch
O. Dols Calatayud a,∗ y J.A. López Pina b
a
b
Departamento de Fisioterapia, Universidad de Murcia, Murcia, España
Facultad de Psicología, Universidad de Murcia, Murcia, España
Recibido el 16 de marzo de 2011; aceptado el 4 de junio de 2011
Disponible en Internet el 22 de julio de 2011
PALABRAS CLAVE
Escala de desarrollo
motor Peabody;
Análisis psicométrico;
Modelo de Rasch;
Ajuste de modelos
∗
Resumen
Objetivo: Investigar las propiedades de medición de la subescala manipulación de objetos del
PDMS-2 (Folio MR, Fewell RR, 2000) mediante la aplicación del modelo de Rasch, con vistas
a determinar si ofrece una estructura unidimensional que permita obtener estimaciones de
parámetros de dificultad de los ítems y habilidad invariantes.
Material y métodos: Un total de 106 niños (97 niños con desarrollo normal y 9 niños con algún
tipo de alteración en el desarrollo motriz) fueron reclutados para dicho estudio psicométrico.
Cada niño fue evaluado con la subescala manipulación de objetos, que consta de 24 ítems en
orden creciente de dificultad. El análisis dicotómico de Rasch se utilizó en el análisis final de
los datos porque fue el que mejor se adaptó al patrón de respuestas.
Resultados: El análisis de los datos mediante ambos modelos politómicos demostró que los datos
del patrón de respuestas no se ajustaban a lo esperado por estos modelos para la mayoría de
los ítems centrales de la escala. En cambio, el análisis dicotómico de Rasch demostró un buen
ajuste de los datos, a pesar de que 8 ítems centrales (6 y del 8 al 14) se alejaban ligeramente de
lo esperado por el modelo, lo que nos permite asegurar con cierta precaución que la variabilidad
en las respuestas del conjunto de ítems estudiados obedece a una sola dimensión de habilidades
manipulativas en niños.
Conclusiones: La metodología basada en el estudio del ajuste de los ítems a la familia de modelos de Rasch nos permite obtener estimaciones invariantes de los parámetros de habilidad de
las personas y de dificultad de los ítems. Además, este estudio proporciona evidencia preliminar de que la simplificación de las escalas de calificación de la mayoría de los ítems de la
escala manipulación de objetos del PDMS-2 a categorías dicotómicas podría optimizar sus cualidades de medición, ya que el modelo dicotómico de Rasch ha sido el que mejor ha explicado
la variabilidad de las respuestas de los niños de la muestra.
© 2011 Asociación Española de Fisioterapeutas. Publicado por Elsevier España, S.L. Todos los
derechos reservados.
Autor para correspondencia.
Correo electrónico: [email protected] (O. Dols Calatayud).
0211-5638/$ – see front matter © 2011 Asociación Española de Fisioterapeutas. Publicado por Elsevier España, S.L. Todos los derechos reservados.
doi:10.1016/j.ft.2011.06.001
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
146
KEYWORDS
Peabody
developmental motor
scale;
Psychometric
analysis;
Rasch model;
Fit models
O. Dols Calatayud, J.A. López Pina
Psychometric analysis of the subscale object manipulation of the peabody
developmental motor scale-second edition (PDMS-2) with the Rasch model
Abstract
Objective: To investigate the measurement properties of the subscale object manipulation of
the PDMS-2 (Folio MR, Fewell RR, 2000) by applying the Rasch model in order to determine
if it offers a one-dimensional structure to obtain estimates of difficulty and skill invariant
parameters.
Material and methods: A total of 106 children (97 children with normal development and
9 children with some kind of motor development alteration) were recruited for this psychometric study. Each child was assessed with the subscale object manipulation. This scale is
made up of 24 items in increasing order of difficulty. The dichotomous Rasch analysis was used
in the final analysis of the data because it was the best adapted to the pattern of responses.
Results: The data analysis using both polytomous data models showed that the pattern of responses did not conform to expectations for these models for most of the central items of the
scale. In contrast, the dichotomous Rasch analysis showed a good fit of the data, although eight
central items (6 and 8 to 14) moved slightly away from that expected by the model, allowing us
to say with some caution variability in the responses of all the items studied is due to a single
dimension of manipulative skills in children.
Conclusions: The methodology based on the study of fit of the items to the Rasch family of
models allows us to obtain estimates of the invariant skill of people and item difficulty parameters. In addition, this study provides preliminary evidence that the simplification of the rating
scales of most items of the scale object manipulation of the PDMS-2 to dichotomous categories
could optimize their measurement qualities because the Rasch dichotomous model has been
the one that has best explained the variability of the responses of children in the sample.
© 2011 Asociación Española de Fisioterapeutas. Published by Elsevier España, S.L. All rights
reserved.
Introducción
Uno de los cambios más importantes de la fisioterapia en
pediatría ha sido el paso del uso del enfoque de la neuromaduración y los reflejos para la evaluación de los niños a la
medición de la discapacidad relacionada con las actividades
funcionales. Este cambio parece haber sido impulsado por
las teorías contemporáneas del desarrollo y el control motor,
que apoyan el aprendizaje motor y los métodos de evaluación e intervención. Además, este cambio está relacionado
con un mayor énfasis en la evaluación y la intervención terapéutica en el entorno del niño, ya que no es lo mismo el
rendimiento motor en el entorno real que en un ambiente
terapéutico, y es fundamental enfocar la intervención hacia
las tareas que los niños necesitan llevar a cabo en su día a
día1 .
Un tipo de habilidad muy importante en el día a día de
los niños, tanto a nivel social, por la interacción en el campo
del juego, como a nivel de rendimiento académico en materias como educación física, es la habilidad de manejo de la
pelota2 . Esta destreza típicamente incluye lanzar, atrapar y
chutar, conformando una actividad motriz global y no solo
manual, fundamental en educación física porque es la piedra
angular de la mayoría de los juegos.
Una prueba de referencia normativa del desarrollo motor
que incluye la medida de las habilidades de manejo de la
pelota y es ampliamente utilizada por los fisioterapeutas
es el Peabody Developmental Motor Scale segunda edición (PDMS-2)3 . El PDMS-2 está compuesto de 6 subtests
que miden capacidades motoras interrelacionadas que se
desarrollan temprano en la vida. Fue diseñado para evaluar
las habilidades motoras en niños desde el nacimiento hasta
la edad de 6 años.Los 6 subtests que componen el PDMS-2
son: respuestas motoras, estática, locomoción, manipulación de objetos (estas cuatro subescalas evalúan el desarrollo motor grueso), prensión y coordinación visuo-motora;
estas dos últimas subescalas miden desarrollo motor fino.
La subescala objeto de este estudio es la de manipulación
de objetos, que consta de 24 ítems que miden la capacidad
de un niño de manejar pelotas de diferentes tamaños. Ejemplos de las acciones medidas en ella incluyen coger, lanzar y
chutar. Estas habilidades no son aparentes hasta que un niño
ha alcanzado la edad de 11 meses, por lo que este subtest se
emplea solo para niños a partir de los 12 y hasta los 72 meses.
Dentro del proceso de identificación de los niños con
retrasos motores o trastornos en el desarrollo motor se
incluye, en primer lugar, un screening o cribado, después
una exhaustiva evaluación motriz, y por último, una o varias
reevaluaciones para constatar avances o retrocesos con el
paso del tiempo. El cribado tiene la finalidad de evaluar
más a fondo solo a los niños que confirmen signos de alteración motriz. En segundo lugar, la selección de una escala de
medida adecuada es una parte crucial del proceso de evaluación y de reevaluación y debe estar orientada hacia los criterios de la evaluación y las características del niño. El PDMS-2
constituye una de las pruebas de elección entre los expertos
encargados en evaluar el desarrollo motor del niño4,5 .
Este trabajo se realiza motivado por la relevancia del
instrumento de medida PDMS-2 y el interés que despierta
en el ámbito de la fisioterapia pediátrica y la atención
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Análisis psicométrico de la subescala manipulación de objetos
temprana6 , ya que en la actualidad se están tomando
decisiones muy importantes de medida, evaluación, diagnóstico y tratamiento basándose en sus resultados. Aunque
ha sido ampliamente validada7-9 y contrastada con otras
escalas de desarrollo motor y, al mismo tiempo, ampliamente utilizada como instrumento de medida en proyectos
de investigación10-12 , hasta la fecha no existe evidencia científica sobre su aplicabilidad en nuestro entorno
cultural.
Familia de modelos de Rasch
La familia de modelos de Rasch engloba un conjunto de
modelos que permiten pronosticar cada una de las respuestas que una persona da a cada uno de los ítems de un test.
Uno de los más utilizados es el modelo unidimensional de
Rasch13 , que afirma que cada persona tiene una y solo una
habilidad esencial (␪) y el ítem tiene una y solo una dificultad (␦) relacionada con la dimensión que se mide. La
habilidad de las personas solo se puede conocer enfrentándolas con los ítems del test, mientras que la dificultad de
los ítems sólo se puede conocer haciendo que las personas de distintas habilidades los contesten. Además, ambos
parámetros producen escalas de intervalo cuyo origen y
unidad de escala son arbitrarios. Para ítems dicotómicos
(acierto/fallo, sí/no), Rasch propuso que la relación entre la
habilidad de las personas y la dificultad de los ítems se puede
modelar probabilísticamente a través de la siguiente función
matemática:
P(i ) =
exp(i − ı)
1 + exp(i − ıj )
(1)
En la ecuación (1), ␪i es el parámetro de habilidad de la
persona i, ıj es el parámetro de dificultad del ítem j, exp
es el número e, y P( i ) es la probabilidad de que la persona
de habilidad i acierte el ítem. La ecuación (1) es una función no lineal que genera una enorme complejidad a la hora
de estimar los parámetros de habilidad de las personas y de
dificultad de los ítems. A pesar de ello, esta cuestión se simplifica, ya que la suma de las respuestas a través de los ítems
o de las personas permite obtener estimadores suficientes14
de los correspondientes parámetros.
Una condición esencial del modelo de Rasch15-17 y de otros
modelos de TRI18 es que cualquier aplicación del modelo a
un conjunto de datos de las respuestas a los ítems de un
test requiere un estudio del ajuste de los ítems y del test
completo al modelo especificado. El modelo de Rasch dispone de un conjunto de estadísticos de ajuste para los ítems
y para el test completo, entre los que pueden destacarse
los estadísticos basados en residuales entre la respuesta
dada y la probabilidad esperada que se operativizan bajo
diversas distribuciones (normal, chi al cuadrado). Si la diferencia entre las respuestas a los ítems y las probabilidades
de respuesta se eleva al cuadrado y se suma a través de
todas las casillas de la matriz de respuestas, obtendremos
medias cuadráticas basadas en residuales cuya distribución
se aproxima a la distribución chi al cuadrado, cuya esperanza matemática es 1. La transformación Wilson-Hilferty
(en este trabajo, transformación t) permite transformar las
147
medias cuadráticas a la distribución normal. Si el método
de estimación de parámetros converge y los estadísticos
de ajuste permiten afirmar que las respuestas de las personas pueden explicarse en función de la dificultad de los
ítems que componen el test, entonces podemos asegurar
que las estimaciones de los parámetros de las personas y
de los ítems son independientes, es decir, que la habilidad estimada de cada persona no depende del número y
el tipo de ítems que ha contestado ni la dificultad de los
ítems depende del número y el tipo de personas que los han
contestado. Este hecho es muy importante en la medida en
ciencias de la salud, ya que en el modelo clásico de tests
(MCT), que fue el modelo de medida más utilizado en las
ciencias sociales y de la salud durante gran parte del siglo
pasado, la puntuación observada de las personas depende
del número de ítems que contiene el test y la dificultad
de los ítems depende del número de personas que los contestan. De esta forma, si el número de ítems cambia, las
puntuaciones observadas de las personas cambian, y si el
tamaño del grupo aumenta, los índices de dificultad de los
ítems cambian en función de las características del grupo.
A diferencia del MCT que se aplica independientemente de
la dimensionalidad del test y el formato de los ítems, el
modelo de Rasch es, en realidad, un precursor de una familia de modelos que, manteniendo su esencia, se adapta a
las condiciones de medida en las que trabajamos. De esta
forma, existe una variante del modelo de Rasch para ítems
con más de dos categorías (politómicos, también conocidos como tipo Likert) y para rangos antes que puntuaciones
resultantes de la ejecución de una tarea. Estos modelos
tienen variantes multidimensionales que permiten estimar
parámetros en las dimensiones especificadas en el estudio.
Entre los modelos unidimensionales para ítems politómicos
destacan el modelo de escalas de valoración19,20 y el modelo
de crédito parcial16,21 . Ambos se caracterizan por producir,
además de un parámetro de dificultad para cada ítem, k-1
parámetros para las categorías de los ítems. En el modelo de
escalas de valoración, los parámetros de las categorías serán
iguales para todos los ítems y siempre estarán ordenados de
menor a mayor (categoría más baja a más alta), mientras
que en el modelo de crédito parcial, los parámetros de las
categorías pueden variar de ítem a ítem, e incluso no estar
ordenados.
Como resultado de las importantes ventajas que este
modelo ofrece, diferentes instrumentos de valoración del
desarrollo motor en niños han sido recientemente validados mediante su aplicación, entre ellos la subescala de
desarrollo motor fino del PDMS-2 (PDMS-FM-2, que engloba
los 2 últimos subtests de la escala, prensión y coordinación
visuo-motora), que fue estudiada para su validación con
niños de Taiwán de edades comprendidas entre 0 y 5 años
(de 0 a 60 meses)22 .
El modelo de crédito parcial
El modelo de crédito parcial16,23 fue diseñado especialmente
para ítems de ejecución cuyas categorías suponían un incremento de aprendizaje de una categoría a otra. El modelo,
entonces, permite obtener estimaciones de los umbrales
entre las categorías (parámetros de paso) que permiten
determinar no sólo la dificultad del ítem en el grupo, sino si
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
148
O. Dols Calatayud, J.A. López Pina
las categorías están bien ordenadas y espaciadas en cada uno
de los ítems que componen el test. La función matemática
de este modelo tiene la siguiente forma:
exp
Pnix () =
mj
xj
( − ıjk )
k=0
exp
h=0
h
(2)
( − ıjk )
k=0
donde ıjk es el umbral de la categoría k en el ítem j, y el
resto de parámetros se interpreta como en (1). Como en
el modelo de Rasch dicotómico, en el modelo de crédito
parcial es preciso estimar los parámetros de habilidad de las
personas, dificultad de los ítems y de las categorías con un
método de máxima verosimilitud, así como probar el ajuste
de los datos al modelo.
El modelo de escalas de valoración
El modelo de escalas de valoración20 fue ideado por Andrich
(1978) y básicamente es equivalente al modelo de crédito
parcial excepto en que asume que los umbrales de las categorías son iguales para todos los ítems que forman el test.
La función matemática de este modelo tiene la forma:
exp
Pnjx () =
m
j=0
x
(n − ıj − k )
k=0
exp
h
n − ı j − k
k=0
(3)
donde ıj es el parámetro de dificultad del ítem y ␶k es el
umbral entre las categorías.
Objetivos de este estudio
Este estudio pretende demostrar la utilidad de los diferentes modelos de la familia de Rasch (Rasch dicotómico, de
crédito parcial y de escalas de valoración) con una escala
de desarrollo psicomotriz ampliamente utilizada en el
ámbito de las ciencias de la salud conocida como Peabody
Development Motor Scales-Second Edition (PDMS-2), para
investigar las propiedades de medición de la subescala
manipulación de objetos, englobada dentro de la sección
de motricidad gruesa del PDMS-2.
Además, las influencias culturales podrían estar asociadas a diferencias en el desarrollo en las habilidades motrices
entre niños de diferentes zonas geográficas y, además,
podrían afectar a la idoneidad de las pruebas de los tests de
valoración del desarrollo en algunos contextos interculturales. Por lo tanto, este estudio también pretende investigar
la posibilidad de que los ítems de esta subescala del PDMS-2
puedan ser utilizados adecuadamente para evaluar los niveles de habilidad de manipulación de objetos de los niños y
las niñas de nuestro entorno cultural.
Material y métodos
Participantes
Un total de 106 niños fueron reclutados en cuatro colegios
de la Región de Murcia, entre el 1 de abril de 2010 y el
10 de junio de 2010. Los 97 niños con desarrollo normal
desde el nacimiento constituyeron la muestra normativa,
con los siguientes criterios: a) recién nacidos a término
(nacidos entre las 36 y las 42 semanas); b) peso al nacer
2.500 g o más, y c) ausencia de déficits sensoriomotores
conocidos y de enfermedades diagnosticadas (p. ej., cáncer o enfermedades del corazón) o alteraciones corporales
(p. ej., amputaciones o fracturas recientes) que limitarían
la capacidad del niño para realizar tareas de movimiento,
de acuerdo con informes aportados por los padres.
Además, 9 niños que presentaron retrasos madurativos o
diferentes patologías neurológicas congénitas fueron reclutados para constituir la muestra clínica. Los niños fueron
incluidos en la muestra clínica si tenían un diagnóstico
médico formal de un trastorno del desarrollo global como
parálisis cerebral, retraso madurativo, síndrome de Down u
otros trastornos sensoriomotrices.
Las características demográficas de los 106 niños incluidos en el estudio se presentan en la tabla 1.
Procedimiento
Tras ser aprobada la propuesta de estudio en los cuatro centros públicos de educación infantil donde se reclutaron a los
niños participantes, todos los padres de los niños firmaron el
consentimiento informado antes del comienzo del estudio.
A cada participante se le administró la subescala manipulación de objetos del PDMS-2 de forma individual en un
entorno tranquilo en el centro en el que se encontrase
escolarizado. En algunas pocas ocasiones a los cuidadores
(auxiliares técnicos educativos encargados de atender a los
niños con discapacidad en colegios) se les permitió que participaran en la administración de la prueba, si el niño parecía
incómodo cuando se le dejaba a solas con el examinador.
Tres fisioterapeutas entrenados previamente en la administración del PDMS-2 y con experiencia en el ámbito de la
fisioterapia en pediatría llevaron a cabo las evaluaciones de
todos los niños participantes. Los cuatro centros de educación infantil y primaria a los que pertenecen los niños de
la muestra y los detalles de la asignación a cada centro se
pueden ver en la tabla 2.
Instrumento y medidas
El PDMS-2 es una prueba de referencia normativa y su subescala manipulación de objetos consta de 24 ítems que se
ordenan por grado de dificultad, de menor a mayor.
Cada ítem se puntúa en una escala de calificación de
3 puntos (0-1-2). Los criterios generales para anotar los puntos se describen de la siguiente manera: 0, lo que indica que
el niño no puede realizar la prueba solicitada; 1, indica que
el niño lleva a cabo la prueba, pero no logra satisfacer los
criterios, y 2, indica que el niño puede completar la prueba
de acuerdo con los criterios especificados por el ítem.
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Análisis psicométrico de la subescala manipulación de objetos
Tabla 1
149
Características demográficas de los 106 niños de la muestra
Muestra completa
(n = 106)
Muestra normativa
(n1 = 97) (91,51%)
Muestra clínica (n2 = 9)
(8,49%)
Sexo n (%)
Niños
Niñas
48 (45,28%)
58 (54,72%)
43 (44,33%)
54 (55,67%)
5 (55,6%)
4 (44,4%)
Edad media (meses)
Media ± desviación estándar
50,44 ± 6,417
50,90 ± 6,101
45,56 ± 8,033
Edad, n (%)
36-48 meses
49-60 meses
51 (48,11%)
64 (60,38%)
44 (45,36%)
62 (63,92%)
7 (77,78%)
2 (22,22%)
Diagnóstico, n (%)
PCI
Retraso madurativo
Síndrome de Down
—
—
—
—
—
—
4 (44,4%)
4 (44,4%)
1 (1,11%)
Variables demográficas
La forma de administrar las pruebas en este estudio se
realizó siguiendo el procedimiento original, que consiste en
un procedimiento estándar que se limita a la administración
de los ítems entre el que se constituye como basal (3 pruebas
consecutivas con máxima puntuación) y el que se constituye
como techo (límite superior de habilidad con tres ítems con
puntuación mínima). Los ítems por debajo del nivel basal o
aquellos que superan el límite máximo (techo) no se administran, sino que se puntúan directamente con la máxima
calificación los situados por debajo del nivel basal y con la
mínima calificación los situados por encima del techo.
Por último, la administración de los ítems se llevó a cabo
de forma ordenada según aparecen en la escala y siguiendo
las instrucciones del manual de administración del PDMS-2
para cada prueba de cada ítem. La explicación para una adecuada comprensión de cada prueba por parte de los niños
se llevó a cabo de forma oral, realizando la prueba (para
favorecer la imitación) y ayudándonos de las imágenes explicativas de cada ítem.
Estimación de parámetros
La matriz de respuestas a los 24 ítems de la subescala obtenida de los 106 niños de la muestra fue sometida a un análisis
de Rasch utilizando el programa informático ConQuest23 .
El programa ConQuest permite estimar los parámetros de los ítems y de las personas, bajo la familia de
modelos de Rasch, con ítems dicotómicos o politómicos, aunque también permite mezclar ítems de ambos
Tabla 2
CEIP
CEIP
CEIP
CEIP
formatos. Además, también puede obtener los parámetros
de modelos unidimensionales y multidimensionales. En este
caso, emplearemos el programa para obtener los parámetros
asumiendo que solo existe una dimensión para explicar la
variabilidad de las observaciones en los ítems de la subescala
del PDMS-2.
ConQuest requiere un archivo con las órdenes necesarias para ejecutar el análisis y otro archivo con la matriz
de datos, aunque la matriz de datos puede ir en el mismo
archivo de las órdenes. Ambos archivos deben tener formato
de texto. Una vez que se ejecuta el archivo de órdenes, si
no se produce ningún problema de mala especificación de
los comandos, ConQuest producirá un archivo con las estimaciones de los parámetros de los ítems, un mapa donde se
despliega la distribución de las habilidades de las personas y
las dificultades de los ítems, y de las categorías de los ítems
en los ítems politómicos, y si se requiere, en un archivo
aparte, una estimación de los parámetros de habilidad de
las personas que forman el grupo de acuerdo con el método
de estimación seleccionado. En la figura 1 aparece el archivo
de comandos para el modelo de crédito parcial como ejemplo. Se puede ver que el modelo de crédito parcial se llama
en ConQuest: item + item * step.
En primer lugar, utilizamos el modelo de crédito
parcial16,21 para el análisis de Rasch, que se usa para estimar
los parámetros de las escalas con ítems politómicos (con más
de una respuesta posible) y que produce un parámetro de
dificultad para cada ítem analizado y otro para cada umbral
entre las diferentes categorías de cada ítem. Este modelo
fue seleccionado, en primer lugar, debido a que los ítems
Distribución por colegios de los niños de la muestra
Nuestra Sra. del Rosario (Santomera, Murcia)
Narciso Yepes (Murcia)
Jara Carrillo (Alcantarilla, Murcia)
Ramón Gaya (Santomera, Murcia)
Muestra completa
(n = 106)
Muestra normativa
(n1 = 97)
Muestra clínica
(n2 = 9)
87
9
7
3
83
7
5
2
4
2
2
1
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
150
O. Dols Calatayud, J.A. López Pina
-----------------------------------------Title credit partial-pdms2;
datafile pdms2.txt;
format responses 1-24;
codes 2,1,0;
model item + item * step;
estimate;
show !estimates=latent >> pdms2.shw;
quit;
------------------------------------------
Figura 1
Archivo de comandos de ConQuest.
del PDMS- 2 utilizan una escala de calificación de 3 puntos
(0, 1 y 2) y los criterios de puntuación de cada categoría de
calificación varían entre ítems distintos.
En segundo lugar, realizamos el análisis de la matriz de
datos utilizando el modelo de escalas de valoración20 , que
funciona básicamente igual que el modelo de crédito parcial, pero asumiendo que los umbrales de las diferentes
categorías son iguales para todos los ítems que forman el
test.
Estos dos análisis politómicos nos permitirán comprobar
si los datos obtenidos mediante la subescala utilizada se
adaptan al modelo de Rasch politómico o, por el contrario, sería necesario plantear un análisis mediante el modelo
dicotómico de Rasch, así como comparar ambos análisis para
estudiar qué modelo se adapta mejor a los datos recopilados
y poder analizar con él la escala para corroborar si realmente todos los ítems forman un continuo y dependen sus
respuestas de una única dimensión, en este caso la capacidad manipulativa de objetos.Para comprobar si el patrón de
respuestas de la escala se acerca de forma significativa a la
distribución esperada por los diferentes modelos de Rasch
utilizados, observaremos los estadísticos de transformación
t obtenidos en el análisis para cada ítem. Además, si queremos saber cuál de los modelos empleados es el que mejor
representa la distribución del patrón de respuestas tenemos
que comparar las desviaciones obtenidas en cada análisis. La
desviación es un estadístico de ajuste relativo que sigue una
distribución chi al cuadrado con un número determinado de
grados de libertad. Si la diferencia en la desviación entre los
modelos es significativa, entonces podemos afirmar que el
modelo que ha obtenido la desviación más baja ajusta mejor
la escala que el modelo que ha obtenido la desviación más
elevada.
Resultados
En los análisis politómicos de Rasch realizados obtuvimos las
estimaciones de los parámetros de dificultad de cada uno de
los 24 ítems que componen la escala manipulación de objetos del PDMS-2, con sus correspondientes errores típicos y los
estadísticos de ajuste basados en medias cuadráticas y sus
correspondientes transformaciones t a la distribución normal aproximada. Además, cada estadístico de ajuste lleva
aparejado un intervalo de confianza para las medias cuadráticas que permite juzgar si el parámetro obtenido se
encuentra en el rango esperado según las características
del grupo o no. La interpretación de los estadísticos de
ajuste es crucial para decidir si los ítems siguen el modelo
de Rasch. En este caso, realizaremos la interpretación individualizada en función de cada uno de los ítems. Cada ítem
dispone de dos estadísticos de ajuste: uno no ponderado
y otro ponderado. El primero no pondera los residuales,
por lo que puede alterarse fácilmente por resultados extremos, niños muy hábiles que fallan ítems fáciles o niños poco
hábiles que aciertan ítems difíciles. En cambio, el segundo
pondera la estimación del residual en función de la cantidad de información que arrojan los ítems en el intervalo
de habilidad, de modo que las personas con habilidad más
cercana a la dificultad del ítem suelen influir más en el
residual que las personas cuya habilidad está por debajo o
por encima de la dificultad del ítem. Generalmente, ambos
estadísticos se deben tener en cuenta para decidir si el
ítem sigue el modelo de Rasch especificado. Cada uno de
estos estadísticos tiene una esperanza matemática de 1,
por lo que el ítem que ajusta el modelo perfectamente
debe tener este valor. Si la media cuadrática es mayor que
1x, entonces el ítem tiene un x% más de variabilidad que
la esperada por el modelo de Rasch, mientras que si la
media cuadrática es menor que 1, entonces tiene un x%
menos de variabilidad que la esperada por el modelo de
Rasch.
La transformación t de Wilson-Hifferty puede utilizarse
también para decidir sobre el ajuste de los ítems. Así, esperamos que los ítems que se ajustan al modelo de Rasch
tengan sus estadísticos t en el intervalo [—2, +2]. En el caso
del análisis de crédito parcial (fig. 2), casi ningún ítem se
ajusta al modelo de Rasch si utilizamos el estadístico no ponderado, aunque si tenemos en cuenta el estadístico de ajuste
ponderado, la mayor parte de los ítems sigue el modelo de
Rasch, excepto los ítems 8, 9, 10, 12, 13, 14, 15 y 18. En
principio, la estrategia aconsejada por los investigadores en
este campo15 consiste en modificar o eliminar estos ítems
hasta encontrar una escala que se ajuste en todos sus ítems
al modelo de Rasch. No todos los investigadores están de
acuerdo con esta solución, ya que un proceso de eliminación
o modificación de ítems poco cuidadosa puede alterar gravemente el contenido del test que estamos construyendo.
En principio, pues, los ítems 1, 2, 3, 4, 5, 6, 7, 11, 16, 17,
19, 20, 21, 22, 23 y 24 formarían una escala de Rasch unidimensional para evaluar el grado de habilidad en el manejo
de objetos en una muestra de niños de las características
que hemos utilizado en este estudio (fig. 2).
El análisis de los datos mediante ambos modelos politómicos (modelo de crédito parcial y modelo de escalas de
valoración) demostró que los datos del patrón de respuestas
no se ajustan a lo esperado por los modelos para la mayoría
de los ítems centrales de la escala, por lo que el ajuste no
es el adecuado en ninguno de ambos casos.
A pesar de que el modelo de crédito parcial (fig. 2) se
ajusta mejor que el de escalas de valoración, ya que la desviación es significativamente menor, el hecho de que en este
análisis 7 ítems centrales (8, 9, 10, 12, 13, 14, 15 y 18) obtengan estadísticos t significativamente por encima del valor
umbral ±2 nos da una idea de que hay demasiados ítems con
patrones de respuesta que no se ajustan adecuadamente al
modelo y que ofrecen datos que difieren significativamente
de lo esperado. Además, en el análisis con el modelo de crédito parcial, la mayoría de estos ítems centrales presentan
un índice de dificultad mayor para pasar de su categoría 0
a la 1 que para pasar de su categoría 1 a la 2 (12, 13, 14 y
15) —–lo lógico es presentar mayor dificultad en el paso de
la consecución parcial de la prueba a la consecución total,
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Análisis psicométrico de la subescala manipulación de objetos
151
TABLES OF RESPONSE MODEL PARAMETER ESTIMATES
TERM 1: item
VARIABLES
UNWGHTED FIT WGHTED FIT
______________
___________ ___________
item
ESTIMATE ERROR MNSQ T
MNSQ T
1
13.319
0.327
1.27
1.9
0.54 −1.8
2
−4.980
0.314
3.40 11.0
0.63 −1.3
3
−4.926
0.314
3.34 10.9
0.63 −1.3
4
−4.874
0.315
3.28 10.7
0.63 −1.3
5
−4.823
0.315
3.22 10.5
0.63 −1.3
6
−3.625
0.283
5.26 16.2
1.19 0.7
7
−3.933
0.290 10.16 25.5
1.03 0.2
8
−2.363
0.267
4.30 13.7
1.87 2.5
9
−2.225
0.264
3.38 11.0
1.84 2.5
10
−1.928
0.264
4.29 13.7
2.12 3.1
11
−2.805
0.273
4.23 13.5
1.57 1.8
12
−1.156
0.256
3.08 10.0
2.46 3.8
13
−0.523
0.240
2.28
7.0
2.55 4.0
14
−0.721
0.255
4.25 13.6
3.11 4.4
15
−0.401
0.233
1.85
5.0
2.24 3.6
16
0.900
0.192
0.94 −0.4
1.21 1.2
17
0.454
0.198
1.04
0.3
1.16 1.1
18
0.379
0.207
1.27
1.8
1.60 2.6
19
1.550
0.177
1.00
0.1
0.98 −0.1
20
3.538
0.156
1.03
0.2
0.97 −0.2
21
3.885
0.158
0.96 −0.3
0.92 −0.6
22
3.627
0.151
0.86 −1.0
0.91 −0.6
23
4.831
0.166
0.94 −0.4
0.92 −0.4
24
6.799*
An asterisk next to a parameter estimate indicates that it is constrained
Separation Reliability = 0.996
Chi-square test of parameter equality = 5974.680, df = 23, Sig Level = 0.000
TERM 2: item*step
VARIABLES
UNWGHTED FIT WGHTED FIT
______________
___________ ___________
item
ESTIMATE ERROR MNSQ T
MNSQ T
6
1
−0.529
0.690
2.40 7.4
7.46 2.3
7
1
0.682
1.070
3.34 10.9 11.44 2.2
8
1
−0.343
0.576
1.15 1.1
3.35 1.9
9
1
−0.589
0.524
0.96 −0.2
2.83 1.9
10
1
−0.179
0.559
0.79 −1.6
2.53 1.6
11
1
−0.524
0.595
1.32 2.2
4.35 2.2
12
1
0.147
0.539
0.73 −2.1
1.68 1.1
13
1
0.480
0.533
0.58 −3.6
1.26 0.6
14
1
1.863
1.018
0.54 −4.0
1.51 0.8
15
1
0.077
0.447
0.67 −2.7
1.18 0.6
16
1
−0.174
0.317
0.55 −3.9
0.81 −1.2
17
1
−1.185
0.271
0.70 −2.4
0.90 −0.9
18
1
−0.109
0.356
0.55 −3.9
0.89 −0.4
19
1
−1.397
0.229
0.92 −0.6
1.04 0.6
20
1
−0.866
0.219
0.83 −1.3
0.89 −1.8
21
1
−0.931
0.219
0.96 −0.3
1.00 0.0
22
1
−0.411
0.233
0.83 −1.3
0.91 −1.0
23
1
−0.831
0.234
0.91 −0.6
1.06 0.5
24
1
0.564
0.527
1.45 2.9
0.97 0.1
An asterisk next to a parameter estimate indicates that it is constrained
Figura 2
Análisis con el modelo de crédito parcial.
es decir, de la puntuación 1 a la 2—–, lo que puede influir en
la alteración de los resultados esperados y lo que indica que
puede ser adecuada la reorganización de las tres categorías
de clasificación (0, 1 y 2) en una dicotomía (0, 0, 1) para evitar el colapso de la categoría intermedia (1) combinándola
con la categoría inferior (0).
Por lo tanto, decidimos descartar los dos modelos de
análisis politómico para plantear un modelo dicotómico de
Rasch (fig. 3) que represente con más fiabilidad la distribución de los datos del patrón de respuestas de la subescala
de valoración estudiada del PDMS-2. Para ello, recodificamos todos los ítems transformando sus categoría de 3 a tan
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
152
O. Dols Calatayud, J.A. López Pina
MODELO DICOT MICO DE RASCH
TABLES OF RESPONSE MODEL PARAMETER ESTIMATES
TERM 1: item
VARIABLES
UNWGHTED FIT
______________
___________
item
ESTIMATE ERROR MNSQ T
WGHTED FIT
___________
MNSQ T
2
−4.781
0.643
2.95 9.5
1.31 0.7
3
−4.781
0.643
2.95 9.5
1.31 0.7
4
−4.779
0.643
2.94 9.5
1.31 0.7
5
−4.778
0.643
2.94 9.5
1.31 0.7
6
−2.897
0.527
2.55 8.0
2.33 2.1
7
−3.981
0.590
2.93 9.5
1.74 1.3
8
−1.784
0.465
1.62 3.9
2.45 2.4
9
−1.493
0.447
1.46 3.0
2.36 2.4
10
−1.493
0.447
1.46 3.0
2.36 2.4
11
−2.110
0.484
1.81 4.8
2.49 2.4
12
−0.995
0.414
1.17 1.2
2.09 2.3
13
−0.583
0.387
1.07 0.6
1.85 2.1
0.430
1.47 3.0
2.25 2.4
14
−1.232
15
−0.233
0.365
1.08 0.6
1.63 1.9
16
1.309
0.285
0.77 −1.8
0.92 −0.6
17
1.655
0.272
0.74 −2.1
0.86 −1.3
18
0.704
0.312
1.02 0.2
1.16 0.9
19
3.004
0.242
0.81 −1.4
0.89 −1.2
20
4.736
0.253
1.17 1.2
1.14 0.7
21
5.179
0.266
1.36 2.4
1.10 0.5
22
4.529
0.248
0.90 −0.7
1.02 0.1
23
6.213
0.320
1.21 1.4
1.09 0.4
24
8.591*
An asterisk next to a parameter estimate indicates that it is constrained
Separation Reliability = 0.983
Chi-square test of parameter equality = 2026.901, df = 22, Sig Level = 0.000
Figura 3
Análisis con el modelo dicotómico de Rasch.
solo 2 posibles. Para ello reconvertimos el formato de respuesta múltiple (de 3 respuestas posibles) de los ítems de
la escala estudiada a un formato dicotómico. Las puntuaciones de respuestas 0 y 1, que representan la no consecución
o la consecución parcial de la prueba, se recodificaron como
puntuación 0, y la puntuación 2, que representa la realización adecuada de la prueba, se recodificó como 1. Además,
suprimimos el ítem número 1 para que no influya en los resultados del análisis, ya que debido a que todos los sujetos
evaluados han puntuado con la máxima calificación posible
(2) en este ítem no se puede analizar la variabilidad en sus
resultados (fig. 3).
El análisis de los datos mediante el modelo dicotómico
de Rasch demostró un buen ajuste de los datos, a pesar de
que 8 ítems centrales (6 y del 8 al 14) presentaban un valor
del estadístico t ligeramente por encima del valor umbral
+2 desviaciones típicas, lo que nos indica que el patrón de
respuestas a los ítems se aleja de forma sensible de lo esperado por el modelo de Rasch, pero que gracias al buen ajuste
global nos permite a la vez asegurar con cierta precaución
que la variabilidad en las respuestas del conjunto de ítems
estudiados obedece a una sola dimensión de habilidades
manipulativas en niños.
Según el análisis dicotómico de Rasch de la figura 3, los
ítems con una dificultad más elevada fueron los 5 ítems más
avanzados y en el siguiente orden creciente de dificultad: el
ítem 22: coger una pelota en el aire, el 20: dar en el blanco
por arriba, el 21: botar una pelota con una mano, el 23: dar
una patada a un balón (con desplazamiento y un movimiento
adecuado) y, el más difícil, el 24: coger una pelota que bota,
con un índice de dificultad muy por encima de los anteriores.
Mientras que los ítems más fáciles fueron los cuatro primeros
del test (sin contar el primer ítem, que fue descartado para
el análisis) en orden creciente de dificultad: el ítem 2: hacer
rodar el balón, el 3: lanzar la pelota en cualquier dirección,
el 4: dar una patada a un balón (sin llegar a desplazarlo) y
el 5: lanzar la pelota estirando el brazo, todos ellos con un
índice de dificultad muy similar. Para una mejor visualización
de las propiedades de estos ítems es corriente graficar las
probabilidades de los ítems para cada uno de los posibles
niveles de habilidad de las personas en este grupo. Las curvas
resultantes se conocen como curvas características de los
ítems (CCI) y en ítems dicotómicos son siempre monotónicas
crecientes. La figura 4 presenta las CCI de 3s ítems de este
test.
Obsérvese que los 3 ítems representados cumplen el
supuesto básico del modelo de Rasch según el cual a mayor
habilidad de los sujetos existe una mayor probabilidad de
realizar correctamente la prueba del ítem representado.
Además, las CCI que siguen el modelo de Rasch tienen la
misma forma y son paralelas entre sí, variando únicamente
en su situación en relación con el continuo de habilidad,
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Análisis psicométrico de la subescala manipulación de objetos
1,0
0,9
0,8
Probabilidad
0,7
0,6
0,5
0,4
0,3
0,2
I17
0,1
I18
I19
0,0
−3
−2
−1
0
1
2
3
Habilidad
Figura 4 Representación de las CCI 17, 18 y 19 de la subescala
manipulación de objetos.
como se puede observar en el caso de los ítems del gráfico,
aumentando con igual progresión la probabilidad de realizar correctamente la prueba con el aumento de habilidad
de los sujetos evaluados. Cuanto más fácil es el ítem, más
hacia la izquierda estará su CCI, mientras que cuanto más
difícil sea, más a la derecha se encontrará la CCI. Llama la
atención que el nivel de dificultad del ítem 18 sea menor que
el del ítem 17, lo que indica que para la muestra de niños
evaluada en este estudio supone una mayor habilidad realizar adecuadamente el ítem 17 que el 18, al contrario que
para la muestra utilizada por los autores de la escala. Esto
sucede también en algunos de los otros ítems de la escala,
lo que analizaremos posteriormente con la ayuda del mapa
de Wright.
Como ya hemos comentado, una de las mayores ventajas
del modelo de Rasch es la propiedad de medición conjunta,
en la que los parámetros de persona e ítems están en la
misma escala, y que permite comparar sus distribuciones
directamente (fig. 5). La presentación de ambas distribuciones de forma vertical, una frente a otra, se conoce como
mapa de Wright24,25 . Generalmente, el programa ConQuest
centra la escala de dificultad de los ítems para tener media
0, con lo que los parámetros de dificultad de todos los
ítems se distribuirán con más o menos amplitud alrededor
de la media. Un test con unas adecuadas propiedades psicométricas será el formado por ítems que cubran el mayor
rango posible de dificultades, de modo que todas las personas, independientemente de su habilidad, puedan ser
evaluadas.
En la figura 5 la primera columna por la izquierda representa ambas escalas (habilidad y dificultad) en el rango de
—6 a 12. El ítem más difícil (ítem 24) aparece en la parte
superior de la distribución y los ítems más fáciles (ítems 2,
3, 4 y 5) aparecen en la parte inferior de la distribución. Se
observa también que en la parte central se acumulan unos
pocos ítems (15, 13, 12, 14, 9 y 10) que quizás provocan
cierta redundancia en la medida de las personas que ocupan
el centro de la distribución. Sin embargo, esta situación es
normal para este test en concreto, ya que fue construido
153
según el MCT que prioriza los ítems de dificultad media
frente a los ítems de dificultad baja o alta. Desde el punto de
vista del modelo de Rasch, hubiera sido deseable una mayor
amplitud de dificultad entre los ítems, cubriendo rangos de
habilidad (intervalos —3 a —4 y +2 a +4) para los que no se
dispone de ítems en esta subescala. No obstante, el modelo
de Rasch ofrece (fig. 3, abajo) un coeficiente que permite
estimar la separabilidad de los parámetros. Este coeficiente
varía entre 0 y 1, y en nuestro caso su cuantía ha sido de
0,983, lo que nos indica que la separabilidad de los parámetros de dificultad de estos ítems ha sido suficiente para
evaluar la habilidad de manipulación de objetos de los niños
que forman este grupo.
Justo a la izquierda de la distribución de los parámetros
de dificultad, aparece la distribución de los parámetros de
habilidad de las personas (marcados con una X). Se puede
observar en la figura 5 que la distribución de las personas
se parece mucho a una distribución normal y los parámetros
de los ítems se encuentran dispersos a lo largo del continuo dificultad, y ligeramente desequilibrados con respecto
a la distribución de las personas. Si la habilidad media del
grupo fuera igual a la dificultad media del test, ambas distribuciones se situarían una frente a la otra pero, en este
caso, la falta de congruencia de ambas distribuciones quiere
decir que la funcionalidad media de las personas evaluadas
en este grupo está por encima de la dificultad media de los
ítems empleados en este test.
Es importante resaltar también el hecho de que muchos
de los ítems de la subescala analizada no siguen el orden de
dificultad asignado por sus creadores en su desarrollo inicial.
Se puede observar en el mapa de Wright que el ítem 6 supera
al 7 en dificultad, los ítems 8, 9 y 10 superan al 11, los ítems
12 y 13 superan al 14, los ítems 16 y 17 superan al 18 (como
se observaba en el gráfico de las CCI representado), y los
ítems 20 y 21 superan al 22. Estos resultados indican que el
nivel de dificultad asumido por los autores de la escala para
estos ítems, según el nivel de habilidad de los sujetos de la
muestra utilizada para su desarrollo, no es el mismo y no
sigue el mismo orden que el que hemos encontrado para la
muestra utilizada en este estudio.
Discusión
La unidimensionalidad de una escala de valoración hace
referencia a que solo una dimensión sea capaz de explicar la variación de las respuestas de las personas a los
ítems, aunque es posible que existan dimensiones secundarias necesarias para obtener esas respuestas, como puede
ser la capacidad de comprensión en los niños para entender
las indicaciones sobre la prueba de cada ítem y poder realizarla adecuadamente. En este caso, la dimensión o atributo
al que todos los ítems de la escala estudiada deben referirse
es la capacidad motriz gruesa relacionada con la manipulación de objetos. Según los análisis realizados, hemos
encontrado que la subescala manipulación de objetos del
PDMS-2 no es esencialmente o funcionalmente unidimensional (aunque así se plantea partiendo de su elaboración
bajo el MCT) porque no hemos conseguido adaptar con
éxito un modelo politómico unidimensional que explique de
forma adecuada los resultados recogidos en la matriz de
respuestas.
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
154
O. Dols Calatayud, J.A. López Pina
Rasch dicotomico-pdms2
Wed Jun 16 19:17:13 2010
MAP OF LATENT DISTRIBUTIONS AND RESPONSE MODEL PARAMETER ESTIMATES
================================================================================
Terms in the Model Statement
+item
--------------------------------------------------------------------------------------12
|
|
|
|
|
|
11
|
|
|
|
|
|
10
|
|
|
|
|
|
XX|
|
9
|
|
X|24
|
X|
|
8
XXX|
|
XXX|
|
X|
|
7
|
|
X|
|
|
|
6
XXX|23
|
XX|
|
XXXXXX|
|
XXXXXXXX|21
|
5
XXXXX|20
|
XXX|22
|
XXXXXXXXXXX|
|
4
XXXXXX|
|
XXXXXX|
|
XXXXXXXXXXXXX|
|
3
XXXXXXXXXXXXXXX|19
|
XXXXXXXXXXXXXXXXXXXXXXX|
|
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX|
|
2
XXXXXXXXXXXXXXXXXXXXXXXXX|
|
XXXXXXXXXXXXXXXX|17
|
XXXXXXXXX|
|
XXXXXXXX|16
|
1
XXXXXXXXXXX|
|
|18
|
|
|
0
|
|
|15
|
|13
|
-1
|12
|
|14
|
|9 10
|
-2
|8
|
|11
|
|
|
|6
|
-3
|
|
|
|
|
|
-4
|7
|
|
|
|2 3 4 5
|
-5
|
|
|
|
|
|
-6
|
|
XXX|
|
=======================================================================================
Each 'X' represents
0.5 cases
=======================================================================================
Figura 5
Mapa de Wright de los ítems 2-24 de la escala.
Este hecho puede haberse debido a diferentes factores
intrínsecos relacionados con la escala, como la posibilidad
de que, efectivamente, la escala no sea realmente unidimensional y haya ítems que dependan en su respuesta de
más de una dimensión o atributo (como pueden ser los ítems
centrales de la escala, que son los que más se alejan en su
patrón de respuestas de lo esperado por ambos modelos politómicos), o que alguno de estos ítems no sean localmente
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Análisis psicométrico de la subescala manipulación de objetos
independientes, es decir, que la probabilidad de que una
persona acierte un ítem esté afectada por la probabilidad
de que acierte otros o que la probabilidad de que dos o más
personas acierten un ítem no sea independiente para cada
uno de ellos.
La no unidimensionalidad encontrada también puede
deberse a factores relacionados con las características de
la muestra utilizada para analizar las propiedades psicométricas de la escala, como el hecho de que la muestra tenga
una media de edad ligeramente por encima de la edad comparativa de dificultad de la subescala, o como el hecho de
que el pequeño porcentaje de niños con alteraciones del
desarrollo de la muestra clínica (8,49% de la muestra completa) esté afectando al ajuste del patrón de respuestas a
los modelos de respuesta múltiple.
Sin embargo, en un posterior análisis con los ítems dicotomizados, sí que se encontró una evaluación unidimensional
de las capacidades motrices medidas por la subescala analizada, probablemente debido a que al modificar el diseño
politómico de respuesta múltiple y dicotomizar todos los
ítems se optimizaron en gran medida las propiedades psicométricas de la subescala, ya que se evitó el colapso de la
categoría intermedia de respuesta de los ítems.
Con este estudio, realizado sobre una única subescala de
las seis que forman el PDMS-2, hemos demostrado la potencialidad de la familia de modelos de Rasch para obtener
una evaluación más exacta de las personas en el atributo
medido, a través de un proceso de análisis de la escala con
los diferentes modelos de Rasch y paso a paso, lo cual solventa la mayor parte de las asunciones y dificultades de la
metodología ofrecida por el MCT. La familia de modelos de
Rasch no solo permite obtener una evaluación más exacta
del atributo, sino que a la vez es un medio para confirmar
la presencia de uno y solo un atributo medido a través de
estadísticos de ajuste de los ítems. Además, las estimaciones de la habilidad de las personas no son un mero conteo
de ítems contestados o acertados, sino que se estiman de
acuerdo con un modelo matemático que incorpora supuestos a esas puntuaciones, como la unidimensionalidad de la
medida y la independencia local de los ítems. De manera que
si los datos recogidos presentan un buen ajuste al modelo de
Rasch propuesto, en este caso el modelo dicotómico, entonces es posible afirmar que las estimaciones de los parámetros
de los ítems y las estimaciones de los parámetros de habilidad de las personas evaluadas son independientes entre
sí, hecho perseguido durante mucho tiempo en el diseño de
escalas de medida en ciencias de la salud y no conseguido
hasta ahora con ningún otro modelo de medida conocido.
La escala PDMS-23 es una de las herramientas de valoración más utilizadas en el ámbito de la fisioterapia pediátrica
y de la atención temprana en general, tanto a nivel
práctico5,6 , como puramente investigador10-12 , pero a pesar
de ello todavía existe en la actualidad poca investigación
acerca de sus propiedades de medida.
En este trabajo hemos encontrado diferencias significativas en cuanto a la dificultad de los ítems en comparación
con el diseño de la subescala original. Hemos encontrado
ítems muy fáciles para los niños incluidos en este estudio y
que serían apropiados solamente para niños más pequeños
o aquellos con problemas en el desarrollo motor. Por esta
razón, estudios futuros desarrollados en la misma línea son
necesarios para evitar problemas en la calificación real de
155
la edad motriz establecida por la escala, mediante la optimización de las características psicométricas de los ítems.
Por último, este estudio proporciona evidencia preliminar
de que la simplificación de las escalas de calificación de la
mayoría de los ítems de la escala manipulación de objetos
del PDMS-2 a categorías dicotómicas podría optimizar las
cualidades de medición de la subescala, teniendo en cuenta
que el modelo dicotómico de Rasch ha sido el que mejor ha
funcionado para explicar la variabilidad de las respuestas de
los niños y niñas de la muestra.
Agradecimientos
Agradecemos de corazón el apoyo prestado para la realización de este trabajo a todos los profesionales que lo han
hecho posible, compañeros de la Consejería de Educación
de la Región de Murcia, maestras de educación infantil y,
por supuesto, a los tutores del Máster en Intervención e
investigación en ejercicio físico, salud y dependencia de la
Universidad de Murcia. Y con especial afecto y cariño, a los
niños y a los padres que han colaborado con tesón en el
proyecto.
Conflicto de intereses
Los autores declaran no tener ningún conflicto de intereses.
Bibliografía
1. Harris SR, McEwen IR. Assessing motor skills. En: McLean ML,
Bailey D, Wolery M, editores. Assessing infants and toddlers
with special needs. Columbus, Ohio: Merrill; 1996. p. 305—33.
2. Antonette KD, McEwen IR, Parker D, Laskinet J. Effects of testing context on ball skill performance in 5-year-old children
with and without developmental delay. Phys Ther. 1999;79:9.
3. Folio MR, Fewell RR. Peabody developmental motor scales:
examiner’s Manual. 2.a ed. Austin: PROED; 2000.
4. Tieman BL, Palisano RJ, Sutlive AC. Assessment of motor development and function in preschool children. Ment Retard Dev
Disabil Res Rev. 2005;11:189—96.
5. Parmar Sanjay KS. Applicability of Peabody developmental
Motor Scales PDMS-2 as a developmental assessment scale for
Indian children. Occup Ther Int. 2008;2:1—3.
6. Cools W, Martelaer K, Samaey C, Andries C. Movement skill
assessment of typically developing preschool children: A
review of seven movement skill assessment tools. J Sports Sci
Med. 2009;8:154—68.
7. Wang HH, Liao HF, Hsieh CL. Reliability, sensitivity to change,
and responsiveness of the Peabody developmental motor
scales-second edition for children with cerebral palsy. Phys
Ther. 2006;86:1351—9.
8. Van Hartingsveldt MJ, Cup EH, Oostendorp RA. Reliability and
validity of the fine motor scale of the Peabody developmental
motor scales-2. Occup Ther Int. 2005;12:1—13.
9. Provost B, Heimerl S, McLain C, Nae-Hwa Kim BA, Lopez B,
Kodituwakku P. Concurrent validity of the Bayley scales of
infant development II motor scale and the Peabody developmental motor scales-2 in children with developmental delays.
Pediatr Phys Ther. 2004;16:149—56.
10. Evensen KA, Skranes J, Brubakk AM, Vik T. Predictive value of
early motor evaluation in preterm very low birth weight and
term small for gestational age children. Early Human Development. 2009;85:511—8.
Documento descargado de http://www.elsevier.es el 26/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
156
11. Santos DC, Tolocka RE, Carvalho J, Heringer LR, Almeida CM,
Miquelote AF. Gross motor performance and its association
with neonatal and familial factors and day care exposure
among children up to three years old. Rev Bras Fisioter.
2009;13:173—9.
12. Chen YP, Kang LJ, Chuang TY, Doong JL, Lee SJ, Tsai MW, et al.
Use of virtual reality to improve upper-extremity control in
children with cerebral palsy: a single-subject design. Phys Ther.
2007;87:1441—57.
13. Vander Linden W. Fundamental measurement and the fundamentals of Rasch measurement. En: Wilson M, editor. Objective
measurement: Theory into practice, 2. Nueva Jersey: Ablex;
1994. p. 3—24.
14. Andrich D. Rasch models for measurement. Beverly Hills: Sage;
1988.
15. Wright BD, Masters GN. Rating scale analysis. Chicago: MESA
Press; 1982.
16. Wright BD, Stone M. Best test design. Chicago: MESA Press;
1979.
17. Smith EV, Smith RM. Introduction to Rasch measurement. Minnesota: JAM Press; 2004.
O. Dols Calatayud, J.A. López Pina
18. Lopez Pina JA. Teoría de la respuesta al ítem: fundamentos.
Barcelona: DM-PPU; 1995.
19. Andrich D. A rating formulation for ordered response categories. Psychometrika. 1978;43:561—73.
20. Lange R, Greyson B, Houran J. A Rasch scaling validation
of a ‘core’ near-death experience. Br J Psychol. 2004;95:
161—77.
21. Lopez Pina JA. Análisis psicométrico de la escala de marcha
y equilibrio de Tinetti con el modelo de Rasch. Fisioterapia.
2009;31:192—202.
22. Chien CW, Bond TG. Measurement properties of fine motor
scale of Peabody developmental motor scales-second edition.
A Rasch analysis. Am J Phys Med Rehab. 2009.
23. Wu ML, Adams RJ, Wilson MR, Haldane SA. ACER ConQuest.
Version2. 0: generalised item response modelling software.
Victoria: ACER Press; 2007.
24. Bond TG, Fox Ch M. Appying the Rasch model: Fundamental measurement in the human sciences. Nueva Jersey: LEA;
2001.
25. Wilson M. Constructing measures: An item response modelling
approach. Nueva Jersey: LEA; 2005.
Descargar