Tema 2 - Universidad de Granada

Anuncio
Tema II. La Psicometría y la Teoría de los
Tests
INDICE
o Introducción
o Definiciones y objetivo de la
Psicometría
o Historia de la Psicometría
o El objeto de la medición en Psicología
o El método de la Psicometría
o Los contenidos de la Psicometría
o La Teoría de los Tests
BIBLIOGRAFÍA RECOMENDADA
Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos
y educativos. Madrid: Síntesis. Capítulo 1.
Introducción
La finalidad de este tema es presentar la Psicometría e
introducir uno de sus contenidos más importantes: la Teoría de Tests.
Intentar definir un concepto complejo como el de "Psicometría",
al igual que ocurre con la denominación de cualquier disciplina
científica, es una tarea difícil, razón por la que, al contrario de lo que
se podría pensar, no abundan las definiciones explícitas. Bajo la
palabra "Psicometría" pueden convivir contenidos, enfoques,
objetivos y hasta concepciones diferentes sobre la ciencia y la función
social de la Psicología. Por todo ello, tal vez la única estrategia útil
2
para abordar una delimitación conceptual comprehensiva y lo más
exacta posible de la Psicometría sea recorrer desde una perspectiva
histórica la evolución de la medición psicológica, esbozar un análisis
de la naturaleza del "objeto" de la medición psicológica, describir el
método psicométrico, presentar los contenidos de la Psicometría y, a
pesar de las dificultades ... no resistir la tentación final de proponer
una definición propia de la Psicometría.
Definiciones y objetivo de la Psicometría
En este apartado se aborda el significado de la denominación de
la disciplina y se señalan los elementos comunes de las definiciones
propuestas por diferentes autores.
El término "Psicometría" es el más extendido y general para
hacer referencia a la medición psicológica. Su significado popular y la
etimología de la palabra apuntan en la misma dirección: la disciplina
que se encarga de la medición en Psicología. De hecho, los
diccionarios de uso más común como el de la Real Academia de la
Lengua o el de María Moliner también coinciden en su significado: la
medida de los fenómenos psíquicos.
Para avanzar en el camino hacia una delimitación conceptual de
la disciplina es necesario detenerse en las definiciones explícitas que,
desde la propia Psicología, se han propuesto para la Psicometría.
Señalar los puntos comunes y las diferencias de matiz entre ellas
pueden ayudar a entender el alcance de la disciplina.
Yela (1968) apunta que la Psicometría se ocupa de todas las
medidas en el campo psicológico, habiéndose desarrollado a través
de dos ramas principales: los métodos psicofísicos y la teoría de los
tests. Nunnally (1973) se refiere a la Psicometría como la
metodología encargada del desarrollo y utilización de las técnicas de
medición en todos los ámbitos de la psicología.
Muñiz (1998) define la Psicometría como "... el conjunto de
métodos, técnicas y teorías implicadas en la medición de variables
psicológicas... lo específico de la Psicometría sería su énfasis y
especialización en aquellas propiedades métricas exigibles a las
mediciones psicológicas independientemente del campo sustantivo de
aplicación y de los instrumentos utilizados" (pág. 17).
3
La definición de Martínez-Arías (1995) introduce un matiz que
apunta hacia la relación entre la Psicometría y la Psicología
Matemática. Para la autora, la Psicometría "... aglutina todo el
conjunto de modelos formales que posibilitan la medición de variables
psicológicas, centrándose en las condiciones que permiten llevar a
cabo todo proceso de medición en psicología" (pág. 21).
No resulta difícil entresacar los elementos comunes de las
definiciones anteriores. La Psicometría es una disciplina metodológica,
sin un contenido psicológico propio, pero con un campo sustantivo: la
teoría de la medición en sentido amplio. Muñiz (1998) afirma que el
trabajo psicomético tiene como finalidad construir y utilizar
adecuadamente los tests y las escalas, de tal modo que se garantice
su fiabilidad, validez y aplicación adecuada.
Historia de la Psicometría
La revisión de los antecedentes históricos y de la evolución de
la medida en Psicología, ofrece una perspectiva útil para comprender
la Psicometría actual. Para algunos autores, la historia de los tests
mentales es tal vez uno de los mejores ejemplos de la existencia de
una interacción entre las demandas sociales y la evolución de una
disciplina científica. Salvando las distancias, la valoración es aplicable
al conjunto de la historia de la medida en Psicología.
La historia de la medición psicológica ha estado marcada por la
interrelación entre la evolución interna de la Psicometría y de la
Psicología con el deseo de responder a las demandas sociales de cada
momento histórico, reflejando un mayor acento en las aplicaciones
prácticas que en el desarrollo teórico.
Este apartado pretende esbozar el entorno intelectual y social
en el que nace la Psicología moderna y con ella la Psicometría. A
continuación, sólo se aborda una de las dos líneas de trabajo que más
trascendencia han tenido para la evolución de la Psicometría: el
estudio de las diferencias individuales; para la otra línea: la
Psicofísica, se puede recurrir a la bibliografía complementaria del
tema. Por último, se señalan los acontecimientos que han marcado la
consolidación de la disciplina.
4
Estudio de las diferencias individuales
Debemos advertir de una doble simplificación. Primera, dejar a
un lado, por razones de tiempo, la Psicofísica impide lograr una visión
comprehensiva de la historia de la medición en Psicología; segunda,
la que vamos a cometer en este apartado, reducir la historia del
estudio de las diferencias individuales a la historia de los tests
psicológicos y presentarla recurriendo a las aportaciones de algunas
figuras clave. La última es reduccionista pero difícil de evitar: gran
parte de la Psicometría actual no se puede comprender sin atender a
los antecedentes y orígenes históricos de los tests psicológicos y de la
medida de la inteligencia.
El rápido progreso económico y social en la Europa de finales
del siglo XIX planteó la necesidad de evaluar las capacidades y
conocimientos de los individuos en contextos educativos, laborales,
etc. Si la Filosofía y la Fisiología fueron las disciplinas que más
influyeron en el trabajo de los primeros psicofísicos, el impacto más
dramático sobre el estudio de las diferencias individuales vino de la
Biología. Al tiempo que Fechnner presentaba sus trabajos, Darwin
(1809-1882) presentó su teoría en La Evolución de las Especies
(1859) y su aplicación al estudio del hombre en El origen del hombre
y la selección en relación al sexo (1871). Darwin defendió que la
inteligencia y el sentido moral también se habían ido perfeccionando
de manera gradual a través de la selección natural. Al defender esta
idea Darwin no hacía sino reflejar la visión científica y la opinión
popular dominante en la Inglaterra del siglo XIX, que justificaba el
colonialismo y el sistema de clases bajo la creencia de que el hombre
de letras inglés de clase media era el pico de la evolución humana
(Rust y Golombok, 1989).
No es exagerado afirmar que las necesidades de la evaluación
educativa fueron las primeras demandas sociales con un impacto
significativo y duradero en la evolución del estudio de las diferencias
individuales y, por ende, de la Psicometría. Los intentos por medir la
inteligencia como respuesta a esas demandas caminan de la mano de
los desarrollos metodológicos durante este periodo.
Thorndike (1997) señala al movimiento hacia la educación
obligatoria en Francia, Inglaterra y Estados Unidos a finales del siglo
XIX, como uno de los desarrollos críticos que propiciaron la medida
de la inteligencia. La llegada por primera vez a las escuelas de niños
cuyos padres no había recibido una educación o, como en el caso
americano, cuya lengua materna no era el inglés, generó una
5
heterogeneidad en la población de alumnos como antes no se había
conocido. La exposición de estos niños a un currículo antiguo,
diseñado para un grupo selecto de estudiantes, trajo como resultado
niveles dramáticos de fracaso escolar próximos al 50%. Este fracaso
fue visto como una pérdida de recursos en un tiempo en que eran
limitados, de forma que se planteó la necesidad de destinar los
recursos a quienes más se pudieran beneficiar, el medio: la
evaluación de la inteligencia. Este es el contexto en el que se debe
situar la obra de Binet
Los pioneros de la Psicología llevaban años intentando una
formulación aceptable de la inteligencia. Según Rust y Golombok
(1989) los primeros autores tenían unas definiciones de la
inteligencia que no iban más allá de lo que podría ser la psicología
popular del maestro común de escuela. Se reconocía la diferencia
entre una persona educada y una persona inteligente, entendiendo
esta última como una persona "educable", con un origen
esencialmente genético y receptora ideal de los recursos educativos,
frente a los "torpes" incapaces de beneficiarse de la educación
normal.
Entre los pioneros en el estudio de las diferencias individuales
destaca el considerado por muchos autores, como el fundador de la
Psicometría: Francis Galton. Primo de Darwin, inició sus
investigaciones llevado por el objetivo de mostrar el componente
hereditario del "genio". Para ello reunió el primer banco con los datos
de personas relacionadas y no relacionadas. Influido por el
asociacionismo de Locke y llevado por sus observaciones de que las
personas con deficiencias mentales presentaban una peor ejecución a
la hora de discriminar sensaciones de frío, calor, dolor, etc., pensó
que la discriminación sensorial podía ser el medio para cuantificar el
intelecto
de
una
persona.
Sus
aportaciones
propiamente
metodológicas abarcan la formulación de las bases de procedimientos
estadísticos, como el “coeficiente de correlación” desarrollado por K.
Pearson (1857-1936), las intuiciones sobre la forma de "campana",
como imagen para describir la distribución de puntuaciones en un
test, así como las primeras aplicaciones de las escalas de "rating" y
los métodos de cuestionario (Anastasi y Urbina, 1997).
J. M. Catell (1860-1944) trabajo con Wundt, con quién
compartió el interés por los fenómenos perceptivos y sensomotores, y
el rigor en el control de las condiciones en que se realizaban las
observaciones, pero de quién se distanció ante el despreció del
experimentalista alemán por las diferencias individuales. Más tarde
trabajo con Galton e inició en Estados Unidos el estudio de las
diferencias individuales. Acuñó el término "test mental" en un artículo
publicado en 1890 en la revista Mind bajo el título “Mental test and
measurements”. Asumió la idea de Galton sobre la posibilidad de
6
medir las funciones intelectuales por medio de tests de discriminación
sensorial y tiempo de reacción. Sin embargo, los primeros estudios
que se realizaron para evaluar este tipo de tests ofrecieron resultados
desalentadores: el "rendimiento intelectual" mostraba poca
correspondencia de unos tests a otros y prácticamente ninguna
relación con estimaciones independientes del nivel intelectual
realizadas por los profesores. Por el contrario, Ebbinghaus, apuntando
ya un cambio de enfoque, había obtenido con un test de terminación
de frases una correspondencia clara con el rendimiento académico de
los niños.
Pero sin duda, la consolidación social de la medición psicológica
vino de la obra del francés Alfred Binet (1857-1911) cuya influencia
en el desarrollo de la teoría de los tests perdura en la actualidad.
Binet ya a finales de los años noventa del siglo XIX criticó la
aproximación de Galton y Cattell con el argumento de que para medir
procesos mentales complejos era necesario observar la ejecución de
los individuos en actos mentales complejos, rechazando la idea de
que fuese necesaria una mayor precisión para la que no había
instrumentos disponibles, ya que las diferencias individuales eran
mayores respecto a los procesos superiores que en cuanto a la
discriminación sensorial.
Binet recibió en 1904 el encargo del ministerio francés de
instrucción pública de elaborar un instrumento de medida capaz de
diferenciar entre los niños "educables" y los que no podrían
beneficiarse de la educación normal. Junto con su colaborador Simon
presentó en 1905 la primera versión del test Binet-Simon. El test
estaba formado por 30 problemas o tareas dispuestos en orden de
dificultad creciente, que medían la capacidad de juicio, razonamiento
y comprensión. Para determinar el nivel de dificultad, los problemas
habían sido administrados a 50 niños de entre 3 y 11 años más a
algún niño retrasado. La segunda versión del test editada en 1908,
incluía un número mayor de ítems junto con la eliminación de algunos
que se habían considerado podían reflejar diferencias en función de la
extracción social de los niños, además aparecían ya agrupados por
niveles de edad. Binet prefirió el término "nivel mental" al de "edad
mental" popularizado por las sucesivas traducciones de la escala, ya
que el primer término estaba exento de las connotaciones evolutivas
del segundo. Al poco tiempo de su presentación, el test de Binet y
Simon fue traducido a diferentes idiomas y aplicado en diversos
países, lo que prueba la favorable acogida social que recibió.
El interés por la obra de Binet se ha mantenido a lo largo del
tiempo. Van der Linden (1986) ha resaltado las contribuciones
estrictamente metodológicas de la aproximación de Binet a la medida
de la inteligencia. Primero, frente a los experimentos antropométricos
y psicofísicos que planteaban una única tarea, Binet decidió alargar la
7
longitud del test por dos motivos: a) el conjunto de ítems debía ser
una representación adecuada de la gran variedad de tareas a las que
se debe enfrentar una persona en su vida diaria; y b) conocedor de
las teorías de Spearman entendió que cada ítem en sí mismo era una
media imprecisa, por lo que era necesario combinar observaciones de
un buen número de ítems para obtener una medida fiable. Segundo,
la insistencia de Binet en la estandarización de la aplicación del test,
reflejada en la extrema precisión de las guías sobre el material, la
administración, la puntuación y la interpretación de las mediciones.
Por último, la práctica de "normativizar" el test para iniciar una
interpretación relativa de la ejecución de las personas.
Tras las aportaciones de Binet, los mayores desarrollos en la
medición de las diferencias individuales hay que buscarlos en un área
y lugar diferente. El test de Binet fue introducido en Estados Unidos
por H. H. Goddard, cuya traducción y adaptación recibieron el
beneplácito de la audiencia médica, al venir a cubrir la necesidad de
una medida estandarizada y objetiva para el diagnóstico de la
subnormalidad. Sin embargo, fue rápidamente desplazada por la
revisión y adaptación psicométricamente más sólida, realizada por L.
M. Terman en 1916 en la Universidad de Stanford. Al entrar Estados
Unidos en la Primera Guerra Mundial, un comité encabezado por R.
M. Yerkes detecta la necesidad de clasificar de forma rápida al millón
y medio de reclutas con respecto a su nivel intelectual. De nuevo,
una demanda social provoca un avance metodológico: los primeros
tests de inteligencia de administración grupal y no verbales, para
evaluar a los reclutas analfabetos o que no tenían como lengua
materna el inglés. En este contexto hay que situar las contribuciones
de A. S. Otis, por la introducción del formato de elección múltiple y
otros formatos de puntuación objetiva. Impulsado por las
necesidades militares aparece también el primer test estandarizado
para la evaluación de variables de personalidad: el “Personal Data
Sheet” de R. S. Woodworth, un instrumento pensado para la
detección de personas con inestabilidad emocional.
La consolidación institucional de la Psicometría
De forma paralela a los avances teóricos y las aplicaciones
prácticas, se fue produciendo la consolidación institucional de la
Psicología y, claro está, de la propia Psicometría. Esta consolidación
se refleja en la creación de asociaciones profesionales, de
publicaciones especializadas para la comunicación entre profesionales
y de empresas privadas dedicadas desde el inicio al floreciente
negocio de la evaluación psicológica.
8
J. Jastrow habla sobre los tests en la primera convención de la
American Psychological Association (APA) en 1892. La APA formó en
1895 un comité especializado en la nueva tecnología de los tests. En
1899 Kilpatrick, presidente de la APA, realizó un llamamiento a los
psicólogos para que elaborarán tests de tal naturaleza que "...
pudieran ser aplicados tanto a niños como adultos, que fueran de tal
forma que todas las personas tuvieran las mismas oportunidades de
mostrar las capacidades examinadas, y que en aras de la economía
del tiempo fueran diseñados de forma que se pudieran administrar a
una clase o escuela de una vez" (Thorndike, 1997, pág. 6).
Impulsado por la figura clave de Terman el uso de los tests de
inteligencia en las escuelas creció rápidamente. El propio Terman
calculó que en el periodo entre 1920 y 1921 más de dos millones de
niños habían respondido a un test de inteligencia. El uso de test
también se extendió al mundo laboral como prueba su incorporación
a las prácticas de selección de la administración americana.
Cattell fundó la Psychological Corporation para la producción
industrial de tests en 1922. En 1947 se funda el Educational Testing
Service (ETS) institución sin animo de lucro que no sólo se ha
encargado de la producción de tests estandarizados de rendimiento y
tests de aptitud académica, sino que desde su constitución, ha
contribuido a la formación y práctica profesional de influyentes
psicómetras. Desde 1975, el ETS edita en formato CD-ROM el
proyecto ERIC donde con una periodicidad anual se recoge la
información disponible sobre tests, escalamiento y medición
psicológica y educativa.
Galton, Pearson y Weldon fundaron en 1901 la revista
Biometrika que desde entonces publica trabajos matemáticos
relacionados con la Biología y la Psicología. Thorndike funda en
Estados Unidos en 1936 la publicación Psychometrika, revista de
referencia para la Psicometría desde sus inicios. Desde entonces, la
aparición de revistas relacionadas con la medición psicológica ha sido
continua. Como muestra se pueden citar el Educational and
Psychological Measurement (1941), el British Journal of Statistical
Psychology (ahora con el nombre de British Jorunal of Statistical and
Mathematical Psychology) (1947), el Journal of Mathematical
Psychology y el Journal of Educational Measurement (1964), el
Multivariate Behavioral Research y el Aplied Psychological
Measurement (1977), el Applied Measurement in Education (1988),
etc.
Un acontecimiento que se ha convertido en referente obligado
para todos los profesionales es la publicación por las asociaciones
profesionales más relevantes de las guías técnicas y éticas de la
medición psicológica y educativa. Las recomendaciones elaboradas
9
por la APA son, sin duda, las que han tenido y tienen una mayor
influencia.
Tablas
cronológicas
con
los
acontecimientos,
figuras,
publicaciones, etc., relativas a la medición psicológica y educativa
pueden consultarse en numerosas fuentes (e. g., Anastasi y Urbina,
1997; Muñiz, 1998).
La Psicometría española
La aparición de la Psicometría en España está ligada al
nacimiento y desarrollo de la propia Psicología científica al igual que
en el resto del mundo. Carpintero (1996) señala uno de los rasgos
distintivos de la psicología española que también imprime carácter a
la propia Psicometría: España ha sido un país más receptor que
creativo y el interés por la disciplina fue el resultado de la
constatación de que la Psicología podía ofrecer soluciones prácticas
en ámbitos como la educación, la clínica o la empresa.
Autores del Renacimiento como Luis Vives (1492-1540) o
Huarte de San Juan (1530-1589) son los iniciadores de una tradición
que retomará la psicología científica cuando inicia su andadura en las
últimas décadas del siglo XIX. Carpintero (1996) sitúa en la Guerra
Civil la frontera divisoria entre dos épocas. Antes de la ruptura que
supuso la guerra es posible rastrear entre las aportaciones de
diferentes figuras los antecedentes de la Psicometría española. Muñiz
(1991) recoge una reseña de un libro publicado por Julian Besteiro en
1897 con el título de La Psicofísica. Carpintero (1996) destaca entre
los personajes de lo que denomina "la primera psicotecnia" a Emilio
Mira y López (1896-1964). Mira fundó en Barcelona el Institut
d'Orientacio Professional en 1918, realizó trabajos en el campo de la
orientación y selección profesional y fue autor de un test influido por
el acercamiento sensomotriz a la consciencia: el Test Miokinetiko
(PMK). Carpintero (1996) achaca a la falta de un análisis masivo de
sujetos normales en contextos industriales o militares al igual que se
hacía en Estados Unidos, la falta de una consciencia amplia sobre la
utilidad social de la Psicología durante este periodo.
José Germain (1898-1986) había iniciado su labor antes de la
guerra en el entorno intelectual de la Institución Libre de Enseñanza,
como prueba la adaptación y baremación para la población española
del test de Terman que realizó junto a Mercedes Rodrigo en 1930. Sin
embargo, destaca su figura por ser el iniciador, junto con sus
discípulos, del largo proceso de recuperación de la psicología
científica en España de los años cuarenta. Germain fue en 1948 el
primer director del recién creado Departamento de Psicología
10
Experimental, dentro del Instituto de Filosofía del Consejo Superior
de Instituciones Científicas. Entre los discípulos de Germain se
encontraba Mariano Yela (1921-1994) figura sin la que es imposible
entender la Psicometría española. Para obtener una idea global de la
persona y obra de Yela es útil leer la monografía que la revista
Psicothema publicó en 1996 poco después de su fallecimiento (vol.
8).
La Psicometría española carece de una revista específica
aunque son muchas las publicaciones periódicas que dedican un
apartado a la metodología de la medición psicológica. En 1995 se
constituyó la Asociación Española de Metodología de las Ciencias del
Comportamiento (AEMCO), encargada de organizar los Congresos de
Metodología que con periodicidad bienal, van ya por su sexta
celebración. AEMCO ha editado en 1999 el primer número de la
revista Metodología de las Ciencias del Comportamiento con la
pretensión de ser el lugar de referencia para las publicaciones de los
metodólogos españoles en el ámbito de las ciencias humanas y
sociales.
El objeto de la medición en Psicología
Al presentar las definiciones explícitas de la Psicometría
elaboradas por diferentes autores, se entresacaron sus elementos
comunes: disciplina metodológica, sin contenido psicológico propio,
pero con un dominio sustantivo: la teoría de la medición psicológica
en un sentido amplio. La definición de Muñiz (1998) señala además,
el rasgo definitorio de la preocupación psicométrica por la medida: las
condiciones métricas exigibles a todas medición. Sin embargo, hay
otra fuente de singularidad en la preocupación psicométrica por las
condiciones métricas de la medición que no es posible soslayar: la
que viene impuesta por la peculiaridad de los objetos psicológicos de
medición.
A diferencia de las variables físicas, las variables psicológicas no
se pueden observar de manera directa. No quiere esto decir, que en
psicología no se midan conductas directamente observables, cuya
cuantificación se suele obtener a través de alguno de sus parámetros:
duración, frecuencia, intensidad, etc., sino que, incluso en estos
casos, la conductas observables se interpretan como indicios o
resultado de variables inobservables más complejas. Atributos como
"autoestima", "habilidad lectora", "razonamiento analógico", etc., son
variables inobservables que sólo es posible medir por medio de los
comportamientos observables a los que den lugar.
11
Hay un amplio consenso sobre el término con el que referirse
de forma genérica a los objetos de medición: constructos. El término
"constructo" se ha hecho familiar en el campo de la medición
psicológica desde su utilización en el artículo de L. Cronbach y P. E.
Meehl titulado "Construct validity in Psychological Test" (1955).
Cronbach y Meehl (1955) entendieron por constructo un instrumento
intelectual para organizar la experiencia en categorías. Crocker y
Algina (1986) lo definen como "... productos de la imaginación
informada de los científicos sociales qué intentan desarrollar teorías
para explicar el comportamiento humano" (pág. 4).
Crocker y Algina (1986) ilustran el proceso de elaboración de
constructos insistiendo en su papel de "etiqueta" para resumir
comportamiento y remarcan la importancia de establecer alguna
regla de correspondencia entre el constructo y los comportamientos
observables que son sus indicadores legítimos. La dificultad a la hora
de encontrar la conexión "legítima" entre el constructo y sus
indicadores comportamentales es valorada como uno de los lastres
que impide el desarrollo de la medida psicológica.
Lord y Novick (1968) fijaron la definición obligatoria de los
constructos como requisito previo para su medición. La definición de
los constructos se debe abordar a dos niveles:
 Definición operacional o “semántica”. Consiste en
enumerar la serie de comportamientos indicadores que
“engloba” el constructo. Dichos comportamientos son
considerados los “indicadores empíricos” del constructo
objeto de la medición. La importancia de la definición
operacional es evidente: debe conectar la “etiqueta
verbal” con los datos observables.
 Definición conceptual o “sintáctica”. Recoge la teoría
sobre el constructo objeto de la medición. Se trata de un
discurso “conceptual” en el que se hacen explícitas las
relaciones del constructo objeto de la medición con otros
constructos
y/o
indicadores
empíricos
de
otros
constructos con los que el objeto de la medición está
relacionado.
La definición de los constructos a los dos niveles anteriores es
el primer paso inexcusable a la hora de iniciar cualquier medición.
12
El supuesto sobre la estabilidad de los
constructos
La medición psicológica asume, o al menos tiene en cuenta,
algunos supuestos sobre la naturaleza del objeto de la medición, es
decir, sobre la naturaleza de los constructos. Sin duda, el supuesto
común a la práctica totalidad de los modelos de medición es el de la
estabilidad de la variable.
Numerosos estudiosos de la medición psicológica defienden la
idea de que las diferentes versiones de la teoría de los tests (e. g., la
teoría clásica, la teoría de la generalizabilidad y la teoría de respuesta
al ítem) están elaboradas para hacer inferencias con el mismo
"esqueleto": la tendencia de las personas a comportarse de manera
prescrita en situaciones prescritas a partir de sus repuestas a un
conjunto de tareas predeterminadas. Por ejemplo, la perspectiva
tradicional para medir la inteligencia responde a este esquema
inferencial: empleo de tests estandarizados, compuesto por ítems o
tareas predeterminadas, aplicados bajo condiciones estandarizadas y
con la pretensión de predecir el rendimiento futuro de las personas en
situaciones igualmente "estandarizadas": la escuela, el trabajo, el
ejercito, etc., En definitiva, los modelos de medida se han elaborado
bajo el supuesto de estabilidad de la variable.
El supuesto de estabilidad está siendo amenazado por las
perspectivas más recientes sobre la evaluación psicológica, es decir,
por la necesidad de extender el "paradigma metodológico tradicional"
para responder, por ejemplo, a las inferencias que el paradigma
cognitivo plantea sobre las personas: las formas de uso y adquisición
de conocimientos y habilidades, en definitiva, para modelar el
cambio.
La polémica sobre el objeto de la medición
La cuestión sobre la naturaleza del objeto no ha estado exenta
de debate a lo largo de la historia de la medición psicológica como
reflejo de las discusiones sobre el propio objeto de estudio de la
psicología. Resulta difícil evitar plantearse preguntas como las
lanzadas por Meliá (1990): "¿Cuántos atributos latentes o rasgos
subyacentes existen?... ¿en qué medida son estables o evolucionan?
¿son comunes a todas las personas?" (pág. 37).
Rust y Golombok (1989) defienden que la discusión sobre el
objeto de medición ha dividido a la Psicometría en dos escuelas: la
Psicometría del rasgo y la Psicometría funcional. Spearman (1904,
1907) da carta de naturaleza a la Psicometría de los rasgos al
13
plantear que la esencia de la tarea de la medida mental es identificar
rasgos a través de las tendencias de los individuos a comportarse de
formas prescritas en situaciones prescritas. El fuerte carácter
hereditario atribuido por los pioneros de la medida mental a los
rasgos aparece suavizado en la definición de Messick (1989): "Un
rasgo es una característica relativamente estable de una persona –un
atributo, proceso duradero o disposición– que se manifiesta
consistentemente en algún grado a pesar de variaciones
considerables en el rango de contextos y circunstancias" (pág. 15).
Por el contrario, la Psicometría funcional defiende como un principio
de partida que ningún rasgo o variable psicológica interviniente es
relevante. Plantea que dado que es posible definir y medir
directamente los comportamientos a los que supuestamente
conducen los rasgos, el papel de estos es redundante.
Rust y Golombok (1989) contrastan la preeminencia de la
Psicometría funcional en la evaluación educativa, con la de la
Psicometría de los rasgos para la evaluación clínica; y proponen
resolver el enfrentamiento atendiendo a los procesos de toma de
decisión que realizan los clientes de la evaluación y de la selección
psicométrica: las decisiones se realizan resumiendo la medición en
términos de rasgos que reflejan lo que denominan "la psicología
popular humana" ("don de gentes", "genio", "liderazgo", etc.).
El método de la Psicometría
Meliá (1990) plantea que la conexión entre la Psicometría y la
psicología matemática, permite considerar el método de la
Psicometría desde una doble vertiente: por un lado, en tanto que la
teoría psicométrica se refiera a contenidos empíricos, el método no es
otro que el método científico propio de toda ciencia empírica; y por
otro lado, el componente matemático de los modelos formales de
medición, sujeta a la teoría psicométrica, como a la psicología
matemática, a los criterios formales de las matemáticas.
La relación entre la psicología matemática y la Psicometría ha
llevado a algunos autores a defender que el método de la Psicometría
es el de la psicología matemática. El esquema elaborado por Jáñez
(1989) es la referencia obligada a la hora de presentar el método de
la psicología matemática. De manera resumida, dos son las
características distintivas del método de la psicología matemática: a)
la presentación formal, generalmente en términos matemáticos, del
componente teórico; y b) el recurso a procedimientos deductivos
14
basados en la lógica o a procedimientos de simulación a la hora de
derivar las consecuencias del modelo matemático.
Mención especial merece la simulación, por la preponderancia
que está adquiriendo en Psicometría. El papel metodológico de la
simulación no resulta fácil de establecer. Muchos campos de la
Psicometría la utilizan como técnica de obtención de datos, cuando el
problema de investigación hace imposible contrastar el modelo con
datos empíricos. Este es el caso cuando se pretende descubrir las
propiedades y características de índices estadísticos, métodos de
estimación, potencia de contrastes, etc. Además, la simulación
preserva también el estatus de método en cuanto generadora de
conocimiento.
El análisis del método no puede obviar el papel instrumental de
la Psicometría como herramienta metodológica para la contrastación
empírica de las teorías psicológicas. La aplicación del método
científico en psicología obliga a que la Psicometría desempeñe un
papel activo en diferentes momentos del proceso. Arnau (1989)
articula las relaciones entre el plano teórico y empírico del método
científico en tres niveles: el nivel teórico-conceptual, que abarca
desde el planteamiento del problema hasta la formulación de
hipótesis empíricamente contrastables; el nivel técnico-metodológico
que abarca el plan de investigación y la estrategia de recogida de
datos; y el nivel estadístico-analítico, donde se realiza la modelización
estadística de los datos y las inferencias sobre las hipótesis sometidas
a contrastación. La generalización de los resultados hace retornar la
aplicación del método al nivel teórico-conceptual con lo que se cierra
el ciclo. La Psicometría acompaña a la aplicación del método en cada
uno de los tres niveles.
El nivel teórico conceptual recoge a teoría que contextualiza el
problema de investigación. La teoría debe incluir la definición
operacional y "sintáctica" de los constructos implicados en las
hipótesis. A su vez, la teoría condiciona la elección del modelo de
escalamiento y, por tanto, de las condiciones métricas que se exigirán
a las mediciones. La red nomológica desempeña además un papel
crucial durante la elaboración de tests para determinar la utilidad de
las puntuaciones obtenidas.
El nivel técnico metodológico implica la construcción o selección
de los instrumentos de medida idóneos para la medición de los
constructos de interés. La Psicometría debe guiar el proceso de
elaboración de instrumentos, teniendo en cuenta la teoría psicológica
y el modelo de medida seleccionados en el nivel teórico-conceptual.
Dentro del nivel estadístico analítico, las propiedades métricas
de las mediciones valoradas en el nivel anterior, condicionarán la
15
modelización estadística de los datos y la elaboración de
proposiciones a partir de los resultados. Por ejemplo, la información
sobre la fiabilidad y validez de las mediciones, condicionará la
generalización de los resultados en el regreso del proceso de
investigación al nivel teórico conceptual.
Los contenidos de la Psicometría
Hay un consenso amplio en la disciplina sobre cuales son los
contenidos propios de la Psicometría. Las diferencias entre las
propuestas de los autores responden a las distintas tradiciones de
investigación de las que procedan o a diferencias en las estrategias
de estudio de una misma temática. Si se unen las diferentes
versiones de la teoría de los tests bajo una denominación común, se
obtiene la división en tres grandes grupos de los contenidos
psicométricos: teoría de la medición, escalamiento y teoría de los
tests. Los dos primeros contenidos han sido o serán objeto de un
tema en el programa de la asignatura. La teoría de los tests es
introducida en el siguiente apartado.
La teoría de los tests
La teoría de los tests puede verse como un esquema conceptual
formalizado para hacer inferencias a partir de las puntuaciones de las
personas en los tests y permitir la toma de decisiones que impliquen
el constructo objeto de la medición. La teoría de los tests proporciona
los fundamentos para la elaboración y uso de los tests, aportando
además las herramientas para examinar las propiedades métricas de
las mediciones obtenidas con ellos.
La definición de “test” no ha variado de forma significativa
conforme evolucionaba la teoría de los tests. Valgan como muestra
las definiciones de Anastasi o Lord. Para Anastasi (1968), un test
psicológico es esencialmente una medida objetiva y tipificada de una
muestra de conducta; para Lord (1980) “un test psicológico o
educativo es un instrumento para obtener una muestra de conducta”
(pág. 3). La definición de Yela (1996) expresa en términos más
generales la finalidad de los tests como “un reactivo que aplicado a
16
un sujeto revela y da testimonio de la índole o grado de su
instrucción, aptitud o manera de ser” (pág. 249). (definición de test)
La mayoría de los profesionales de la medición psicológica
coinciden en que las características definitorias de un test psicológico
son:
 Procedimiento o instrumento estandarizado. Los tests plantean
a las personas evaluadas una serie de tareas previamente
determinadas, a las que deben responder siguiendo unas
instrucciones fijadas de antemano y, de forma habitual, en un
contexto controlado.
 Obtención de muestras de conducta. Los tests están diseñados
para la obtención de los comportamientos reveladores del
constructo objeto de la medición.
 Asignación numérica. Los tests deben permitir la cuantificación
objetiva de acuerdo con unas reglas establecidas.
 Dispone de información sobre la calidad de las mediciones. Los
autores de los tests y, en algunas circunstancias, los usuarios
deben aportar información técnica sobre la precisión y
relevancia para el objetivo de la evaluación de las mediciones
aportadas por el test.
Se han elaborado diversas clasificaciones de los tests utilizando
diferentes criterios. Crocker y Algina (1986) ofrecen una clasificación
útil de los tests atendiendo al carácter general de la tarea que deben
realizar las personas: tests de ejecución óptima, en los que se
instruye a la persona para que conteste lo mejor que pueda (incluiría
los tests de inteligencia, aptitudes y rendimiento); y tests de
ejecución típica, que demandan de la persona información sobre sus
actitudes, sentimientos, intereses, etc., donde se incluirían los
cuestionarios e inventarios de personalidad.
Las definiciones de Anastasi y Lord utilizan la expresión
“muestras de conducta” que sintetiza la finalidad última de la teoría
de los tests. Crocker y Algina (1986) enumeran los problemas por los
que la medida psicológica está contaminada por el error:
 Ausencia de una aproximaciones únicas a la medición de la
mayoría de los constructos. El problema reside básicamente en
las diferencias en las definiciones operacionales de la mayoría
de las variables psicológicas, lo cual suele conducir a
procedimientos diferentes de medida y distintas conclusiones
sobre la evaluación de una misma persona.
17
 Muestreo limitado del comportamiento. La mediciones suelen
basarse en un número limitado de comportamientos, obtenidos
en un muestreo reducido de situaciones y momentos
temporales. Así, determinar, por ejemplo, el número de ítems y
la variedad de los contenidos de un test es uno de los
problemas habituales en la elaboración de los procedimientos
de medida.
 Presencia inevitable de los errores de medida. Las limitaciones
“muestrales” en la obtención de los comportamientos
indicadores obliga a estimar el grado de error presente de
forma inevitable en cualquier medición.
 Evolución de las teorías psicológicas. Al ser los constructos
“herramientas conceptuales” para la elaboración de teorías, el
significado de las mediciones siempre estará sujeto a la
evolución de la teoría de la que forma parte, dependiendo de la
obtención de evidencias que la confirmen o modifiquen.
La finalidad de la teoría de los tests es aportar soluciones para
minimizar el impacto de estos problemas sobre la medición
psicológica (Martínez-Arias, 1995).
La imposibilidad de observar de forma directa la mayoría de las
variables psicológicas obliga a considerar la teoría de los tests como
una maquinaria conceptual para la inferencia psicométrica. ¿En qué
consiste la inferencia psicométrica? La elaboración de ítems debe
reflejar la definición operacional y sintáctica del constructo objeto de
la medición (Lord y Novick, 1968). El papel de los ítems es el de
provocar que las respuestas de las personas en una situación
estandarizada,
reflejen
la
conductas
que
en
situaciones
“espontáneas”, se considerarían los indicadores conductuales del
constructo. La cuantificación se produce cuando a través de un
procedimiento de escalamiento se asignan valores cuantitativos a los
patrones de repuesta de las personas en el test. Sobre la inferencia,
desde el valor cuantitativo o puntuación resumen de la ejecución de
la persona hasta el constructo, pueden incidir diferentes fuentes de
variabilidad “no deseada”, por no relacionada con el constructo objeto
de la medición, que pueden amenazar la corrección de la inferencia:
fuentes de variabilidad aleatoria, que tradicionalmente se agrupan
bajo la denominación general de “fiabilidad”; y fuentes de variación
sistemática, agrupadas bajo la etiqueta de “validez”. El objetivo
principal de la teoría de los tests es estudiar este proceso de
inferencia y aportar procedimientos para realizarla (Crocker y Algina,
1986). Este objetivo ha hecho que bajo la denominación “teoría de
los tests” tengan cabida contenidos tan diversos como: construcción
de tests, elaboración de ítems, análisis de ítems, métodos de
puntuación e interpretación de las puntuaciones y, de forma
18
preponderante, el análisis de la fiabilidad y validez de las medidas
aportadas por los tests.
La teoría de los tests suele dividirse en dos grandes ramas: la
teoría clásica de los tests y la teoría de respuesta a los ítems. La cita
de Hambleton y van der Linden (1982) expresa con toda claridad esta
división: “Las teorías de los tests pueden dividirse en dos grandes
categorías. La primera es la teoría clásica de los tests, que parte de la
concepción de Spearman de la puntuación observada en el test como
compuesta de un componente verdadero y otro de error...
Importantes hitos en esta larga y venerable tradición son Theory of
mental tests de Gulliksen (1950) y Statistical theories of mental test
scores de Lord y Novick (1968)... La segunda es la teoría de
respuesta al ítem, o teoría del rasgo latente, como se ha llamado
hasta hace poco. Actualmente la teoría de respuesta al ítem esta
teniendo un mayor impacto en el campo de los tests” (pág. 373).
Bibliografía
Anastasi, A. (1968). Psychological testing. New York: MacMillan.
Anastasi, A. y Urbina, S. (1997). Psychological Testing (7ª ed.).
Englewood Cliffs, NJ: Prentice-Hall.
Arnau, J. (1989). Metodología de la investigación y diseño. En J.
Arnau y H. Carpintero (Eds.). Historia, teoria y método. Madrid:
Alhambra Universidad.
Canpintero, H. (1996). Historia de las ideas psicológicas. Madnd:
Pirámide.
Cronbach, L.J. y Meehl, P.E. (1955). Construct validity in
psychological tests. Psychological Bulletin, 52, 281-302.
Crocker, L. y Algina, J. (1986). Introduction to classical and modern
test theory. New York: Holt, Rinehart and Winston.
Hambleton, R.K. y van der Linden, W.J. (1982). Advances in IRT and
applications:
An
introduction.
Applied
Psychological
Measurement, 6(4), 373-378.
Lord, F.M. (1980). Applications of item response theory to practical
testing problems. Hillsdale, New Jersey: Lawrence Erlbaum
Associates.
Lord, F.M. y Novick, M.R (1968). Statistical theories of mental test
scores. New York: Addison-Wesley.
Martínez-Arias, R (1995). Psicometría: Teoría de los tests psicológicos
y educativos. Madrid: Síntesis.
Meliá, J.L. (1990). La construcción de la Psicometría coma ciencia
teórica y aplicada. Valencia: Cristóbal Serrano.
Messick, S. (1989). Validity. En Linn, R.L. (Ed.). Educational
measurement. New York: MacMillan.
19
Muñiz, J. (1991). Introducción a los métodos psicofísicos. Barcelona:
PPU.
Muñiz, J. (1998). La teoría clásica de los tests. Madrid: Pirámide.
Nunnally, J. C. (1973). Introducción a la medición psicológica.
Buenos Aires: Paidós.
Rust, J. y Golombok, S. (1989). Modern psychometrics: The science
of psychological assessment. London: Routledge.
Thorndike, R. M. (1997). The early history of intellegence testing. En
D. P. Flanagan, J. L. Genshaft y Harrison, P.L. (Eds.),
Contemporary intelectual assessment, theories, tests and
issues, (pp. 3-17). New York: The Guildford Press.
van der Linden, W. J. (1986). The changing conception of
measurement
in
education
and
psychology.
Applied
Psychological Measurement, 10, 325-332.
Yela, M. (1968). Apuntes de psicometria y estadística. Madrid:
Universidad Complutense de Madrid.
Descargar