Avances 228. Amelia Márquez

Anuncio
Universidad Autónoma de Ciudad Juárez
Coordinación de Investigación y Posgrado del Instituto de
AVANCES
Cuaderno de Trabajo
Algunos fundamentos metodológicos en la
Elaboración de Instrumento de Medición en
Psicología y Pedagogía: base para la
construcción de un instrumento de medición
de competencias básicas universitarias
Amelia Márquez Jurado
Núm. 228
Octubre
2009
Comité Editorial de Avances
Dra. Martha Patricia Barraza de Anda
Dra. Consuelo Pequeño Rodríguez
Dra. Alba Yadira Corral Avitia
Mtra. Carmen Gabriela Lara Godina
Mtro. Gerardo Sandoval Montes
Dra. Magali Velasco Vargas
Dr. Ricardo Almeida Uranga
Dra. Sonia Bass Zavala
Mtra. Carmen Álvarez González
Mtra. Ma. Elena Vidaña Gaytán
Mtro. Oscar Dena Romero
Mtra. Katya Butrón Yáñez
Directorio
Jorge Mario Quintana Silveyra
Rector
David Ramírez Perea
Secretario General
Martha Patricia Barraza de Anda
Coordinadora General de Investigación y Posgrado
Francisco Javier Sánchez Carlos
Director del Instituto de Ciencias Sociales
y Administración
Consuelo Pequeño Rodríguez
Coordinadora de Investigación y Posgrado del ICSA
Universidad Autónoma de Ciudad Juárez
Instituto de Ciencias Sociales y Administración
H. Colegio Militar # 3775
Zona Chamizal
C.P. 32310
Ciudad Juárez, Chihuahua, México
Tels. 688-38-56 y 688-38-57
Fax: 688-38-57
Correo: [email protected]
[email protected]
Avances
Algunos fundamentos metodológicos en la Elaboración de un
Instrumento de Medición en Psicología y Pedagogía: base para
la construcción de un instrumento de medición de
competencias básicas universitarias
Resumen
El asunto de las competencias universitarias, como base de la formación de los
profesionales universitarios, presenta un vínculo importante entre el trabajo, la educación y
la función del ser humano. Su base fundamental de apoyo surgió a partir de la necesidad
de establecer un parámetro de desarrollo de formación de acuerdo a las necesidades
productivas del mercado a nivel mundial, siendo su asunción y aplicación de acuerdo al
desarrollo de cada nación. Los programas creados en relación con el tema del desarrollo de
las competencias, lleva también implícita la necesidad de ser evaluados para así constatar
la efectividad lograda de los objetivos de aprendizaje vinculados con el trabajo. Si bien se
han diseñado pruebas tales como Ceneval, Excale, sin embargo, hasta la fecha no se
cuenta con un instrumento de medición que evalúe –específicamente- las competencias
básicas universitarias y que otorgue resultados de efectividad de los programas educativos
con enfoque global. Pretendemos entonces, presentar algunos enfoques metodológicos
que pueden servir como parámetro para la construcción de un instrumento de medición
para tal efecto.
Abstract
College competencies, as a base for university students formation, presents an
important link among work, education and being human. Its support base arose from the
necessity to establish a parameter of development and formation according to prevailing
world’s market productive needs. Its use will be directly related to each country
development stage. Developing competencies programs requires at the same time the
need to have them evaluated so as to assess the effectiveness of learning objectives.
Despite tests such as Ceneval and Excale have been designed, there are no measuring
instruments that specifically evaluate basic university competencies that provide
effective results with a global approach on education programs. Therefore, we present
some methodological approaches that may be used as parameter for the construction of
a measuring instrument.
Palabras Claves: Competencias Básicas Universitarias, Sistemas de Evaluación,
Psicometría, educación superior, Teoría Clásica de los Test, Teoría de Respuesta al Item.
1
Avances
Introducción
En el campo de la educación, las competencias han estado cobrando importancia
desde la década de los años sesenta, la evaluación de las mismas ha estado abierta a una
serie de reformas y cambios en su forma original, el nivel al que se ha aplicado es el básico
y bachilleratos. A nivel universitario se ha procedido básicamente a realizar el seguimiento
del rendimiento académico de los alumnos a través de las evaluaciones docentes, con
entrevistas y portafolio, más no con algún instrumento de medición específico para ello. El
presente artículo, pretende ofrecer algunos fundamentos metodológicos que pueden ser
aplicables para la construcción del instrumento de evaluación, con lineamientos teóricometodológicos científicos, mismos que proporcionan la confianza de su medición respecto
de un grupo –normalización- y sea susceptible de aplicarse a alumnos y evaluar su nivel de
desarrollo tanto en conocimiento como en aplicación del mismo en un nivel de praxis
laboral, social y familiar. Nos enfocamos en lo relativo al conocimiento de competencias así
como a los distintos sistemas de evaluación y teorías con las cuales se construye un
instrumento de evaluación. Asimismo se ejemplifica la construcción metodológica y teórica
a través de los resultados obtenidos en la construcción del instrumento de medición de la
competencia laboral denominada Actitud de chóferes de transporte público. De la misma
manera en que una competencia laboral es susceptible de ser medida, también los
dominios cognitivos, los valores, el nivel de inteligencia o cognición, así se infiere
susceptible de ser medida la formación de competencia básica universitaria.
2
Avances
Sistemas de evaluación
El sistema que se utiliza en psicología para medir una serie de parámetros
conductuales, cognitivos, emocionales, de habilidad, destreza etc., se le conoce como
psicometría, donde evaluación psicométrica –a través de una batería de pruebas- se
interpreta como el conjunto de procedimientos que conducen a la valoración cuantitativa de
fenómenos conductuales, cognitivos, emocionales, de personalidad, habilidad, destreza,
actitud, aplicados a los procesos laborales y de vida. Estos instrumentos aportan apoyos
importantes, como en el caso de la pedagogía en la cual se aplican para conocer el nivel de
coeficiente intelectual, la madurez visomotora, el desarrollo de personalidad, las
preferencias vocacionales, valores, actitudes, manejo de tolerancia a la frustración, manejo
de técnicas de estudio, dificultad en el aprendizaje, entre otras; en el área industrial y
laboral se especifican áreas de desarrollo potencial y a desarrollar respecto de capacidad,
manejo de inteligencia múltiple, manejo de tipos de liderazgo, capacidades motoras,
destrezas, habilidades, manejo de personalidad laboral, comunicación y desarrollo personal
y su influencia en las personas, entre otras; en el área jurídica se emplean las pruebas
psicométricas para la elaboración de perfiles de personalidad psicopática, evaluación del
estado mental y tipo de personalidad, dictámenes de tendencias psicopáticas v/s
normalidad, entre otros. En el área de salud se aplican para conocer el estado emocional
vinculado con el desarrollo de personalidad y actitud con un enfoque clínico; en las áreas
sociales se utilizan para conocer la percepción de la dinámica socio-familiar-cultural.
El sistema de evaluación a través de instrumentos de medición psicológica, también se ha
hecho presente, en el área educativa desde el momento en que la fundamentación teóricometodológica para la construcción de pruebas como Ceneval o Excale presentan los
3
Avances
mismos principios, de ahí que consideremos la posibilidad de llevar a cabo una prueba de
evaluación de competencias básica a nivel universitario. Por ejemplo en Estados Unidos
desde 1960 cuenta con un Sistema de Evaluación Nacional del Progreso Educativo (NAEP)
enfocado en el conocimiento y habilidades de los jóvenes, aunque esta evaluación se
realiza a nivel básico1. Para bachillerato cuentan con una evaluación denominada
Alfabetismo funcional o de competencia mínima, misma a la que los alumnos deben
someterse para recibir su diploma de egreso. Los riesgos que han detectado respecto de
esta evaluación: por una parte la ocupa la discriminación, con la cual algunos de los
alumnos consideran que se favorece a ciertos grupos raciales; la otra objeción se ubica en
la alta reprobación; otra más centrada en la calidad y enfoque del profesorado respecto del
contenido de las materias, las cuales se enfocan básicamente a preparar a los alumnos
para que aprueben dicho examen. Otra forma de evaluar el desempeño del alumnado por
competencias es el denominado evaluación de valor agregado en la cual se valora los
conocimientos adquiridos en las materias académicas y habilidades de la vida tales como
analizar una columna de periódico, una tabla matemática, esta valoraciones son aplicadas
antes y después de cada periodo escolar, considerando que la mejoría sustancial de un
alumno es el equivalente a un valor agregado. Para nivel universitario aún no se conoce
con certeza si la forma de evaluar el resultado de programas académicos centrado en la
búsqueda de generar en los alumnos competencias, esté basada en una evaluación de
desarrollo de acuerdo a la obtención de calificaciones y su seguimiento semestral.
Una vez más consideramos la posibilidad, dadas las características que engloban las
competencias, que puedan ser susceptibles de ser medidas a través de instrumentos de
1
Aiken, Lewis R., Test psicológicos y evaluación. pp. 239-240.
4
Avances
evaluación. La psicometría o instrumentos de medición se ocupan de la medición a través
de la asignación de cantidades a las características o propiedades de una persona, en
relación con el tema del que se ocupe dicho instrumento, así puede ser de actitudes y por
qué no de competencias no solo a nivel laboral, sino educativo. Su elaboración requiere del
seguimiento y apego a un método de construcción en el cual se involucra la estadística, la
matemática y la temática a tratar.
Competencias básicas universitarias
Los antecedentes de la Educación Basada en Competencias datan de medidos del
siglo XX en los Estados Unidos -aplicado a infantes-, para 1906 en la Universidad de
Cincinnati-Ohio se crearon convenios con empresas estableciéndose criterios de
desempeño en la práctica. Para 1930 este programa se había masificado y había cobrado
popularidad y sobre todo logrado beneficios mutuos. En 1973 el gobierno de Estados
Unidos el Departamento de Estado realizó un estudio orientado a la selección del personal2,
luego de un período de estudio se llegó a la conclusión que un buen desempeño en el
puesto de trabajo está más relacionado con características propias de las personas, a sus
competencias, que a sus aspectos como conocimientos o habilidades.
3
Siendo hasta la
década de los años ochenta que se inicia con la utilización del concepto de Competencias
erigiéndose como pioneros Estados Unidos, Inglaterra y Australia enfocando la mejora en
eficiencia, pertinencia y calidad de la capacitación laboral.
Uno de los indicadores que permiten observar la necesidad y el avance que en relación a
educación se están dando a nivel mundial, lo marca el informe que se generó en la
2
Tarea que le fuera encomendada a David Mc Clelland catedrático en Harvard, su análisis buscaba detectar las
características presentes en las personas a seleccionar y que predijeran el desempeño de su éxito laboral.
3
Larrain, U., Ana María, González, F. Eduardo, Formación Universitaria por Competencias. Dcto. pdf
5
Avances
Conferencia Mundial sobre la Educación Superior con Sede en la UNESCO (1988) en la
cual se hizo hincapié en que es necesario propiciar el aprendizaje permanente y la
construcción de las competencias adecuadas para contribuir al desarrollo cultural, social y
económico de la sociedad.4 Para Junio de 2000, en el informe de la UNESCO referido al
aspecto de Educación, menciona sobre la Educación Superior en países en desarrollo:
Peligros y Promesas que…La nueva economía demanda competencias interpretativas,
analíticas, de establecimiento de prioridades, evaluativas y otras de alto nivel de manejo
de la información... Todos necesitarán estas competencias. Estas pueden y deben
enseñarse en edades tempranas. Pero también deben ser enseñadas en los niveles
superiores. Este es otro reto a la educación superior donde la especialización y la
competencia
técnica
sombrean
demasiado
frecuentemente
éstas
competencias
generales”. De tal forma, el estudio de las competencias ocupa hoy un espacio de primer
orden y es tratado por su importancia por diversas instituciones y autores, entre los
cuales se puede reconocer determinadas tendencias en su tratamiento y definición. Este
enfoque se inicia de manera más o menos paralela en el Reino Unido y en Australia en
ambos casos constituyen un sistema de normalización, formación y certificación de
competencias instituido luego de haber realizado profundos estudios y análisis en sus
respectivos países.
De acuerdo a lo anterior, se considera que la vinculación de la educación con el campo
laboral se da entonces como una necesidad, considerando las competencias profesionales
como una base o referencia para crear una mejora en los enfoques educativos, en los
cuales no se busca privilegiar sólo la adquisición de conocimientos, sino también la forma
4
Las competencias básicas se apoyan en 47modelos universitarios de Australia, Canadá y los Estados Unidos.
6
Avances
en que éstos se aplican a la vida misma. Este parámetro facilita la evaluación de los
egresados de los sistemas de educación profesional, considerando así también los
requerimientos del entorno socioeconómico en el que se encuentra inserta la sociedad en la
que se está desarrollando, es decir, considerando el contexto en el que se desarrollarán
profesionalmente los egresados de cualquier país, dado que las necesidades laborales se
encuentran interrelacionadas. La competencia laboral se considera a partir de la conjunción
de conocimientos, habilidades y actitudes conducentes a un desempeño de calidad y
oportuno y funcional. Esta cultura de competencia establece la articulación entre trabajoeducación-recurso humano.
En este enfoque globalizado y enfocado básicamente a los países en desarrollo, se observa
que existe un sesgo en cuanto al enfoque, dado que si bien hace referencia a la necesidad
de realizar cambios en los sistemas educativos para establecer la vinculación entre el
conocimiento y las necesidades laborales que preparen a las personas para una vida más
íntegra, en la cual se involucra trabajo-educación y recurso humano, no se consideran
todos aquellos elementos de función biológica que afecta y altera la capacidad perceptiva
del ser humano. Si bien es cierto que cada persona tiene una forma peculiar de percibir e
interpretar el mundo, existen elementos de función biológica insoslayables tales como los
trastornos por déficit de atención, hiperactividad, dislexia, del aprendizaje, negativismo
desafiante, disocial, fonológico, expresivo. Trastornos emocionales como la bipolaridad,
ansiedad, del estado de ánimo, y algunos más que se encuentran documentados con
detalle en el Manual Diagnóstico DSM-IV-R y que dan cuenta de su existencia en las
múltiples quejas que los docentes argumentan, no solo a nivel básico, sino universitario y
que las autoridades mundiales encargadas del manejo y función de educación no han
7
Avances
asumido con la necesidad y urgencia con la que se presenta o que no la han dimensionado
por desconocimiento de su etiología y evolución y solo consideran las consecuencias –
conducta- como algo inherente del ser humano.
Concepto de Competencia
En el mundo globalizado no basta con preparar profesionales especializados en
un área de conocimiento, cada vez con mayor necesidad se requiere que la formación
además de ser básica, proporcione al egresado las habilidades en su área de preferencia
de estudio, las capacidades para captar el mundo circundante y sus necesidades, es
decir, desarrollar la percepción, además para adaptarse a las circunstancias y responder
a ellas de forma rápida y eficiente, ordenar sus impresiones, comprender las relaciones
entre los hechos que observa, que vive y en consecuencia pueda actuar. Para lograr este
objetivo, se requiere, además de las capacidades y conocimientos logrados por el propio
individuo, una formación de saberes transversales los cuales puede estar actualizando
de forma cotidiana y de acuerdo a las necesidades del desarrollo de la comunidad. Por lo
que se requiere que la formación académica se constituya de la combinación de las
capacidades propias, la educación formal y el aprendizaje que obtenga del trabajo. Como
este supuesto involucra factores múltiples, que van desde las capacidades intrínsecas de
cada individuo5, hasta las condiciones socioeconómicas, de política gubernamental y
educativa las cuales proporcionarán en cada egresado diversos niveles de competencia,
se hace entonces, difícil expresar un solo concepto de competencia que sea válido a
nivel mundial, de ahí que se han adaptado conceptos de competencia de acuerdo a las
necesidades considerando, en general que …el concepto de competencia reconoce un
5
Dentro de las capacidades intrínsecas se encuentra el nivel de coeficiente intelectual, la madurez perceptiva,
capacidades motrices gruesas y finas, capacidades auditivas, visuales, táctiles, gustativas y olfativas, así como los
aspectos afectivos, emocionales y conductuales.
8
Avances
equilibrio entre las necesidades de las personas, de las empresas, de la sociedad y, en
general de la realidad contemporánea global, entendiéndose en general …la
competencia como la capacidad de un sujeto para realizar una tarea que exige activar
una serie de recursos que se manifiestan en su comportamiento eficiente.6
Para tal efecto globalmente se han considerado, tres tipos de Competencias: 1) las
Básicas , en las cuales la persona constituye las bases de su aprendizaje –interpreta y
comunica información, razona de forma creativa y soluciona problemas entre otras y
están referidas fundamentalmente a la capacidad de “aprender a aprender”-. Requiere de
instrumentación básica como la idoneidad para la expresión oral y escrita y del manejo
de las matemáticas aplicadas y pone en movimiento diversos rasgos cognitivos, como la
capacidad de situar y comprender de manera crítica, las imágenes y los datos que le
llegan de fuentes múltiples; la aptitud para observar, la voluntad de experimentación y la
capacidad de tener criterio y toma de decisiones. Se suelen incluir en los currículos como
comunicación verbal y escrita, lectura y escritura, las nociones de aritmética, el trabajo en
equipo, la resolución de problemas y la enseñanza de lenguas extranjeras; 2) las
Personales, son aquellas que permiten realizar con éxito las diferentes funciones en la
vida -actuar responsablemente, mostrar deseo de superación y aceptar el cambio, entre
otras-. Estas constituyen un conjunto difícil de definir, pues están en función de las
capacidades y potencialidades de expresión de un grupo de características que se
manifiestan en dependencia del ambiente en que se desarrolle la actividad, tales como
seguridad en si mismo, capacidad para dominar los sentimientos y las tensiones
emocionales, curiosidad, argumentación crítica y capacidad analítica, y 3) las
6
Mertens (1996), citado en emergencias y Actualidades de las Competencias.
9
Avances
Profesionales son las que garantizan cumplir con las tareas y responsabilidades de su
ejercicio profesional. Se reconoce que las cualidades de las personas para
desempeñarse productivamente en una situación de trabajo, no sólo dependerán de las
situaciones de aprendizaje escolar formal sino también del aprendizaje derivado de la
experiencia en situaciones concretas de trabajo. 7
Considerando las necesidades del mercado, los centros educativos profesional y de nivel
medio superior, se dieron a la tarea de conservar los vínculos ya establecidos con las
empresas, así en Estados Unidos, se elabora el informe SCAN (1991)8, en el cual se
identifican cinco categorías generales de competencias o competencias transversales a
saber: 1) Gestión de Recursos consistente en el manejo de tiempo, dinero, materiales y
distribución personal ; 2) Relaciones Interpersonales, consistente en trabajo en equipo,
enseñanza a otros, servicio a clientes, despliegue de liderazgo, negociar y trabajar con
personas diversas; 3) Gestión de Información, consistente en buscar y evaluar información,
organizar y mantener sistemas de información, interpretar y comunicar, usar computadora;
4) Comprensión Sistemática, consistente en comprender interrelaciones complejas,
entender sistemas, monitorear y corregir desempeños, mejorar o diseñar sistemas y 5)
Dominio Tecnológico, consistente en seleccionar tecnologías, aplicarlas en la tarea, dar
mantenimiento y reparar equipos. Este enfoque vertido hacia el trabajo, puso en evidencia
la necesidad de que tanto la empresa, como el sector educativo y gubernamental pudieran
7
8
Elementos constitutivos. Competencias; 2003. http://www.edutec.es/edutec01/edutec/comunic/TSE09.html
El reporte SCAN Secretary’s Commission on Achieving Necessary Skills 1991, expresa que las competencias
laborales que se requieren, fácilmente se pueden relacionar con las competencias que los estudiantes construyen en
la educación superior: En su investigación Workplace Basics 1990, Carnavale, Gainer y Meletzer identifican 7
competencias básicas que se requieren en el trabajo: Competencias laborales: Aprender a aprender; Competencia
en lectura, para expresarse por escrito y en nuevas tecnologías; Comunicación: habilidades para saber escuchar y
expresarse oralmente; Adaptabilidad: resolución de problemas y pensamiento creativo; Autogestión: autoestima,
motivación y proyección de metas, servicio, desarrollo profesional; Eficiencia en trabajo con grupos:
interdisciplinarios, habilidades para negociar y trabajar en equipos; Autoridad: habilidades para organizar y de
liderazgo.
10
Avances
sintonizar sus programas de tal manera que pudieran los egresados de las universidades
ser competentes y no sólo conocedores.
En 1994 se forma el Comité Conjunto sobre Prácticas Educativas el cual fue conformado
por American Psychological Association (APA), Educational Research, Association (AERA)
y el National Council of Measurement Educatión (NCME), este comité tuvo a su cargo la
publicación del Manual de Estándares de Pruebas. En México el Centro Nacional para la
Evaluación de la Educación Superior (Ceneval) publicó la versión nacional de las normas
en el documento llamado Estándares de Calidad para Instrumentos de Evaluación
Educativa (2000)9. Para vigilar que la normatividad se cumpla en la construcción de
instrumentos de medición educativa, sean para exámenes de admisión, diagnóstico,
ubicación o certificación. El Instituto Nacional Peruano para la Evaluación de la Educación
instrumentó mecanismos de control en sus exámenes para la Calidad y el Logro Educativos
(Excale)10, buscando con ello asegurar el seguimiento de la norma, así como la validez de
los resultados e interpretaciones.
Así como en el campo de la psicología podemos destacar una rama o especialización
denominada Psicometría encargada del estudio de los métodos, técnicas y teorías
implicadas en la medición de variables psicológicas, en Educación no existe una
especialización tan concreta algo así como la Edumetría. Por lo tanto y dadas las
variables estudiadas en educación y su semejanza a las que se trabajan en psicología se
ha aplicado el mismo sistema teórico-metodológico para la medición de variables y
9
Instituto Nacional para la Evaluación de la Educación, Manual Técnico para la Validación de Reactivos, p. 3
Excale, contiene una tabla que resume las decisiones adoptadas por el Comité Académico respecto a la planeación
de la prueba. En ella se especifican las líneas de evaluación, las áreas temáticas, los temas y subtemas cuyo
dominios serán evaluados, el número de especificación de reactivos necesario para evaluarlo, asi como el número y
tipo de reactivos que será necesario construir para responder a cada especificación. La tabla de contenido presenta
la estructura general del examen.
10
11
Avances
contenidos educativos, de ahí que se considere la funcionalidad y pertinencia en la
evaluación de competencias básicas universitarias.
La Ciencia y la empresa piden inteligencia en lugar de acumulación de saberes que
aportan un porcentaje menor al esperado por la empresa cuando de aplicación de los
mismos se trata. Para que los centros educativos pasen de ser transmisores de
información a formadores estimuladores de las múltiples inteligencias personales, se
requiere de un cambio en la currícula educativa, además de un cambio de paradigmas
sobre la enseñanza. Recientemente en el proyecto europeo sobre investigación de
universidades, se realizó una encuesta sobre las capacidades genéricas que las
empresas piden de los egresados universitarios, [arrojaron] las 17 siguientes
capacidades por orden prioritario.11
1. Capacidad de aprender.
2. Capacidad de aplicar los conocimientos en la práctica.
3. Capacidad de análisis y síntesis.
4. Capacidad para adaptarse a las nuevas situaciones.
5. Habilidades interpersonales.
6. Capacidad para generar nuevas ideas (creatividad).
7. Comunicación oral y escrita en la propia lengua.
8. Toma de decisiones.
9. Capacidad crítica y autocrítica.
10. Habilidades básicas de manejo de la computadora.
11
Mestizo Cósmico, Las competencias básicas para la sociedad del conocimiento, en www.mestizos.net
12
Avances
11. Capacidad de trabajar en equipo interdisciplinario.
12. Conocimientos generales básicos sobre el área de estudio.
13. Compromiso ético (valores).
14. Conocimientos básicos de la profesión.
15. Conocimiento de una segunda lengua.
16. Apreciación de la diversidad y multiculturalidad.
17. Habilidades de investigación.
Hasta ahora, parece que los centros universitarios se apegan más a las características
enmarcadas en los niveles 14 al 17, dejando de lado la formación para la creación de
autodisciplina, aplicación de su potencialidad, lo que se conoce como la aplicación de las
inteligencias múltiples.
Teoría de la Medida
En el lenguaje de la psicometría la medida, es considerada como un elemento
matemático imprescindible en el momento de la definición operacional de conceptos
teóricos12, para la formulación precisa de las hipótesis, la constatación estricta de los
datos y la verificación experimental de las teorías. Juega asimismo un papel importante
en Psicología aplicada.13 Algunos de estos planteamientos se realizan en escala
psicológicas como las de medición de personalidad, de actitudes, entre otras, algunas
otras podrían considerarse cognitivas como en el caso de la evaluación de aprendizaje, o
de medición de la capacidad intelectual. Luego entonces se puede decir en todo proceso
12
Los conceptos no se pueden medir directamente, se miden las definiciones operativas de ese concepto, por ello los
conceptos requieren operacionalización. El Concepto se puede situar en una escala en arreglo a su complejidad y
esto depende de las facetas que contenga. http://perso.wanadoo.es/aniorte_nic/apunt_metod_investigac4_7.htm
13
Análisis Factorial; aptitud; cociente de inteligencia; inteligencia; psicología aplicada; psicología diferencial; psicología
pedagógica; psicología del trabajo; psicodiagnóstico; psicotecnia; test psicológico.
13
Avances
en el cual se encuentre involucrada la creación de pruebas y el concepto de medida se
hace referencia a la utilización estadística en la medición de confiabilidad y validez y se
apoyan en representaciones empíricas, cognitivas y perceptuales. En psicometría se
considera el …medir [como] el contar, comparar una unidad con otra, dar una valoración
numérica, asignar un valor, asignar números a los objetos. Todo lo que existe está en
una cierta cantidad y se puede medir. Estos no se asignan de forma arbitraria sino que
se rigen por ciertas reglas, se establece un sistema empírico y éste da lugar a un sistema
formal.14
Dentro de la teoría de la medida para clarificar si la medición es realmente posible se
hizo necesario el desarrollo de una teoría acerca de lo que significa medir, especificando
los tipos de medidas posibles, cuales son deseables para una ciencia y a cuales se
puede pretender desde el punto de vista de la psicología y su aplicación a otras ciencias,
entre ellas la pedagogía. Se han generado por lo menos tres grandes perspectivas
históricas que en enfocan el concepto de la medición (Abad, 2007; Jáñez, 1989): el
Idealismo Platónico, la Teoría de las Escalas de Medida y la Teoría Representacional.
Desde el enfoque que se marca en el Idealismo Platónico, medir se caracterizaba por
asignar al objeto el número que representaba la cuantía verdadera de la propiedad que
se medía (es decir, su magnitud), considerando que en la realidad existen dichas
magnitudes. Tanto Pitágoras como Platón afirmaban que todas las cosas se podían
transformar en números, que los números representan cantidades, en cambio Aristóteles
afirmaba que la esencia de las cosas era cualitativa. En el s. XIX, Newton impone lo que
14
www:aniorte-nic.net
14
Avances
se ha conocido como el imperativo cuantitativo que ayudó a dar sentido a muchos
fenómenos psicológicos apoyándose en las matemáticas.
Aristóteles consideró la cantidad como la categoría fundamental de la realidad, así,
dividió las cantidades en discretas y continuas. Las discretas eran los números naturales
los cuales no los consideraba elementos de un sistema formal pero sus propiedades
comunes formaban clases o conjuntos, por ejemplo, el número 2 era lo común de todos
los pares de cosas. Las continuas, que llamaba magnitudes, las utilizaba para intentar
designar variables como la longitud, el tiempo, el peso, el volumen, etc. Dichas
categorías, se diferenciaban por el hecho de que un valor de una magnitud está
compuesto por partes aditivas mientras que un número natural está compuesto de una
única parte; según lo cual, las magnitudes pueden ser divididas infinitamente, por esa
razón las llamó variables continuas. Su estudio le llevó a trabajar con otro concepto que
denominó magnitud relativa, que se basaba en el uso de equivalencias y razones.
González Barberá (2006)15.
En el campo de la medida en psicología Fechner (1860)
16
fue una figura importante
dado su enfoque en la medida, en inicio física y posteriormente en la intensidad de las
emociones. Su enfoque de medición refleja una postura tradicional: la medida de una
cantidad consiste en descubrir cuantas veces una magnitud de referencia está contenida
en otra. Esta filosofía queda formalizada en los axiomas de cantidad de Hölder (1901),
que especifican cuando una magnitud es susceptible de ser medida. Para que lo sea,
15
http://www.ucm.es/info/funvalor/docs/medida.pdf, Gonzalez Barberá (2007) Naturalez de la Medida en Educación,
ED. Universidad Complutense de Madrir
16
El comienzo formal de la psicología experimental lo encontramos en la obra de Gustav Theodor Fechner (18011887) que encontramos . Antes de Fechner, como dice Boring (1950), había solo fisiología psicológica y psicología
filosófica. Fue Fechner "quien realizó con rigor científico los primeros experimentos que pusieron las bases para la
nueva psicología y su metodología" (p. 275).
15
Avances
hace falta que se pueda definir la operación de concatenación entre cantidades. En el
caso de la longitud, sí se cumple que la longitud del objeto resultante de unir dos objetos
es la suma de sus correspondientes longitudes. Una propiedad que satisfaga estos
axiomas es denominada “extensiva” y posee una estructura aditiva (Narens y Luce,
1986).
En la Teoría de las Escalas de Medida Stevens (1946)17. Define medir como asignar
números a los objetos de acuerdo con una regla. Mediante esta definición lo que se
indica es que los números no representan cantidades, sino relaciones. Considerándose
la existencia de un homomorfismo18 entre el sistema de números asignados y el sistema
empírico del atributo representado, aunque el homomorfismo podía darse en cuanto a
otras características de los números distintas de la adición. De esta manera, se libró del
concepto de concatenación y redefinió la medición como un modo de representación. En
concreto, definió cuatro posibles reglas de asignación que daban lugar a cuatro escalas
de medida: A) la escala “nominal”, en la que sólo se considera la propiedad de identidad
de los números asignados (1 es distinto de 2, 2 es distinto de 3…); B) la escala “ordinal”,
en la que se considera además la propiedad de orden (1 es menor que 2, 2 es menor
que 3…); C) la escala de “intervalo”, en la que el cociente entre diferencias indica
cuantas veces está contenida una en la otra (la diferencia entre los números 10 y 4
contiene tres veces la diferencia entre 7 y 5); y D) la escala de “razón” en la que el
17
18
Stevens, S.S., (1946) On the Theory of Scales of Measurement, Cience.
Un homomorfismo, (o a veces simplemente morfismo) desde un objeto matemático a otro de la misma categoría,
es una función que es compatible con toda la estructura relevante. La noción de homomorfismo se estudia
abstractamente en el álgebra universal. Una noción más general de morfismo se estudia abstractamente en la teoría
de las categorías. Por ejemplo, si un objeto consiste en un conjunto X con un orden < y el otro objeto consiste en un
conjunto Y con orden {, entonces debe valer para la función
que, si u < v
f ( u ) { f ( v ).
16
Avances
cociente entre los números indica cuantas veces está el menor contenido en el mayor (el
8 contiene cuatro veces el 2).
Las propiedades extensivas se corresponden con los niveles de medida de razón y de
intervalo (Jáñez, 1989). El planteamiento de Stevens es menos restrictivo que el de
Campbell y abre posibilidades a la medición científica en Psicología. Sin embargo,
Stevens no proponía qué relaciones empíricas debían satisfacer los objetos en cuanto al
atributo que se pretendía medir. Durante la segunda mitad del siglo XX se fraguó una
nueva teoría axiomática de la medición: la Teoría Representacional, que es el paradigma
dominante hasta la actualidad.
19
En esta teoría se establece un homomorfismo entre las
relaciones de los números que se asignan a los objetos -sistema relacional numérico- y
las relaciones empíricas entre los objetos -sistema relacional empírico-, donde medir
implica utilizar el sistema numérico para, mediante el homomorfismo, representar el
sistema de relaciones empíricas. En contraste con el trabajo de Stevens, se hace un
mayor énfasis en las condiciones que debe satisfacer ese sistema relacional empírico
antes de atribuirle una escala de medida.
Test instrumento de evaluación
En los Standards for Educational and Psychological Testing -AERA, APA y NCME(1999), definen Test como “un aparato o procedimiento evaluador por el que se obtiene
una muestra de la conducta de los examinados en un dominio específico, que es a
continuación evaluada y puntuada siguiendo un proceso estandarizado”. Al respecto
Anne Anastasie refiere que a pesar de sus diferencias superficiales –entre las diferentes
19
ésta se encuentra exhaustivamente desarrollada en los tres volúmenes de la obra “Foundations of Measurement”
(Krantz, Luce, Suppes y Tversky, 1971; Luce, Krantz, Suppes y Tversky, 1990; Suppes, Kranz, Luce y Tversky,
1989)
17
Avances
pruebas , sus objetivos y usos- todas esas pruebas constan de muestras de conducta del
individuo y cada una debe probar su valor con la demostración de una correspondencia
empírica entre el desempeño del examinado de la prueba y en otras situaciones o
desempeño laboral.20 Mientras que el término test se reserva por lo general para los
instrumentos en los que se evalúa lo correcta que es o la calidad de la respuesta, y los
términos escalas o cuestionarios se aplican a la medida de las actitudes, intereses o
disposiciones, lo común es utilizar el término Test para referirse a todos los anteriores
instrumentos evaluadores. Precisamente por seguir los procedimientos estandarizados,
una de sus fortalezas es que permiten que cada individuo obtenga la puntuación que le
corresponde, sin que resulte afectada por los juicios subjetivos que pueda tener el
evaluador sobre él (Colom, 1995).
Además de los test de personalidad, de inteligencia, de intereses, de motivación, de
actitudes, de percepción, también se considera un test un examen de opción múltiple e
incluso un examen de preguntas abiertas si se evalúan de forma estandarizada21.
También debe quedar claro que no todo procedimiento de evaluación es un test, por
ejemplo la mayoría de las encuestas no lo son, al no tener conjuntos de preguntas que
se planteen como indicadores de variables psicológicas latentes de los encuestados que
interese medir. Tampoco es un test una entrevista ordinaria, pues no tiene el carácter de
procedimiento estandarizado en la recogida y análisis de las respuestas, tampoco lo es
un examen para evaluar el contenido de una clase, o el cúmulo de conocimiento que
sobre ella hayan logrado los alumnos, tampoco lo es el registro de la habilidad de un
trabajador ante un determinado instrumento. Un test, entonces para que sea considerado
20
21
Anastasi, Anne, Urbina Susana, (1998), Test Psicológicos, p.33.
Utilización de los mismos criterios de aplicación, revisión y evaluación para todas las personas a las que se les sea
aplicado.
18
Avances
como tal requiere de la aplicación estricta tanto de teoría, metodología y técnica
específica para el contenido y contexto que se pretende medir.
Fiabilidad o Consistencia
Para determinar la calidad de un instrumento de medición se deben realizar
estudios de fiabilidad o consistencia y de validez. Los primeros tienen que ver con el
análisis del error de medida, refieren cuán importante es el error de medida en las
puntuaciones que son registradas en un determinado test. Las dos principales teorías
son la Teoría Clásica y la Teoría de la Respuesta al Ítem o también llamada la Teoría del
Rasgo Latente tienen sus propios indicadores de fiabilidad. Los estudios de fiabilidad se
refieren al atributo de consistencia en la medición, denota algo que es consistente, no
necesariamente consistentemente bueno o malo sino consistente22 y se obtiene a través
de la aplicación del Coeficiente de Consistencia Interna entre los cuales ubicamos los
que son aplicables en muestras contrastadas, formas alternativas, división por mitades y
la confiabilidad entre evaluadores. Así la falta de confiabilidad en un test está en relación
directa con la intervención del error, considerado éste como cualquier efecto irrelevante
para los fines o resultados de la medición. El error se considera de dos tipos: 1) error
constante o sistemático que es producido cuando las mediciones que se obtienen con
una escala son sistemáticamente mayores o menores que lo que realmente debe ser y 2)
error causal al azar o no sistemático que se produce cuando las medidas son
alternativamente mayores o menores de lo que realmente deben ser. En este último error
intervienen factores tales como las condiciones médicas de quien responde y que
pueden alterar la visión, la fatiga, incrementar la tensión emocional, la inatención, el fallo
22
Cohen, Ronald Jay, Mark, E., Swerdlik, (2001), Pruebas y Evaluación Psicológicas: introducción a las pruebas y a la
medición, p. 154
19
Avances
en la memoria, o también se pueden considerar –cuando ha habido varias aplicaciones,
la familiaridad que se tenga con el test-, asimismo se consideran intervenciones que
alteran la fiabilidad las condiciones externas de calor, luz, humedad, ventilación, frío, olor
del medio ambiente, comodidad de las sillas, entre algunas otras (Ray, 1972; Brown,
1982)23.
La confiabilidad de una prueba se obtiene a través del Coeficiente de Confiabilidad (r xx)
y del error estándar de la medida (EEM), el cual es obtenido a través de la siguiente
fórmula: (EEM = s 1rx) x
donde s= Desviación estándar de los puntajes de la
distribución; rxx = Coeficiente de confiabilidad del test;1 = Constante. Una vez obtenido el
EEM, se debe elegir el nivel de confianza: Nivel de confianza del 68% = PD ± 1 EEM;
Nivel de confianza del 95% = PD ± 2 EEM.24
En la medición psicométrica, se aplican tanto la teoría, la metodología como las técnicas
a casi cualquier situación que se desee o necesite ser medida, sea en el ámbito de la
psicología, la pedagogía, el derecho, etc., y considerando el principio fundamental de la
competencia como…la capacidad de un sujeto para realizar una tarea que exige activar
una serie de recursos que se manifiestan en su comportamiento eficiente.25
Dentro de las competencias laborales ubicamos las transversales – la comunicación, la
resolución de problemas, el razonamiento, la capacidad de liderazgo, la creatividad, la
23
Aliaga, Tovar, Jaime, Psicometría, Test Psicométricos: Confiabilidad y Validez, véase en:
http://www.unmsm.edu.pe/psicologia/documentos/documentos2007/libro%20eap/05LibroEAPAliaga.pdf
24
Para el nivel de confianza del 68% la interpretación sería: "Podemos concluir, con un 68% de confianza, que el
puntaje verdadero de un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1
EEM". El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de un sujeto se
encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD) y ± 2 EEM".
25
Mertens (1996), citado en Emergencias y Actualidades de las Competencias.
20
Avances
motivación, el trabajo en equipo y especialmente la capacidad de aprender- y personales
- centradas en la capacidad para trabajar en equipos y de integración en equipos
multidisciplinares, adquisición de valores éticos en el manejo y uso de la información- ,
que fueron consideradas en la creación del instrumento para la medición de las
Actitudes26 de Conductores de Transporte Público (Márquez, 2004)27, en éste se aplicó
tanto la Teoría Clásica de los Test como la Teoría de la Medida. Se utilizó la técnica de
Rasgos Sumarizado descrito por Rensis Likert28, la confiabilidad se obtuvo a través de
la Consistencia Interna con Sistema de Muestras Contrastadas o Contraste de Grupos
Extremos los cuales se obtuvieron a partir del total de las 259 aplicaciones con 132
reactivos en una matriz de doble entrada, donde en la columna se situaron los reactivos y
en la línea cada uno de los sujetos participantes, se generó la sumatoria lineal, la cual se
agrupó por distribución de frecuencia, obteniendo así una distribución de puntuaciones
altas y bajas. Del total de la sumatoria se consideró el 25% de calificación más alta que
representaron los sujetos con una aceptable actitud –Grupo A- se consideró el grupo de
25% de calificación más baja que representaron una no aceptable actitud –Grupo B-.
Para aceptar como discriminativo positivo se consideró un mínimo de .70 que supone
una correlación de .836 con las puntuaciones verdaderas. Para la obtención del Poder
Discriminativo de cada reactivo se aplicó la formula:
26
Actitudes han sido definidas como aquella forma de pensar o de comportarse hacia una idea, objeto, persona o
grupo de semejantes (Mc Conell, 1978, p.91), quedan implícitos tres elementos el cognitivo, el afectivo y el
comportamental. El Cognitivo seria aquello que se piensa acerca del objeto de la actitud. Desde un punto de vista
cognitivo puede pensarse que algo esta bien o que esta mal independientemente de lo que luego se haga, porque
puede suceder que afectivamente se sienta movido en otra dirección. El elemento afectivo haría referencia a aquello
se que siente, que gusta o disgusta, sin embargo, pude sentirse que algo gusta o disgusta sin que necesariamente
se actúe en la dirección que apunte ese sentimiento, porque racionalmente se considere que no es conveniente.
El comportamiento o reactivo en las actitudes, se quiere significar que no basta que algo parezca bien o mal, guste o
disguste sino que esto lleva de una manera u otra a actuar en consecuencia.
27
Márquez, Jurado Amelia, Medición de Actitudes en Conductores de Transporte Público, Caso Concesionaria
Fronteriza, Municipio de Cd. Juárez, (2004), pp. 44-46
28
Aiken, Lewis, R., (2003) Test psicológicos y evaluación, 294-300
21
Avances
A-B
PD=
½ N
Para la obtención del Grado de Dificultad de los reactivos se aplicó la siguiente fórmula
A+B
GD=
N X 100
Se corrió como dato adicional la media, la desviación estándar de cada ítem y la
distribución de frecuencia así como la t de Student, y la significancia de la matriz de dos
entradas. En el siguiente cuadro se hace referencia a los datos arrojados para las 5
dimensiones que conforman el instrumento. Los reactivos que presentan un (*) son
aceptables, los que presentan (**) son excelentes además de ser significativos al nivel de
aceptación de .05 o <.
Tabla # 1 Confiabilidad de las Dimensiones de la Escala de Actitud de CHTP
Escla
Reactivos
110, 112, 114, 115, 116, 118, 119, 120, 121,
Ansiedad y Tensión
123 **
Capacitación
89, 90, 91, 92, 93, 94, 95, 96, 97, 98 **
99, 100, 101, 102, 103, 104, 105, 106, 107,
Compañerismo
108 *
Responsabilidad
7, 8 ,12, 14, 33, 44, 52, 53, 55, 58 **
Tolerancia
65, 70, 71, 72, 74, 77, 79, 83, 85, 86 *
Alpha de
División por
Cronbach
Mitades
0.84
0.89
0.81
0.88
0.73
0.76
0.80
0.81
0.78
0.83
Fuente: Márquez Jurado Amelia, Op. Cit. p. 56.
22
Avances
Para la obtención del Coeficiente Alpha de Cronbach29 se aplicó la siguiente fórmula:
r=
Σ S²i
k
1-
α
S²sum
k-1
Donde k es el número de ítems de la prueba, i S es la varianza de los items (desde 1...i)
y2
sum S es la varianza de la prueba total.
Para la obtención de la División por Mitades se sumaron las puntuaciones de los
reactivos pares y las puntuaciones de los reactivos nones, ambos se correlacionaron al
resultado se le aplicó la fórmula de corrección de Sperman-Brown:
r=
nr xy
1+(n-
SB
1)rxy
Donde (r SB) es igual a la confiabilidad ajustada por la fórmula de Sperman-Barun,(rxy)
es igual a la (r) de Pearson en la prueba con la longitud original y (n) es igual al número
29
El coeficiente Alfa, desarrollado por Cronbach en 1951 y ampliado en lo subsecuente por otros como Kaiser y
Michael eb 1975; Noveick y Lewis en 1967, este coeficiente puede considerarse como la media de todas las
correlaciones de división por mitades posibles, las buenas junto con las malas, corrgida por la fórmula de SpearmanBrown. Es apropiado para usarse en pruebas que contienen reactivos que no son dicotómicos, reactivos que pueden
calificarse en forma individual o a lo largo de un rango de valores. Cohen Ronald Jay, E., Swerdlik, Op. Cit., 154, 166
23
Avances
de reactivos en la versión revisada dividido entre el número de reactivos en la revisión
original.
Una vez obtenido el índice de confiabilidad en cada una de las Dimensiones del
instrumento o escala de medición de Actitudes para Conductores de Transporte Público
se consideró que el instrumento mantuvo una confiabilidad equivalente a 0.84, 0.82,
0.73, 0.80 y 0.78 para cada una de las Dimensiones arriba referidas, lo cual se considera
suficiente para ser utilizado en las empresas que requieren seleccionar al personal,
conocer las actitudes presentadas por sus empleados, orientar la capacitación en función
de los resultados, contando con una confianza de .05 o <.
Hemos constatado que los indicadores de la fiabilidad presentan algunos cambios en las
diferentes teorías de los tests, sin embargo, se puede decir que es un concepto que si
está presente en toda prueba que pretenda tener la categoría de Test. Al respecto Muñiz
(1988) menciona, en relación con los Test que:
1) “Las consecuencias de los tests pueden ser de más o menos trascendencia para
quien los responde. Del resultado de un test puede depender la admisión o rechazo en
un proceso de selección, recibir una acreditación profesional, la calificación final en un
examen... Un primer aspecto a tener en cuenta es que antes de aplicar un test se ha de
tener información que justifique el uso que se va a hacer de sus puntuaciones. La
utilización de un test en un proceso selectivo requiere que previamente se haya mostrado
que el rendimiento laboral en el puesto depende del rasgo que vamos a medir.” En el
caso de las competencias básicas universitarias se considera que el desarrollo de los
24
Avances
alumnos debe estar acorde a las necesidades sociales, laborales e universitarias para
que su aprendizaje sea para la aplicación tanto en su vida personal, social como laboral;
2) “Todo test ha de muestrear adecuadamente el dominio que quiere medir. En un test
de calidad de vida, habrá que obtener respuestas que informen de la salud, del bienestar
laboral y económico y de todas las áreas que tengan que ver con la calidad de vida, no
puede quedar fuera, por ejemplo, lo relativo a la red familiar y social”. Si es en el caso de
las competencias básicas universitarias consideraríamos que debe muestrear los
factores cognitivo, habilidades de comunicación, capacidades para aplicar lo conocido al
área práctica, dominio del área a desarrollar, además de actitudes y valores.
3) finalmente se recomienda un “… estudio que muestre que las puntuaciones del test se
relacionan como cabe esperar, según la teoría psicológica, con otras medidas”. En el
caso de las competencias básicas universitarias se pretendería que las puntuaciones
fueran arrojando datos longitudinales de desarrollo, habiendo diferenciales ascendentes
del inicio de la carrera al término de la misma.
Validez
Refiere Morales Vallejo (2000)30 que para entender a lo que se le puede referir
como Teoría Convencional de la Validez, habría que considerar las recomendaciones
técnicas de la American Psychological Association (A.P.A.), en la década de los años
cincuenta estableció un comité el cual tenía a su cargo poner orden y estabilizar las
definiciones que existían sobre el concepto de Validez. Hacia la década de los años
sesenta la A.P.A. reconoce la Validez de Contenido, de Criterio tanto concurrente como
30
Morales, Vallejo,Pedro (2000) Medición de actitudes en psicología y educación, ED Comillas, 2ª ed, Madrid. Pp. 426427.
25
Avances
predictiva y de Constructo. La de Contenido se refiere a la relevancia de los ítems o al
grado en que los ítems de una escala representan un determinado universo temático –
representatividad y relevancia-, -validez lógica o intrínseca- son expresiones que se
emplean en el mismo sentido. La Validez de Criterio se refiere directamente a los
coeficientes de correlación con otras medidas o criterios, suele dividirse en concurrente
donde ambas medidas se obtienen simultáneamente y predictiva donde la medida en el
criterio es posterior. En el caso del concepto de Validez de Constructo surge, como
explica Nunnally (1978, p. 91-109) de la limitación de la validez de contenido cuando se
aplica a la medición de rasgos, actitudes, etc., aplicable a conceptos abstractos que
resumen consistencias conductuales y actitudinales. El proceso de validar un constructo
es, según Stenner, Smith y Burdick (1983) el proceso de adscribir significados a las
puntuaciones obtenidas con un determinado instrumento, siendo más necesario cuando
aumenta el grado de absorción de la variable medida.31
La descripción más genérica y aceptada sobre el concepto de validez es aquella que
refiere que una prueba es Valida cuando mide lo que dice medir. La validez está
establecida tanto sobre lo que una prueba dice que pretende medir, como a la referencia
que hacen los puntajes obtenidos, a conocer si es válido el uso que se le está dando al
Test así como la interpretación que se esté haciendo de los puntajes obtenidos y si se
pueden realizar generalizaciones a partir de los resultados obtenidos (Thorndike, 1989).
31
Morales Vallejo, Ibidem. pp. 427-428.
26
Avances
Para la obtención de la Validez de un instrumento o Test32 se requiere de la aplicación de
un Proceso de Validación en el cual interesan en principio, los errores constantes o
sistemáticos y en la confiabilidad interesan los errores aleatorios o no sistemáticos. En
términos estadísticos la Validez está definida como la proporción de la varianza
verdadera que es relevante para los fines del examen y es susceptible de ser medida
mediante la relación entre sus puntuaciones con alguna medida de criterio externo o
también con la extensión con la que la prueba mide un rasgo subyacente específico
hipotético, denominado en psicometría como Constructo. La validez de Constructo está
referida al grado en que cada prueba refleja el contenido que dice medir, elaborándose
operativamente de tal forma que se puedan realizar inferencias acerca de conductas o
atributos que pueden agruparse bajo la etiqueta de un contexto particular (APA).
La validez de Constructo está relacionada con cinco aspectos, a saber: 1) el contenido
referido a su relevancia y representatividad; 2) lo sustantivo referido a razones teóricas
de la consistencia observada de las respuestas; 3) lo estructural relacionado a la
configuración interna del test y dimensionalidad; 4) generalización referido al grado en
que las inferencias a partir del resultado del test se pueden generalizar a otras
poblaciones, situaciones o tareas y 5) consecuencia relacionado con la ética y el aspecto
de deseabilidad social y disminución de la aquiescencia33. (Messick 1995, citado en
Psicometría, Test Psicométricos).
32
En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella
posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford, 1946, citado en Muñiz,
1996, p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y
los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los
puntajes de las pruebas, que son función no sólo de los ítems sino también de la forma de responder de las
personas así como del contexto de la evaluación. Aliaga, Tovar, Jaime, Psicometría, Test Psicométricos:
Confiabilidad y Validez, Op. Cit.,
33
Aquiesencia: tendencia de algunos sujetos a responder afirmativamente (de acuerdo) con independencia del
contenido del ítem incluso mostrando acuerdo con afirmaciones de signo opuesto. Se trata de un estilo o modo de
responder que invalida la información que aparentemente está presente en las respuestas y en este caso una
27
Avances
En relación con la validación; el proceso que se siguió en la validación del instrumento
para medir Actitudes de Choferes de Transporte Público, se utilizó la Validez de
Contenido - la cual efectivamente, hace referencia al juicio concerniente a lo bien que
mide la prueba, lo que pretende medir… juicio basado en evidencia sobre lo apropiado
de las inferencias extraídas de las puntuaciones de prueba (Lewis Aiken, citado en
Márquez , 2004, p.41)-. El instrumento se validó utilizando el criterio de diagnóstico
realizado por un grupo de personas involucradas en la problemática tanto de la
elaboración de pruebas como en la selección y contratación de personal, ellos fueron
considerados como expertos en el área. A este grupo asignado se les ofreció: 1) las
definiciones específicas de términos y categorías del cuestionario; 2) se les pidió que
seleccionaran para cada reactivo la dimensión a la cual consideraban que pertenecía.
Para la selección de los jueces consideraron personas que por su trayectoria académica
y laboral conocieran del tema y pudieran emitir un juicio con base en conocimiento.
Además de constar que su relación fuera mínima o nula con los sujetos objeto de
aplicación de la muestra, con la cuan se alcanzó la objetividad del criterio.
Para la obtención de deseabilidad social, tomando en consideración que cualquiera de
los rasgos o características personales que típicamente expresan los ítems se pueden
situar a lo largo de un continum en cuyos extremos se encontraría la máxima
deseabilidad social y en la otra la mínima deseabilidad social. Para tal efecto se reunió a
un total de 10 jueces, los cuales deberían asignar a cada ítem o constructo una
respuesta afirmativa no indicaría acuerdo genuino con la afirmación contenida en el ítem sino que sería simplemente
una manifestación de dicha tendencia del sujeto. Morales Vallejo Pedro (2000)p. 141-143
28
Avances
calificación. A diferencia del método utilizado por A. Edward
34
quien es considerado
como el autor inicial más conocido y citado por sus estudios sobre la deseabilidad social,
se les pidió a los jueces que con base en las definiciones operacionalizadas de cada
dimensión de las que consta el instrumento de medición de actitudes de choferes de
transporte público, designaran a cuál de ellas correspondía cada reactivo, se consideró
que si el contenido de cada uno estaba construido bajo un criterio de aceptación o
rechazo social estos deberían mantener sus características de apego a una normatividad
social, por lo que cada uno de los jueces en la lectura de los reactivos debería quedarle
claro a que dimensión de actitud se hacía referencia.
A diferencia de Edwards que considera la deseabilidad social a través de un grupo de
jueces los cuales marcan con un número de 5 a 0 la aceptación o el rechazo, siendo el
reactivo aceptado en mayor o menor medida de deseabilidad o aceptación de actitudes
positivas o negativas, en este caso se buscó comprobar si el reactivo respondía con
claridad a la dimensión a la que se estaba destinado, siendo esta parte una de las
necesidades básicas de validación que se pretendía y logró comprobar, dado que cada
una de ellas fueron elegidas con base en la experiencia empírica y documental surgida
de las actitudes de conductores de transporte público documentadas en publicaciones
periódicas, de esta forma los resultados se cuantificaron para considerar como válidos
sólo aquellos reactivos que cumplieron con la norma del 80 al 100 % de aceptación del
grupo de jueces.
34
Morales Vallejo, Pedro, Medición de Actitudes en Psicología y Educación p. 141, 243, 206, citado en Marquez
Jurado Amelia, (2004) Op. Cit. p.37
29
Avances
Los resultados obtenidos en esta validación de deseabilidad social fue la siguiente: de
180 reactivos se eliminaron 57 los cuales no cumplieron con el criterio de validación. De
los 132 reactivos restantes 63 de ellos correspondieron a la dimensión de
responsabilidad; 23 a la de tolerancia; 12 a capacitación; 10 a compañerismo y 15 a
ansiedad y tensión. De las dimensiones inicialmente planteadas se agruparon los
reactivos correspondientes a manejo de sexualidad, respeto, abuso de sustancias y
responsabilidad en una sola dimensión determinándose de responsabilidad.
El Valor Diagnóstico o Predictivo del instrumento de medición se demostró en relación al
funcionamiento del instrumento aplicado, como un indicador de las actitudes en relación
con la correspondencia empírica estrecha entre las actitudes de los choferes y el apego a
las normas empresariales, municipales y estatales además del criterio utilizado para la
formulación del instrumento. Los resultados de evaluación posteriores a la aplicación de
la muestra se muestran en la Figura # 1, con resultados que arrojaron los siguientes
porcentajes de actitudes:
Figura # 1 Actitudes de Choferes de
Transporte Público
11% Favorable
33% Ligeramente Favorable
39% Ligeramente Desfavorable
14% Desfavorable
3% Muy desfavorable
30
Avances
Siendo una de las consideraciones finales que el instrumento resultó adecuado para la
medición de actitudes de los chóferes, ofreciendo una muestra representativa del
ambiente actitudinal que presentaron los trabajadores de la Concesionaria Fronteriza35
Estandarización
Ronald Hay Cohen (1988) refiere que el proceso de aplicar una prueba a una
muestra representativa de personas que las responden con el propósito de establecer
normas se conoce como estandarización de una prueba. Un instrumento de medición se
reconoce que está estandarizado cuando presenta procedimientos claros y definidos
tanto para su administración, calificación y datos normativos...el establecimiento de un
conjunto estándar de instrucciones y condiciones bajo las cuales se administra la prueba
hace que las puntuaciones de la muestra de estandarización normativa puedan ser
comprobables con las puntuaciones de quienes responderán la prueba en el futuro.
Regresando a la construcción del instrumento de medición de actitudes de chóferes, se
aplicó a una muestra representativa de conductores, utilizando una muestra de
conveniencia. Como escenario de aplicación se utilizaron las instalaciones de la
empresa, dado que los empleados de transporte tienen horarios y rutas diversos los
cuales requerían de un espacio y tiempo específico para la realización de la prueba. Así
una categoría más de confiabilidad la constituyó la estandarización precisa con la que
cuenta este instrumento, otra de las ventajas establecidas cuando se cuenta con el
procedimiento de estandarización es que los resultado que se obtienen de su aplicación
35
Márquez, Jurado Amelia, (2004) Op. Cit. pp. 64, 88.
31
Avances
son susceptibles de ser comparables y comparables, así como medible al ser calificado
por cualquier persona –siempre que se siga el procedimiento-.
Como se establece en Standards for Educational and Psychological Testing “las normas
que se presenten deberán referirse a grupos descritos con claridad. Estos grupos
deberán ser aquellos con quienes los administradores de pruebas desearan de ordinario
comparar a las personas que sean examinadas.” (APA, 1985 citado en Ronald Hay C.)36
Normatividad
Cohen R. (2001) refiere…en un contexto psicométrico normas son los datos de
desempeño en la prueba de un grupo en particular de personas, que están diseñados
para su uso como referencia para evaluar e interpretar puntuaciones de prueba
individual, donde los miembros del grupo se les considera típicos con respecto a una
característica de las personas para quienes se diseña una prueba en particular. En el
caso de la prueba de actitudes, se consideró por mejor conveniencia, la obtención de
conversión de puntaje crudo a rango percentilar, el cual fue calculado por dimensión lo
que equivale a un estatus de Escala de medición37 dado que cuenta con la conversión de
36
Jay Cohen, Ronald, Swerdlik Mark, (1988) Pruebas y Evaluación Psicológicas, introducción a las pruebas y la
medición, p. 127-128
37
Una escala seria un instrumento de medición (Maynt,R., Holm,K,Hubner,P. 1983,p.63) en el cual se puede hace una
disposición de cosas distintas pero con un aspecto común(Sierra Bravo, R. 1992) de esta manera una escala de
actitud seria la disposición de diferentes actitudes de mayor o menor intensidad a favor o en contra. Existen diversos
tipo de escalas:Las escalas sumativas de Likert, las diferenciales de Thurston y las acumulativas de Guttman estos
tres tipos de descalas tienen en común que le presentan al alumno una serie de ítems formulados como preguntas y
según responda de una manera u otra se le asigna una puntuación en la actitud medida que le coloca en una escala
continua de 1 a 5 normalmente. En las escalas diferenciales Thurston (1929) se caracterizan porque en ellas hay
solo dos respuestas “de acuerdo” o “en desacuerdo”, previamente existe un grupo de expertos que ha dado una
puntuación a cada uno de los ítems del cuestionario de acuerdo a la intensidad con la que se acerca mas a la actitud
que se pretende medir. En las escalas summativas referidas por Likert (1932) miden actitudes a partir de la medición
de las técnicas de la personalidad todos los ítems presentan una misma intensidad, la cual variara de acuerdo a la
selección de la persona que responde. Las escalas acumulativas, tienen su origen en el modelo de Guttman (1950)
también llamado escalograma los ítems tienen una determinada dificultad y el estar de acuerdo con uno implica estar
de acuerdo con los precedentes, suelen tener muy pocos ítems y se utiliza para medir actitudes muy concretas.
pt.wikipedia.org/wiki/Escala_Likert
32
Avances
medida cruda a medida de actuación de una población o mejor conocida como
puntuación normalizada. Así este instrumento presenta una Normatividad Local. En
psicometría se sabe que la conversión de puntación bruta a percentil permite conocer en
que rango de aceptación o rechazo se encuentra la persona que está siendo evaluada o
seleccionada, respecto del grupo de la población local, en este caso el Municipio de Cd.
Juárez, estado de Chihuahua, México.
Para la obtención del Rango Percentil se utilizaron los datos obtenidos en cada una de
las dimensiones, aplicando la siguiente fórmula para todos los items: frecuencia (f);
frecuencia acumulada (fa); Punto medio de la frecuencia acumulada (Pmfa); Punto medio
de la frecuencia acumulada entre el número total de casos (Pmfa/n) y Punto medio de la
frecuencia acumulada entre el número total de casos por cien (Pmfa/n)(100), los
resultados obtenidos para la conversión de la puntuación directa a puntuación
normalizada se obtuvieron los siguientes resultados, presentado en la tabla # 2:
33
Avances
Tabla # 2 Datos Normativos para las Escalas de Actitud, Conductores de
Transporte Público
N= 259
Rangos Percentiles
Puntaje
Crudo
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Media
D.S.
Ansiedad
y Tensión
Capacita
ción
Compañe
rismo
~
1
~
~
1
~
~
~
~
1
1
2
3
7
9
11
13
16
19
24
31
38
48
57
63
68
73
77
81
86
89
91
96
40.4
5.7
1
~
~
~
1
1
2
~
3
3
4
6
8
10
13
16
21
26
31
36
42
49
59
69
76
83
87
89
91
94
96
97
99
38.33
5.63
~
~
~
~
1
1
~
1
2
3
3
~
4
6
8
10
17
25
31
37
45
54
63
71
79
86
90
92
94
96
97
98
99
38.33
4.87
Responsabilidad Tenacidad
~
~
~
1
~
1
~
1
~
2
2
3
5
8
11
14
18
21
26
33
38
44
51
57
63
70
76
81
85
89
92
95
98
39.63
5.8
~
1
~
1
1
1
2
2
3
3
4
6
8
11
14
17
20
25
33
42
50
58
66
74
79
83
87
90
92
94
96
98
99
37.93
5.56
Puntaje
Crudo
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Media
D.S.
Fuente: Márquez Jurado, Amelia, Op.Cit. p. 59.
34
Avances
La Teoría Clásica de los Tests
Se considera que la Teoría Clásica de los Test es la que proporciona los modelos
para las puntuaciones que se obtienen del test, decimos entonces que modeliza matrices
de datos que contienen las respuestas que ya sea una muestra o grupo de sujetos han
dado a cada uno de los ítems que conforma el test. El análisis o modelado de estas
matrices de datos da como resultado: 1) la estimación del nivel en que poseen los
sujetos la(s) característica(s) que mide el test (valores escalares de los sujetos) y 2) la
estimación de los parámetros de los items (valores escalares de los items). El objetivo de
cualquier teoría de tests es realizar inferencias sobre el nivel en que los sujetos poseen
la característica o rasgo inobservable que mide el test, a partir de las respuestas que
éstos han dado a los elementos que forman el mismo. Por tanto, para medir o, mejor
dicho, estimar las características latentes de los sujetos es necesario relacionar éstas
con la actuación observable en una prueba y esta relación debe de ser adecuadamente
descrita por una función matemática.38
Dos son las principales teorías de los tests: la Teoría Clásica de los Tests (TCT) y la
Teoría de la Respuesta al Ítem o del Rasgo Latente. La primera está contenida en un
conjunto de artículos, publicados por Spearman entre 1904 y 1913. La publicación de
referencia es el libro de Gulliksen (1950). La TCT supone que cuando una persona i
responde a un test se generan tres puntuaciones: la observada (Xi), la verdadera (Ti) y el
error de medida (Ei), siendo no observables las dos últimas. (Ti) puede entenderse como
la media de las (Xi) si el sujeto respondiese al test infinitas veces en las mismas
circunstancias. Se asume que i i i X 00T 00E . Es decir, la puntuación (Xi ) incluye el nivel
38
http://www.uned.es/psico-3-psicometria/ttest.htm#que
35
Avances
real de la persona, que debiera no cambiar si se le aplicase otro test equivalente, y el
componente error. Los errores se suponen aleatorios, en ocasiones positivos y en
ocasiones negativos como ya se había mencionado. Se asume, en concreto, que su
media es cero. Se asume además que no existe correlación entre los errores y las
puntuaciones verdaderas, ni entre los errores entre sí. Con cada medida Xi se tienen dos
incógnitas (Ti y Ei), no siendo posible llegar a su obtención cuando se aplica un test. Una
medida de la precisión del test, que sí se podrá obtener, es el “error típico de medida” o
desviación típica de los errores de medida (Se). La TCT llega a medidas de la precisión
del test a partir de la definición de “formas paralelas”. Dos tests pueden considerarse
paralelos cuando “da lo mismo usar uno que otro” (Gulliksen, 1950, p. 11). Expresado
con más precisión, dos tests son paralelos sólo si cada persona tiene la misma
puntuación verdadera en ambos tests y los dos tienen el mismo error típico de medida.
La idea original de Spearman fue descubrir la vía para obtener indicadores de la
precisión del test a partir de los únicos datos disponibles (las puntuaciones observadas).
La correlación de Pearson entre las puntuaciones de una muestra de personas en dos
formas paralelas de un test es su “coeficiente de fiabilidad”, (rxx), que se interpreta como
la proporción de la varianza de las puntuaciones observadas que corresponde a la
varianza de las puntuaciones verdaderas. A partir del coeficiente de fiabilidad y de la
desviación típica de las puntuaciones observadas se puede obtener el error típico de
medida (Se), aplicando la expresión expuesta anteriormente. El nivel de fiabilidad o error
de medida tolerable depende, obviamente, del uso que se pretenda hacer del test, pero
hay cierto acuerdo en que, tanto el coeficiente de fiabilidad como otro indicador, muy
utilizado, el coeficiente Alpha de Cronbach, debieran estar por encima de 0.70.
36
Avances
La Teoría de la Respuesta al Ítem
La Teoría de la Respuesta al Ítem (TRI) también conocida como el rasgo latente,
que es un modelo probabilístico, surge para resolver las limitaciones de la TCT. La
principal es que las puntuaciones de las personas dependen de las características de los
ítems, y al contrario. Si al preparar un examen las preguntas resultan muy fáciles, se
obtendrán calificaciones más altas que si los ítems hubiesen sido más difíciles. Si se
aplica un examen a un grupo con mayor conocimiento o dominio sobre el tema se
obtendrán mas aciertos considerándose que las preguntas fueron fáciles que si hubieran
sido aplicadas a un grupo de menor perfil. Lo deseable es que las medidas no dependan
del instrumento, que sean “invariantes” y no dependan de los ítems concretos que se
apliquen. Esta importante propiedad la cumple la TRI y en ella descansan algunas de sus
aplicaciones más interesantes.
Aunque los primeros trabajos sobre la TRI aparecen en la década de los 50 (Lord, 1952),
el empuje definitivo se debe al libro de Lord y Novick (1968). La TRI es una teoría de los
tests que, como la TCT, va a proporcionar medidas de las personas y de las
características de los ítems, pero requiere aplicar la metodología estadística común para
la estimación de parámetros y determinación de la bondad del ajuste. Mientras en la TCT
no es posible comprobar si los datos de un test cumplen los supuestos de la teoría, en la
TRI el proceso de obtención de las características de las personas e ítems debe ir
precedido por un estudio del control de los supuestos y por la verificación del ajuste al
modelo. En la práctica, mientras la TCT requiere poco más que calcular medias,
varianzas y correlaciones, la TRI requiere cálculos complicados, obtención de
estimaciones por métodos numéricos y la utilización de software específico.
37
Avances
En la TRI, las puntuaciones de los n individuos en el test son las estimaciones de los n
parámetros 01, 02,… 0n. Análogamente, las características del ítem i son las
estimaciones de sus parámetros ai, bi y ci. Para obtener tales estimaciones se suelen
seguir los procedimientos estadísticos habituales. Se utiliza, con frecuencia, la
estimación máximo-verosímil. Es decir, se ofrece como solución los n valores de 0 y los k
valores de a, b y c que maximizan la probabilidad de las respuestas dadas por la muestra
al test. De las propiedades de los estimadores máximo-verosímiles se desprende que el
correspondiente estimador de 0, 000, sigue asintóticamente la distribución normal, con
media 0 y varianza V(000)=[I(0001 (Arnaiz, 1978), donde I(0) es la información que
suministra el test para la estimación del parámetro 0. La varianza del estimador o la
desviación típica, también llamada “error típico de medida” (Muñiz, 1997, p. 123), va a
ser la medida de la precisión o fiabilidad con la que el test mide, cuando se aplica la TRI.
De lo anterior se siguen dos consecuencias importantes: a) No sólo es posible, es
además lo habitual obtener la precisión de “cada” medida. En la TCT se obtiene la
precisión del test y se suele asumir que dicha precisión corresponde a todas las medidas
que se hagan con él. En la TRI, por el contrario, cada medida del nivel de rasgo, cada
estimación de 0, se hace con una determinada precisión, que viene indicada por su error
típico. Cuando la precisión es alta (es decir, cuando el error típico de medida se acerca a
cero), es baja la variabilidad de las estimaciones que produciría el test en caso de
aplicarse a una muestra de personas con nivel de rasgo 0. Cuando la precisión es baja,
ocurre lo contrario. b) Si a cada 0 se asocia su I(0), se obtiene la función de información
del test. Es una de las herramientas más útiles para la construcción de instrumentos de
38
Avances
medida, pues refiere qué niveles de rasgo pueden medirse mejor y peor con el test, y
cual es la máxima y mínima precisión alcanzable.
En el ámbito educativo, en lo que a psicometría se refiere se cuenta con una serie de
instrumentos, los cuales cuentan con características de validación, confiabilidad, validez
y estandarización, como es el caso de instrumentos para la medición del cociente
intelectual como Wppsi, Wisc-rm, Wais, Therman, Goodenaugh; de la personalidad como
16FP, MMPI-2, Barranquilla, Gordon; de madurez visomotora como Bender, Frosting;
para la medición de la orientación vocacional como Kuder; para el manejo y conocimiento
de técnicas de estudio como el CHTE, por referir algunos. En general, es a través de las
pruebas psicométricas que se puede conocer la capacidad, habilidad, destreza, valores,
actitudes, intereses, manejo de tolerancia a la frustración, inatención, problemas de
dislexia, dispraxia, nivel de avance educativo, entre otros. Ahora bien, en el ámbito de la
educación se cuenta con otros elementos para la medición de avances académicos,
como los exámenes –orales o escritos-, ensayos, evaluación del maestro respecto de la
destreza de desempeño, portafolio, etc. Todas estas formas de medición están referidas,
de manera evidente a conocer cuál es el nivel de desarrollo en que una persona se
encuentra o ha adquirido o desarrollado.
Conclusión
Si las competencias laborales pueden ser medidas, las actitudes, los valores, el
coeficiente, la tolerancia a la frustración, las técnicas de estudio. Las competencias
educativas también son susceptibles de ser medidas no solo a través de entrevista,
39
Avances
seguimiento de calificaciones, portafolio, sino a través de un instrumento de medición que
cuente con un sustento teórico-metodológico. Los enfoques correspondientes a
Competencias, Teoría de la Medida, teoría de la Respuesta al Item y de Teoría Clásica de
los Test, nos refiere a la construcción de instrumentos, con enfoque a prácticamente
cualquier tema que se requiera medir.
El sistema de evaluación a través de instrumentos de medición psicológica, también se han
hecho presentes en la educación, desde el momento en que la fundamentación teóricometodología para la construcción de pruebas como Ceneval o Excale presentan los mismos
preceptos teórico metodológicos, de ahí que destaquemos la fundamentación básica para
sugerir la construcción de un instrumento de medición de Competencias Básicas a nivel
universitario.
40
Avances
Bibliografía
Bibliografía sobre Competencias
Alfaro Rosca, Ma. Teresa, El aprendizaje de la Medicina en la universidad de Castilla la
Mancha. Una experiencia educativa basada en el aprendizaje de las
competencias profesionales, en Educ. éd. v.8 supl.2 Barcelona sep. 2005. Dcto.,
pdf.
Aguerrondo, I. (1996): La Calidad de la educación: Ejes para su definición y evaluación.
Washington D. C. Año XXXVII # 116. OEA.
Applied Psychological Measurement. AERA, APA y NCME (1999). Standards for
educational and psychological testing. Washington, DC: American Psychological
Association.
Barrios, Edgar (2000): Gestión de las competencias. CINTERFOR/OIT.
http//www.cinterfor.org.uy
Bogoya Maldonado, D. (1999): Proyecto sobre evaluación de competencias. Universidad
Nacional de Colombia. Memorias del Taller sobre Evaluación de Competencias
Básicas.
Casaliz, P. (1996): La modernidad de la Universidad en el siglo XXI. Ponencia
presentada en Seminario Internacional Modelos de Universidades en América
Latina. Bolivia.
CINTERFOR/OIT (2000): http//www.cinterfor.org.uy, Las 40 preguntas más frecuentes
sobre competencia laboral.
Doa, E,. Alberto
y otros (2000). El conocimiento y las competencias en las
organizaciones del Siglo XXI. Ed. Epsilon Libros, s.r.l. Universidad Metropolitana,
Caracas, Venezuela.
Filmus, D. (1997): El papel de la educación frente a los desafíos de las transformaciones
científico- tecnológicas. ED Aique, Buenos Aires.
González, V. (2002): ¿Qué significa ser un profesional competente?. Revista Cubana de
Educación Superior, Vol. 1/2002.
Guedez, Victor: Las competencias en las organizaciones del siglo XXI. Ed. Epsilon
Libros, s.r.l. Universidad Metropolitana, Caracas, Venezuela, pag.156.
Iñigo Bajos, Enrique. (2000): La formación de profesionales: una perspectiva desde el
mundo del trabajo. Tesis de Doctorado.
41
Avances
Irigoin, M., Vargas, F., Emergencias y actualidad de las Competencias Profesionales:
apuntes para su análsis, Art., pdf, 6-7, 8/27.
Larrain, U. Ana María, González Eduardo, Formación Universitaria por
Dcto. Pdf, p. 1
Competencias.
Magnusson, D. (1977): Teoría de los tests. México, Trillas.
Marin, Rigoberto. «www.fca.uach.mx/semestre1/tecnologias%20y%20manejo%20%de20la%20informacion/Libro/171.ht
m1.» 2003. 5 de octubre de 2008.Meister, Jeanne C.: Universidades Empresariales.
Cómo crear una fuerza laboral de clase mundial. 2000.
Merstens, Leonard. (2000): La gestión por competencia laboral en la empresa y la
formación profesional. OEI para la Educación, la Ciencia y la Cultura.
(1997): Competencia laboral: sistemas, surgimiento y modelos.
PISA (2006) Marco de la Evaluación, conocimientos y habilidades en ciencias
matemáticas y lectura, ED, Organización para la Cooperación y el Desarrollo
Económico (OCDE) Manual Técnico para la Validación de Reactivos.
Tejada Fernández, J.: Acerca de las competencias profesionales. Rev. Herramientas.
España. Material fotocopiado.SCAN Secretary’s Commission on Achieving
Necessary Skills 1991, EUA.
SCANS, Informe, Secretary´s Comisión on Achieving News Skills, 1992, EUA.
Bibliografía referida sobre Teoría Clásica
Abad, F.J. (2007). Introducción a la Psicometría. Proyecto docente. Madrid: Universidad
Autónoma de Madrid.
Abad, F., Olea, J. y Ponsoda, V. (en prensa). The Multiple-Choice model: Some solutions
for the estimation of parameters in the presence of omitted responses.
Abad, F.J. (2007); Jáñez, (1989): el Idealismo Platónico, la Teoría de las Escalas de
Medida y la Teoría Representacional. Madrid, Universidad Autónoma de Madrid.
Aiken, Lewis, R., (2003) Test psicológicos y evaluación, ED., Printice Hall, 11ª edición,
México.
Anastasi, Anne, Urbina Susana, (1998), Test Psicológicos, ED., Printice Hall, 7ª ed.,
México.
42
Avances
Arthur, Aron, Elaine N. Aron,(2001) Estadística para psicología, ED., Printice Hall, 2ª ed.,
México.
Ayerbe, I. (2006). La iniciativa privada y profesionalización de la Psicología aplicada en
España: Historia de TEA Ediciones (1952-2005). Sevilla: Universidad de Sevilla.
educational and psychological testing. Council of Chief State School Officers,
Meeting. 17 de junio.
Baker, F. (2001). The Basics of Item Response Theory. ERIC Clearinghouse on
Assessment and Evaluation, University of Maryland, College Park, MD.
Brown, F.G. (1980): Principios de la medición en Psicología y Educación. México. Manual
Moderno.
Campbell, N. R. (1928). An account of the principles of measurement and calculation.
Londres: Longmans, Green and Co.
Camilli, G. (2006). Test fairness. En R.L. Brennan (Ed.) Educational Measurement.
Westport, CT: Praeger. 4ª edición.
Clauser, B. E., Margolis, M. J. y Case, S. M. (2006). Testing for licensure and
certifications in the professions. En Brennan, R. L. (Ed.). Educational measurement.
Whasington: Praeger. 4ª edición.
Cohen, Ronald Jay, Mark, E., Swerdlik, (2001), Pruebas y Evaluación Psicológicas:
introducción a las pruebas y a la medición, ED Mc Graw Hill, 4ª ed., México.
Colom, B.R. (1995). Tests, inteligencia y personalidad. Madrid: Pirámide.
Colom, B. R. (2005). Psicología de las diferencias individuales. Teoría y práctica. Madrid:
Pirámide.
Crocker, L. y Algina, J. (1986): Introduction to Classical and Modern Test Theory. New
York, Holt, Rinehart and Winston.
Cordero, A. (1997): La evaluación psicológica en el año 2.000. Madrid: TEA Ediciones.
Cronbach, L.J. (1972). Fundamentos de la exploración psicológica. Madrid: Biblioteca
Nueva. Cuadras.
Embretson, S.E. (1985). Test design: Developments in Psychology and psychometrics.
New York: Academic Press.
Fraser, C.O. (1980). Measurement in psychology. British Journal of Psychology, 71, 2324. Traducción en Muñiz, J. (1992), Teoría clásica de los tests. Madrid: Pirámide.
García Cueto, E. (1993): Introducción a la Psicometría. Madrid, Siglo XXI.
43
Avances
González Barberá (2007) Naturaleza de la Medida en Educación, ED. Universidad
Complutense de Madrid.
Jañez, L. (1989). Fundamentos de Psicología Matemática. ED. Pirámide. Cap. 18,
Madrid.
Jay Cohen, Ronald, Swerdlik Mark, (1988) Pruebas y Evaluación Psicológicas,
introducción a las pruebas y la medición. ED., Printice Hall, México
Lopez-Feal, R. (1986): Construcción de instrumentos de medida en Ciencias
Conductuales y Sociales. Barcelona, Alamex.
Márquez, Jurado Amelia, (2004), Medición de Actitudes en Conductores de Transporte
Público, caso Concesionaria Fronteriza Municipio de Cd. Juárez. Tesis de
Maestría en Salud en el Trabajo, UACJ, México.
Martínez Arias, M.R. (1995). Psicometría: Teoría de los tests psicológicos y educativos.
Madrid: Síntesis. Capítulo 10 y 11.
Meliá, J.L. (1990). Introducción a la medición. ED.Cristóbal Serrano Villalba. Capítulos 1
y 2, Valencia.
Morales, S, P. (2000). Medición de actitudes en psicología y educación. Madrid:
Universidad Pontifica Comillas.
M.R. (1995). Psicometría: Teoría de los tests psicológicos y educativo. Madrid.
Muñiz, J. (1992). Teoría clásica de tests. Madrid: Pirámide.
Muñiz, J. (Coord.) (1996). Psicometría. Madrid: Universitas.
Nunnally, J.C. (1987): Teoría psicométrica. México, Trillas. Original.
Nunnally, J.C. (1989). Teoría psicométrica. México: Trillas.
Santisteban, C. (1990). Psicometría. Teoría y práctica en la construcción de tests.
Madrid: Norma. Capítulos 10 a 14.
Spearman, C. (1904), General Inteligence Objectively Determined and Measured,
American Journal of Psicology Suppes, Kranz, Luce y Tversky, 1989).
Santiesteban, C. (1990): Psicometría: Teoría y práctica en la construcción de tests.
Madrid: Norma.
Thorndike, R.L. y Hagen, E. (1977). Measurement and Evaluation in Psychology and
Education. New York: Wiley.
Thorndike, R.L. (1991). Psicometría aplicada. México: Trillas.
44
Avances
Bibliografía referida sobre Teoría de la Respuesta al Item
Abad, F.J, Garrido, J., Olea, J. y Ponsoda V. (2004). Introducción a la Psicometría.
Teoría Clásica de los Tests y Teoría de la Respuesta al Ítem. Documento inédito.
Madrid: Universidad Autónoma de Madrid. (Manual).
Conejo, R. (2001). SIETTE: Un sistema de evaluación mediante test basado en la Teoría
de Respuesta al Ítem. Accesible en www.lcc.uma.es/ publicaciones/ LCC1031.pdf.
Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New
York: Holt, Rinehart and Winston. Capítulo 15.
Hambleton, R.K. (1989). Principles and selected applications of item response theory. En
R.L.Linn, Educational Measurement. New York: Macmillan.
López Pina, J.A. (1995). Teoría de la respuesta al ítem: Fundamentos. Barcelona: PPU.
Martínez Arias.
Muñiz,J.(1997).Introducción a la teoría de la respuesta a los ítems. Madrid: Pirámide.
Muñiz, J. (1998). Teoría de respuesta a los items: Un nuevo enfoque en la evolución
psicológica y educativa. Madrid: Pirámide.
Santisteban, C. y Alvarado, J.M. (2003). Psicometría (II). Teoría de la respuesta al Item.
ED. Complutense, S.A. , Madrid.
Tomás, J.M., Olivier, A. y Meliá, J.L. (1992). Teoría de la respuesta al ítem:
Fundamentos, modelos y aplicaciones. Valencia: Cristóbal Serrano. Cap. 1,4 y 6.
Bibliografía básica recomendada para la Teoría de la Medida
Allen, M.J. y Yen, W.N. (1979): Introduction to Measurement Theory. Monterey, CA.,
Books-Cole.
Arnaiz, G. (1978). Introducción a la estadística teórica. 3ª edición. Valladolid: Lex- Nova.
Amón, J. (1980). Estadística para psicólogos (Volumen 1). ED.Pirámide. Capítulo 2,
Madrid.
Arce, C. (1994): Técnicas de construcción de escalas psicológicas.Madrid: Síntesis.
Baird, J.C. y Noma, E. (1978): Fundamentals of Scaling and Pychophysics. New York,
Wiley.
Barbero, M.I. (1993): Métodos de elaboración de escalas. Madrid, UNED.
45
Avances
Bejar, I.I. y Braun, H.I. (1999). Architectural simulations: From research to
implementation. (RM-99-2). Princeton, NJ: Educational Testing Service.
Borsboom, D. (2005). Measuring the mind: conceptual issues in contemporary
Psychometrics. New York: Cambridge University Press.
Bravo, A. y Fernández, J. (2000). La evaluación convencional frente a los nuevos
modelos de evaluación auténtica. Psicothema, 12, Supl. nº 2, 95-99.
Brusco, M.J. y Köhn, H.-F. (2008). Optimal partitioning of a data set based on the
pmedian model. sychometrika, 73, 89-115.
Castro, C.de (1980). Teoría de la medida en psicología y ciencias sociales. Caracas,
Universidad Central de Venezuela: Ediciones de la Facultad de Humanidades y
Educación.
Coombs, C.H., Dawes, R.M. y Tversky, A. (1981). Introducción a la psicología
matemática. Madrid: Alianza Universidad. Capítulos 2 y 3.
Ceulemans, E. y Van Mechelen, I. (2008). CLASSI: A classification model for the study of
sequential processes and individual differences therein. Psychometrika, 73, 107124.
C.M. (1981). Métodos de análisis multivariante. Barcelona: Eunibar. Del Pino, G., San
Martín, E.
De Castro, C. (1982): La medida en Psicología: Perspectiva Psicofísica. Revista de
Psicología General y Aplicada. P. 37.
González, J. y De Boeck, P. (2008). On the relationships between sum score based
estimation and joint maximum likelihood estimation. Psychometrika, 73, 145-151.
Haladyna, T.M. (1994): Developing and validating multiple-choice test items. Hillsdale,
NJ: LEA.
Hambleton, R.K. y Sdwaminathan, H. (1985). Item response theory: Principles and
applications. Boston, MA: Kluwer- Nijhoff Publishing.
Hambleton, R.K., y Swaminathan, H. y Rogers, H.J. (1991). Fundamental of item
response theory. Newbury Park: Sage.
Holden, R.R., and Jackson, D.N., (1985) item subtlrty and face validity in pertsonality
assessment, journal of consuling and clinical psychology.
Keeves, J.P. (1988): Educational research, methodology and measurement. Oxford,
Pergamon Press.
46
Avances
Muñiz, J. (1982): Medición psicológica: Métodos de escalamiento. Madrid. Universidad
Complutense.
Muñiz, J. (1991). Introducción a los métodos psicofísicos. Madrid: PPU. Capítulo 1.
Olea, J.; Ponsoda, V. y Prieto, G. (Eds.) (1999): Tests informatizados: fundamentos y
aplicaciones. Madrid: Pirámide.
Pérez, C.; Padilla, J. L.; González, A. y Rojas, A. J. (1996). El uso de las técnicas de
escalamiento para la definición y medida del continuo psicosocial "individualismocolectivismo". Boletín de Psicología, 25, 7-14.
Tomas, J.M.; Oliver, A. y Meliá, J.L. (1992). Teoría de la Respuesta al Item:
Fundamentos, Modelos y Aplicaciones. Valencia: Cristóbal Serrano.
Torgerson, W.S., (1958) Theorynand Methods of Scaling, New York-. Wiley.
Vargas, F. (1999): La formación basada en competencias: Instrumento para la
empleabilidad. Centro de Investigación y Documentación.
Artículos
Cortada de Kohan, N. (2004). Teoría de Respuesta al Ítem: Supuestos Básicos. Evaluar,
4, pp. 95-110.
Elosúa, P. y López, A. (1999). Funcionamiento diferencial de los ítems y sesgo en la
adaptación de dos pruebas verbales. Psicológica, 20, pp. 23-40.
Fan, X. (1998). Item response theory and classical test theory: an empirical comparison
of their item/person statistics. Educational and Psychological Measurement, 58(3),
pp. 357-382.
Gómez Benito, J. y Navas, M.J. (1998). Impacto y funcionamiento diferencial de los ítems
respecto al género en una prueba de aptitud numérica. Psicothema, 10(3), pp.
685-696.
Hambleton R.K. y Jones, R.W. (1993). Comparison of classical test theory and item
response. Educational Measurement: Issues and Practice, 12(3), pp.38-47.
Harris, D. (1989). Comparison of 1-, 2-, and 3-parameter IRT models. Educational
Measurement: Issues and Practice;. 1(8), pp. 35-41.
ITEMS: The Instructional Topics in Educational Measurement Series, by Mark Gierl.
Stenner, A.J., Smith III, M and Burdick, D.S.(1983)Toward a Theory of Construct
Definition, Journal of Educational Measurement , 20, 305-316.
Prieto, G. y Dias, A. (2003) Uso del modelo de Rasch para poner en la misma escala las
puntuaciones de distintos tests. Actualidades en Psicología,19(106), pp. 5-23.
47
Avances
Direcciones WEB
http://www.ucm.es/info/funvalor/docs/medida.pdf,
http://www.uam.es/personal_pdi/stmaria/jmurillo/recursos/medida.htm
http://www.canalsocial.net/GER/ficha_GER.asp?id=9589&cat=Matematicas
http://www.uned.es/psico-3-psicometria/ttest.htm#que
http://www.pt.wikipedia.org/wiki/Escala_Likert
http://www.unmsm.edu.pe/psicologia/documentos/documentos2007/libro%20eap/05Libro
EAPAliaga Tovar Jaime, Test psicométricos: Confiabilidad y Validez.pdf
http://perso.wanadoo.es/aniorte_nic/apunt_metod_investigac4_7.htm
http:// www:aniorte-nic.net
http://www.mestizos.net
48
Descargar