Universidad Autónoma de Ciudad Juárez Coordinación de Investigación y Posgrado del Instituto de AVANCES Cuaderno de Trabajo Algunos fundamentos metodológicos en la Elaboración de Instrumento de Medición en Psicología y Pedagogía: base para la construcción de un instrumento de medición de competencias básicas universitarias Amelia Márquez Jurado Núm. 228 Octubre 2009 Comité Editorial de Avances Dra. Martha Patricia Barraza de Anda Dra. Consuelo Pequeño Rodríguez Dra. Alba Yadira Corral Avitia Mtra. Carmen Gabriela Lara Godina Mtro. Gerardo Sandoval Montes Dra. Magali Velasco Vargas Dr. Ricardo Almeida Uranga Dra. Sonia Bass Zavala Mtra. Carmen Álvarez González Mtra. Ma. Elena Vidaña Gaytán Mtro. Oscar Dena Romero Mtra. Katya Butrón Yáñez Directorio Jorge Mario Quintana Silveyra Rector David Ramírez Perea Secretario General Martha Patricia Barraza de Anda Coordinadora General de Investigación y Posgrado Francisco Javier Sánchez Carlos Director del Instituto de Ciencias Sociales y Administración Consuelo Pequeño Rodríguez Coordinadora de Investigación y Posgrado del ICSA Universidad Autónoma de Ciudad Juárez Instituto de Ciencias Sociales y Administración H. Colegio Militar # 3775 Zona Chamizal C.P. 32310 Ciudad Juárez, Chihuahua, México Tels. 688-38-56 y 688-38-57 Fax: 688-38-57 Correo: [email protected] [email protected] Avances Algunos fundamentos metodológicos en la Elaboración de un Instrumento de Medición en Psicología y Pedagogía: base para la construcción de un instrumento de medición de competencias básicas universitarias Resumen El asunto de las competencias universitarias, como base de la formación de los profesionales universitarios, presenta un vínculo importante entre el trabajo, la educación y la función del ser humano. Su base fundamental de apoyo surgió a partir de la necesidad de establecer un parámetro de desarrollo de formación de acuerdo a las necesidades productivas del mercado a nivel mundial, siendo su asunción y aplicación de acuerdo al desarrollo de cada nación. Los programas creados en relación con el tema del desarrollo de las competencias, lleva también implícita la necesidad de ser evaluados para así constatar la efectividad lograda de los objetivos de aprendizaje vinculados con el trabajo. Si bien se han diseñado pruebas tales como Ceneval, Excale, sin embargo, hasta la fecha no se cuenta con un instrumento de medición que evalúe –específicamente- las competencias básicas universitarias y que otorgue resultados de efectividad de los programas educativos con enfoque global. Pretendemos entonces, presentar algunos enfoques metodológicos que pueden servir como parámetro para la construcción de un instrumento de medición para tal efecto. Abstract College competencies, as a base for university students formation, presents an important link among work, education and being human. Its support base arose from the necessity to establish a parameter of development and formation according to prevailing world’s market productive needs. Its use will be directly related to each country development stage. Developing competencies programs requires at the same time the need to have them evaluated so as to assess the effectiveness of learning objectives. Despite tests such as Ceneval and Excale have been designed, there are no measuring instruments that specifically evaluate basic university competencies that provide effective results with a global approach on education programs. Therefore, we present some methodological approaches that may be used as parameter for the construction of a measuring instrument. Palabras Claves: Competencias Básicas Universitarias, Sistemas de Evaluación, Psicometría, educación superior, Teoría Clásica de los Test, Teoría de Respuesta al Item. 1 Avances Introducción En el campo de la educación, las competencias han estado cobrando importancia desde la década de los años sesenta, la evaluación de las mismas ha estado abierta a una serie de reformas y cambios en su forma original, el nivel al que se ha aplicado es el básico y bachilleratos. A nivel universitario se ha procedido básicamente a realizar el seguimiento del rendimiento académico de los alumnos a través de las evaluaciones docentes, con entrevistas y portafolio, más no con algún instrumento de medición específico para ello. El presente artículo, pretende ofrecer algunos fundamentos metodológicos que pueden ser aplicables para la construcción del instrumento de evaluación, con lineamientos teóricometodológicos científicos, mismos que proporcionan la confianza de su medición respecto de un grupo –normalización- y sea susceptible de aplicarse a alumnos y evaluar su nivel de desarrollo tanto en conocimiento como en aplicación del mismo en un nivel de praxis laboral, social y familiar. Nos enfocamos en lo relativo al conocimiento de competencias así como a los distintos sistemas de evaluación y teorías con las cuales se construye un instrumento de evaluación. Asimismo se ejemplifica la construcción metodológica y teórica a través de los resultados obtenidos en la construcción del instrumento de medición de la competencia laboral denominada Actitud de chóferes de transporte público. De la misma manera en que una competencia laboral es susceptible de ser medida, también los dominios cognitivos, los valores, el nivel de inteligencia o cognición, así se infiere susceptible de ser medida la formación de competencia básica universitaria. 2 Avances Sistemas de evaluación El sistema que se utiliza en psicología para medir una serie de parámetros conductuales, cognitivos, emocionales, de habilidad, destreza etc., se le conoce como psicometría, donde evaluación psicométrica –a través de una batería de pruebas- se interpreta como el conjunto de procedimientos que conducen a la valoración cuantitativa de fenómenos conductuales, cognitivos, emocionales, de personalidad, habilidad, destreza, actitud, aplicados a los procesos laborales y de vida. Estos instrumentos aportan apoyos importantes, como en el caso de la pedagogía en la cual se aplican para conocer el nivel de coeficiente intelectual, la madurez visomotora, el desarrollo de personalidad, las preferencias vocacionales, valores, actitudes, manejo de tolerancia a la frustración, manejo de técnicas de estudio, dificultad en el aprendizaje, entre otras; en el área industrial y laboral se especifican áreas de desarrollo potencial y a desarrollar respecto de capacidad, manejo de inteligencia múltiple, manejo de tipos de liderazgo, capacidades motoras, destrezas, habilidades, manejo de personalidad laboral, comunicación y desarrollo personal y su influencia en las personas, entre otras; en el área jurídica se emplean las pruebas psicométricas para la elaboración de perfiles de personalidad psicopática, evaluación del estado mental y tipo de personalidad, dictámenes de tendencias psicopáticas v/s normalidad, entre otros. En el área de salud se aplican para conocer el estado emocional vinculado con el desarrollo de personalidad y actitud con un enfoque clínico; en las áreas sociales se utilizan para conocer la percepción de la dinámica socio-familiar-cultural. El sistema de evaluación a través de instrumentos de medición psicológica, también se ha hecho presente, en el área educativa desde el momento en que la fundamentación teóricometodológica para la construcción de pruebas como Ceneval o Excale presentan los 3 Avances mismos principios, de ahí que consideremos la posibilidad de llevar a cabo una prueba de evaluación de competencias básica a nivel universitario. Por ejemplo en Estados Unidos desde 1960 cuenta con un Sistema de Evaluación Nacional del Progreso Educativo (NAEP) enfocado en el conocimiento y habilidades de los jóvenes, aunque esta evaluación se realiza a nivel básico1. Para bachillerato cuentan con una evaluación denominada Alfabetismo funcional o de competencia mínima, misma a la que los alumnos deben someterse para recibir su diploma de egreso. Los riesgos que han detectado respecto de esta evaluación: por una parte la ocupa la discriminación, con la cual algunos de los alumnos consideran que se favorece a ciertos grupos raciales; la otra objeción se ubica en la alta reprobación; otra más centrada en la calidad y enfoque del profesorado respecto del contenido de las materias, las cuales se enfocan básicamente a preparar a los alumnos para que aprueben dicho examen. Otra forma de evaluar el desempeño del alumnado por competencias es el denominado evaluación de valor agregado en la cual se valora los conocimientos adquiridos en las materias académicas y habilidades de la vida tales como analizar una columna de periódico, una tabla matemática, esta valoraciones son aplicadas antes y después de cada periodo escolar, considerando que la mejoría sustancial de un alumno es el equivalente a un valor agregado. Para nivel universitario aún no se conoce con certeza si la forma de evaluar el resultado de programas académicos centrado en la búsqueda de generar en los alumnos competencias, esté basada en una evaluación de desarrollo de acuerdo a la obtención de calificaciones y su seguimiento semestral. Una vez más consideramos la posibilidad, dadas las características que engloban las competencias, que puedan ser susceptibles de ser medidas a través de instrumentos de 1 Aiken, Lewis R., Test psicológicos y evaluación. pp. 239-240. 4 Avances evaluación. La psicometría o instrumentos de medición se ocupan de la medición a través de la asignación de cantidades a las características o propiedades de una persona, en relación con el tema del que se ocupe dicho instrumento, así puede ser de actitudes y por qué no de competencias no solo a nivel laboral, sino educativo. Su elaboración requiere del seguimiento y apego a un método de construcción en el cual se involucra la estadística, la matemática y la temática a tratar. Competencias básicas universitarias Los antecedentes de la Educación Basada en Competencias datan de medidos del siglo XX en los Estados Unidos -aplicado a infantes-, para 1906 en la Universidad de Cincinnati-Ohio se crearon convenios con empresas estableciéndose criterios de desempeño en la práctica. Para 1930 este programa se había masificado y había cobrado popularidad y sobre todo logrado beneficios mutuos. En 1973 el gobierno de Estados Unidos el Departamento de Estado realizó un estudio orientado a la selección del personal2, luego de un período de estudio se llegó a la conclusión que un buen desempeño en el puesto de trabajo está más relacionado con características propias de las personas, a sus competencias, que a sus aspectos como conocimientos o habilidades. 3 Siendo hasta la década de los años ochenta que se inicia con la utilización del concepto de Competencias erigiéndose como pioneros Estados Unidos, Inglaterra y Australia enfocando la mejora en eficiencia, pertinencia y calidad de la capacitación laboral. Uno de los indicadores que permiten observar la necesidad y el avance que en relación a educación se están dando a nivel mundial, lo marca el informe que se generó en la 2 Tarea que le fuera encomendada a David Mc Clelland catedrático en Harvard, su análisis buscaba detectar las características presentes en las personas a seleccionar y que predijeran el desempeño de su éxito laboral. 3 Larrain, U., Ana María, González, F. Eduardo, Formación Universitaria por Competencias. Dcto. pdf 5 Avances Conferencia Mundial sobre la Educación Superior con Sede en la UNESCO (1988) en la cual se hizo hincapié en que es necesario propiciar el aprendizaje permanente y la construcción de las competencias adecuadas para contribuir al desarrollo cultural, social y económico de la sociedad.4 Para Junio de 2000, en el informe de la UNESCO referido al aspecto de Educación, menciona sobre la Educación Superior en países en desarrollo: Peligros y Promesas que…La nueva economía demanda competencias interpretativas, analíticas, de establecimiento de prioridades, evaluativas y otras de alto nivel de manejo de la información... Todos necesitarán estas competencias. Estas pueden y deben enseñarse en edades tempranas. Pero también deben ser enseñadas en los niveles superiores. Este es otro reto a la educación superior donde la especialización y la competencia técnica sombrean demasiado frecuentemente éstas competencias generales”. De tal forma, el estudio de las competencias ocupa hoy un espacio de primer orden y es tratado por su importancia por diversas instituciones y autores, entre los cuales se puede reconocer determinadas tendencias en su tratamiento y definición. Este enfoque se inicia de manera más o menos paralela en el Reino Unido y en Australia en ambos casos constituyen un sistema de normalización, formación y certificación de competencias instituido luego de haber realizado profundos estudios y análisis en sus respectivos países. De acuerdo a lo anterior, se considera que la vinculación de la educación con el campo laboral se da entonces como una necesidad, considerando las competencias profesionales como una base o referencia para crear una mejora en los enfoques educativos, en los cuales no se busca privilegiar sólo la adquisición de conocimientos, sino también la forma 4 Las competencias básicas se apoyan en 47modelos universitarios de Australia, Canadá y los Estados Unidos. 6 Avances en que éstos se aplican a la vida misma. Este parámetro facilita la evaluación de los egresados de los sistemas de educación profesional, considerando así también los requerimientos del entorno socioeconómico en el que se encuentra inserta la sociedad en la que se está desarrollando, es decir, considerando el contexto en el que se desarrollarán profesionalmente los egresados de cualquier país, dado que las necesidades laborales se encuentran interrelacionadas. La competencia laboral se considera a partir de la conjunción de conocimientos, habilidades y actitudes conducentes a un desempeño de calidad y oportuno y funcional. Esta cultura de competencia establece la articulación entre trabajoeducación-recurso humano. En este enfoque globalizado y enfocado básicamente a los países en desarrollo, se observa que existe un sesgo en cuanto al enfoque, dado que si bien hace referencia a la necesidad de realizar cambios en los sistemas educativos para establecer la vinculación entre el conocimiento y las necesidades laborales que preparen a las personas para una vida más íntegra, en la cual se involucra trabajo-educación y recurso humano, no se consideran todos aquellos elementos de función biológica que afecta y altera la capacidad perceptiva del ser humano. Si bien es cierto que cada persona tiene una forma peculiar de percibir e interpretar el mundo, existen elementos de función biológica insoslayables tales como los trastornos por déficit de atención, hiperactividad, dislexia, del aprendizaje, negativismo desafiante, disocial, fonológico, expresivo. Trastornos emocionales como la bipolaridad, ansiedad, del estado de ánimo, y algunos más que se encuentran documentados con detalle en el Manual Diagnóstico DSM-IV-R y que dan cuenta de su existencia en las múltiples quejas que los docentes argumentan, no solo a nivel básico, sino universitario y que las autoridades mundiales encargadas del manejo y función de educación no han 7 Avances asumido con la necesidad y urgencia con la que se presenta o que no la han dimensionado por desconocimiento de su etiología y evolución y solo consideran las consecuencias – conducta- como algo inherente del ser humano. Concepto de Competencia En el mundo globalizado no basta con preparar profesionales especializados en un área de conocimiento, cada vez con mayor necesidad se requiere que la formación además de ser básica, proporcione al egresado las habilidades en su área de preferencia de estudio, las capacidades para captar el mundo circundante y sus necesidades, es decir, desarrollar la percepción, además para adaptarse a las circunstancias y responder a ellas de forma rápida y eficiente, ordenar sus impresiones, comprender las relaciones entre los hechos que observa, que vive y en consecuencia pueda actuar. Para lograr este objetivo, se requiere, además de las capacidades y conocimientos logrados por el propio individuo, una formación de saberes transversales los cuales puede estar actualizando de forma cotidiana y de acuerdo a las necesidades del desarrollo de la comunidad. Por lo que se requiere que la formación académica se constituya de la combinación de las capacidades propias, la educación formal y el aprendizaje que obtenga del trabajo. Como este supuesto involucra factores múltiples, que van desde las capacidades intrínsecas de cada individuo5, hasta las condiciones socioeconómicas, de política gubernamental y educativa las cuales proporcionarán en cada egresado diversos niveles de competencia, se hace entonces, difícil expresar un solo concepto de competencia que sea válido a nivel mundial, de ahí que se han adaptado conceptos de competencia de acuerdo a las necesidades considerando, en general que …el concepto de competencia reconoce un 5 Dentro de las capacidades intrínsecas se encuentra el nivel de coeficiente intelectual, la madurez perceptiva, capacidades motrices gruesas y finas, capacidades auditivas, visuales, táctiles, gustativas y olfativas, así como los aspectos afectivos, emocionales y conductuales. 8 Avances equilibrio entre las necesidades de las personas, de las empresas, de la sociedad y, en general de la realidad contemporánea global, entendiéndose en general …la competencia como la capacidad de un sujeto para realizar una tarea que exige activar una serie de recursos que se manifiestan en su comportamiento eficiente.6 Para tal efecto globalmente se han considerado, tres tipos de Competencias: 1) las Básicas , en las cuales la persona constituye las bases de su aprendizaje –interpreta y comunica información, razona de forma creativa y soluciona problemas entre otras y están referidas fundamentalmente a la capacidad de “aprender a aprender”-. Requiere de instrumentación básica como la idoneidad para la expresión oral y escrita y del manejo de las matemáticas aplicadas y pone en movimiento diversos rasgos cognitivos, como la capacidad de situar y comprender de manera crítica, las imágenes y los datos que le llegan de fuentes múltiples; la aptitud para observar, la voluntad de experimentación y la capacidad de tener criterio y toma de decisiones. Se suelen incluir en los currículos como comunicación verbal y escrita, lectura y escritura, las nociones de aritmética, el trabajo en equipo, la resolución de problemas y la enseñanza de lenguas extranjeras; 2) las Personales, son aquellas que permiten realizar con éxito las diferentes funciones en la vida -actuar responsablemente, mostrar deseo de superación y aceptar el cambio, entre otras-. Estas constituyen un conjunto difícil de definir, pues están en función de las capacidades y potencialidades de expresión de un grupo de características que se manifiestan en dependencia del ambiente en que se desarrolle la actividad, tales como seguridad en si mismo, capacidad para dominar los sentimientos y las tensiones emocionales, curiosidad, argumentación crítica y capacidad analítica, y 3) las 6 Mertens (1996), citado en emergencias y Actualidades de las Competencias. 9 Avances Profesionales son las que garantizan cumplir con las tareas y responsabilidades de su ejercicio profesional. Se reconoce que las cualidades de las personas para desempeñarse productivamente en una situación de trabajo, no sólo dependerán de las situaciones de aprendizaje escolar formal sino también del aprendizaje derivado de la experiencia en situaciones concretas de trabajo. 7 Considerando las necesidades del mercado, los centros educativos profesional y de nivel medio superior, se dieron a la tarea de conservar los vínculos ya establecidos con las empresas, así en Estados Unidos, se elabora el informe SCAN (1991)8, en el cual se identifican cinco categorías generales de competencias o competencias transversales a saber: 1) Gestión de Recursos consistente en el manejo de tiempo, dinero, materiales y distribución personal ; 2) Relaciones Interpersonales, consistente en trabajo en equipo, enseñanza a otros, servicio a clientes, despliegue de liderazgo, negociar y trabajar con personas diversas; 3) Gestión de Información, consistente en buscar y evaluar información, organizar y mantener sistemas de información, interpretar y comunicar, usar computadora; 4) Comprensión Sistemática, consistente en comprender interrelaciones complejas, entender sistemas, monitorear y corregir desempeños, mejorar o diseñar sistemas y 5) Dominio Tecnológico, consistente en seleccionar tecnologías, aplicarlas en la tarea, dar mantenimiento y reparar equipos. Este enfoque vertido hacia el trabajo, puso en evidencia la necesidad de que tanto la empresa, como el sector educativo y gubernamental pudieran 7 8 Elementos constitutivos. Competencias; 2003. http://www.edutec.es/edutec01/edutec/comunic/TSE09.html El reporte SCAN Secretary’s Commission on Achieving Necessary Skills 1991, expresa que las competencias laborales que se requieren, fácilmente se pueden relacionar con las competencias que los estudiantes construyen en la educación superior: En su investigación Workplace Basics 1990, Carnavale, Gainer y Meletzer identifican 7 competencias básicas que se requieren en el trabajo: Competencias laborales: Aprender a aprender; Competencia en lectura, para expresarse por escrito y en nuevas tecnologías; Comunicación: habilidades para saber escuchar y expresarse oralmente; Adaptabilidad: resolución de problemas y pensamiento creativo; Autogestión: autoestima, motivación y proyección de metas, servicio, desarrollo profesional; Eficiencia en trabajo con grupos: interdisciplinarios, habilidades para negociar y trabajar en equipos; Autoridad: habilidades para organizar y de liderazgo. 10 Avances sintonizar sus programas de tal manera que pudieran los egresados de las universidades ser competentes y no sólo conocedores. En 1994 se forma el Comité Conjunto sobre Prácticas Educativas el cual fue conformado por American Psychological Association (APA), Educational Research, Association (AERA) y el National Council of Measurement Educatión (NCME), este comité tuvo a su cargo la publicación del Manual de Estándares de Pruebas. En México el Centro Nacional para la Evaluación de la Educación Superior (Ceneval) publicó la versión nacional de las normas en el documento llamado Estándares de Calidad para Instrumentos de Evaluación Educativa (2000)9. Para vigilar que la normatividad se cumpla en la construcción de instrumentos de medición educativa, sean para exámenes de admisión, diagnóstico, ubicación o certificación. El Instituto Nacional Peruano para la Evaluación de la Educación instrumentó mecanismos de control en sus exámenes para la Calidad y el Logro Educativos (Excale)10, buscando con ello asegurar el seguimiento de la norma, así como la validez de los resultados e interpretaciones. Así como en el campo de la psicología podemos destacar una rama o especialización denominada Psicometría encargada del estudio de los métodos, técnicas y teorías implicadas en la medición de variables psicológicas, en Educación no existe una especialización tan concreta algo así como la Edumetría. Por lo tanto y dadas las variables estudiadas en educación y su semejanza a las que se trabajan en psicología se ha aplicado el mismo sistema teórico-metodológico para la medición de variables y 9 Instituto Nacional para la Evaluación de la Educación, Manual Técnico para la Validación de Reactivos, p. 3 Excale, contiene una tabla que resume las decisiones adoptadas por el Comité Académico respecto a la planeación de la prueba. En ella se especifican las líneas de evaluación, las áreas temáticas, los temas y subtemas cuyo dominios serán evaluados, el número de especificación de reactivos necesario para evaluarlo, asi como el número y tipo de reactivos que será necesario construir para responder a cada especificación. La tabla de contenido presenta la estructura general del examen. 10 11 Avances contenidos educativos, de ahí que se considere la funcionalidad y pertinencia en la evaluación de competencias básicas universitarias. La Ciencia y la empresa piden inteligencia en lugar de acumulación de saberes que aportan un porcentaje menor al esperado por la empresa cuando de aplicación de los mismos se trata. Para que los centros educativos pasen de ser transmisores de información a formadores estimuladores de las múltiples inteligencias personales, se requiere de un cambio en la currícula educativa, además de un cambio de paradigmas sobre la enseñanza. Recientemente en el proyecto europeo sobre investigación de universidades, se realizó una encuesta sobre las capacidades genéricas que las empresas piden de los egresados universitarios, [arrojaron] las 17 siguientes capacidades por orden prioritario.11 1. Capacidad de aprender. 2. Capacidad de aplicar los conocimientos en la práctica. 3. Capacidad de análisis y síntesis. 4. Capacidad para adaptarse a las nuevas situaciones. 5. Habilidades interpersonales. 6. Capacidad para generar nuevas ideas (creatividad). 7. Comunicación oral y escrita en la propia lengua. 8. Toma de decisiones. 9. Capacidad crítica y autocrítica. 10. Habilidades básicas de manejo de la computadora. 11 Mestizo Cósmico, Las competencias básicas para la sociedad del conocimiento, en www.mestizos.net 12 Avances 11. Capacidad de trabajar en equipo interdisciplinario. 12. Conocimientos generales básicos sobre el área de estudio. 13. Compromiso ético (valores). 14. Conocimientos básicos de la profesión. 15. Conocimiento de una segunda lengua. 16. Apreciación de la diversidad y multiculturalidad. 17. Habilidades de investigación. Hasta ahora, parece que los centros universitarios se apegan más a las características enmarcadas en los niveles 14 al 17, dejando de lado la formación para la creación de autodisciplina, aplicación de su potencialidad, lo que se conoce como la aplicación de las inteligencias múltiples. Teoría de la Medida En el lenguaje de la psicometría la medida, es considerada como un elemento matemático imprescindible en el momento de la definición operacional de conceptos teóricos12, para la formulación precisa de las hipótesis, la constatación estricta de los datos y la verificación experimental de las teorías. Juega asimismo un papel importante en Psicología aplicada.13 Algunos de estos planteamientos se realizan en escala psicológicas como las de medición de personalidad, de actitudes, entre otras, algunas otras podrían considerarse cognitivas como en el caso de la evaluación de aprendizaje, o de medición de la capacidad intelectual. Luego entonces se puede decir en todo proceso 12 Los conceptos no se pueden medir directamente, se miden las definiciones operativas de ese concepto, por ello los conceptos requieren operacionalización. El Concepto se puede situar en una escala en arreglo a su complejidad y esto depende de las facetas que contenga. http://perso.wanadoo.es/aniorte_nic/apunt_metod_investigac4_7.htm 13 Análisis Factorial; aptitud; cociente de inteligencia; inteligencia; psicología aplicada; psicología diferencial; psicología pedagógica; psicología del trabajo; psicodiagnóstico; psicotecnia; test psicológico. 13 Avances en el cual se encuentre involucrada la creación de pruebas y el concepto de medida se hace referencia a la utilización estadística en la medición de confiabilidad y validez y se apoyan en representaciones empíricas, cognitivas y perceptuales. En psicometría se considera el …medir [como] el contar, comparar una unidad con otra, dar una valoración numérica, asignar un valor, asignar números a los objetos. Todo lo que existe está en una cierta cantidad y se puede medir. Estos no se asignan de forma arbitraria sino que se rigen por ciertas reglas, se establece un sistema empírico y éste da lugar a un sistema formal.14 Dentro de la teoría de la medida para clarificar si la medición es realmente posible se hizo necesario el desarrollo de una teoría acerca de lo que significa medir, especificando los tipos de medidas posibles, cuales son deseables para una ciencia y a cuales se puede pretender desde el punto de vista de la psicología y su aplicación a otras ciencias, entre ellas la pedagogía. Se han generado por lo menos tres grandes perspectivas históricas que en enfocan el concepto de la medición (Abad, 2007; Jáñez, 1989): el Idealismo Platónico, la Teoría de las Escalas de Medida y la Teoría Representacional. Desde el enfoque que se marca en el Idealismo Platónico, medir se caracterizaba por asignar al objeto el número que representaba la cuantía verdadera de la propiedad que se medía (es decir, su magnitud), considerando que en la realidad existen dichas magnitudes. Tanto Pitágoras como Platón afirmaban que todas las cosas se podían transformar en números, que los números representan cantidades, en cambio Aristóteles afirmaba que la esencia de las cosas era cualitativa. En el s. XIX, Newton impone lo que 14 www:aniorte-nic.net 14 Avances se ha conocido como el imperativo cuantitativo que ayudó a dar sentido a muchos fenómenos psicológicos apoyándose en las matemáticas. Aristóteles consideró la cantidad como la categoría fundamental de la realidad, así, dividió las cantidades en discretas y continuas. Las discretas eran los números naturales los cuales no los consideraba elementos de un sistema formal pero sus propiedades comunes formaban clases o conjuntos, por ejemplo, el número 2 era lo común de todos los pares de cosas. Las continuas, que llamaba magnitudes, las utilizaba para intentar designar variables como la longitud, el tiempo, el peso, el volumen, etc. Dichas categorías, se diferenciaban por el hecho de que un valor de una magnitud está compuesto por partes aditivas mientras que un número natural está compuesto de una única parte; según lo cual, las magnitudes pueden ser divididas infinitamente, por esa razón las llamó variables continuas. Su estudio le llevó a trabajar con otro concepto que denominó magnitud relativa, que se basaba en el uso de equivalencias y razones. González Barberá (2006)15. En el campo de la medida en psicología Fechner (1860) 16 fue una figura importante dado su enfoque en la medida, en inicio física y posteriormente en la intensidad de las emociones. Su enfoque de medición refleja una postura tradicional: la medida de una cantidad consiste en descubrir cuantas veces una magnitud de referencia está contenida en otra. Esta filosofía queda formalizada en los axiomas de cantidad de Hölder (1901), que especifican cuando una magnitud es susceptible de ser medida. Para que lo sea, 15 http://www.ucm.es/info/funvalor/docs/medida.pdf, Gonzalez Barberá (2007) Naturalez de la Medida en Educación, ED. Universidad Complutense de Madrir 16 El comienzo formal de la psicología experimental lo encontramos en la obra de Gustav Theodor Fechner (18011887) que encontramos . Antes de Fechner, como dice Boring (1950), había solo fisiología psicológica y psicología filosófica. Fue Fechner "quien realizó con rigor científico los primeros experimentos que pusieron las bases para la nueva psicología y su metodología" (p. 275). 15 Avances hace falta que se pueda definir la operación de concatenación entre cantidades. En el caso de la longitud, sí se cumple que la longitud del objeto resultante de unir dos objetos es la suma de sus correspondientes longitudes. Una propiedad que satisfaga estos axiomas es denominada “extensiva” y posee una estructura aditiva (Narens y Luce, 1986). En la Teoría de las Escalas de Medida Stevens (1946)17. Define medir como asignar números a los objetos de acuerdo con una regla. Mediante esta definición lo que se indica es que los números no representan cantidades, sino relaciones. Considerándose la existencia de un homomorfismo18 entre el sistema de números asignados y el sistema empírico del atributo representado, aunque el homomorfismo podía darse en cuanto a otras características de los números distintas de la adición. De esta manera, se libró del concepto de concatenación y redefinió la medición como un modo de representación. En concreto, definió cuatro posibles reglas de asignación que daban lugar a cuatro escalas de medida: A) la escala “nominal”, en la que sólo se considera la propiedad de identidad de los números asignados (1 es distinto de 2, 2 es distinto de 3…); B) la escala “ordinal”, en la que se considera además la propiedad de orden (1 es menor que 2, 2 es menor que 3…); C) la escala de “intervalo”, en la que el cociente entre diferencias indica cuantas veces está contenida una en la otra (la diferencia entre los números 10 y 4 contiene tres veces la diferencia entre 7 y 5); y D) la escala de “razón” en la que el 17 18 Stevens, S.S., (1946) On the Theory of Scales of Measurement, Cience. Un homomorfismo, (o a veces simplemente morfismo) desde un objeto matemático a otro de la misma categoría, es una función que es compatible con toda la estructura relevante. La noción de homomorfismo se estudia abstractamente en el álgebra universal. Una noción más general de morfismo se estudia abstractamente en la teoría de las categorías. Por ejemplo, si un objeto consiste en un conjunto X con un orden < y el otro objeto consiste en un conjunto Y con orden {, entonces debe valer para la función que, si u < v f ( u ) { f ( v ). 16 Avances cociente entre los números indica cuantas veces está el menor contenido en el mayor (el 8 contiene cuatro veces el 2). Las propiedades extensivas se corresponden con los niveles de medida de razón y de intervalo (Jáñez, 1989). El planteamiento de Stevens es menos restrictivo que el de Campbell y abre posibilidades a la medición científica en Psicología. Sin embargo, Stevens no proponía qué relaciones empíricas debían satisfacer los objetos en cuanto al atributo que se pretendía medir. Durante la segunda mitad del siglo XX se fraguó una nueva teoría axiomática de la medición: la Teoría Representacional, que es el paradigma dominante hasta la actualidad. 19 En esta teoría se establece un homomorfismo entre las relaciones de los números que se asignan a los objetos -sistema relacional numérico- y las relaciones empíricas entre los objetos -sistema relacional empírico-, donde medir implica utilizar el sistema numérico para, mediante el homomorfismo, representar el sistema de relaciones empíricas. En contraste con el trabajo de Stevens, se hace un mayor énfasis en las condiciones que debe satisfacer ese sistema relacional empírico antes de atribuirle una escala de medida. Test instrumento de evaluación En los Standards for Educational and Psychological Testing -AERA, APA y NCME(1999), definen Test como “un aparato o procedimiento evaluador por el que se obtiene una muestra de la conducta de los examinados en un dominio específico, que es a continuación evaluada y puntuada siguiendo un proceso estandarizado”. Al respecto Anne Anastasie refiere que a pesar de sus diferencias superficiales –entre las diferentes 19 ésta se encuentra exhaustivamente desarrollada en los tres volúmenes de la obra “Foundations of Measurement” (Krantz, Luce, Suppes y Tversky, 1971; Luce, Krantz, Suppes y Tversky, 1990; Suppes, Kranz, Luce y Tversky, 1989) 17 Avances pruebas , sus objetivos y usos- todas esas pruebas constan de muestras de conducta del individuo y cada una debe probar su valor con la demostración de una correspondencia empírica entre el desempeño del examinado de la prueba y en otras situaciones o desempeño laboral.20 Mientras que el término test se reserva por lo general para los instrumentos en los que se evalúa lo correcta que es o la calidad de la respuesta, y los términos escalas o cuestionarios se aplican a la medida de las actitudes, intereses o disposiciones, lo común es utilizar el término Test para referirse a todos los anteriores instrumentos evaluadores. Precisamente por seguir los procedimientos estandarizados, una de sus fortalezas es que permiten que cada individuo obtenga la puntuación que le corresponde, sin que resulte afectada por los juicios subjetivos que pueda tener el evaluador sobre él (Colom, 1995). Además de los test de personalidad, de inteligencia, de intereses, de motivación, de actitudes, de percepción, también se considera un test un examen de opción múltiple e incluso un examen de preguntas abiertas si se evalúan de forma estandarizada21. También debe quedar claro que no todo procedimiento de evaluación es un test, por ejemplo la mayoría de las encuestas no lo son, al no tener conjuntos de preguntas que se planteen como indicadores de variables psicológicas latentes de los encuestados que interese medir. Tampoco es un test una entrevista ordinaria, pues no tiene el carácter de procedimiento estandarizado en la recogida y análisis de las respuestas, tampoco lo es un examen para evaluar el contenido de una clase, o el cúmulo de conocimiento que sobre ella hayan logrado los alumnos, tampoco lo es el registro de la habilidad de un trabajador ante un determinado instrumento. Un test, entonces para que sea considerado 20 21 Anastasi, Anne, Urbina Susana, (1998), Test Psicológicos, p.33. Utilización de los mismos criterios de aplicación, revisión y evaluación para todas las personas a las que se les sea aplicado. 18 Avances como tal requiere de la aplicación estricta tanto de teoría, metodología y técnica específica para el contenido y contexto que se pretende medir. Fiabilidad o Consistencia Para determinar la calidad de un instrumento de medición se deben realizar estudios de fiabilidad o consistencia y de validez. Los primeros tienen que ver con el análisis del error de medida, refieren cuán importante es el error de medida en las puntuaciones que son registradas en un determinado test. Las dos principales teorías son la Teoría Clásica y la Teoría de la Respuesta al Ítem o también llamada la Teoría del Rasgo Latente tienen sus propios indicadores de fiabilidad. Los estudios de fiabilidad se refieren al atributo de consistencia en la medición, denota algo que es consistente, no necesariamente consistentemente bueno o malo sino consistente22 y se obtiene a través de la aplicación del Coeficiente de Consistencia Interna entre los cuales ubicamos los que son aplicables en muestras contrastadas, formas alternativas, división por mitades y la confiabilidad entre evaluadores. Así la falta de confiabilidad en un test está en relación directa con la intervención del error, considerado éste como cualquier efecto irrelevante para los fines o resultados de la medición. El error se considera de dos tipos: 1) error constante o sistemático que es producido cuando las mediciones que se obtienen con una escala son sistemáticamente mayores o menores que lo que realmente debe ser y 2) error causal al azar o no sistemático que se produce cuando las medidas son alternativamente mayores o menores de lo que realmente deben ser. En este último error intervienen factores tales como las condiciones médicas de quien responde y que pueden alterar la visión, la fatiga, incrementar la tensión emocional, la inatención, el fallo 22 Cohen, Ronald Jay, Mark, E., Swerdlik, (2001), Pruebas y Evaluación Psicológicas: introducción a las pruebas y a la medición, p. 154 19 Avances en la memoria, o también se pueden considerar –cuando ha habido varias aplicaciones, la familiaridad que se tenga con el test-, asimismo se consideran intervenciones que alteran la fiabilidad las condiciones externas de calor, luz, humedad, ventilación, frío, olor del medio ambiente, comodidad de las sillas, entre algunas otras (Ray, 1972; Brown, 1982)23. La confiabilidad de una prueba se obtiene a través del Coeficiente de Confiabilidad (r xx) y del error estándar de la medida (EEM), el cual es obtenido a través de la siguiente fórmula: (EEM = s 1rx) x donde s= Desviación estándar de los puntajes de la distribución; rxx = Coeficiente de confiabilidad del test;1 = Constante. Una vez obtenido el EEM, se debe elegir el nivel de confianza: Nivel de confianza del 68% = PD ± 1 EEM; Nivel de confianza del 95% = PD ± 2 EEM.24 En la medición psicométrica, se aplican tanto la teoría, la metodología como las técnicas a casi cualquier situación que se desee o necesite ser medida, sea en el ámbito de la psicología, la pedagogía, el derecho, etc., y considerando el principio fundamental de la competencia como…la capacidad de un sujeto para realizar una tarea que exige activar una serie de recursos que se manifiestan en su comportamiento eficiente.25 Dentro de las competencias laborales ubicamos las transversales – la comunicación, la resolución de problemas, el razonamiento, la capacidad de liderazgo, la creatividad, la 23 Aliaga, Tovar, Jaime, Psicometría, Test Psicométricos: Confiabilidad y Validez, véase en: http://www.unmsm.edu.pe/psicologia/documentos/documentos2007/libro%20eap/05LibroEAPAliaga.pdf 24 Para el nivel de confianza del 68% la interpretación sería: "Podemos concluir, con un 68% de confianza, que el puntaje verdadero de un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y ± 1 EEM". El nivel de confianza más usado en psicometría es el del 95%: "el puntaje verdadero de un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD) y ± 2 EEM". 25 Mertens (1996), citado en Emergencias y Actualidades de las Competencias. 20 Avances motivación, el trabajo en equipo y especialmente la capacidad de aprender- y personales - centradas en la capacidad para trabajar en equipos y de integración en equipos multidisciplinares, adquisición de valores éticos en el manejo y uso de la información- , que fueron consideradas en la creación del instrumento para la medición de las Actitudes26 de Conductores de Transporte Público (Márquez, 2004)27, en éste se aplicó tanto la Teoría Clásica de los Test como la Teoría de la Medida. Se utilizó la técnica de Rasgos Sumarizado descrito por Rensis Likert28, la confiabilidad se obtuvo a través de la Consistencia Interna con Sistema de Muestras Contrastadas o Contraste de Grupos Extremos los cuales se obtuvieron a partir del total de las 259 aplicaciones con 132 reactivos en una matriz de doble entrada, donde en la columna se situaron los reactivos y en la línea cada uno de los sujetos participantes, se generó la sumatoria lineal, la cual se agrupó por distribución de frecuencia, obteniendo así una distribución de puntuaciones altas y bajas. Del total de la sumatoria se consideró el 25% de calificación más alta que representaron los sujetos con una aceptable actitud –Grupo A- se consideró el grupo de 25% de calificación más baja que representaron una no aceptable actitud –Grupo B-. Para aceptar como discriminativo positivo se consideró un mínimo de .70 que supone una correlación de .836 con las puntuaciones verdaderas. Para la obtención del Poder Discriminativo de cada reactivo se aplicó la formula: 26 Actitudes han sido definidas como aquella forma de pensar o de comportarse hacia una idea, objeto, persona o grupo de semejantes (Mc Conell, 1978, p.91), quedan implícitos tres elementos el cognitivo, el afectivo y el comportamental. El Cognitivo seria aquello que se piensa acerca del objeto de la actitud. Desde un punto de vista cognitivo puede pensarse que algo esta bien o que esta mal independientemente de lo que luego se haga, porque puede suceder que afectivamente se sienta movido en otra dirección. El elemento afectivo haría referencia a aquello se que siente, que gusta o disgusta, sin embargo, pude sentirse que algo gusta o disgusta sin que necesariamente se actúe en la dirección que apunte ese sentimiento, porque racionalmente se considere que no es conveniente. El comportamiento o reactivo en las actitudes, se quiere significar que no basta que algo parezca bien o mal, guste o disguste sino que esto lleva de una manera u otra a actuar en consecuencia. 27 Márquez, Jurado Amelia, Medición de Actitudes en Conductores de Transporte Público, Caso Concesionaria Fronteriza, Municipio de Cd. Juárez, (2004), pp. 44-46 28 Aiken, Lewis, R., (2003) Test psicológicos y evaluación, 294-300 21 Avances A-B PD= ½ N Para la obtención del Grado de Dificultad de los reactivos se aplicó la siguiente fórmula A+B GD= N X 100 Se corrió como dato adicional la media, la desviación estándar de cada ítem y la distribución de frecuencia así como la t de Student, y la significancia de la matriz de dos entradas. En el siguiente cuadro se hace referencia a los datos arrojados para las 5 dimensiones que conforman el instrumento. Los reactivos que presentan un (*) son aceptables, los que presentan (**) son excelentes además de ser significativos al nivel de aceptación de .05 o <. Tabla # 1 Confiabilidad de las Dimensiones de la Escala de Actitud de CHTP Escla Reactivos 110, 112, 114, 115, 116, 118, 119, 120, 121, Ansiedad y Tensión 123 ** Capacitación 89, 90, 91, 92, 93, 94, 95, 96, 97, 98 ** 99, 100, 101, 102, 103, 104, 105, 106, 107, Compañerismo 108 * Responsabilidad 7, 8 ,12, 14, 33, 44, 52, 53, 55, 58 ** Tolerancia 65, 70, 71, 72, 74, 77, 79, 83, 85, 86 * Alpha de División por Cronbach Mitades 0.84 0.89 0.81 0.88 0.73 0.76 0.80 0.81 0.78 0.83 Fuente: Márquez Jurado Amelia, Op. Cit. p. 56. 22 Avances Para la obtención del Coeficiente Alpha de Cronbach29 se aplicó la siguiente fórmula: r= Σ S²i k 1- α S²sum k-1 Donde k es el número de ítems de la prueba, i S es la varianza de los items (desde 1...i) y2 sum S es la varianza de la prueba total. Para la obtención de la División por Mitades se sumaron las puntuaciones de los reactivos pares y las puntuaciones de los reactivos nones, ambos se correlacionaron al resultado se le aplicó la fórmula de corrección de Sperman-Brown: r= nr xy 1+(n- SB 1)rxy Donde (r SB) es igual a la confiabilidad ajustada por la fórmula de Sperman-Barun,(rxy) es igual a la (r) de Pearson en la prueba con la longitud original y (n) es igual al número 29 El coeficiente Alfa, desarrollado por Cronbach en 1951 y ampliado en lo subsecuente por otros como Kaiser y Michael eb 1975; Noveick y Lewis en 1967, este coeficiente puede considerarse como la media de todas las correlaciones de división por mitades posibles, las buenas junto con las malas, corrgida por la fórmula de SpearmanBrown. Es apropiado para usarse en pruebas que contienen reactivos que no son dicotómicos, reactivos que pueden calificarse en forma individual o a lo largo de un rango de valores. Cohen Ronald Jay, E., Swerdlik, Op. Cit., 154, 166 23 Avances de reactivos en la versión revisada dividido entre el número de reactivos en la revisión original. Una vez obtenido el índice de confiabilidad en cada una de las Dimensiones del instrumento o escala de medición de Actitudes para Conductores de Transporte Público se consideró que el instrumento mantuvo una confiabilidad equivalente a 0.84, 0.82, 0.73, 0.80 y 0.78 para cada una de las Dimensiones arriba referidas, lo cual se considera suficiente para ser utilizado en las empresas que requieren seleccionar al personal, conocer las actitudes presentadas por sus empleados, orientar la capacitación en función de los resultados, contando con una confianza de .05 o <. Hemos constatado que los indicadores de la fiabilidad presentan algunos cambios en las diferentes teorías de los tests, sin embargo, se puede decir que es un concepto que si está presente en toda prueba que pretenda tener la categoría de Test. Al respecto Muñiz (1988) menciona, en relación con los Test que: 1) “Las consecuencias de los tests pueden ser de más o menos trascendencia para quien los responde. Del resultado de un test puede depender la admisión o rechazo en un proceso de selección, recibir una acreditación profesional, la calificación final en un examen... Un primer aspecto a tener en cuenta es que antes de aplicar un test se ha de tener información que justifique el uso que se va a hacer de sus puntuaciones. La utilización de un test en un proceso selectivo requiere que previamente se haya mostrado que el rendimiento laboral en el puesto depende del rasgo que vamos a medir.” En el caso de las competencias básicas universitarias se considera que el desarrollo de los 24 Avances alumnos debe estar acorde a las necesidades sociales, laborales e universitarias para que su aprendizaje sea para la aplicación tanto en su vida personal, social como laboral; 2) “Todo test ha de muestrear adecuadamente el dominio que quiere medir. En un test de calidad de vida, habrá que obtener respuestas que informen de la salud, del bienestar laboral y económico y de todas las áreas que tengan que ver con la calidad de vida, no puede quedar fuera, por ejemplo, lo relativo a la red familiar y social”. Si es en el caso de las competencias básicas universitarias consideraríamos que debe muestrear los factores cognitivo, habilidades de comunicación, capacidades para aplicar lo conocido al área práctica, dominio del área a desarrollar, además de actitudes y valores. 3) finalmente se recomienda un “… estudio que muestre que las puntuaciones del test se relacionan como cabe esperar, según la teoría psicológica, con otras medidas”. En el caso de las competencias básicas universitarias se pretendería que las puntuaciones fueran arrojando datos longitudinales de desarrollo, habiendo diferenciales ascendentes del inicio de la carrera al término de la misma. Validez Refiere Morales Vallejo (2000)30 que para entender a lo que se le puede referir como Teoría Convencional de la Validez, habría que considerar las recomendaciones técnicas de la American Psychological Association (A.P.A.), en la década de los años cincuenta estableció un comité el cual tenía a su cargo poner orden y estabilizar las definiciones que existían sobre el concepto de Validez. Hacia la década de los años sesenta la A.P.A. reconoce la Validez de Contenido, de Criterio tanto concurrente como 30 Morales, Vallejo,Pedro (2000) Medición de actitudes en psicología y educación, ED Comillas, 2ª ed, Madrid. Pp. 426427. 25 Avances predictiva y de Constructo. La de Contenido se refiere a la relevancia de los ítems o al grado en que los ítems de una escala representan un determinado universo temático – representatividad y relevancia-, -validez lógica o intrínseca- son expresiones que se emplean en el mismo sentido. La Validez de Criterio se refiere directamente a los coeficientes de correlación con otras medidas o criterios, suele dividirse en concurrente donde ambas medidas se obtienen simultáneamente y predictiva donde la medida en el criterio es posterior. En el caso del concepto de Validez de Constructo surge, como explica Nunnally (1978, p. 91-109) de la limitación de la validez de contenido cuando se aplica a la medición de rasgos, actitudes, etc., aplicable a conceptos abstractos que resumen consistencias conductuales y actitudinales. El proceso de validar un constructo es, según Stenner, Smith y Burdick (1983) el proceso de adscribir significados a las puntuaciones obtenidas con un determinado instrumento, siendo más necesario cuando aumenta el grado de absorción de la variable medida.31 La descripción más genérica y aceptada sobre el concepto de validez es aquella que refiere que una prueba es Valida cuando mide lo que dice medir. La validez está establecida tanto sobre lo que una prueba dice que pretende medir, como a la referencia que hacen los puntajes obtenidos, a conocer si es válido el uso que se le está dando al Test así como la interpretación que se esté haciendo de los puntajes obtenidos y si se pueden realizar generalizaciones a partir de los resultados obtenidos (Thorndike, 1989). 31 Morales Vallejo, Ibidem. pp. 427-428. 26 Avances Para la obtención de la Validez de un instrumento o Test32 se requiere de la aplicación de un Proceso de Validación en el cual interesan en principio, los errores constantes o sistemáticos y en la confiabilidad interesan los errores aleatorios o no sistemáticos. En términos estadísticos la Validez está definida como la proporción de la varianza verdadera que es relevante para los fines del examen y es susceptible de ser medida mediante la relación entre sus puntuaciones con alguna medida de criterio externo o también con la extensión con la que la prueba mide un rasgo subyacente específico hipotético, denominado en psicometría como Constructo. La validez de Constructo está referida al grado en que cada prueba refleja el contenido que dice medir, elaborándose operativamente de tal forma que se puedan realizar inferencias acerca de conductas o atributos que pueden agruparse bajo la etiqueta de un contexto particular (APA). La validez de Constructo está relacionada con cinco aspectos, a saber: 1) el contenido referido a su relevancia y representatividad; 2) lo sustantivo referido a razones teóricas de la consistencia observada de las respuestas; 3) lo estructural relacionado a la configuración interna del test y dimensionalidad; 4) generalización referido al grado en que las inferencias a partir del resultado del test se pueden generalizar a otras poblaciones, situaciones o tareas y 5) consecuencia relacionado con la ética y el aspecto de deseabilidad social y disminución de la aquiescencia33. (Messick 1995, citado en Psicometría, Test Psicométricos). 32 En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford, 1946, citado en Muñiz, 1996, p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los puntajes de las pruebas, que son función no sólo de los ítems sino también de la forma de responder de las personas así como del contexto de la evaluación. Aliaga, Tovar, Jaime, Psicometría, Test Psicométricos: Confiabilidad y Validez, Op. Cit., 33 Aquiesencia: tendencia de algunos sujetos a responder afirmativamente (de acuerdo) con independencia del contenido del ítem incluso mostrando acuerdo con afirmaciones de signo opuesto. Se trata de un estilo o modo de responder que invalida la información que aparentemente está presente en las respuestas y en este caso una 27 Avances En relación con la validación; el proceso que se siguió en la validación del instrumento para medir Actitudes de Choferes de Transporte Público, se utilizó la Validez de Contenido - la cual efectivamente, hace referencia al juicio concerniente a lo bien que mide la prueba, lo que pretende medir… juicio basado en evidencia sobre lo apropiado de las inferencias extraídas de las puntuaciones de prueba (Lewis Aiken, citado en Márquez , 2004, p.41)-. El instrumento se validó utilizando el criterio de diagnóstico realizado por un grupo de personas involucradas en la problemática tanto de la elaboración de pruebas como en la selección y contratación de personal, ellos fueron considerados como expertos en el área. A este grupo asignado se les ofreció: 1) las definiciones específicas de términos y categorías del cuestionario; 2) se les pidió que seleccionaran para cada reactivo la dimensión a la cual consideraban que pertenecía. Para la selección de los jueces consideraron personas que por su trayectoria académica y laboral conocieran del tema y pudieran emitir un juicio con base en conocimiento. Además de constar que su relación fuera mínima o nula con los sujetos objeto de aplicación de la muestra, con la cuan se alcanzó la objetividad del criterio. Para la obtención de deseabilidad social, tomando en consideración que cualquiera de los rasgos o características personales que típicamente expresan los ítems se pueden situar a lo largo de un continum en cuyos extremos se encontraría la máxima deseabilidad social y en la otra la mínima deseabilidad social. Para tal efecto se reunió a un total de 10 jueces, los cuales deberían asignar a cada ítem o constructo una respuesta afirmativa no indicaría acuerdo genuino con la afirmación contenida en el ítem sino que sería simplemente una manifestación de dicha tendencia del sujeto. Morales Vallejo Pedro (2000)p. 141-143 28 Avances calificación. A diferencia del método utilizado por A. Edward 34 quien es considerado como el autor inicial más conocido y citado por sus estudios sobre la deseabilidad social, se les pidió a los jueces que con base en las definiciones operacionalizadas de cada dimensión de las que consta el instrumento de medición de actitudes de choferes de transporte público, designaran a cuál de ellas correspondía cada reactivo, se consideró que si el contenido de cada uno estaba construido bajo un criterio de aceptación o rechazo social estos deberían mantener sus características de apego a una normatividad social, por lo que cada uno de los jueces en la lectura de los reactivos debería quedarle claro a que dimensión de actitud se hacía referencia. A diferencia de Edwards que considera la deseabilidad social a través de un grupo de jueces los cuales marcan con un número de 5 a 0 la aceptación o el rechazo, siendo el reactivo aceptado en mayor o menor medida de deseabilidad o aceptación de actitudes positivas o negativas, en este caso se buscó comprobar si el reactivo respondía con claridad a la dimensión a la que se estaba destinado, siendo esta parte una de las necesidades básicas de validación que se pretendía y logró comprobar, dado que cada una de ellas fueron elegidas con base en la experiencia empírica y documental surgida de las actitudes de conductores de transporte público documentadas en publicaciones periódicas, de esta forma los resultados se cuantificaron para considerar como válidos sólo aquellos reactivos que cumplieron con la norma del 80 al 100 % de aceptación del grupo de jueces. 34 Morales Vallejo, Pedro, Medición de Actitudes en Psicología y Educación p. 141, 243, 206, citado en Marquez Jurado Amelia, (2004) Op. Cit. p.37 29 Avances Los resultados obtenidos en esta validación de deseabilidad social fue la siguiente: de 180 reactivos se eliminaron 57 los cuales no cumplieron con el criterio de validación. De los 132 reactivos restantes 63 de ellos correspondieron a la dimensión de responsabilidad; 23 a la de tolerancia; 12 a capacitación; 10 a compañerismo y 15 a ansiedad y tensión. De las dimensiones inicialmente planteadas se agruparon los reactivos correspondientes a manejo de sexualidad, respeto, abuso de sustancias y responsabilidad en una sola dimensión determinándose de responsabilidad. El Valor Diagnóstico o Predictivo del instrumento de medición se demostró en relación al funcionamiento del instrumento aplicado, como un indicador de las actitudes en relación con la correspondencia empírica estrecha entre las actitudes de los choferes y el apego a las normas empresariales, municipales y estatales además del criterio utilizado para la formulación del instrumento. Los resultados de evaluación posteriores a la aplicación de la muestra se muestran en la Figura # 1, con resultados que arrojaron los siguientes porcentajes de actitudes: Figura # 1 Actitudes de Choferes de Transporte Público 11% Favorable 33% Ligeramente Favorable 39% Ligeramente Desfavorable 14% Desfavorable 3% Muy desfavorable 30 Avances Siendo una de las consideraciones finales que el instrumento resultó adecuado para la medición de actitudes de los chóferes, ofreciendo una muestra representativa del ambiente actitudinal que presentaron los trabajadores de la Concesionaria Fronteriza35 Estandarización Ronald Hay Cohen (1988) refiere que el proceso de aplicar una prueba a una muestra representativa de personas que las responden con el propósito de establecer normas se conoce como estandarización de una prueba. Un instrumento de medición se reconoce que está estandarizado cuando presenta procedimientos claros y definidos tanto para su administración, calificación y datos normativos...el establecimiento de un conjunto estándar de instrucciones y condiciones bajo las cuales se administra la prueba hace que las puntuaciones de la muestra de estandarización normativa puedan ser comprobables con las puntuaciones de quienes responderán la prueba en el futuro. Regresando a la construcción del instrumento de medición de actitudes de chóferes, se aplicó a una muestra representativa de conductores, utilizando una muestra de conveniencia. Como escenario de aplicación se utilizaron las instalaciones de la empresa, dado que los empleados de transporte tienen horarios y rutas diversos los cuales requerían de un espacio y tiempo específico para la realización de la prueba. Así una categoría más de confiabilidad la constituyó la estandarización precisa con la que cuenta este instrumento, otra de las ventajas establecidas cuando se cuenta con el procedimiento de estandarización es que los resultado que se obtienen de su aplicación 35 Márquez, Jurado Amelia, (2004) Op. Cit. pp. 64, 88. 31 Avances son susceptibles de ser comparables y comparables, así como medible al ser calificado por cualquier persona –siempre que se siga el procedimiento-. Como se establece en Standards for Educational and Psychological Testing “las normas que se presenten deberán referirse a grupos descritos con claridad. Estos grupos deberán ser aquellos con quienes los administradores de pruebas desearan de ordinario comparar a las personas que sean examinadas.” (APA, 1985 citado en Ronald Hay C.)36 Normatividad Cohen R. (2001) refiere…en un contexto psicométrico normas son los datos de desempeño en la prueba de un grupo en particular de personas, que están diseñados para su uso como referencia para evaluar e interpretar puntuaciones de prueba individual, donde los miembros del grupo se les considera típicos con respecto a una característica de las personas para quienes se diseña una prueba en particular. En el caso de la prueba de actitudes, se consideró por mejor conveniencia, la obtención de conversión de puntaje crudo a rango percentilar, el cual fue calculado por dimensión lo que equivale a un estatus de Escala de medición37 dado que cuenta con la conversión de 36 Jay Cohen, Ronald, Swerdlik Mark, (1988) Pruebas y Evaluación Psicológicas, introducción a las pruebas y la medición, p. 127-128 37 Una escala seria un instrumento de medición (Maynt,R., Holm,K,Hubner,P. 1983,p.63) en el cual se puede hace una disposición de cosas distintas pero con un aspecto común(Sierra Bravo, R. 1992) de esta manera una escala de actitud seria la disposición de diferentes actitudes de mayor o menor intensidad a favor o en contra. Existen diversos tipo de escalas:Las escalas sumativas de Likert, las diferenciales de Thurston y las acumulativas de Guttman estos tres tipos de descalas tienen en común que le presentan al alumno una serie de ítems formulados como preguntas y según responda de una manera u otra se le asigna una puntuación en la actitud medida que le coloca en una escala continua de 1 a 5 normalmente. En las escalas diferenciales Thurston (1929) se caracterizan porque en ellas hay solo dos respuestas “de acuerdo” o “en desacuerdo”, previamente existe un grupo de expertos que ha dado una puntuación a cada uno de los ítems del cuestionario de acuerdo a la intensidad con la que se acerca mas a la actitud que se pretende medir. En las escalas summativas referidas por Likert (1932) miden actitudes a partir de la medición de las técnicas de la personalidad todos los ítems presentan una misma intensidad, la cual variara de acuerdo a la selección de la persona que responde. Las escalas acumulativas, tienen su origen en el modelo de Guttman (1950) también llamado escalograma los ítems tienen una determinada dificultad y el estar de acuerdo con uno implica estar de acuerdo con los precedentes, suelen tener muy pocos ítems y se utiliza para medir actitudes muy concretas. pt.wikipedia.org/wiki/Escala_Likert 32 Avances medida cruda a medida de actuación de una población o mejor conocida como puntuación normalizada. Así este instrumento presenta una Normatividad Local. En psicometría se sabe que la conversión de puntación bruta a percentil permite conocer en que rango de aceptación o rechazo se encuentra la persona que está siendo evaluada o seleccionada, respecto del grupo de la población local, en este caso el Municipio de Cd. Juárez, estado de Chihuahua, México. Para la obtención del Rango Percentil se utilizaron los datos obtenidos en cada una de las dimensiones, aplicando la siguiente fórmula para todos los items: frecuencia (f); frecuencia acumulada (fa); Punto medio de la frecuencia acumulada (Pmfa); Punto medio de la frecuencia acumulada entre el número total de casos (Pmfa/n) y Punto medio de la frecuencia acumulada entre el número total de casos por cien (Pmfa/n)(100), los resultados obtenidos para la conversión de la puntuación directa a puntuación normalizada se obtuvieron los siguientes resultados, presentado en la tabla # 2: 33 Avances Tabla # 2 Datos Normativos para las Escalas de Actitud, Conductores de Transporte Público N= 259 Rangos Percentiles Puntaje Crudo 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Media D.S. Ansiedad y Tensión Capacita ción Compañe rismo ~ 1 ~ ~ 1 ~ ~ ~ ~ 1 1 2 3 7 9 11 13 16 19 24 31 38 48 57 63 68 73 77 81 86 89 91 96 40.4 5.7 1 ~ ~ ~ 1 1 2 ~ 3 3 4 6 8 10 13 16 21 26 31 36 42 49 59 69 76 83 87 89 91 94 96 97 99 38.33 5.63 ~ ~ ~ ~ 1 1 ~ 1 2 3 3 ~ 4 6 8 10 17 25 31 37 45 54 63 71 79 86 90 92 94 96 97 98 99 38.33 4.87 Responsabilidad Tenacidad ~ ~ ~ 1 ~ 1 ~ 1 ~ 2 2 3 5 8 11 14 18 21 26 33 38 44 51 57 63 70 76 81 85 89 92 95 98 39.63 5.8 ~ 1 ~ 1 1 1 2 2 3 3 4 6 8 11 14 17 20 25 33 42 50 58 66 74 79 83 87 90 92 94 96 98 99 37.93 5.56 Puntaje Crudo 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 Media D.S. Fuente: Márquez Jurado, Amelia, Op.Cit. p. 59. 34 Avances La Teoría Clásica de los Tests Se considera que la Teoría Clásica de los Test es la que proporciona los modelos para las puntuaciones que se obtienen del test, decimos entonces que modeliza matrices de datos que contienen las respuestas que ya sea una muestra o grupo de sujetos han dado a cada uno de los ítems que conforma el test. El análisis o modelado de estas matrices de datos da como resultado: 1) la estimación del nivel en que poseen los sujetos la(s) característica(s) que mide el test (valores escalares de los sujetos) y 2) la estimación de los parámetros de los items (valores escalares de los items). El objetivo de cualquier teoría de tests es realizar inferencias sobre el nivel en que los sujetos poseen la característica o rasgo inobservable que mide el test, a partir de las respuestas que éstos han dado a los elementos que forman el mismo. Por tanto, para medir o, mejor dicho, estimar las características latentes de los sujetos es necesario relacionar éstas con la actuación observable en una prueba y esta relación debe de ser adecuadamente descrita por una función matemática.38 Dos son las principales teorías de los tests: la Teoría Clásica de los Tests (TCT) y la Teoría de la Respuesta al Ítem o del Rasgo Latente. La primera está contenida en un conjunto de artículos, publicados por Spearman entre 1904 y 1913. La publicación de referencia es el libro de Gulliksen (1950). La TCT supone que cuando una persona i responde a un test se generan tres puntuaciones: la observada (Xi), la verdadera (Ti) y el error de medida (Ei), siendo no observables las dos últimas. (Ti) puede entenderse como la media de las (Xi) si el sujeto respondiese al test infinitas veces en las mismas circunstancias. Se asume que i i i X 00T 00E . Es decir, la puntuación (Xi ) incluye el nivel 38 http://www.uned.es/psico-3-psicometria/ttest.htm#que 35 Avances real de la persona, que debiera no cambiar si se le aplicase otro test equivalente, y el componente error. Los errores se suponen aleatorios, en ocasiones positivos y en ocasiones negativos como ya se había mencionado. Se asume, en concreto, que su media es cero. Se asume además que no existe correlación entre los errores y las puntuaciones verdaderas, ni entre los errores entre sí. Con cada medida Xi se tienen dos incógnitas (Ti y Ei), no siendo posible llegar a su obtención cuando se aplica un test. Una medida de la precisión del test, que sí se podrá obtener, es el “error típico de medida” o desviación típica de los errores de medida (Se). La TCT llega a medidas de la precisión del test a partir de la definición de “formas paralelas”. Dos tests pueden considerarse paralelos cuando “da lo mismo usar uno que otro” (Gulliksen, 1950, p. 11). Expresado con más precisión, dos tests son paralelos sólo si cada persona tiene la misma puntuación verdadera en ambos tests y los dos tienen el mismo error típico de medida. La idea original de Spearman fue descubrir la vía para obtener indicadores de la precisión del test a partir de los únicos datos disponibles (las puntuaciones observadas). La correlación de Pearson entre las puntuaciones de una muestra de personas en dos formas paralelas de un test es su “coeficiente de fiabilidad”, (rxx), que se interpreta como la proporción de la varianza de las puntuaciones observadas que corresponde a la varianza de las puntuaciones verdaderas. A partir del coeficiente de fiabilidad y de la desviación típica de las puntuaciones observadas se puede obtener el error típico de medida (Se), aplicando la expresión expuesta anteriormente. El nivel de fiabilidad o error de medida tolerable depende, obviamente, del uso que se pretenda hacer del test, pero hay cierto acuerdo en que, tanto el coeficiente de fiabilidad como otro indicador, muy utilizado, el coeficiente Alpha de Cronbach, debieran estar por encima de 0.70. 36 Avances La Teoría de la Respuesta al Ítem La Teoría de la Respuesta al Ítem (TRI) también conocida como el rasgo latente, que es un modelo probabilístico, surge para resolver las limitaciones de la TCT. La principal es que las puntuaciones de las personas dependen de las características de los ítems, y al contrario. Si al preparar un examen las preguntas resultan muy fáciles, se obtendrán calificaciones más altas que si los ítems hubiesen sido más difíciles. Si se aplica un examen a un grupo con mayor conocimiento o dominio sobre el tema se obtendrán mas aciertos considerándose que las preguntas fueron fáciles que si hubieran sido aplicadas a un grupo de menor perfil. Lo deseable es que las medidas no dependan del instrumento, que sean “invariantes” y no dependan de los ítems concretos que se apliquen. Esta importante propiedad la cumple la TRI y en ella descansan algunas de sus aplicaciones más interesantes. Aunque los primeros trabajos sobre la TRI aparecen en la década de los 50 (Lord, 1952), el empuje definitivo se debe al libro de Lord y Novick (1968). La TRI es una teoría de los tests que, como la TCT, va a proporcionar medidas de las personas y de las características de los ítems, pero requiere aplicar la metodología estadística común para la estimación de parámetros y determinación de la bondad del ajuste. Mientras en la TCT no es posible comprobar si los datos de un test cumplen los supuestos de la teoría, en la TRI el proceso de obtención de las características de las personas e ítems debe ir precedido por un estudio del control de los supuestos y por la verificación del ajuste al modelo. En la práctica, mientras la TCT requiere poco más que calcular medias, varianzas y correlaciones, la TRI requiere cálculos complicados, obtención de estimaciones por métodos numéricos y la utilización de software específico. 37 Avances En la TRI, las puntuaciones de los n individuos en el test son las estimaciones de los n parámetros 01, 02,… 0n. Análogamente, las características del ítem i son las estimaciones de sus parámetros ai, bi y ci. Para obtener tales estimaciones se suelen seguir los procedimientos estadísticos habituales. Se utiliza, con frecuencia, la estimación máximo-verosímil. Es decir, se ofrece como solución los n valores de 0 y los k valores de a, b y c que maximizan la probabilidad de las respuestas dadas por la muestra al test. De las propiedades de los estimadores máximo-verosímiles se desprende que el correspondiente estimador de 0, 000, sigue asintóticamente la distribución normal, con media 0 y varianza V(000)=[I(0001 (Arnaiz, 1978), donde I(0) es la información que suministra el test para la estimación del parámetro 0. La varianza del estimador o la desviación típica, también llamada “error típico de medida” (Muñiz, 1997, p. 123), va a ser la medida de la precisión o fiabilidad con la que el test mide, cuando se aplica la TRI. De lo anterior se siguen dos consecuencias importantes: a) No sólo es posible, es además lo habitual obtener la precisión de “cada” medida. En la TCT se obtiene la precisión del test y se suele asumir que dicha precisión corresponde a todas las medidas que se hagan con él. En la TRI, por el contrario, cada medida del nivel de rasgo, cada estimación de 0, se hace con una determinada precisión, que viene indicada por su error típico. Cuando la precisión es alta (es decir, cuando el error típico de medida se acerca a cero), es baja la variabilidad de las estimaciones que produciría el test en caso de aplicarse a una muestra de personas con nivel de rasgo 0. Cuando la precisión es baja, ocurre lo contrario. b) Si a cada 0 se asocia su I(0), se obtiene la función de información del test. Es una de las herramientas más útiles para la construcción de instrumentos de 38 Avances medida, pues refiere qué niveles de rasgo pueden medirse mejor y peor con el test, y cual es la máxima y mínima precisión alcanzable. En el ámbito educativo, en lo que a psicometría se refiere se cuenta con una serie de instrumentos, los cuales cuentan con características de validación, confiabilidad, validez y estandarización, como es el caso de instrumentos para la medición del cociente intelectual como Wppsi, Wisc-rm, Wais, Therman, Goodenaugh; de la personalidad como 16FP, MMPI-2, Barranquilla, Gordon; de madurez visomotora como Bender, Frosting; para la medición de la orientación vocacional como Kuder; para el manejo y conocimiento de técnicas de estudio como el CHTE, por referir algunos. En general, es a través de las pruebas psicométricas que se puede conocer la capacidad, habilidad, destreza, valores, actitudes, intereses, manejo de tolerancia a la frustración, inatención, problemas de dislexia, dispraxia, nivel de avance educativo, entre otros. Ahora bien, en el ámbito de la educación se cuenta con otros elementos para la medición de avances académicos, como los exámenes –orales o escritos-, ensayos, evaluación del maestro respecto de la destreza de desempeño, portafolio, etc. Todas estas formas de medición están referidas, de manera evidente a conocer cuál es el nivel de desarrollo en que una persona se encuentra o ha adquirido o desarrollado. Conclusión Si las competencias laborales pueden ser medidas, las actitudes, los valores, el coeficiente, la tolerancia a la frustración, las técnicas de estudio. Las competencias educativas también son susceptibles de ser medidas no solo a través de entrevista, 39 Avances seguimiento de calificaciones, portafolio, sino a través de un instrumento de medición que cuente con un sustento teórico-metodológico. Los enfoques correspondientes a Competencias, Teoría de la Medida, teoría de la Respuesta al Item y de Teoría Clásica de los Test, nos refiere a la construcción de instrumentos, con enfoque a prácticamente cualquier tema que se requiera medir. El sistema de evaluación a través de instrumentos de medición psicológica, también se han hecho presentes en la educación, desde el momento en que la fundamentación teóricometodología para la construcción de pruebas como Ceneval o Excale presentan los mismos preceptos teórico metodológicos, de ahí que destaquemos la fundamentación básica para sugerir la construcción de un instrumento de medición de Competencias Básicas a nivel universitario. 40 Avances Bibliografía Bibliografía sobre Competencias Alfaro Rosca, Ma. Teresa, El aprendizaje de la Medicina en la universidad de Castilla la Mancha. Una experiencia educativa basada en el aprendizaje de las competencias profesionales, en Educ. éd. v.8 supl.2 Barcelona sep. 2005. Dcto., pdf. Aguerrondo, I. (1996): La Calidad de la educación: Ejes para su definición y evaluación. Washington D. C. Año XXXVII # 116. OEA. Applied Psychological Measurement. AERA, APA y NCME (1999). Standards for educational and psychological testing. Washington, DC: American Psychological Association. Barrios, Edgar (2000): Gestión de las competencias. CINTERFOR/OIT. http//www.cinterfor.org.uy Bogoya Maldonado, D. (1999): Proyecto sobre evaluación de competencias. Universidad Nacional de Colombia. Memorias del Taller sobre Evaluación de Competencias Básicas. Casaliz, P. (1996): La modernidad de la Universidad en el siglo XXI. Ponencia presentada en Seminario Internacional Modelos de Universidades en América Latina. Bolivia. CINTERFOR/OIT (2000): http//www.cinterfor.org.uy, Las 40 preguntas más frecuentes sobre competencia laboral. Doa, E,. Alberto y otros (2000). El conocimiento y las competencias en las organizaciones del Siglo XXI. Ed. Epsilon Libros, s.r.l. Universidad Metropolitana, Caracas, Venezuela. Filmus, D. (1997): El papel de la educación frente a los desafíos de las transformaciones científico- tecnológicas. ED Aique, Buenos Aires. González, V. (2002): ¿Qué significa ser un profesional competente?. Revista Cubana de Educación Superior, Vol. 1/2002. Guedez, Victor: Las competencias en las organizaciones del siglo XXI. Ed. Epsilon Libros, s.r.l. Universidad Metropolitana, Caracas, Venezuela, pag.156. Iñigo Bajos, Enrique. (2000): La formación de profesionales: una perspectiva desde el mundo del trabajo. Tesis de Doctorado. 41 Avances Irigoin, M., Vargas, F., Emergencias y actualidad de las Competencias Profesionales: apuntes para su análsis, Art., pdf, 6-7, 8/27. Larrain, U. Ana María, González Eduardo, Formación Universitaria por Dcto. Pdf, p. 1 Competencias. Magnusson, D. (1977): Teoría de los tests. México, Trillas. Marin, Rigoberto. «www.fca.uach.mx/semestre1/tecnologias%20y%20manejo%20%de20la%20informacion/Libro/171.ht m1.» 2003. 5 de octubre de 2008.Meister, Jeanne C.: Universidades Empresariales. Cómo crear una fuerza laboral de clase mundial. 2000. Merstens, Leonard. (2000): La gestión por competencia laboral en la empresa y la formación profesional. OEI para la Educación, la Ciencia y la Cultura. (1997): Competencia laboral: sistemas, surgimiento y modelos. PISA (2006) Marco de la Evaluación, conocimientos y habilidades en ciencias matemáticas y lectura, ED, Organización para la Cooperación y el Desarrollo Económico (OCDE) Manual Técnico para la Validación de Reactivos. Tejada Fernández, J.: Acerca de las competencias profesionales. Rev. Herramientas. España. Material fotocopiado.SCAN Secretary’s Commission on Achieving Necessary Skills 1991, EUA. SCANS, Informe, Secretary´s Comisión on Achieving News Skills, 1992, EUA. Bibliografía referida sobre Teoría Clásica Abad, F.J. (2007). Introducción a la Psicometría. Proyecto docente. Madrid: Universidad Autónoma de Madrid. Abad, F., Olea, J. y Ponsoda, V. (en prensa). The Multiple-Choice model: Some solutions for the estimation of parameters in the presence of omitted responses. Abad, F.J. (2007); Jáñez, (1989): el Idealismo Platónico, la Teoría de las Escalas de Medida y la Teoría Representacional. Madrid, Universidad Autónoma de Madrid. Aiken, Lewis, R., (2003) Test psicológicos y evaluación, ED., Printice Hall, 11ª edición, México. Anastasi, Anne, Urbina Susana, (1998), Test Psicológicos, ED., Printice Hall, 7ª ed., México. 42 Avances Arthur, Aron, Elaine N. Aron,(2001) Estadística para psicología, ED., Printice Hall, 2ª ed., México. Ayerbe, I. (2006). La iniciativa privada y profesionalización de la Psicología aplicada en España: Historia de TEA Ediciones (1952-2005). Sevilla: Universidad de Sevilla. educational and psychological testing. Council of Chief State School Officers, Meeting. 17 de junio. Baker, F. (2001). The Basics of Item Response Theory. ERIC Clearinghouse on Assessment and Evaluation, University of Maryland, College Park, MD. Brown, F.G. (1980): Principios de la medición en Psicología y Educación. México. Manual Moderno. Campbell, N. R. (1928). An account of the principles of measurement and calculation. Londres: Longmans, Green and Co. Camilli, G. (2006). Test fairness. En R.L. Brennan (Ed.) Educational Measurement. Westport, CT: Praeger. 4ª edición. Clauser, B. E., Margolis, M. J. y Case, S. M. (2006). Testing for licensure and certifications in the professions. En Brennan, R. L. (Ed.). Educational measurement. Whasington: Praeger. 4ª edición. Cohen, Ronald Jay, Mark, E., Swerdlik, (2001), Pruebas y Evaluación Psicológicas: introducción a las pruebas y a la medición, ED Mc Graw Hill, 4ª ed., México. Colom, B.R. (1995). Tests, inteligencia y personalidad. Madrid: Pirámide. Colom, B. R. (2005). Psicología de las diferencias individuales. Teoría y práctica. Madrid: Pirámide. Crocker, L. y Algina, J. (1986): Introduction to Classical and Modern Test Theory. New York, Holt, Rinehart and Winston. Cordero, A. (1997): La evaluación psicológica en el año 2.000. Madrid: TEA Ediciones. Cronbach, L.J. (1972). Fundamentos de la exploración psicológica. Madrid: Biblioteca Nueva. Cuadras. Embretson, S.E. (1985). Test design: Developments in Psychology and psychometrics. New York: Academic Press. Fraser, C.O. (1980). Measurement in psychology. British Journal of Psychology, 71, 2324. Traducción en Muñiz, J. (1992), Teoría clásica de los tests. Madrid: Pirámide. García Cueto, E. (1993): Introducción a la Psicometría. Madrid, Siglo XXI. 43 Avances González Barberá (2007) Naturaleza de la Medida en Educación, ED. Universidad Complutense de Madrid. Jañez, L. (1989). Fundamentos de Psicología Matemática. ED. Pirámide. Cap. 18, Madrid. Jay Cohen, Ronald, Swerdlik Mark, (1988) Pruebas y Evaluación Psicológicas, introducción a las pruebas y la medición. ED., Printice Hall, México Lopez-Feal, R. (1986): Construcción de instrumentos de medida en Ciencias Conductuales y Sociales. Barcelona, Alamex. Márquez, Jurado Amelia, (2004), Medición de Actitudes en Conductores de Transporte Público, caso Concesionaria Fronteriza Municipio de Cd. Juárez. Tesis de Maestría en Salud en el Trabajo, UACJ, México. Martínez Arias, M.R. (1995). Psicometría: Teoría de los tests psicológicos y educativos. Madrid: Síntesis. Capítulo 10 y 11. Meliá, J.L. (1990). Introducción a la medición. ED.Cristóbal Serrano Villalba. Capítulos 1 y 2, Valencia. Morales, S, P. (2000). Medición de actitudes en psicología y educación. Madrid: Universidad Pontifica Comillas. M.R. (1995). Psicometría: Teoría de los tests psicológicos y educativo. Madrid. Muñiz, J. (1992). Teoría clásica de tests. Madrid: Pirámide. Muñiz, J. (Coord.) (1996). Psicometría. Madrid: Universitas. Nunnally, J.C. (1987): Teoría psicométrica. México, Trillas. Original. Nunnally, J.C. (1989). Teoría psicométrica. México: Trillas. Santisteban, C. (1990). Psicometría. Teoría y práctica en la construcción de tests. Madrid: Norma. Capítulos 10 a 14. Spearman, C. (1904), General Inteligence Objectively Determined and Measured, American Journal of Psicology Suppes, Kranz, Luce y Tversky, 1989). Santiesteban, C. (1990): Psicometría: Teoría y práctica en la construcción de tests. Madrid: Norma. Thorndike, R.L. y Hagen, E. (1977). Measurement and Evaluation in Psychology and Education. New York: Wiley. Thorndike, R.L. (1991). Psicometría aplicada. México: Trillas. 44 Avances Bibliografía referida sobre Teoría de la Respuesta al Item Abad, F.J, Garrido, J., Olea, J. y Ponsoda V. (2004). Introducción a la Psicometría. Teoría Clásica de los Tests y Teoría de la Respuesta al Ítem. Documento inédito. Madrid: Universidad Autónoma de Madrid. (Manual). Conejo, R. (2001). SIETTE: Un sistema de evaluación mediante test basado en la Teoría de Respuesta al Ítem. Accesible en www.lcc.uma.es/ publicaciones/ LCC1031.pdf. Crocker, L. y Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston. Capítulo 15. Hambleton, R.K. (1989). Principles and selected applications of item response theory. En R.L.Linn, Educational Measurement. New York: Macmillan. López Pina, J.A. (1995). Teoría de la respuesta al ítem: Fundamentos. Barcelona: PPU. Martínez Arias. Muñiz,J.(1997).Introducción a la teoría de la respuesta a los ítems. Madrid: Pirámide. Muñiz, J. (1998). Teoría de respuesta a los items: Un nuevo enfoque en la evolución psicológica y educativa. Madrid: Pirámide. Santisteban, C. y Alvarado, J.M. (2003). Psicometría (II). Teoría de la respuesta al Item. ED. Complutense, S.A. , Madrid. Tomás, J.M., Olivier, A. y Meliá, J.L. (1992). Teoría de la respuesta al ítem: Fundamentos, modelos y aplicaciones. Valencia: Cristóbal Serrano. Cap. 1,4 y 6. Bibliografía básica recomendada para la Teoría de la Medida Allen, M.J. y Yen, W.N. (1979): Introduction to Measurement Theory. Monterey, CA., Books-Cole. Arnaiz, G. (1978). Introducción a la estadística teórica. 3ª edición. Valladolid: Lex- Nova. Amón, J. (1980). Estadística para psicólogos (Volumen 1). ED.Pirámide. Capítulo 2, Madrid. Arce, C. (1994): Técnicas de construcción de escalas psicológicas.Madrid: Síntesis. Baird, J.C. y Noma, E. (1978): Fundamentals of Scaling and Pychophysics. New York, Wiley. Barbero, M.I. (1993): Métodos de elaboración de escalas. Madrid, UNED. 45 Avances Bejar, I.I. y Braun, H.I. (1999). Architectural simulations: From research to implementation. (RM-99-2). Princeton, NJ: Educational Testing Service. Borsboom, D. (2005). Measuring the mind: conceptual issues in contemporary Psychometrics. New York: Cambridge University Press. Bravo, A. y Fernández, J. (2000). La evaluación convencional frente a los nuevos modelos de evaluación auténtica. Psicothema, 12, Supl. nº 2, 95-99. Brusco, M.J. y Köhn, H.-F. (2008). Optimal partitioning of a data set based on the pmedian model. sychometrika, 73, 89-115. Castro, C.de (1980). Teoría de la medida en psicología y ciencias sociales. Caracas, Universidad Central de Venezuela: Ediciones de la Facultad de Humanidades y Educación. Coombs, C.H., Dawes, R.M. y Tversky, A. (1981). Introducción a la psicología matemática. Madrid: Alianza Universidad. Capítulos 2 y 3. Ceulemans, E. y Van Mechelen, I. (2008). CLASSI: A classification model for the study of sequential processes and individual differences therein. Psychometrika, 73, 107124. C.M. (1981). Métodos de análisis multivariante. Barcelona: Eunibar. Del Pino, G., San Martín, E. De Castro, C. (1982): La medida en Psicología: Perspectiva Psicofísica. Revista de Psicología General y Aplicada. P. 37. González, J. y De Boeck, P. (2008). On the relationships between sum score based estimation and joint maximum likelihood estimation. Psychometrika, 73, 145-151. Haladyna, T.M. (1994): Developing and validating multiple-choice test items. Hillsdale, NJ: LEA. Hambleton, R.K. y Sdwaminathan, H. (1985). Item response theory: Principles and applications. Boston, MA: Kluwer- Nijhoff Publishing. Hambleton, R.K., y Swaminathan, H. y Rogers, H.J. (1991). Fundamental of item response theory. Newbury Park: Sage. Holden, R.R., and Jackson, D.N., (1985) item subtlrty and face validity in pertsonality assessment, journal of consuling and clinical psychology. Keeves, J.P. (1988): Educational research, methodology and measurement. Oxford, Pergamon Press. 46 Avances Muñiz, J. (1982): Medición psicológica: Métodos de escalamiento. Madrid. Universidad Complutense. Muñiz, J. (1991). Introducción a los métodos psicofísicos. Madrid: PPU. Capítulo 1. Olea, J.; Ponsoda, V. y Prieto, G. (Eds.) (1999): Tests informatizados: fundamentos y aplicaciones. Madrid: Pirámide. Pérez, C.; Padilla, J. L.; González, A. y Rojas, A. J. (1996). El uso de las técnicas de escalamiento para la definición y medida del continuo psicosocial "individualismocolectivismo". Boletín de Psicología, 25, 7-14. Tomas, J.M.; Oliver, A. y Meliá, J.L. (1992). Teoría de la Respuesta al Item: Fundamentos, Modelos y Aplicaciones. Valencia: Cristóbal Serrano. Torgerson, W.S., (1958) Theorynand Methods of Scaling, New York-. Wiley. Vargas, F. (1999): La formación basada en competencias: Instrumento para la empleabilidad. Centro de Investigación y Documentación. Artículos Cortada de Kohan, N. (2004). Teoría de Respuesta al Ítem: Supuestos Básicos. Evaluar, 4, pp. 95-110. Elosúa, P. y López, A. (1999). Funcionamiento diferencial de los ítems y sesgo en la adaptación de dos pruebas verbales. Psicológica, 20, pp. 23-40. Fan, X. (1998). Item response theory and classical test theory: an empirical comparison of their item/person statistics. Educational and Psychological Measurement, 58(3), pp. 357-382. Gómez Benito, J. y Navas, M.J. (1998). Impacto y funcionamiento diferencial de los ítems respecto al género en una prueba de aptitud numérica. Psicothema, 10(3), pp. 685-696. Hambleton R.K. y Jones, R.W. (1993). Comparison of classical test theory and item response. Educational Measurement: Issues and Practice, 12(3), pp.38-47. Harris, D. (1989). Comparison of 1-, 2-, and 3-parameter IRT models. Educational Measurement: Issues and Practice;. 1(8), pp. 35-41. ITEMS: The Instructional Topics in Educational Measurement Series, by Mark Gierl. Stenner, A.J., Smith III, M and Burdick, D.S.(1983)Toward a Theory of Construct Definition, Journal of Educational Measurement , 20, 305-316. Prieto, G. y Dias, A. (2003) Uso del modelo de Rasch para poner en la misma escala las puntuaciones de distintos tests. Actualidades en Psicología,19(106), pp. 5-23. 47 Avances Direcciones WEB http://www.ucm.es/info/funvalor/docs/medida.pdf, http://www.uam.es/personal_pdi/stmaria/jmurillo/recursos/medida.htm http://www.canalsocial.net/GER/ficha_GER.asp?id=9589&cat=Matematicas http://www.uned.es/psico-3-psicometria/ttest.htm#que http://www.pt.wikipedia.org/wiki/Escala_Likert http://www.unmsm.edu.pe/psicologia/documentos/documentos2007/libro%20eap/05Libro EAPAliaga Tovar Jaime, Test psicométricos: Confiabilidad y Validez.pdf http://perso.wanadoo.es/aniorte_nic/apunt_metod_investigac4_7.htm http:// www:aniorte-nic.net http://www.mestizos.net 48