UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS SOCIALES CARRERA DE PSICOLOGÍA ACTUALIZACIÓN DE NORMAS DEL TEST DEL RELOJ PARA ESTUDIANTES DE EDUCACIÓN MEDIA CIENTÍFICO HUMANISTA DEL GRAN SANTIAGO Memoria para optar al Título de Psicólogo Profesora Patrocinante: Ps. Elisabeth Wenk Wehmeyer Alumnos: Lic. Ps. María Margarita Zarricueta Contreras Lic. Ps. Juan Osvaldo Mejía Paredes Santiago, 2009 2 AGRADECIMIENTOS En esta larga travesía han sido muchas las personas que nos han colaborado de distintas maneras y desde su dominio particular. Nuestro primer reconocimiento es para nuestras respectivas familias, en sus particularidades respectivas, pues nos sostuvieron anímicamente, alentándonos en cada parte del proceso y facilitándonos los espacios y tiempos que muchas veces tuvimos que sustraerles durante todo este proceso: A todos y cada uno de ustedes, muchísimas gracias por su amor y su apoyo, además de la inmensa cuota de comprensión que aportaron tan generosamente. Vayan también, nuestros agradecimientos a los amigos y compañeros de labores: Betty, René, Manolo, Marcelo, Sergio y demás funcionarios de la Facultad de Ciencias Sociales. A todos ustedes, gracias por su cariño, apoyo y buenos deseos para la consecución de nuestro objetivo. Muy especialmente, agradecemos a nuestra profesora patrocinante, la Señora Elisabeth Wenk, por presentarnos esta oportunidad, acogernos, escucharnos y orientarnos en lo que finalmente se convirtió en este proyecto de titulación. Muchísimas gracias por la dedicación, el cariño y todas sus enseñanzas. No queremos dejar pasar la ocasión de agradecer a cada uno de los establecimientos escolares que posibilitaron la obtención de los datos con los que se realizó esta investigación. A sus directores, inspectores, psicólogos, orientadores y profesores que colaboraron tan generosamente con nosotros. 3 RESUMEN La presente investigación tiene como objetivos la actualización de normas para el Test de Inteligencia del Reloj en estudiantes de Enseñanza Media científico-humanista del Gran Santiago, así como analizar las propiedades psicométricas del instrumento desde los marcos aportados por la Teoría Clásica de la Medición y la Teoría de Respuesta al Ítem, contrastando los resultados obtenidos con investigaciones anteriores. El instrumento fue aplicado a una muestra compuesta por 1201 estudiantes de 1º a 4º año medio, provenientes de distintos grupos socioeconómicos. A partir de los análisis comparativos realizados, se obtuvieron normas relativas y diferenciales de acuerdo con las variables sociodemográficas que demostraron tener incidencia en la variabilidad del rendimiento en la prueba. Los principales hallazgos de esta investigación son consistentes con investigaciones anteriores y permiten confirmar que las variables edad-nivel de instrucción y grupo socioeconómico tienen una clara influencia en el rendimiento intelectual de los sujetos. Así mismo, se confirman los adecuados niveles de confiabilidad, validez y capacidad discriminativa del instrumento. 4 TABLA DE CONTENIDOS Agradecimientos 2 Resumen 3 Tabla de Contenidos 4 I. Introducción 6 II. Objetivos 8 1.- Objetivos Generales 8 2.- Objetivos Específicos 8 3.- Hipótesis de Investigación 9 III. Marco Teórico 10 1. De la Inteligencia 10 2. De la Teoría Clásica de la Medición 10 3. De la Teoría de Respuesta al Ítem 12 4. Antecedentes del Test del Reloj 13 IV. Método 1. Definición de Variables 16 16 1.1. Variables de Muestreo 16 1.2 Variables de Estratificación de la Muestra 16 1.3 Variables en Estudio 17 1.4 Grado y Parámetro de Dificultad de un Ítem 17 2. Diseño 17 3. Participantes 18 3.1 Criterios de Estratificación de la Muestra 18 3.2 Criterios de Exclusión de la Muestra 18 4. Instrumentos 19 4.1 Encuesta Himmel 19 4.2 Test del Reloj 19 5. Procedimiento 20 5.1 Selección de la Muestra 20 5.2 Recolección de Datos 21 5.3 Análisis de los Datos 21 V. Análisis de Resultados 22 1. Caracterización Descriptiva de la Muestra 22 2. Resultados del Rendimiento en el Test del Reloj 23 2.1 Resultados para la Muestra Total 23 5 2.2 Resultados por Subgrupos 3. Estimación de las Propiedades Psicométricas del Instrumento 23 26 3.1 Análisis del Grado de Dificultad 26 3.2 Análisis de la Capacidad Discriminativa 26 3.3 Análisis de la Confiabilidad del Instrumento 28 3.4 Determinación de la Unidimensionalidad de los Ítemes 29 4. Comparación Estadística del Rendimiento de los Diferentes Grupos 30 4.1 Comparación Según Grupo Socioeconómico 31 4.2 Comparación Según Curso 32 4.3 Comparación Según Sexo 34 5. Obtención de Normas 35 VI. Síntesis de Principales Resultados y Conclusiones 39 Referencias Bibliográficas 42 Anexos 6 I. INTRODUCCIÓN El estudio y medición de la inteligencia mediante tests de estímulo no verbal y aplicación colectiva ha contribuido al desarrollo y aplicación de las distintas teorías y modelos en el ámbito de la Psicometría (Prieto y Delgado, 2003; Jiménez, 2007). Durante las últimas décadas se ha potenciado el interés por el desarrollo de modelos complementarios a la Teoría Clásica de la Medición (TCM) para superar las limitaciones de sus dos principales aplicaciones: los índices de dificultad y la discriminación. En esta línea, la Teoría de Respuesta al Ítem (TRI) complementa a la TCM en el diseño, construcción y evaluación de pruebas, dado que se centra más en las propiedades psicométricas de los ítemes individuales que en las propiedades globales del test y el grupo examinado. En Chile, el Test de Inteligencia del Reloj, desarrollado en 1974 por Alejandra Rojo, ha sido estudiado tanto desde la TCM como desde la TRI, evidenciando ser una prueba psicológica confiable y válida. Este instrumento se elaboró con la finalidad de presentar una prueba paralela al Test de Dominós de Edgar Anstey en su versión D-48, estructurándose en base a los mismos principios y cumpliendo con tres de las cuatro condiciones requeridas para el establecimiento de las formas paralelas en el ámbito de las pruebas (Rojo y Bravo, 1974). En este contexto, la presente investigación tiene como objetivo principal actualizar las normas del Test del Reloj para jóvenes de enseñanza media científico-humanista; analizando los resultados desde la TCM y su adecuación a la TRI para aprovechar los aportes de esta última en la interpretación de los datos. De acuerdo con los objetivos de la investigación, se estiman y comparan los índices y parámetros de dificultad para los ítemes de la prueba, se obtienen las normas relativas para la interpretación de los puntajes, y se evalúa la consistencia interna del instrumento en la muestra estudiada. Entre los alcances y proyecciones posibles de este trabajo, se espera contribuir a la investigación sobre instrumentos de medición psicológica en otros campos, como por ejemplo, la evaluación del impacto de la educación en el rendimiento intelectual para jóvenes provenientes de distintos niveles socioeconómicos, así como en las áreas y contextos de la Psicología asociados. La utilidad metodológica de este trabajo radica en que se constituye como un aporte a las investigaciones que utilizan test psicométricos para el desarrollo de la disciplina, en el ámbito de la medición y evaluación psicológica de la inteligencia. Desde el punto de vista de su utilidad práctica, queda a disposición de los distintos profesionales de la psicología y del ámbito de la educación 7 para que en adelante sea utilizado para distintos propósitos en la población de estudiantes secundarios, con normas actualizadas para su correcta interpretación. El presente trabajo se define como una investigación metodológica y psicométrica, de tipo descriptivo y correlacional-comparativo, que corresponde a un diseño no experimental de carácter transeccional o de medición (Hernández et al., 2003; Briones, 2002). Así, el instrumento fue aplicado a una muestra aproximada de 1000 estudiantes (hombres y mujeres) de primero a cuarto medio durante los años 2007 y 2008, de quienes, a partir de los análisis comparativos pertinentes, se obtuvieron las normas relativas de interpretación del instrumento según nivel de estudios y/o rango etáreo y grupo socioeconómico de pertenencia. 8 II. OBJETIVOS 1. OBJETIVOS GENERALES: • Actualizar las normas para la interpretación de los resultados obtenidos en el Test de Inteligencia del Reloj en estudiantes de Enseñanza media científico-humanista de establecimientos educacionales urbanos del Gran Santiago. • Analizar las características del instrumento desde los marcos aportados por la Teoría Clásica de la Medición y la Teoría de Respuesta al Ítem, contrastando los resultados obtenidos con investigaciones anteriores. 2. OBJETIVOS ESPECIFICOS: • Describir el rendimiento de la muestra, de acuerdo con los resultados obtenidos en el Test del Reloj. • Evaluar si existen diferencias significativas en el rendimiento del test del reloj entre los sujetos de la muestra considerando las variables de estratificación (sexo, curso y GSE). • Obtener normas clínicas y diferenciales en las variables que presenten diferencias significativas en la muestra de análisis • Evaluar las propiedades psicométricas de los ítemes que conforman el Test de Inteligencia del Reloj mediante el análisis estadístico de los resultados. • Evaluar la consistencia interna del instrumento para la muestra a través del método Alfa de Cronbach. • Determinar si el instrumento es adecuado para someterlo al análisis de sus características psicométricas desde la Teoría de Respuesta al Ítem. • Comparar los resultados obtenidos en las investigaciones anteriores con los datos obtenidos en la muestra actual. • Aportar nueva evidencia empírica que permita posicionar al Test del Reloj como un instrumento adecuado para la evaluación de rendimiento intelectual y nuevos usos alternativos, como la orientación vocacional en jóvenes de enseñanza media. 9 3. HIPÓTESIS DE INVESTIGACION De acuerdo con los objetivos específicos planteados, se han formulado las siguientes hipótesis relacionadas con las variables de estratificación de la muestra (curso, sexo y GSE): H1: “Se encontrarán diferencias significativas en el rendimiento al Test del Reloj de acuerdo con el grupo socioeconómico de pertenencia de los sujetos evaluados” H2: “Se encontrarán diferencias significativas en el rendimiento al Test del Reloj de acuerdo con la variable edad-curso” H3: “No existirá una diferencia significativa en el rendimiento al Test del Reloj según los sujetos evaluados sean hombres o mujeres” 10 III. MARCO TEÓRICO 1. De la Inteligencia El carácter polimorfo y abierto de la inteligencia hace difícil una delimitación verificable del concepto. De ello se colige que la definición sobre inteligencia esté íntimamente ligada a la perspectiva desde donde se la estudie. Así, desde la psicología diferencial, de matiz psicométrico, que trata de medir y explicar las diferencias entre los hombres y de fundamentar en ellas diagnósticos y pronósticos, la definición de la inteligencia se hace designando algún proceso o atributo distintivo. Por ejemplo, para Thorndike, ésta sería la capacidad de buena respuesta desde el punto de vista de la verdad y los hechos; para Binet, tendría relación con la comprensión, invención, dirección y crítica; para Terman, sería la abstracción; mientras que para Spearman, sería la neogénesis o capacidad abstractiva y relacionante (Yela, 1991). La definición operativa de Bridgman «inteligencia es lo que miden los tests de inteligencia», es un instrumento metodológico fecundo, por cuanto el estudio experimental y matemático de los tests que supuestamente midan la inteligencia irá indicando, progresiva y autocorrectivamente, qué miden los tests y hasta qué punto miden una misma cosa. Es así como se ha construido el concepto de inteligencia psicométrica (Op. cit.). La inteligencia psicométrica es un campo de covariación continuo, heterogéneo y jerarquizado porque todas las actividades inteligentes tienden a covariar entre sí, y en ese continuo se originan zonas de intensa covariación (aptitudes) según la interacción entre la dotación genética y las circunstancias personales (edad, sexo, experiencia) y ambientales (sociedad, clase, cultura), y porque las diferencias individuales pueden expresarse en función de varias aptitudes o factores, ordenadas desde la general y común a todas las actividades hasta las singulares de cada actividad, pasando por múltiples niveles de generalidad descendente (Op. cit.). El modelo factorial indica que la inteligencia es única (una estructura, un factor general) y múltiple, en donde la herencia fija el potencial y los límites, y la experiencia y la cultura deciden en qué medida se actualiza ese potencial y hasta dónde se desplazan esos límites (Op. cit.). 2. De la Teoría Clásica de la Medición (TCM) Los trabajos de Carl Spearman de comienzos del siglo XX marcan el puntapié inicial de la Teoría Clásica de la Medición (Cortada de Kohan, 1999). La hipótesis fundamental en esta teoría es que “el puntaje de una persona de un test (puntaje observado) es función de dos componentes, 11 el puntaje verdadero (latente o inobservable) y el error de medición” (Cortada de Kohan, 1999; Manzi y San Martín, 2003; Wenk, 2003). Entonces, estaríamos ante un modelo de regresión lineal simple donde la variable dependiente corresponde al puntaje total observado, y las variables independientes están relacionadas aditivamente y son el puntaje verdadero y el error de medición (Manzi y San Martín, 2003). Específicamente, cuando los ítemes de un test son dicotómicos, la medida de habilidad del evaluado corresponde al número de respuestas correctas que obtuvo en la prueba. Las hipótesis básicas del modelo de la TCM son: que el valor esperado del error de medición es cero y, que el error de medición para una persona no está relacionado con el puntaje verdadero ni con el error de medición asociado a otros ítemes (Manzi y San Martín, 2003). En otras palabras: primero, las observaciones miden, con error, un rasgo latente, que caracteriza a cada individuo; y segundo, un axioma de independencia local, el cual señala que las respuestas de las personas a un ítem son independientes de las respuestas a los otros ítemes (Jiménez, 2007). La TCM presenta una alta dependencia de la muestra, es decir, el grado de dificultad y la capacidad de discriminación de los ítemes dependen del grupo que rindió la prueba. En el caso de preguntas con puntaje dicotómico, se utiliza como medida del nivel de dificultad de un ítem el cociente entre la cantidad de sujetos en la muestra que responden correctamente el ítem y el número total de sujetos. Es decir, la proporción de respuestas correctas (Wenk, 2003). Por su parte, la discriminación de un ítem corresponde a la correlación entre los puntajes en el ítem y los puntajes totales de la prueba (Dussaillant, 2003; Manzi y San Martín, 2003; Wenk, 2003). Así, un ítem tendrá una alta discriminación cuando los sujetos que lo respondan correctamente son aquellos que tienen los puntajes más altos en la prueba y los que lo responden incorrectamente son aquellos que obtienen los menores puntajes (Dussaillant, 2003; Wenk, 2003). Del mismo modo, la TCM también presenta una alta dependencia de los ítemes, puesto que los puntajes que describen el desempeño de los sujetos dependen del grupo de ítemes que se les entregó. Esta dependencia de la TCM de que las características de la prueba y de la muestra sólo pueden ser interpretadas una en el contexto de la otra (Dussaillant, 2003), haría difícil comparar examinados que toman diferentes pruebas, y comparar ítemes cuyas características se han obtenido usando diferentes grupos de examinados (Dussaillant, 2003; Manzi y San Martín, 2003). Otra dificultad que presenta la TCM es el supuesto de que el error de medición es constante para todos los examinados (Dussaillant, 2003; Manzi y San Martín, 2003). Esto resulta poco factible, ya que la precisión de los puntajes varía de manera desigual según la habilidad de los examinados. Por ejemplo, si un sujeto obtiene un puntaje igual a cero en una prueba, eso nos indica que el sujeto tiene una habilidad baja, pero no queda claro cuán baja. El puntaje de un sujeto en una prueba provee información más precisa respecto a lo que el examinado puede hacer 12 o no, cuando éste contesta correctamente a unos ítemes e incorrectamente a otros (Jiménez, 2007). Finalmente, como la TCM es una teoría orientada a la prueba y no al ítem, se vuelve difícil predecir el comportamiento de un examinado o un grupo de examinados en un ítem particular (Manzi y San Martín, 2003). En este escenario, resulta atractiva la incorporación de métodos alternativos a la TCM que provean una medida de precisión en la estimación del nivel de habilidad. En estos modelos alternativos, de los cuales la Teoría de Respuesta al Ítem es uno de ellos, las características de los ítemes no serían dependientes de la muestra y los puntajes de los examinados no serían dependientes de los ítemes utilizados en la prueba. Lo anterior apunta a una complementariedad de los modelos de la TCM y de los modelos alternativos en lo referente a la evaluación de los instrumentos de medición. 3. De la Teoría de Respuesta al Ítem (TRI) Los modelos TRI intentan establecer la probabilidad, para cada uno de los ítemes, de ser respondidos correctamente. Esta probabilidad depende, por un lado, de la habilidad del examinado; y por otra parte, del grado de dificultad y capacidad discriminativa del ítem, así como de la probabilidad de que un individuo de muy baja habilidad lo responda correctamente al azar. El modelo TRI más simple diferencia los ítems sólo según su grado de dificultad. Pero existen otros modelos que permiten además diferenciar respecto de su grado de discriminación y la probabilidad de responderlo correctamente al azar. La TRI reporta la función informativa del ítem, es decir el nivel de “certeza” o “precisión” que un ítem aporta a la estimación para cada nivel de habilidad: mientras mayor es la información que aporta el ítem a un determinado nivel de habilidad, mayor es la precisión en la estimación de ese nivel de habilidad (Jiménez, 2007). La principal ventaja teórica de la TRI, y que la distingue de la TCM, es la invarianza. Esto apunta a que un sujeto obtendría siempre la misma estimación de su habilidad, independientemente de las preguntas que deba responder. Lo único que podría variar es el error de medición. Respecto de un ítem, éste tendría siempre el mismo grado de dificultad, capacidad de discriminación, y probabilidad de ser respondido correctamente al azar, independientemente de la muestra en que se aplicó la prueba. Esta propiedad se cumple siempre y cuando se satisfagan una serie de supuestos y requisitos (Dusaillant, 2003). 13 Estos son: (a) la unidimensionalidad, es decir, todos los ítemes de una misma prueba miden sólo una habilidad en los examinados; (b) la independencia local: “dado un nivel de habilidad, las respuestas a los ítems no pueden estar correlacionadas entre sí” (Dussaillant, 2003, pág. 95), y si ésta existe “sólo se explica por habilidad” (Op.cit.); (c) que las experiencias educacionales de los examinados sean similares; (d) que la aplicación de la prueba haya contado con el tiempo necesario para ser abordada; y (e) que no haya “efectos de contexto” no controlados, es decir, que diferentes posiciones de un ítem en la prueba indiquen que éste se comporta diferentemente. El requisito básico de la TRI es que el modelo debe ser capaz de predecir el comportamiento de los examinados a los ítemes con el mayor grado de exactitud posible. Es decir, que las predicciones del modelo se ajusten a los datos reales, para que no haya problemas con la estimación de habilidad de los examinados y para que se cumpla la propiedad de invarianza (Dussaillant, 2003; Jiménez, 2007). Todos éstos son aportes importantísimos de la TRI y que complementan a la TCM en la evaluación y análisis de resultados de los instrumentos de medición. Sin embargo, cuando alguno de los supuestos y requisitos no se cumplen, se pierde no sólo la invarianza sino que se distorsiona la estimación de habilidad y se introducen errores en aplicaciones secundarias de la teoría (Dussaillant, 2003). 4. Antecedentes del Test del Reloj El Test del Reloj se creó como una prueba paralela al Test de Dominós D-481. Fue desarrollado en nuestro país por la psicóloga de la Universidad de Chile Alejandra Rojo en 1974, con el propósito de evaluar inteligencia general de manera colectiva, sencilla y relativamente breve. Los reactivos de ambas pruebas presentan características semejantes en cuanto son estímulos no verbales, vehículos de cantidades (presentándose en una serie continua, finita y circular), y conocidos. En base a estas similitudes, Alejandra Rojo creó una serie de ejercicios que elicitaran el mismo tipo de operaciones mentales que elicitan los ítemes del Test de Dominós. Aunque el “reloj” pareció ser un estímulo más complejo que el “dominós”, esto sólo significó que el 1 Desde los trabajos de Spearman (1955) y el desarrollo del análisis multi-factorial (Salgado y López, 1987; Jiménez, 2007), se desprende que los tests psicológicos con mayor correlación con el factor “G” de la inteligencia son aquellas pruebas de tipo perceptivo y no verbal, que plantean esencialmente problemas de abstracción, comprensión y deducción de relaciones (Anastasi, 1998; Yela, 1956 en Salgado y López, 1987). El Test de Matrices Progresivas de Raven y el Test de Dominós de Edgar Anstey se cuentan entre los principales representantes de este tipo de pruebas. 14 tiempo de ejecución del Test del Reloj fue mayor que el del Dominós2, sin afectar otros aspectos (Rojo y Bravo, 1974; Salgado y López, 1987). La versión final de la prueba quedó constituida por 45 ítemes, más 4 ejemplos. En general, cada ítem del Test del Reloj corresponde a su ítem homólogo en el D-48. Los ejercicios del Test del Reloj, al igual que en el D-48, no presentan un orden estricto de dificultad creciente, sino sólo una tendencia a este tipo de ordenamiento, puesto que se mantienen las agrupaciones de ítemes que tienen en común principios similares de resolución (Rojo y Bravo, 1974). Esta prueba puede aplicarse de forma colectiva o individual, y está diseñada para un nivel cultural medio y superior (Rojo y Bravo, 1974; Salgado y López, 1987; Benito y Serrano, 1992). Es una prueba de potencia, puesto que está compuesta por reactivos de dificultad variable y tiene un tiempo límite, pero suficientemente amplio de ejecución, para dar respuesta a todos ellos. Así, la calificación refleja el nivel de dificultad de los reactivos a los que puede responder el sujeto. Es también una prueba de comportamiento máximo, pues el sujeto recibe la instrucción de contestar la mayor cantidad posible de ítemes (Cortada de Kohan, 1999; Wenk, 2003 en Jiménez, 2007). Al tratarse de una prueba de papel y lápiz, estructurada y objetiva, se especifican con claridad los estímulos y las tareas del sujeto, y quienquiera que realice su corrección arribará a los mismos resultados, ya que existen pautas precisas para efectuarla. En la aplicación experimental del Test del Reloj, respecto de la estimación de las propiedades psicométricas del instrumento, se obtuvieron indicadores que apuntaron a su validación concurrente con el Test D-48 (Rojo y Bravo, 1974). En efecto, se encontró un alto paralelismo entre ambos instrumentos (promedios iguales en la distribución de puntajes y promedios y varianzas iguales en sus distribuciones de índices de dificultad), además de obtenerse coeficientes de confiabilidad por consistencia interna mediante el método de bipartición par-impar de Spearman-Brown de rtt = 0.85 (Op.cit.). Con esto se confirmaron los supuestos de que el test efectivamente medía el factor “G” de inteligencia y de que se trataba de una prueba bastante homogénea y precisa (Rojo y Bravo, 1974). En 1987, Salgado y López realizaron la tipificación de la prueba en una muestra de razón fija compuesta por 306 estudiantes entre 16 y 18 años de la Región Metropolitana. De acuerdo con los resultados del análisis experimental, los investigadores realizaron las siguientes modificaciones a la prueba: (1) la eliminación de dos ítemes de la prueba original (25 y 44); (2) la inversión de la 2 El Test de Dominós, creado en 1944 por Edgar Anstey, surgió como una prueba alternativa al Test de Matrices Progresivas de Raven, y al igual que éste, evalúa la inteligencia general de forma no verbal y colectiva. Es una indicación global del factor “G” y entre sus propósitos destaca su utilidad en el diagnóstico de deterioro mental en contextos clínicos, además de su aplicación en otros campos, tales como el área educacional, el área de orientación vocacional, y últimamente, en el área de selección de personal. 15 secuencia de presentación del ítem 41; y (3) el cambio de ubicación de los ítemes 10 y 13 de la prueba original. Los principales resultados de esta investigación fueron el establecimiento del tiempo máximo de ejecución del test en 55 minutos, la obtención de normas clínicas y generales para el rango de edad entre 16 y 18 años, y la obtención de normas diferenciales de acuerdo a nivel socioeconómico, por ser ésta la variable que demostró diferenciar significativamente el rendimiento en la prueba. A partir de lo anterior, los autores señalan que no se evidencian diferencias en el desempeño intelectual de hombres y mujeres, así como el hecho de que la inteligencia pareciera desarrollarse de forma más notoria en etapas anteriores a la estudiada por ellos y que ésta se ve fuertemente influida por el medio socio-cultural que rodea al individuo. Investigaciones posteriores han encontrado consistentemente altos grados de confiabilidad y validez para la prueba, obteniéndose normas relativas para jóvenes en el rango de 12 a 18 años (Benito y Serrano, 1992; Salgado y López, 1987) y para el uso de la prueba en selección de personal (Rodríguez y Torrico, 2000; Jiménez, 2007). 16 IV. METODO 1. DEFINICION DE VARIABLES 1.1. Variables de muestreo 1.1.1 Tipo y nivel de escolaridad 1.1.1.a Definición conceptual: Estudiantes de Enseñanza Media de Educación CientíficoHumanista en Establecimientos Educacionales urbanos del Gran Santiago. 1.1.1.b Definición operacional: Alumnos matriculados que se encuentran cursando de 1º a 4º año de Enseñanza Media Científico Humanista en Establecimientos educacionales urbanos del Gran Santiago. 1.1.2. Ausencia de retraso pedagógico: Criterio de exclusión de casos dentro de la muestra que pudieran introducir sesgos en los resultados. 1.1. 2.a Definición conceptual: Dos años o más de la edad esperada para cada curso. 1.1.2.b Definición operacional: Más de 15 años para 1º medio, más de 16 años para 2º medio, más de 17 años para 3º medio y más de 18 años para 4º medio. 1.2. Variables de estratificación de la muestra (como variables independientes) 1.2.1. Curso - edad: Edad cronológica de los sujetos de acuerdo las edades esperadas para los cursos. 1.2.1.a Definición conceptual: Se espera que los sujetos de 1er año medio tengan entre 14 y 15 años, para los de 2º entre 15 y 16 años, para los de 3º entre 16 y 17 años, para los de 4º entre 17 y 18. 1.2.1.b Definición operacional: Se determina a través de la edad y la fecha de nacimiento reportada por cada uno de los sujetos de la muestra. 1.2.2. Sexo 1.2.2.a Definición conceptual: Características anatomofisiológicas propias de hombres y mujeres. 1.2.2.b Definición operacional: Adscripción al sexo masculino o femenino de acuerdo con características externas. 1.2.3. Grupo Socioeconómico (G.S.E.): 1.2.3.a Definición conceptual: Segmentación de la población de acuerdo al nivel de educación y la categoría ocupacional de los principales sostenedores del hogar. 1.2.3.b Definición operacional: Se establece de acuerdo a la puntuación obtenida en la escala de Himmel y otros, versión modificada por Wenk, E. (2006). 17 1.3 Variables en Estudio (como variables dependientes) 1.3.1 Nivel o Rendimiento Intelectual 1.3.1.a Definición Conceptual: El rendimiento intelectual tiene relación con el grado de desarrollo que han alcanzado las habilidades cognitivas del individuo para relacionarse con su medio, para pensar racionalmente y para actuar con propósito (en comparación con lo que la mayoría de los sujetos de su misma edad han logrado) (Rodríguez y Torrico, 2000). En la presente investigación, se hace referencia a la inteligencia general (factor G) de los sujetos, de acuerdo con las habilidades que mide la prueba. 1.3.1.b Definición Operacional: Se define como el puntaje directo obtenido en la prueba, el cual está dado por el número de respuestas correctas que el sujeto obtiene al responder el instrumento. 1.4 Grado y Parámetro de Dificultad de un Ítem. 1.4.1 Definición Conceptual del Grado de Dificultad: Proporción de sujetos que, al interior de un grupo de examinados, responde correctamente un ítem (Dussaillant, 2003; Manzi y San Martín, 2003; Wenk, 2003). 1.4.2 Definición Operacional del Grado de Dificultad: Cociente entre el número de personas que aciertan un ítem y el número de personas que lo responden. Es una proporción que va desde 0 (ítem muy difícil) a 1 (ítem muy fácil) (Dussaillant, 2003; Manzi y San Martín, 2003; Wenk, 2003). 1.4.3 Definición Conceptual del Parámetro de Dificultad: Estimación que señala la probabilidad de responder correctamente un ítem según el nivel de habilidad del examinado (Dussaillant, 2003; Manzi y San Martín, 2003). 1.4.4 Definición Operacional del Parámetro de Dificultad: Valor de θ (habilidad) para el punto de máxima pendiente de la curva característica de un ítem (CCI), en la cual la probabilidad de responder correctamente un ítem es de 0.5 (Hambleton et al., 1991 en Dussaillant, 2003; Manzi y San Martín, 2003). 2. DISEÑO La presente investigación, tal como se ha planteado en sus objetivos generales y específicos, pretende actualizar normas y estudiar las características psicométricas del Test de 18 Inteligencia del Reloj. Por lo tanto, se define como una investigación metodológica y psicométrica, en la medida que aporta a la disciplina en el desarrollo y análisis de instrumentos psicológicos de medición (Wenk, 2003; Ábalos y otros, 2004, en Jiménez, 2007). Por otro lado, es de tipo descriptivo, en tanto describe las características sociodemográficas de la muestra y el nivel de rendimiento intelectual de los sujetos que la componen, así como las propiedades psicométricas de la prueba (Hernández et al., 2003). Finalmente, se constituye como un estudio de carácter correlacional-comparativo, puesto que se plantea encontrar relaciones entre el nivel de rendimiento intelectual y las características sociodemográficas de la muestra, así como la comparación de los índices de dificultad y los parámetros de dificultad de los ítemes determinados desde la TCM y la TRI, respectivamente. El presente estudio corresponde a un diseño de campo, no experimental de carácter transeccional (Hernández et al., 2003). 3. PARTICIPANTES El colectivo estuvo conformado por jóvenes, varones y mujeres, de entre 14 y 18 años, sin retraso pedagógico, que se encontraran cursando de 1º a 4º año de Enseñanza Media Científico Humanista en colegios no municipales del Gran Santiago. 3.1 Criterios de Estratificación de la Muestra Para caracterizar a la muestra se consideraron las variables identificadas anteriormente como variables de estratificación de la misma, a saber: sexo, curso-edad y grupo socioeconómico de pertenencia. De esta manera, se estima que se han obtenido sujetos que representan en gran medida el continuo de normalidad de la variable inteligencia. A partir de estos criterios se realizaron los análisis necesarios para alcanzar los objetivos establecidos. Dentro de la variable curso-edad, fue incluida la variable ausencia de retraso pedagógico, quedando grupos relativamente homogéneos respecto a la cantidad de sujetos por curso. En lo referente a pertenencia a grupo socioeconómico, la muestra quedó dividida en tres categorías de acuerdo a las puntuaciones obtenidas por los sujetos en la escala de Himmel y otros, versión modificada por Wenk, E. (2006). 3.2 Criterios de Exclusión de la muestra En la presente investigación fueron excluidos los casos que presentaran retraso pedagógico de dos años o más respecto a la edad esperada para cada curso. Se utilizó este criterio para evitar que la inclusión de estos casos sesgara los resultados debido al probable bajo rendimiento de estos sujetos. 19 4. INSTRUMENTOS 4.1 ENCUESTA HIMMEL et al., (versión modificada por Wenk, E., 2006) La encuesta Himmel de NSE para niños y adolescentes es un formulario de lápiz y papel que permite evaluar de forma colectiva y breve el nivel socioeconómico de los individuos. Se basa en el criterio de que el nivel socioeconómico del sujeto se ve condicionado principalmente por el nivel educacional y la situación ocupacional del jefe de hogar. En 1991, Wenk constató que el criterio original de Himmel no permitía discriminar adecuadamente entre los diferentes grupos socioeconómicos. Así, se estableció un criterio de corte diferente para la estratificación del instrumento, pasando a conocerse como Encuesta Himmel et al., versión modificada por Pinto, Gallardo y Wenk. Posteriormente, en 2006, Wenk amplió y actualizó las categorías ocupacionales para que fuesen suficientemente claras y explícitas para los sujetos que respondían el instrumento (Wenk, E., 2007). Ésta es la versión del instrumento que se utilizó en la presente investigación. 4.2 TEST DEL RELOJ El Test del Reloj es una prueba de papel y lápiz, consta de un cuadernillo con 4 ejemplos y 45 ejercicios. Cada examinado cuenta con una hoja de respuestas de uso sencillo. Al reverso de la carátula del cuadernillo, figuran impresas las instrucciones para el examinado. Estas instrucciones son leídas en voz alta por el examinador, quien después procede a resolver los problemas de ejemplo con el grupo de examinados. El tiempo máximo de administración determinado por Salgado y López para su muestra,en 1987 fue de 55 minutos. Sin embargo, éste quedó establecido en 45 minutos, considerando que el 90% del grupo experimental necesitó este tiempo para abordar la totalidad de los ítemes. Cada ejercicio presenta una secuencia en la que hay un reloj en blanco para que el examinado señale en su hoja de respuestas la hora que corresponde a la solución. Los ejercicios de ejemplo del Test del Reloj muestran las formas de presentación de los ejercicios de la prueba (matricial3, circular, espiral o elíptica), así como el tipo de relación (sucesiones simples, lineales o alternadas)4 que debe ser elucidada para resolver los problemas planteados en los 45 ítems siguientes. (Ver Anexo I) 3 En filas y columnas. Se entenderá por sucesiones simples aquellas que presenten una progresión constante. Las sucesiones serán lineales cuando las progresiones sean las mismas para todos los términos de la sucesión; aquí se distinguirá según sean sólo crecientes o decrecientes para ambos componentes del término (horas : minutos), o bien, según el sentido sea distinto para horas y minutos. Por último, se entenderá por sucesión alternada, aquella en que dos o más sucesiones independientes (sean éstas lineales o simples) se ubican término por medio en la presentación del ejercicio. 4 20 5. PROCEDIMIENTO DE LA INVESTIGACION La investigación se llevó a cabo en la Ciudad se Santiago entre los meses de octubre de 2007 y noviembre de 2008. Sus principales objetivos fueron actualizar las normas existentes para la interpretación del Test del Reloj en estudiantes de Enseñanza Media Científico Humanista del Gran Santiago, evaluando las diferencias en rendimiento intelectual de acuerdo a las variables curso y GSE. Además se estudiaron las características psicométricas del instrumento. 5.1. Selección de la muestra Se seleccionaron establecimientos educacionales del Gran Santiago que aportaran sujetos que cumplieran con las características necesarias para cada subgrupo de la muestra. De esta manera, se tomó contacto a través de conversaciones telefónicas y una carta remitida por los investigadores y la Profesora Patrocinante de la investigación. Finalmente, se sostuvieron entrevistas con los Directores y Orientadores de los establecimientos para explicar los propósitos y alcances de la investigación, estableciéndose las fechas para la aplicación de los instrumentos en aquellos establecimientos que accedieron a participar en el estudio. La muestra quedó finalmente constituida por 1201 sujetos, todos ellos alumnos de 1º a 4º año de Enseñanza Media Científico Humanista, pertenecientes a los siguientes 6 establecimientos educacionales: Scuola Italiana, The English Institute, y Liceo Manuel de Salas (GSE Alto); Liceo Santa Juliana, Liceo Santa María de Santiago (GSE Medio y Bajo); y, Liceo Avda. Principal (GSE Bajo). Tabla Nº1: Número de participantes por Establec. Educacional, Curso y Grupo Socioeconómico Liceo Santa Juliana 21 21 Total 84 59 70 43 256 6 24 15 19 64 16 20 13 34 83 84 59 70 43 256 99 98 70 81 348 77 78 77 100 332 48 49 39 54 190 61 58 64 45 228 Establec. Alto Liceo Manuel de Salas Scuola Italiana The English Institute 1º 34 2º 33 3º 76 4º 63 Total 206 1º 2º 23 3º 4º 23 Total 1º 19 2º 17 3º 4º 36 Total curso curso curso Liceo Santa María de Santiago 45 25 16 8 94 curso Liceo Avda. Principal 1º 2º 3º 4º Total 1º 2º 3º 4º Total 1º 2º 3º 4º Total GSE Bajo Medio curso Alto curso Establec. GSE Bajo Medio Total 34 33 76 63 206 23 23 19 17 36 21 5.2. Recolección de datos La aplicación de los instrumentos se llevó a cabo en las salas y horarios de clases de los establecimientos educacionales, destinándose 2 horas pedagógicas (90 minutos) para todo el procedimiento. En general, las actividades se distribuyeron de la siguiente forma: 15 minutos para una presentación general y descripción a grandes rasgos de la investigación y sus propósitos, 15 minutos para la aplicación de la Encuesta Himmel de NSE para niños y adolescentes (versión modificada por Wenk, E., 2006), 5 minutos para entregar el Test del Reloj y dar las instrucciones para responderlo, 45 minutos para contestar el Test del Reloj, 10 minutos para recoger el instrumento y agradecer a los alumnos y Profesores por su colaboración. Las condiciones de aplicación de los instrumentos fueron bastante adecuadas, especialmente gracias a la presencia de Profesores que ayudaron a mantener un clima de orden para facilitar la concentración de los alumnos mientras respondían los instrumentos. 5.3. Análisis de los datos Una vez concluida la recolección de datos, se procedió a corregir la escala de estratificación socioeconómica, asignando los sujetos a los distintos subgrupos de la muestra de acuerdo a las variables Sexo, Curso y GSE. Las respuestas al Test del Reloj fueron codificadas dicotómicamente asignando el valor 1 para respuestas correctas, y el valor 0 para respuestas incorrectas u omitidas. Posteriormente, se ingresaron junto con las variables Sexo, Edad, Curso y GSE a una base de datos en el Software de análisis estadístico SPSS, versión 15.0 (Licencia de la Facultad de Ciencias Sociales, Universidad de Chile). Luego se procedió al análisis de datos, obteniéndose estadísticos descriptivos para la muestra y aplicando pruebas de ajuste a la normalidad. Para verificar las hipótesis de existencia de diferencias significativas de acuerdo a las variables curso, sexo y GSE, se utilizaron los procedimientos “t de Student” y “ANOVA”, asumiendo que la variable en estudio (“nivel o rendimiento intelectual”) se encontraba en un nivel intervalar de medición. Finalmente, se procedió a la construcción de las normas relativas para el grupo total y diferenciales de acuerdo a los resultados obtenidos por los análisis de diferencias de medias entre los subgrupos de la muestra. Para todos los análisis se estableció un nivel de confianza del 95% (α=0,05), en atención a que éste es uno de los estándares establecidos para la investigación en Ciencias Sociales (Hernández et al., 2003). 22 V. ANÁLISIS DE RESULTADOS 1. Caracterización Descriptiva de la Muestra De acuerdo al cruce de las variables de estratificación, se obtuvo 24 subgrupos, estipulándose que 40 casos para cada uno de ellos resultaba un número suficiente para realizar las estimaciones necesarias para los objetivos de la investigación. Por lo tanto, se determinó que la muestra teórica debiera estar compuesta por 960 sujetos. La muestra efectivamente obtenida quedó conformada por 1201 sujetos, superándose el número teórico de casos en 23 de los 24 subgrupos. Sólo el subgrupo “hombres de 2º medio pertenecientes al grupo socioeconómico medio” quedó constituido por 39 sujetos. Lo que, a nuestro criterio, igualmente constituye un factor favorable para la obtención de resultados en el presente estudio. Tabla Nº2: Distribución de participantes por Sexo, Curso y G.S.E. Sexo: Femenino Curso 1º 2º 3º 4º Alto 47 54 52 44 Bajo 59 49 55 55 Medio 64 68 57 45 Total 170 171 164 144 GSE Sexo: Masculino Curso Total 197 218 234 649 1º 2º 3º 4º 51 44 40 48 47 54 43 41 45 46 54 39 143 137 129 143 Total 183 185 184 552 La Tabla Nº2 muestra el grupo total subdividido en 24 categorías. De esta manera, se observa que 54% de los casos corresponden a mujeres y que el 46% son hombres. Respecto al nivel de estudio, se tiene que el 26,1% de los casos se encuentran en 1er año, el 25,6% se encuentra cursando el 2º año, en tercer año nos encontramos con el 24,4% de los casos, mientras que el 23,9% de los casos está en 4º año. En lo referente a grupo socioeconómico de pertenencia, tenemos que el 31,6% de los casos pertenece al GSE alto, el 48,4% al GSE medio y el 34,8% corresponde al GSE bajo. Se realizó la prueba de bondad del ajuste χ2 que arrojó los siguientes resultados: χ2=25,278, df=23, p=0,336, y un n esperado de 50 casos por subgrupo (consultar Anexo II para mayores detalles). El valor p es mayor a 0,05, lo que indica que la cantidad de casos efectivamente obtenida por subgrupo no difiere significativamente del n esperado para cada uno de ellos. 23 2. Resultados del Rendimiento en el Test del Reloj. 2.1 Resultados para la Muestra Total Como se puede observar en la Tabla Nº3, el puntaje promedio observado es de 28,11 puntos, con una desviación típica de 5,6 puntos. El valor que más se repite en esta distribución es 30 puntos. Si bien el puntaje máximo teórico del Test del Reloj es de 45 puntos, el rango de puntajes para esta muestra osciló entre los 7 y los 40 puntos. Por su parte, las medidas de posición ubican en el puntaje 25 el percentil 25, los 29 puntos en el percentil 50 (es decir, la mediana de la distribución) y el percentil 75 en los 32 puntos. A partir de los datos proporcionados por la Tabla Nº2 y del Gráfico Nº1, se puede decir que la distribución sería bastante cercana a una distribución normal, relativamente homogénea y con una tendencia a la asimetría negativa. Tabla Nº3: Estadísticos Gráfico Nº1: Histograma para la distribución de Puntaje Total obtenido en Test del Reloj Descriptivos para Ptje. Total 1201 28,11 Media 0,16 Error Típ. de la Media 29 Mediana 30 Moda 5,56 Desviación Típica 30,89 Varianza 33 Rango 7 Mínimo 40 Máximo 25 Percentil 25 29 Percentil 50 32 Percentil 75 Frecuencia N Total Puntaje Total 2.2 Resultados por Subgrupos En la Tabla Nº4, se observa que el puntaje promedio para el grupo socioeconómico bajo es de 26,49 puntos, con una desviación típica de 6,02 puntos; mientras que para el grupo socioeconómico medio, la media es igual a 28,79 puntos y su desviación típica es de 5,35 puntos. Para el grupo socioeconómico alto el promedio fue de 29,09 puntos con una desviación típica de 4,86. Se aprecian diferencias en los promedios y las desviaciones típicas de los tres grupos 24 socioeconómicos entre sí y con respecto a la muestra total, situación que se analizará luego en los análisis de tipo comparativo. Respecto de los valores para la moda, se observan diferencias en las distintas distribuciones: 28 para bajo, 32 para medio y 30 para alto. Incluso en el caso del GSE medio se tiene que la moda y la mediana son diferentes (32 y 30, respectivamente). Asimismo, se puede apreciar que los puntajes mínimo y máximo de la distribución para la muestra total, se encuentran en el grupo socioeconómico bajo, lo que estaría dando cuenta de que este grupo presentaría una mayor dispersión de los puntajes respecto de los otros dos (medio y alto). Por último, los puntajes observados para el grupo socioeconómico bajo son menores en todos los percentiles reportados respecto de los grupos medio y alto (que no presentan diferencias en valores para los percentiles 25, 50 y 75). Tabla Nº4: Estadísticos Descriptivos por G.S.E. Bajo 403 26,49 0,30 Error Típ. de la Media 28 Mediana 28 Moda 6,02 Desviación Típica 36,28 Varianza 33 Rango 7 Mínimo 40 Máximo Percentil 25 23 Percentil 50 28 Percentil 75 31 N Total Media Medio Alto 418 28,79 0,26 30 32 5,35 28,57 28 9 37 26 30 33 380 29,09 0,25 30 30 4,86 23,63 23 15 38 26 30 33 Tal como se aprecia en la Tabla Nº5, se puede observar que el puntaje promedio para 1º medio es de 26,49 puntos y su desviación típica de 6,06 puntos; para 2º medio, la media es de 27,86 puntos, con una desviación típica de 5,64 puntos; en 3º medio el promedio fue de 29,16 puntos con una desviación típica de 5,03; mientras que para 4º medio el valor para la media fue de 29,97 puntos y la desviación típica, de 4,29 puntos. Se aprecia una tendencia al incremento del puntaje de los promedios a medida que se va subiendo de curso, mientras que la dispersión va disminuyendo; esta situación se analizará cuando se realicen los análisis de tipo comparativo. La moda para 1º medio fue de 28, para 2º y 4º medio de 29, y para 3º medio de 33 Mientras la variación entre los puntajes mínimo y máximo fue de 7 y 38 puntos para 1º, de 8 y 30 para 2º, de 10 y 40 para 3º, y de 15 y 39 puntos para cuarto. Por último, los puntajes observados 25 para el percentil 25 fueron de 23, 24, 27 y 28, respectivamente para cada curso; en el percentil 50 fueron de 26, 29, 30 y 30, y en el percentil 75 de 30, 32, 33 y 33, respectivamente. Tabla Nº5: Estadísticos Descriptivos por Curso N Total Media Error Típ. de la Media Mediana Moda Desviación Típica Varianza Rango Mínimo Máximo Percentil 25 Percentil 50 Percentil 75 1º E.M. 2º E.M. 3º E.M. 4º E.M. 313 25,67 0,34 26 28 6,06 36,75 31 7 38 22,5 26 30 293 29,16 0,29 30 33 5,03 25,31 30 10 40 27 30 33 287 29,97 0,25 30 29 4,29 18,44 24 15 39 28 30 33 308 27,86 0,32 29 29 5,64 31,76 30 8 38 24 29 32 La Tabla Nº6 muestra notables semejanzas en el comportamiento de la variable sexo. Así se tiene que el promedio para hombres y mujeres es de 28 y 28,2 puntos, con desviaciones típicas de 5,58 y 5,54 puntos, respectivamente. Aunque la moda de las mujeres es de 32 puntos y la de los hombres es de 30, sus medianas son iguales (29 puntos). Los puntajes máximos y mínimos para ambos subgrupos son también similares (7 y 39 para mujeres, 8 y 40 para hombres). En cuanto a los puntajes de corte para los percentiles 25, 50 y 75 de ambos grupos, éstos son 25, 29 y 32, respectivamente. Esto podría estar adelantando que no existirían diferencias significativas entre ambos subgrupos, situación que se comprobará en el análisis de tipo comparativo. Tabla Nº6: Estadísticos Descriptivos por Sexo Fem. Masc. 649 N Total 28,20 Media 0,22 Error Típico de la Media 29 Mediana 32 Moda 5,54 Desviación Típica 30,70 Varianza 32 Rango 7 Mínimo 39 Máximo 25 Percentil 25 29 Percentil 50 32 Percentil 75 552 28,00 0,24 29 30 5,58 31,15 32 8 40 25 29 32 26 3. Estimación de las Propiedades Psicométricas 3.1 Análisis del Grado de Dificultad Se procedió a determinar el grado de dificultad de los 45 ítemes que componen el Test del Reloj, a través del cálculo de la proporción de respuestas correctas para cada ítem. Los ítemes fueron clasificados en tres categorías de acuerdo al siguiente criterio: a) Muy Fácil: p > 0.8; b) Moderado: 0.2 < p < 0.8: y c) Muy Difícil: p < 0.2 (Jiménez, 2007). Tal como puede apreciarse en la tabla Nº7, los resultados señalan que 21 ítemes tienen un grado de dificultad “muy fácil”, 16 ítemes presentan una dificultad “moderada”, y 8 ítemes aparecen como “muy difíciles” para la muestra. En general, los resultados encontrados son muy consistentes con los reportados por Rojo y Bravo (1974), Benito y Serrano (1992), y Jiménez (2007), confirmándose que tanto la constelación de ítemes para cada categoría, así como sus grados de dificultad se han mantenido relativamente constantes en el tiempo y a través de las diferentes muestras estudiadas. Finalmente, el grado de dificultad promedio de los ítemes de la prueba es de 0.62, es decir, de dificultad media, lo cual sugiere que se trata de un instrumento abordable. Tabla Nº7: Índices de Dificultad para los 45 ítemes del Test del Reloj Número Indice Número Indice Item Dificultad Item Dificultad Item1 0,94 (*) Item16 0,37 Item2 0,97 (*) Item17 0,26 Item3 0,96 (*) Item18 0,51 Item4 0,85 (*) Item19 0,94 (*) Item5 0,94 (*) Item20 0,92 (*) Item6 0,96 (*) Item21 0,92 (*) Item7 0,91 (*) Item22 0,48 Item8 0,80 Item23 0,92 (*) Item9 0,82 (*) Item24 0,77 Item10 0,90 (*) Item25 0,07 (***) Item11 0,90 (*) Item26 0,58 Item12 0,89 (*) Item27 0,40 Item13 0,94 (*) Item28 0,51 Item14 0,97 (*) Item29 0,64 Item15 0,88 (*) Item30 0,70 Leyenda: (*) = “Muy Fácil” (***) = “Muy Difícil” Número Item Item31 Item32 Item33 Item34 Item35 Item36 Item37 Item38 Item39 Item40 Item41 Item42 Item43 Item44 Item45 Indice Dificultad 0,88 (*) 0,86 (*) 0,75 0,82 (*) 0,53 0,39 0,15 (***) 0,28 0,36 0,20 (***) 0,10 (***) 0,17 (***) 0,01 (***) 0,01 (***) 0,01 (***) 3.2 Análisis de la Capacidad Discriminativa El índice de discriminación de un ítem describe la relación existente entre éste y la ejecución global en la prueba. A pesar de que existen varios índices de discriminación posibles 27 (por ej. covarianza item-total, correlación promedio entre un reactivo y todos los demás, correlación ítem-test, etc.) ninguno de ellos proporciona una ventaja en particular, y los resultados tienden a ser muy semejantes entre sí; por lo tanto se sugiere utilizar la correlación ítem-total por ser el índice de discriminación más simple. En estricto rigor, para variables de puntuación dicotómica, correspondería utilizar una correlación punto biserial (rpb); sin embargo, esta distinción no tiene sentido al utilizar programas de computador para realizar el cálculo. Una última consideración para utilizar este índice de discriminación, es que el puntaje del reactivo es parte del puntaje total en la prueba, por lo que el coeficiente de correlación resulta más elevado de lo que ocurriría si el reactivo fuera correlacionado con la suma de los restantes reactivos de la prueba. La solución sería trabajar con un índice de corrección, no obstante, esta corrección tiene poco efecto al trabajar con pruebas de 10 reactivos o más (Nunnally, 1995). En la tabla Nº8 se presentan los índices de discriminación, obtenidos como coeficientes de correlación corregidos, para los 45 ítemes del Test del Reloj (en el Anexo IV se presenta la tabla con mayores detalles de este análisis). Los resultados del análisis indicaron que sólo el ítem 43 no alcanza un índice de correlación significativo con el instrumento total (criterio de corte r(0.05)=0.08). No obstante, llama la atención que sólo 24 de los 45 ítemes alcanzaran a mostrar una correlación sustantiva con el instrumento total ( p > 0,30 ). Por último, se obtuvo una capacidad discriminativa promedio de 0.28 para el instrumento. Tabla Nº8: Índices de Discriminación para los 45 ítemes del Test del Reloj (Coeficientes de correlación corregidos) Número Item Coef. Pearson Número Item Coef. Pearson 0,14 0,15 Item1 Item16 0,20 0,08 Item2 Item17 0,29 0,34 (*) Item3 Item18 0,18 0,28 Item4 Item19 0,18 0,34 (*) Item5 Item20 0,19 0,34 (*) Item6 Item21 0,29 0,29 Item7 Item22 0,31 (*) 0,35 (*) Item8 Item23 0,38 (*) 0,34 (*) Item9 Item24 0,30 (*) 0,17 Item10 Item25 0,37 (*) 0,38 (*) Item11 Item26 0,34 (*) 0,34 (*) Item12 Item27 0,30 (*) 0,42 (*) Item13 Item28 0,11 0,41 (*) Item14 Item29 0,28 0,45 (*) Item15 Item30 (*) Índices de correlación mayores a 0,30 Número Item Item31 Item32 Item33 Item34 Item35 Item36 Item37 Item38 Item39 Item40 Item41 Item42 Item43 Item44 Item45 Coef. Pearson 0,42 (*) 0,47 (*) 0,38 (*) 0,39 (*) 0,43 (*) 0,40 (*) 0,30 (*) 0,27 0,32 (*) 0,08 0,24 0,16 0,04 0,08 0,09 28 3.3 Análisis de la Confiabilidad del Instrumento El coeficiente de confiabilidad es un índice de la efectividad de un instrumento, en tanto indica el grado en que las diferencias de puntajes entre los sujetos evaluados son producto de sus diferencias reales en el atributo medido. El uso principal de los coeficientes de confiabilidad es comunicar la repetibilidad de los resultados. Actualmente, una de las estimaciones de confiabilidad más usada es la de consistencia interna a través del coeficiente α de Cronbach. Este coeficiente permite obtener además una estimación del error de medición para determinar la variación esperada de cada examinado con respecto a su puntaje real. Se calculó el coeficiente α de Cronbach, que para variables dicotómicas es igual al KuderRichardson (KR20). El coeficiente obtenido para la muestra fue de 0.83, lo que es un muy buen indicador de confiabilidad, ya que de acuerdo a Nunnally (1995) un α>0.80 es aceptable para pruebas ya establecidas, cuando se trabaja con métodos de consistencia interna. Además, se consideró la prueba Q de Cochran (Q=25103.149; Sig.=.000), para evaluar las medias de los ítemes de la prueba, los que resultaron no ser iguales. Al tratarse de variables dicotómicas, esto equivale a decir que los índices de dificultad de los ítemes no son iguales entre sí y que, por lo tanto los ítemes están aportando en capacidad discriminativa para el instrumento total. Asimismo, se encontraron indicadores de confiabilidad aceptables al calcular α de Cronbach tanto para los grupos separados por Sexo, Curso y GSE, como para los 12 subgrupos resultantes del cruce de las variable GSE – Curso (Ver Anexo V). 29 3.4 Determinación de la Unidimensionalidad de los Ítemes Con el fin de evaluar la unidimensionalidad de los ítemes que conforman el Test del Reloj, se llevó a cabo un análisis factorial exploratorio, con extracción de componentes principales y rotación equamax, la cual es una combinación de los métodos varimax y quartimax para minimizar el número de variables con mayor peso en un factor y el número de factores necesarios para explicar la varianza del instrumento total. Los resultados de este análisis dan cuenta de una tendencia a la unidimensionalidad del instrumento. Así, el primer factor explica un 13% de la varianza total del instrumento. Este resultado es relativamente consistente con el 19.4% reportado por Jiménez (2007). Además, cabe señalar que el α de Cronbach también refleja la medida en que un grupo de ítemes mide un sólo constructo latente unidimensional. Así, cuando los datos tienen una estructura multidimensional, el α será bajo. Si se considera que los estudios realizados con el Test del Reloj han presentado consistentemente coeficientes de confiabilidad altos (superiores a 0.80), se podría sugerir que existe evidencia que apuntaría a la unidimensionalidad del instrumento. No obstante lo anterior, los resultados del análisis factorial indican que son necesarios 14 componentes para explicar el 54% de la varianza total del instrumento (Tabla Nº10, consultar Anexo III para más detalles). Por lo tanto, se ha considerado en esta investigación que la evidencia disponible resulta insuficiente para asegurar que este instrumento cumple con el criterio de unidimensionalidad requerido por la Teoría de Respuesta al Ítem. Tabla Nº10: Resultados de Análisis Factorial Exploratorio (Extracto) Component 1 2 3 4 5 6 7 8 9 10 11 12 13 Total 5,826 2,316 1,913 1,722 1,653 1,491 1,407 1,326 1,242 1,171 1,112 1,078 1,050 14 1,042 Initial Eigenvalues % of Variance Cumulative % 12,948 12,948 5,147 18,094 4,251 22,345 3,827 26,171 3,672 29,844 3,314 33,158 3,127 36,285 2,946 39,231 2,759 41,990 2,603 44,592 2,472 47,064 2,396 49,460 2,332 51,793 2,316 54,108 Rotation Sums of Squared Loadings Total % of Variance Cumulative % 2,310 5,133 5,133 2,107 4,683 9,816 2,063 4,584 14,400 2,048 4,552 18,951 2,016 4,481 23,432 1,945 4,323 27,756 1,752 3,894 31,650 1,717 3,816 35,466 1,533 3,407 38,873 1,421 3,157 42,030 1,400 3,110 45,140 1,391 3,092 48,232 1,388 3,084 51,316 1,256 2,792 54,108 30 A continuación, se pueden apreciar los gráficos de sedimentación (Nº2), y de componentes rotados en el espacio (Nº3): Gráfico Nº2: Sedimentación Gráfico Nº3: Componentes Rotados en el Espacio 4. Comparación Estadística del Rendimiento de los Diferentes Grupos en el Test del Reloj: Se realizaron pruebas estadísticas de comparación de medias para determinar la existencia de diferencias entre los subgrupos establecidos a partir de las variables de estratificación de la muestra (Consultar Anexo IV para las salidas completas del software SPSS para estos análisis). A partir de estos resultados se calculan luego las normas de interpretación de puntajes para los grupos que presentan diferencias significativas en sus medias. 31 4.1 Comparación según GSE Para establecer si existían diferencias estadísticamente significativas entre el rendimiento de los sujetos pertenecientes a los 3 grupos socioeconómicos considerados, se realizó un análisis de varianza de una vía (ANOVA). La tabla Nº11.a resume los principales descriptivos de cada grupo. La prueba de Homogeneidad de las Varianzas de Levene indicó que no existía igualdad de varianzas entre los grupos (tabla 11.b), por lo tanto se utilizó el indicador de Brown-Forsythe (tabla 11.c) que confirmó la existencia de diferencias significativas de las medias de los grupos. En este escenario es apropiado utilizar una prueba post-hoc que no asume la igualdad de varianzas como la T2 de Tamhane (tabla 11.d), la cual arrojó que no existían diferencias significativas entre las medias de los grupos medio y alto, pero sí entre éstos y el grupo socioeconómico bajo. En el gráfico Nº4 puede observarse la representación de las medias obtenidas por los tres grupos. Tabla Nº11.a: Estadísticos Descriptivos para cada grupo GSE Bajo Medio Alto Total N Mean 403 418 380 1201 26,49 28,79 29,09 28,11 Tabla Nº11.b: Prueba de Homogeneidad de Varianzas Levene Statistic 8,01 df1 df2 Sig. 2 1198 0,000 Std. Dev. Min 6,02 5,35 4,86 5,56 7 9 15 7 Max 40 37 38 40 Tabla Nº11.c: Prueba Robusta de igualdad de Medias Brown‐ Forsythe Statistic df1 27,48 2 df2 Sig. 1169,1 0,000 Tabla Nº11.d: Prueba Tamahne para comparaciones múltiples (I) GSE Bajo Medio Alto (J) GSE Medio * Alto * Bajo * Alto Bajo * Medio Mean Diff. (I-J) Std. Error Sig. -2,303 -2,600 2,303 -0,297 2,600 0,297 0,398 0,390 0,398 0,361 0,390 0,361 0,000 0,000 0,000 0,795 0,000 0,795 (*) La diferencia de Medias es significativa al nivel .05 32 Gráfico Nº4: Puntajes promedios para los grupos GSE Bajo, Medio y Alto 4.2 Comparación según Curso Con el propósito de establecer si existían diferencias estadísticamente significativas en el rendimiento en el Test del Reloj para los sujetos de primero, segundo, tercer y cuarto año medio, se realizó un análisis de varianza de una vía (ANOVA). Al indicar la prueba de Levene que no existía igualdad de varianza entre los grupos, se utilizó el indicador Brown-Forsythe que mostró diferencias significativas en las medias de los grupos. La prueba T2 de Tamhane indicó que no existían diferencias significativas entre las medias para los grupos 3º y 4º año medio, pero sí entre éstas y las medias de los grupos 1º y 2º año medio; la diferencia fue significativa para 1º respecto de los otros cursos, repitiéndose este resultado para la media de 2º año medio. Las tablas 12.a, 12.b. 12.c y 12.d muestran los resultados del análisis. Además, se presenta el gráfico Nº5 en el que se pueden observar las medias para cada curso. Tabla Nº12.a: Estadísticos Descriptivos para cada grupo GSE N Mean Std. Dev. Min Max 1ºMedio 313 308 293 287 1201 25,67 27,86 29,16 29,97 28,11 6,06 5,64 5,03 4,29 5,56 7 8 10 15 7 38 38 40 39 40 2ºMedio 3ºMedio 4ºMedio Total 33 Tabla Nº12.b: Prueba de Homogeneidad de Varianzas Levene Statistic 12,41 df1 df2 Sig. 3 1197 0,000 Tabla Nº12.c: Prueba Robusta de igualdad de Medias Brown‐ Forsythe Statistic df1 38,02 3 df2 Sig. 1150,7 0,000 Tabla Nº12.d: Prueba Tamahne para comparaciones múltiples (I) curso 1ºMedio 2ºMedio 3ºMedio 4ºMedio (J) curso 2ºM (*) 3ºM (*) 4ºM (*) 1ºM (*) 3ºM (*) 4ºM (*) 1ºM (*) 2ºM (*) 4ºM 1ºM (*) 2ºM (*) 3ºM Mean Diff. (I-J) ‐2,183 ‐3,486 ‐4,295 2,183 ‐1,303 ‐2,111 3,486 1,303 ‐0,808 4,295 2,111 0,808 Std. Error 0,470 0,451 0,426 0,470 0,435 0,409 0,451 0,435 0,388 0,426 0,409 0,388 Sig. 0,000 0,000 0,000 0,000 0,017 0,000 0,000 0,017 0,206 0,000 0,000 0,206 (*) La diferencia de Medias es significativa al nivel .05 Gráfico Nº5: Puntajes promedios para los grupos 1ºM, 2ºM, 3ºM, y 4ºM 34 4.3 Comparación según Sexo Se realizó el procedimiento “Prueba t para comparación de dos muestras independientes” para establecer si existían diferencias estadísticamente significativas para las medias de rendimiento según los sujetos evaluados sean hombres o mujeres. La media para el grupo de hombres fue de 28.0 puntos, con una desviación estándar de 5.58; mientras que la media para el grupo de mujeres fue de 28.20 puntos, con una desviación estándar de 5.54 (Tabla Nº13.a). Por su parte, la prueba de Levene para la igualdad de varianzas arrojó un estadístico F=.012, Sig.=.912; por lo que se puede asumir la igualdad de varianzas entre los grupos. La prueba t arrojó un resultado t= -.626, Sig.=.531 (Tabla Nº13.b). En el gráfico Nº6 pueden apreciarse los promedios obtenidos por ambos grupos. A partir de los resultados de este análisis, se concluyó que no existe diferencia entre las medias de los grupos comparados. Y por tanto, la distinción hombres-mujeres no se consideró al momento de elaborar las normas del instrumento. Tabla Nº13.a: Estadísticos Descriptivos para cada grupo Std. Std. Error N Mean Sexo Dev. Mean Masc. Fem. 552 649 28,00 28,20 5,58 5,54 0,24 0,22 Tabla Nº13.b: Prueba t para muestras independientes Levene's Test for Equality of Variances F Sig. t-test for Equality of Means t df Sig. (2tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Upper Lower 0,012 0,912 ‐0,626 1199 0,531 ‐0,202 0,322 ‐0,626 1165,577 0,532 ‐0,202 0,322 ‐ 0,430 0,833 ‐ 0,430 0,834 35 Gráfico Nº6: Puntajes promedios para los grupos Masculino y Femenino 5. Obtención de Normas La obtención de normas entrega un marco de referencia para la interpretación del puntaje obtenido por un examinado en relación a los puntajes de un grupo normativo. Esto es necesario porque un puntaje aislado carece de significado (Nunnally, 1995). Es necesario que la muestra normativa represente adecuadamente los diversos grupos demográficos presentes en la población de referencia (Op. cit.). Para facilitar la interpretación de los datos, por lo general las normas se entregan en percentiles, que indica el porcentaje de personas ubicadas por sobre un puntaje particular de la muestra normativa; y en puntajes z (promedio 0 y desviación típica 1) que permiten la transformación de los puntajes en otras puntuaciones estandarizadas. De acuerdo con los resultados obtenidos en la comparación del rendimiento de los diferentes grupos, se decidió establecer normas relativas para la muestra total y normas relativas diferenciales para los grupos que arrojaron diferencias significativas entre sus medias. A continuación se entregan la normas relativas para el grupo total, normas diferenciales por G.S.E. y normas diferenciales por Curso (dado que se excluyeron de la muestra los casos con retraso pedagógico, las normas por curso pueden ser interpretadas también como normas por edad). Para todos los casos, las normas están expresadas en puntaje z y percentiles. Además, en el Anexo VIII pueden encontrarse normas diferenciales para el cruce de las variables Curso y G.S.E. 36 NORMAS RELATIVAS PARA EL GRUPO TOTAL PTJE. BRUTO PTJE. Z 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -4,88 -4,70 -4,52 -4,34 -4,16 -3,98 -3,80 -3,62 -3,44 -3,26 -3,08 -2,90 -2,72 -2,54 -2,36 -2,18 -2,00 -1,82 -1,64 -1,46 -1,28 -1,10 -0,92 -0,74 -0,56 -0,38 -0,20 -0,02 0,16 0,34 0,52 0,70 0,88 1,06 1,24 1,42 1,60 1,78 1,96 2,14 2,32 2,50 2,68 2,86 3,04 PERCENTIL --------<1 1 1 1 2 2 2 3 4 5 6 8 10 13 15 18 23 26 32 37 45 54 63 71 79 86 91 95 98 99 > 99 > 99 ------ 37 NORMAS DIFERENCIALES POR G.S.E. NORMAS DIFERENCIALES G.S.E. Bajo NORMAS DIFERENCIALES G.S.E. Medio-Alto PTJE. BRUTO PTJE. Z PERCENTIL PTJE. BRUTO PTJE. Z PERCENTIL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -4,23 -4,07 -3,90 -3,73 -3,57 -3,40 -3,24 -3,07 -2,90 -2,74 -2,57 -2,41 -2,24 -2,07 -1,91 -1,74 -1,57 -1,41 -1,24 -1,08 -0,91 -0,74 -0,58 -0,41 -0,25 -0,08 0,09 0,25 0,42 0,58 0,75 0,92 1,08 1,25 1,41 1,58 1,75 1,91 2,08 2,24 2,41 2,58 2,74 2,91 3,07 -------<1 1 2 2 2 3 4 5 6 7 8 11 13 17 20 23 27 31 35 40 46 55 65 73 80 88 95 97 99 99 > 99 > 99 > 99 ------ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -5,46 -5,26 -5,07 -4,87 -4,67 -4,48 -4,28 -4,09 -3,89 -3,70 -3,50 -3,31 -3,11 -2,92 -2,72 -2,53 -2,33 -2,14 -1,94 -1,74 -1,55 -1,35 -1,16 -0,96 -0,77 -0,57 -0,38 -0,18 0,01 0,21 0,40 0,60 0,79 0,99 1,19 1,38 1,58 1,77 1,97 2,16 2,36 2,55 2,75 2,94 3,14 -----------<1 1 1 1 2 2 3 4 6 7 10 11 14 18 22 27 32 40 48 58 66 75 82 88 93 97 99 > 99 ------- 38 NORMAS DIFERENCIALES POR CURSO-EDAD Normas Diferenciales 1º Medio PTJE. PTJE. Z PERCENTIL BRUTO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -4,07 -3,91 -3,74 -3,58 -3,41 -3,25 -3,08 -2,92 -2,75 -2,59 -2,42 -2,26 -2,09 -1,93 -1,76 -1,60 -1,43 -1,27 -1,10 -0,94 -0,77 -0,61 -0,44 -0,28 -0,11 0,05 0,22 0,38 0,55 0,71 0,88 1,04 1,21 1,37 1,54 1,70 1,87 2,03 2,20 2,36 2,53 2,69 2,86 3,02 3,19 ------<1 1 1 2 3 3 4 5 6 7 8 10 12 14 18 21 25 31 38 44 50 55 65 71 79 84 91 94 97 98 99 > 99 -------- Normas Diferenciales 2º Medio PTJE. PTJE. Z PERCENTIL BRUTO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -4,77 -4,59 -4,41 -4,23 -4,06 -3,88 -3,70 -3,52 -3,35 -3,17 -2,99 -2,81 -2,64 -2,46 -2,28 -2,10 -1,93 -1,75 -1,57 -1,39 -1,22 -1,04 -0,86 -0,68 -0,51 -0,33 -0,15 0,03 0,20 0,38 0,56 0,74 0,91 1,09 1,27 1,44 1,62 1,80 1,98 2,15 2,33 2,51 2,69 2,86 3,04 ---------<1 1 1 1 1 2 3 3 4 7 9 12 17 19 22 26 29 33 39 47 56 65 74 80 85 91 94 97 > 99 -------- Normas Diferenciales 3º - 4º Medio PTJE. PTJE. Z PERCENTIL BRUTO 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -6,08 -5,87 -5,66 -5,44 -5,23 -5,02 -4,81 -4,59 -4,38 -4,17 -3,95 -3,74 -3,53 -3,31 -3,10 -2,89 -2,68 -2,46 -2,25 -2,04 -1,82 -1,61 -1,40 -1,18 -0,97 -0,76 -0,55 -0,33 -0,12 0,09 0,31 0,52 0,73 0,95 1,16 1,37 1,58 1,80 2,01 2,22 2,44 2,65 2,86 3,08 3,29 -----------<1 1 1 1 2 2 2 3 4 5 7 7 9 13 16 21 26 34 43 53 63 72 82 88 94 98 99 > 99 > 99 ------ 39 VI. SÍNTESIS DE PRINCIPALES RESULTADOS Y CONCLUSIONES La presente investigación se inició planteándose como objetivos generales: a) actualizar normas relativas y diferenciales para la interpretación de los resultados obtenidos con el instrumento para la muestra seleccionada; y b) analizar las características psicométricas del test del reloj desde los procedimientos establecidos por la Teoría Clásica de Medición y la Teoría de la Respuesta al Ítem, contrastando los resultados obtenidos con las investigaciones anteriores. Para la consecución de estos objetivos, se obtuvo una muestra compuesta de 1.201 sujetos, procediéndose luego a realizar la caracterización descriptiva de ella. Ésta quedó compuesta por un 54% de mujeres y un 46% de varones. El 26,1% de los casos cursaba 1º medio; el 25,6% se encontraba en 2º medio; en 3º medio se ubicó el 24,4% de los individuos; mientras que el 23,9% estaba cursando 4º medio. En lo referente al grupo socioeconómico de pertenencia, el 31,6% correspondía al GSE Alto; el 48,4% pertenecía al GSE Medio; encontrándose para el GSE Bajo un 34,8%. Se determinó que las diferencias de porcentajes en la composición de los distintos grupos de la muestra no eran significativas (a través de prueba de bondad del ajuste χ2), lo que permitió la comparación de los resultados para los distintos subgrupos y la estimación de la pertinencia de establecer normas diferenciales. De la comparación de los resultados por subgrupos, se determinó que existían diferencias significativas en el rendimiento del Test del Reloj entre los sujetos de la muestra para las variables de estratificación Curso y GSE. A su vez, no se encontraron diferencias estadísticamente significativas para la variable Sexo. Al evaluar las propiedades psicométricas de los ítemes que conforman el Test de Inteligencia del Reloj mediante el análisis estadístico de los resultados, se obtuvo un grado de dificultad promedio de 0,62 para el instrumento; una capacidad discriminativa promedio de 0,33, y un coeficiente de confiabilidad de 0,83; adicionalmente, se evaluó la unidimensionalidad del instrumento a través de un análisis factorial exploratorio, encontrándose 14 factores que explicaban un 54% de la varianza del instrumento. El conjunto de los resultados obtenidos, confirma hallazgos de investigaciones anteriores, pudiéndose concluir que el instrumento presenta adecuados niveles de confiabilidad, validez y discriminación; de manera que puede ser utilizado con propiedad como instrumento de medición colectivo y no verbal de inteligencia general. Respecto de la adecuación del instrumento para su análisis desde la Teoría de Respuesta al Ítem, luego de analizar la literatura disponible y de los procedimientos ejecutados, se estimó que 40 no existen evidencias suficientes para cumplir con el principio de invarianza (propiedad angular de la TRI). Por tanto, se desestimó continuar con los análisis desde esta teoría. En concreto, no se encontraron diferencias significativas en el rendimiento de hombres y mujeres, desestimándose esta característica como variable discriminativa. Por otra parte, se encontró que los sujetos pertenecientes a los grupos socioeconómicos medio y alto no presentan diferencias significativas en su rendimiento intelectual, diferenciándose en conjunto del rendimiento de los sujetos pertenecientes al GSE Bajo. La variable Curso resultó discriminativa, pudiéndose diferenciar claramente 3 subgrupos, a saber, 1º Medio, 2º Medio, y 3º-4º Medio. Este resultado aparece consistente con lo planteado por Salgado y López (1987) respecto a que parece observarse un menor incremento en la curva de desarrollo de la inteligencia a partir de los 16 años de edad. A su vez, Benito y Serrano (1992), siguiendo la línea de Piaget, atribuyen este fenómeno al asentamiento del estadio de las operaciones formales. De acuerdo con estos resultados, se decidió confeccionar normas relativas para el grupo total y normas diferenciales para los grupos GSE Bajo, GSE Medio-Alto, 1º Medio, 2º Medio, 3º-4º Medio, 1º Medio – GSE Bajo, 1º Medio – GSE Medio-Alto, 2º Medio – GSE Bajo, 2º Medio – GSE Medio-Alto, 3º-4º Medio – GSE Bajo y 3º-4º Medio – GSE Medio-Alto. Basándose en los resultados obtenidos en la presente investigación y considerando los reportes de las investigaciones anteriores es factible establecer lo siguiente: (a) la variable sexo no tiene influencia en el rendimiento al evaluar inteligencia general; (b) el rendimiento de los individuos en este tipo de pruebas se ve claramente afectado por el nivel de instrucción y la edad del sujeto, especialmente para la población analizada; y (c) el GSE Bajo tiene peor rendimiento que los GSE Medio y Alto, comportándose estos últimos como un sólo grupo en este tipo de evaluaciones. Los alcances de los resultados obtenidos en la presente investigación se ven limitados, dado que sólo se abarcó a estudiantes de enseñanza media científico-humanista de establecimientos urbanos del Gran Santiago. Esto, así como el hecho de que la muestra obtenida no fue probabilística, hace que las normas establecidas no puedan aplicarse con fiabilidad a otros colectivos como estudiantes de enseñanza media técnico-profesional, o pertenecientes a zonas rurales. Los autores de esta investigación estiman que sería de gran utilidad metodológica, psicométrica y teórica, que futuras investigaciones que se desprendan del presente estudio se planteen avanzar en lo siguiente: (a) la profundización en el estudio de la adecuación del instrumento a los modelos de la TRI; (b) ahondar en la relación curso-edad y rendimiento intelectual para el colectivo estudiado; (c) ampliar las características de la población normativa, 41 incluyendo establecimientos de áreas rurales, así como establecimientos de educación técnicoprofesional para aumentar los alcances y la fiabilidad de las normas establecidas para el colectivo; (d) analizar los ítemes desde una perspectiva más cualitativa5, de manera que la interpretación de los resultados obtenidos en la aplicación del instrumento entregue mayor información acerca de la habilidad de los examinados; (e) reordenar los ítemes de acuerdo a su grado de dificultad y eliminar la puntuación de aquellos ítemes considerados como inductores, para luego realizar un análisis factorial exploratorio que corrobore o descarte la existencia de los 14 factores encontrados en esta oportunidad; (g) estimar la posible agrupación de los ítemes de acuerdo a su descripción cualitativa en factores; y eventualmente (h) considerar la posiblidad de eliminar aquellos ítemes que tengan un coeficiente de correlación inferior al 0.20, de manera de establecer una prueba más breve, pero con ítemes cuya capacidad discriminativa sea significativa y sustantiva. Finalmente, y a partir de lo expuesto, se concluye que los objetivos planteados para la presente investigación han sido alcanzados, habiéndose encontrado resultados altamente consistentes con el reporte de investigaciones anteriores. Además se han proporcionado normas actualizadas para la correcta interpretación de los puntajes obtenidos en la población de la cual se extrajo la muestra. De esta manera, se estima que se ha aportado nueva evidencia empírica que permite considerar al Test del Reloj como un instrumento maduro para su utilización en la evaluación de rendimiento intelectual. 5 En observación a este punto, cabe señalar, por ejemplo, que en las presentaciones matriciales y espirales es claramente visible la dirección de las sucesiones; mientras que en las circulares y elípticas, las coordenadas de comienzo y fin de las sucesiones no resultan evidentes, pudiendo incluso presentarse las sucesiones de forma alternada. 42 REFERENCIAS BIBLIOGRÁFICAS 1. Anastasi, A. (1998) Test psicológicos. México. Prentice Hall. 2. Benito, M. y Serrano, I. (1992). Adaptación del Test de Inteligencia del Reloj de Alejandra Rojo en una muestra de estudiantes de educación científico humanista de la Región Metropolitana. Tesis para optar al título de Psicólogo. Universidad de Chile, Santiago. 3. Briones, G. (2002): Metodología de la Investigación Cuantitativa en Ciencias Sociales. Bogotá, Colombia. ARFO Editores e Impresores Ltda. 4. Cortada de Kohan, N. (1999). Teorías psicométricas y construcción de tests. Buenos Aires. Lugar Editorial. 5. Dussaillant, F. (2003). Técnicas de medición en pruebas de admisión a las universidades. Centro de Estudios Públicos (CEP). 90. 6. Hernández R., Fernández, C. y Baptista, P. (2003) Metodología de la investigación. México. Editorial McGraw-Hill (Orig.1991). 7. Jiménez, F. (2007) Estandarización y Análisis de las Propiedades Psicométricas del Test de Inteligencia del Reloj a partir de la Teoría Clásica de la Medición (TCM) y la Teoría de Respuesta al Ítem (TRI). Tesis para optar al título de Psicólogo. Universidad de Chile, Santiago. 8. Salgado, M. y López, S. (1987) Tipificación del Test de Inteligencia del Reloj de Alejandra Rojo en una muestra de estudiantes de educación media de la Región Metropolitana. Tesis para optar al título de Psicólogo. Universidad de Chile, Santiago. 9. Manzi, J. y San Martín, E. (2003). La necesaria complementariedad entre la Teoría Clásica de la Medición (TCM) y la Teoría de Respuesta al Ítem (TRI). Centro de Estudios Públicos (CEP). 90. 43 10. Nunnally, J. y Bernstein, I. (1995). Teoría Psicométrica. Editorial McGraw-Hill. 11. Prieto, G. y Delgado, A. (2003) Análisis de un test mediante el Modelo de Rasch. Revista Psicothema. 1(15). 94-100. Texto disponible en: http://www.psicothema.com 12. Rodríguez, R. y Torrico, I. (2000) Tipificación del test de Inteligencia del Reloj de Alejandra Rojo para su uso en la selección de personal. Memoria para optar al título de Psicólogo. Universidad de Chile, Santiago. 13. Rojo, A. y Bravo, M. (1974) Experiencia piloto de un nuevo test de inteligencia R-47; una prueba paralela del test D-48. Seminario de Tesis para optar al título de Psicólogo. Universidad de Chile, Santiago. 14. Yela, M. (1991). Inteligencia. Leído el 20 de noviembre del 2008, en Enciclopedia GER, Página Web: http://www.canalsocial.net/GER/ficha_GER.asp?id=11770&cat=sociologia 15. Wenk, E. (2003) Apuntes docentes. Asignatura Metodología Psicométrica. Carrera de Psicología. Universidad de Chile. 16. Wenk, E. (2007). Guía Académica para Proyectos de Investigación: Cuestionario para la Estratificación de Nivel Socioeconómico de Himmel y Colaboradores (1981), Modificado de acuerdo con el criterio de Pinto, Gallardo y Wenk (1991). Carrera de Psicología, Universidad de Chile. ANEXOS ANEXO I Descripción de los Ítemes del Test del Reloj Descripción de los ítemes del Test del Reloj Los ejercicios de ejemplo del Test del Reloj, muestran las formas de presentación de los ejercicios de la prueba1, así como el tipo relación2 que debe ser elucidada para resolver los problemas planteados en los 45 ítems siguientes. A continuación se describen cada uno de los ejercicios (incluidos los ejemplos) presentes en el instrumento3: • Ejemplo A: Esta es una presentación matricial de dos filas por tres columnas, se distinguen claramente dos sucesiones simples independientes de tres términos cada una: la primera es una progresión constante, vale decir, cuyos términos son todos iguales, y sirve de modelo para la resolución de la segunda. • Ejemplo B: Esta es una presentación circular que muestra una sucesión simple constante de seis términos. • Ejemplo C: Presentación matricial de tres por tres, con una sucesión lineal (progresión aritmética creciente: la diferencia tiene signo positivo) de nueve términos, cuya diferencia es 1:00. • Ejemplo D: Presentación espiral, en donde se aprecia una sucesión lineal creciente de siete términos, cuya diferencia es 1:05. • Ítem 1: Presentación matricial en dos filas y tres columnas, de una sucesión simple de seis términos. • Ítem 2: Presentación matricial en dos filas y tres columnas, de una sucesión simple de seis términos. • Ítem 3: Presentación matricial de dos filas y tres columnas, en la que se pueden observar tres sucesiones simples independientes: los primeros términos de cada columna son iguales, cosa que se repite para los segundos términos, cabiendo suponer que se repetiría la situación con los terceros términos. • Ítem 4: Presentación matricial de dos filas por tres columnas. Hay dos sucesiones simples independientes de tres términos cada una, en que los términos de la primera son todos 1 Matricial, circular, espiral o elíptica. Éstas serán sucesiones simples cuando presenten una progresión aritmética constante (es decir, la variación sea igual a cero); lineales cuando las progresiones sean las mismas para todos los términos de las sucesiones (se distinguirá según sean sólo crecientes o decrecientes para ambos componentes del término – horas:minutos – , o bien el sentido sea distinto para horas y minutos); y por último, se entenderá por sucesión alternada aquella en que dos sucesiones independientes (sean éstas lineales o simples) se ubican término por medio en la presentación del ejercicio. 3 Al hablar del número de términos que componen el ejercicio, se incluirá el término que aparece en blanco. 2 iguales, y los dos términos conocidos de la segunda sucesión son distintos a la de la primera pero iguales entre sí. • Ítem 5: Presentación matricial de tres filas por tres columnas, donde se distingue una sucesión lineal de seis términos: progresión aritmética creciente de diferencia 1:00. • Ítem 6: Presentación matricial de dos por tres, de una sucesión lineal en la que la progresión aritmética es decreciente (la diferencia tiene signo negativo= -1:00). • Ítem 7: Presentación matricial de tres filas y tres columnas, que muestra dos sucesiones lineales independientes. Ambas son progresiones aritméticas decrecientes independientescon una diferencia de -0:05. • Ítem 8: Presentación matricial de dos filas por tres columnas. Se está frente a dos sucesiones lineales de tres términos cada una, donde la progresión aritmética es creciente (+1:05), y donde el último término de la primera progresión es el primero de la segunda. • Ítem 9: Presentación matricial de dos filas y tres columnas. Se presentan dos sucesiones lineales independientes de tres términos cada una, donde se observa una progresión decreciente para el primer componente de cada término (-1), mientras que para el segundo componente de cada término la progresión es creciente en +05. • Ítem 10: Presentación matricial en tres filas y tres columnas. Hay tres sucesiones de tres elementos cada una, en donde la sucesión siguiente se forma desplazando el último término de la sucesión anterior hacia el primer lugar y se conserva el orden de los otros dos términos. • Ítem 11: Presentación matricial de tres filas por tres columnas. En estas tres sucesiones de tres términos cada una, la formación de la siguiente se consigue al desplazar el primer término al último lugar, de manera que los términos restantes ocupan, correspondientemente, el lugar precedente al que ocupaban en la sucesión anterior. • Ítem 12: Presentación matricial de tres filas por tres columnas. Estas tres sucesiones de tres términos cada una, ocupan como referencia la sucesión anterior al cambiar al primer lugar el término que ocupaba el último, conservando los términos restantes el orden que poseían. • Ítem 13: Presentación matricial de tres por tres. Tres sucesiones de tres términos cada una, en que la sucesión siguiente resulta de llevar el último término de la primera sucesión al primer lugar de modo que los términos restantes se desplazan en un lugar. • Ítem 14: Presentación circular de una sucesión simple de cinco términos. • Ítem 15: Presentación circular en la que se advierte una sucesión lineal de dos términos (progresión aritmética creciente, cuya diferencia es +2:00), repetida tres veces. • Ítem 16: Presentación circular, donde se muestra una sucesión de dos términos repetidos cuatro veces. • Ítem 17: Presentación circular donde se distinguen tres sucesiones de dos términos cada una, en que el segundo término de cada sucesión mantiene constante el primer elemento del término anterior (hora), mientras que adopta el segundo elemento (minutos) del primer término de la sucesión siguiente. • Ítem 18: Presentación circular, en la que se advierten tres sucesiones independientes de dos términos cada una, donde el segundo término de cada par es el resultado de una progresión creciente de diferencia +1:00 (comenzando en 5:30). • Ítem 19: Presentación circular, en la que se distinguen dos sucesiones de tres términos cada una, donde la segunda sucesión es la repetición de la primera. • Ítem 20: Presentación circular, en la que se advierten dos pares de términos idénticos, siendo la respuesta el término que queda sin su pareja. • Ítem 21: Presentación circular, en la que se distinguen dos pares de términos idénticos y el término faltante corresponde al término que queda sin su pareja. • Ítem 22: Presentación circular de dos sucesiones lineales de tres términos cada una, donde la primera es negativa para horas y minutos en -1:05 y la segunda es negativa para las horas (-1) y positiva para los minutos (+05). Comenzando por 2:20. • Ítem 23: Presentación circular, de tres sucesiones de dos términos cada una, en que ambos son iguales. • Ítem 24: Presentación circular, en la que se presentan dos sucesiones lineales independientes de tres términos cada una, pero ambas positivas de (+ 1:05). Comenzando por 10:20. • Ítem 25: Presentación circular. En este ejercicio se presenta una sucesión en la que las horas son números pares y los minutos varían de diez en diez, por lo que hay que determinar cuál es la hora par que falta y el múltiplo de diez que falta por informar. • Ítem 26: Presentación circular en la que se identifican 2 sucesiones de cuatro términos cada una, las que corresponden a uno de los cuatro cuartos de hora que se puede presentar para esa hora. • Ítem 27: Presentación circular de ocho términos, donde se distinguen 4 pares en los que uno de los términos corresponde a la hora y el otro término a la misma hora con quince minutos. • Ítem 28: Presentación circular de ocho términos. Cuatro pares conformados por las horas pares y sus cuartos. • Ítem 29: Presentación en espiral de una sucesión lineal 7 términos, en donde la progresión aritmética es positiva de (+2:10). • Ítem 30: Presentación en espiral, en la que se muestra una sucesión lineal, en que la progresión aritmética es negativa, e igual a -2:10. • Ítem 31: Presentación en espiral, donde se observa una sucesión lineal de siete términos, siendo la progresión aritmética positiva de +1:00. • Ítem 32: Presentación en espiral, donde se observa una sucesión lineal de siete términos, siendo la progresión aritmética negativa en -1:00. • Ítem 33: Presentación en espiral, donde se observa una sucesión lineal de siete términos, en los que se advierte una progresión aritmética creciente para las horas de +1, mientras que para los minutos es decreciente en – 05 • Ítem 34: Presentación espiral de una sucesión lineal de siete términos, donde para las horas existe una progresión aritmética creciente de +1 y decreciente para los minutos de 05 • Ítem 35: Presentación espiral de una sucesión lineal de siete términos, con una progresión aritmética creciente de +2 para las horas y decreciente para los minutos de -10 • Ítem 36: Presentación en espiral de una sucesión alternada de siete términos, en la que se distingue una progresión aritmética creciente de +4 para el primer componente del término par respecto al impar precedente, y decreciente de -15 para el segundo componente del término par respecto al impar precedente; mientras que el término impar siguiente presenta respecto al término precedente una progresión aritmética decreciente de -3 para las horas y creciente en +20 para los minutos. • Ítem 37: Presentación espiral de una sucesión alternada de siete términos, donde se verifica una progresión aritmética decreciente de -4:05 entre cada término par de la sucesión respecto al impar precedente; mientras que entre el término impar y el término par anterior la progresión aritmética decreciente es -1:20. • Ítem 38: Presentación en espiral de una sucesión alternada de siete términos, en que se observa una progresión aritmética creciente de +6:10 entre cada término par de la sucesión respecto al impar precedente; mientras que entre el término impar y el término par anterior la progresión aritmética creciente es +2:30. • Ítem 39: Presentación en espiral de una sucesión alternada de siete términos, en que se observa una progresión aritmética creciente de -2:05 entre cada término par de la sucesión respecto al impar precedente; mientras que entre el término impar y el término par anterior la progresión aritmética creciente es -1:10. • Ítem 40: Presentación en espiral de una sucesión alternada de siete términos, en que se observa una progresión aritmética creciente de +1:10 entre el segundo término y el primero; mientras que entre el tercer término y el segundo término existe una progresión aritmética creciente de +2:05, lo mismo entre el cuarto y tercer término. Entre el quinto y el cuarto término la progresión es creciente en +1:10, mientras que entre el sexto y el quinto y entre el séptimo y el sexto la progresión creciente toma un valor de +2:05. • Ítem 41: Presentación en elipse de dos sucesiones alternadas de siete términos cada una. En la primera, la progresión creciente tiene un valor (+1:00) y en la segunda es de (+0:05) • Ítem 42: Presentación en elipse de dos sucesiones independientes de seis términos cada una, a partir del reloj ubicado en la parte central superior del ejercicio. En la primera, hacia la derecha, habría una progresión aritmética creciente para los minutos de (+05) y hacia la izquierda se tendría una progresión aritmética negativa con valor (-05) para los mismos. Mientras que para las horas, en ambas direcciones, la diferencia del siguiente término respecto a su precedente tendría los siguientes valores: (-1), (+2), (-3), (-1), (-1), (-1). • Ítem 43: Presentación matricial de tres filas por tres columnas, en la que se distinguen tres sucesiones, donde el tercer término de cada una es el resultado de la suma de los dos anteriores. • Ítem 44: Presentación matricial de tres columnas y tres filas, donde se advierten tres sucesiones en que el tercer término resulta de restar la hora del segundo con el primero y de continuar la progresión aritmética creciente de diferencia +5 para los minutos. • Ítem 45: Presentación matricial de tres por tres. Se observan tres sucesiones, en donde el tercer término se obtiene restando el primer componente (horas) del segundo término con el primer componente del primer término, y sumando los respectivos segundos componentes (minutos). ANEXO II Prueba de Bondad de Ajuste Pruebas no paramétricas Prueba de chi-cuadrado para Bondad de Ajuste Frecuencias subgrupos Fem - 1ºM - GSE Alto Fem - 2ºM - GSE Alto Fem - 3ºM - GSE Alto Fem - 4ºM - GSE Alto Fem - 1ºM - GSE Bajo Fem - 2ºM - GSE Bajo Fem - 3ºM - GSE Bajo Fem - 4ºM - GSE Bajo Fem - 1ºM - GSE Medio Fem - 2ºM - GSE Medio Fem - 3ºM - GSE Medio Fem - 4ºM - GSE Medio Masc - 1ºM - GSE Alto Masc - 2ºM - GSE Alto Masc - 3ºM - GSE Alto Masc - 4ºM - GSE Alto Masc - 1ºM - GSE Bajo Masc - 2ºM - GSE Bajo Masc - 3ºM - GSE Bajo Masc - 4ºM - GSE Bajo Masc - 1ºM - GSE Medio Masc - 2ºM - GSE Medio Masc - 3ºM - GSE Medio Masc - 4ºM - GSE Medio Total N observado 47 54 52 44 59 49 55 55 64 68 57 45 51 44 40 48 47 54 43 41 45 39 46 54 1201 N esperado 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 50,0 Estadísticos de contraste VAR00001 Chi-cuadradoa 25,278 gl 23 Sig. asintót. ,336 a. 0 casillas (,0%) tienen frecuencias esperadas menores que 5. La frecuencia de casilla esperada mínima es 50,0. Residual -3,0 4,0 2,0 -6,0 9,0 -1,0 5,0 5,0 14,0 18,0 7,0 -5,0 1,0 -6,0 -10,0 -2,0 -3,0 4,0 -7,0 -9,0 -5,0 -11,0 -4,0 4,0 ANEXO III Índices de Dificultad de los Ítemes del Test del Reloj Descriptives (Las respuestas a cada ítem fueron codificadas dicotómicamente con 1 para respuestas correctas, y 0 para respuestas incorrectas u omitidas. De esta manera, el cálculo de la media aritmética es equivalente al cálculo de la proporción de respuestas correctas para cada ítem.) Descriptive Statistics Item01 Item02 Item03 Item04 Item05 Item06 Item07 Item08 Item09 Item10 Item11 Item12 Item13 Item14 Item15 Item16 Item17 Item18 Item19 Item20 Item21 Item22 Item23 Item24 Item25 Item26 Item27 Item28 Item29 Item30 Item31 Item32 Item33 Item34 Item35 Item36 Item37 Item38 Item39 Item40 Item41 Item42 Item43 Item44 Item45 Valid N (listwise) N 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 Mean ,94 ,97 ,96 ,85 ,94 ,96 ,91 ,80 ,82 ,90 ,90 ,89 ,94 ,97 ,88 ,37 ,26 ,51 ,94 ,92 ,92 ,48 ,92 ,77 ,07 ,58 ,40 ,51 ,64 ,70 ,88 ,86 ,75 ,82 ,53 ,39 ,15 ,28 ,36 ,20 ,10 ,17 ,01 ,01 ,01 ANEXO IV Índices de Discriminación de los Ítemes del Test del Reloj Coeficientes de Correlación Ítem - Test Cases Valid Excluded Total N 1201 0 1201 % 100,0 ,0 100,0 Item-Total Statistics Item01 Item02 Item03 Item04 Item05 Item06 Item07 Item08 Item09 Item10 Item11 Item12 Item13 Item14 Item15 Item16 Item17 Item18 Item19 Item20 Item21 Item22 Item23 Item24 Item25 Item26 Item27 Item28 Item29 Item30 Item31 Item32 Item33 Item34 Item35 Item36 Item37 Item38 Item39 Item40 Item41 Item42 Item43 Item44 Item45 Scale Mean if Item Deleted 27,17 27,14 27,15 27,26 27,17 27,15 27,20 27,31 27,29 27,21 27,22 27,22 27,17 27,14 27,23 27,75 27,85 27,60 27,17 27,19 27,20 27,63 27,19 27,34 28,04 27,54 27,71 27,60 27,47 27,42 27,24 27,25 27,36 27,29 27,58 27,72 27,96 27,83 27,76 27,91 28,01 27,94 28,10 28,10 28,10 Scale Variance if Item Deleted 30,494 30,460 30,196 30,052 30,374 30,453 29,885 29,359 29,184 29,823 29,566 29,624 30,078 30,648 29,796 29,895 30,334 28,828 30,110 29,808 29,781 29,072 29,800 29,166 30,354 28,622 28,840 28,418 28,566 28,466 29,297 28,995 28,919 29,113 28,365 28,564 29,619 29,361 29,037 30,395 30,025 30,100 30,831 30,812 30,810 Corrected Item-Total Correlation ,137 ,203 ,290 ,184 ,183 ,186 ,289 ,314 ,378 ,303 ,370 ,344 ,301 ,115 ,280 ,145 ,075 ,338 ,279 ,336 ,340 ,292 ,348 ,342 ,165 ,383 ,344 ,417 ,409 ,451 ,415 ,471 ,383 ,394 ,428 ,400 ,298 ,272 ,315 ,078 ,238 ,157 ,037 ,083 ,085 ANEXO V Índices de Confiabilidad para el Test del Reloj Reliability - Confiabilidad para toda la muestra. Case Processing Summary Cases Valid Excluded Total N 1201 0 1201 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,828 N of Items 45 Scale Statistics Mean 28,11 Variance 30,894 Std. Deviation 5,558 N of Items 45 ------------- Reliability - Confiabilidad para Sexo: Masculino Case Processing Summary N Cases Valid Excluded Total 552 0 552 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,826 N of Items 45 Scale Statistics Mean 28,00 Variance 31,149 Std. Deviation 5,581 N of Items 45 Reliability - Confiabilidad para Sexo: Femenino Case Processing Summary N Cases Valid Excluded Total 649 0 649 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,831 N of Items 45 Scale Statistics Mean 28,20 Variance 30,705 Std. Deviation 5,541 N of Items 45 --------------------------- Reliability - Confiabilidad para GSE: Alto Case Processing Summary N Cases Valid Excluded Total 380 0 380 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,782 N of Items 45 Scale Statistics Mean 29,09 Variance 23,626 Std. Deviation 4,861 N of Items 45 Reliability - Confiabilidad para GSE: Medio Case Processing Summary N Cases Valid Excluded Total 418 0 418 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,819 N of Items 45 Scale Statistics Mean 28,79 Variance 28,574 Std. Deviation 5,345 N of Items 45 -------------------------- Reliability - Confiabilidad para GSE: Bajo Case Processing Summary N Cases Valid Excluded Total 403 0 403 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,848 N of Items 45 Scale Statistics Mean 26,49 Variance 36,280 Std. Deviation 6,023 N of Items 45 Reliability - Confiabilidad para Curso: 1º Case Processing Summary N Cases Valid Excluded Total 313 0 313 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,849 N of Items 45 Scale Statistics Mean 25,67 Variance 36,746 Std. Deviation 6,062 N of Items 45 ----------------------------- Reliability - Confiabilidad para Curso: 2º Case Processing Summary N Cases Valid Excluded Total 308 0 308 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,826 N of Items 45 Scale Statistics Mean 27,86 Variance 31,758 Std. Deviation 5,635 N of Items 45 Reliability - Confiabilidad para Curso: 3º Case Processing Summary N Cases Valid Excluded Total 293 0 293 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,800 N of Items 45 Scale Statistics Mean 29,16 Variance 25,313 Std. Deviation 5,031 N of Items 45 -------------------------- Reliability - Confiabilidad para Curso: 4º Case Processing Summary N Cases Valid Excluded Total 287 0 287 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,737 N of Items 45 Scale Statistics Mean 29,97 Variance 18,443 Std. Deviation 4,295 N of Items 45 Reliability - Confiabilidad para GSE: Bajo y Curso: 1º Case Processing Summary N Cases Valid Excluded Total 106 0 106 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,877 N of Items 45 Scale Statistics Mean 22,90 Variance 47,827 Std. Deviation 6,916 N of Items 45 -------------------------- Reliability - Confiabilidad para GSE: Bajo y Curso: 2º Case Processing Summary N Cases Valid Excluded Total 103 0 103 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,790 N of Items 45 Scale Statistics Mean 26,12 Variance 27,731 Std. Deviation 5,266 N of Items 45 Reliability - Confiabilidad para GSE: Bajo y Curso: 3º Case Processing Summary N Cases Valid Excluded Total 98 0 98 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,785 N of Items 45 Scale Statistics Mean 28,67 Variance 22,841 Std. Deviation 4,779 N of Items 45 -------------------------- Reliability - Confiabilidad para GSE: Bajo y Curso: 4º Case Processing Summary N Cases Valid Excluded Total 96 0 96 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,792 N of Items 45 Scale Statistics Mean 28,61 Variance 23,524 Std. Deviation 4,850 N of Items 45 Reliability - Confiabilidad para GSE: Medio y Curso: 1º Case Processing Summary N Cases Valid Excluded Total 109 0 109 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,812 N of Items 45 Scale Statistics Mean 27,21 Variance 28,001 Std. Deviation 5,292 N of Items 45 -------------------------- Reliability - Confiabilidad para GSE: Medio y Curso: 2º Case Processing Summary N Cases Valid Excluded Total 107 0 107 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,838 N of Items 45 Scale Statistics Mean 29,61 Variance 32,618 Std. Deviation 5,711 N of Items 45 Reliability - Confiabilidad para GSE: Medio y Curso: 3º Case Processing Summary N Cases Valid Excluded Total 103 0 103 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,845 N of Items 45 Scale Statistics Mean 28,36 Variance 33,683 Std. Deviation 5,804 N of Items 45 -------------------------- Reliability - Confiabilidad para GSE: Medio y Curso: 4º Case Processing Summary N Cases Valid Excluded Total 99 0 99 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,677 N of Items 45 Scale Statistics Mean 30,09 Variance 14,981 Std. Deviation 3,871 N of Items 45 Reliability - Confiabilidad para GSE: Alto y Curso: 1º Case Processing Summary N Cases Valid Excluded Total 98 0 98 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,764 N of Items 45 Scale Statistics Mean 26,97 Variance 22,463 Std. Deviation 4,740 N of Items 45 -------------------------- Reliability - Confiabilidad para GSE: Alto y Curso: 2º Scale: ALL VARIABLES Case Processing Summary N Cases Valid Excluded Total 98 0 98 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,821 N of Items 45 Scale Statistics Mean 27,78 Variance 29,104 Std. Deviation 5,395 N of Items 45 Reliability - Confiabilidad para GSE: Alto y Curso: 3º Case Processing Summary N Cases Valid Excluded Total 92 0 92 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,692 N of Items 45 Scale Statistics Mean 30,58 Variance 16,115 Std. Deviation 4,014 N of Items 45 -------------------------- Reliability - Confiabilidad para GSE: Alto y Curso: 4º Case Processing Summary N Cases Valid Excluded Total 92 0 92 % 100,0 ,0 100,0 Reliability Statistics Cronbach's Alpha ,660 N of Items 45 Scale Statistics Mean 31,25 Variance 13,662 Std. Deviation 3,696 N of Items 45 ANEXO VI Análisis Factorial Exploratorio del Test del Reloj Factor Analysis Descriptive Statistics Item01 Item02 Item03 Item04 Item05 Item06 Item07 Item08 Item09 Item10 Item11 Item12 Item13 Item14 Item15 Item16 Item17 Item18 Item19 Item20 Item21 Item22 Item23 Item24 Item25 Item26 Item27 Item28 Item29 Item30 Item31 Item32 Item33 Item34 Item35 Item36 Item37 Item38 Item39 Item40 Item41 Item42 Item43 Item44 Item45 Mean ,94 ,97 ,96 ,85 ,94 ,96 ,91 ,80 ,82 ,90 ,90 ,89 ,94 ,97 ,88 ,37 ,26 ,51 ,94 ,92 ,92 ,48 ,92 ,77 ,07 ,58 ,40 ,51 ,64 ,70 ,88 ,86 ,75 ,82 ,53 ,39 ,15 ,28 ,36 ,20 ,10 ,17 ,01 ,01 ,01 Std. Deviation ,230 ,180 ,205 ,355 ,231 ,196 ,292 ,403 ,383 ,297 ,307 ,313 ,231 ,171 ,325 ,482 ,441 ,500 ,237 ,275 ,279 ,500 ,269 ,420 ,259 ,494 ,491 ,500 ,480 ,460 ,331 ,350 ,434 ,384 ,499 ,488 ,355 ,451 ,479 ,398 ,299 ,378 ,118 ,081 ,081 Analysis N 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 1201 Total Variance Explained Initial Eigenvalues Compo % of Cumulative nent Variance % Total 1 5,826 12,948 12,948 2 2,316 5,147 18,094 3 1,913 4,251 22,345 4 1,722 3,827 26,171 5 1,653 3,672 29,844 6 1,491 3,314 33,158 7 1,407 3,127 36,285 8 1,326 2,946 39,231 9 1,242 2,759 41,990 10 1,171 2,603 44,592 11 1,112 2,472 47,064 12 1,078 2,396 49,460 13 1,050 2,332 51,793 14 1,042 2,316 54,108 15 ,998 2,218 56,326 16 ,984 2,186 58,512 17 ,915 2,034 60,546 18 ,894 1,988 62,533 19 ,884 1,965 64,498 20 ,867 1,927 66,426 21 ,831 1,848 68,274 22 ,816 1,814 70,087 23 ,792 1,759 71,846 24 ,761 1,691 73,537 25 ,721 1,602 75,139 26 ,712 1,582 76,721 27 ,701 1,557 78,278 28 ,693 1,541 79,819 29 ,672 1,493 81,312 30 ,664 1,475 82,786 31 ,641 1,424 84,210 32 ,622 1,383 85,593 33 ,609 1,354 86,947 34 ,582 1,293 88,240 35 ,563 1,251 89,491 36 ,556 1,236 90,727 37 ,546 1,213 91,941 38 ,532 1,183 93,124 39 ,520 1,157 94,280 40 ,484 1,076 95,357 41 ,482 1,071 96,428 42 ,457 1,015 97,443 43 ,422 ,938 98,381 44 ,401 ,891 99,271 45 ,328 ,729 100,000 Extraction Method: Principal Component Analysis. Extraction Sums of Squared Loadings % of Cumulative Variance % Total 5,826 12,948 12,948 2,316 5,147 18,094 1,913 4,251 22,345 1,722 3,827 26,171 1,653 3,672 29,844 1,491 3,314 33,158 1,407 3,127 36,285 1,326 2,946 39,231 1,242 2,759 41,990 1,171 2,603 44,592 1,112 2,472 47,064 1,078 2,396 49,460 1,050 2,332 51,793 1,042 2,316 54,108 Total Variance Explained Rotation Sums of Squared Loadings % of Cumulative Variance % Total 2,310 5,133 5,133 2,107 4,683 9,816 2,063 4,584 14,400 2,048 4,552 18,951 2,016 4,481 23,432 1,945 4,323 27,756 1,752 3,894 31,650 1,717 3,816 35,466 1,533 3,407 38,873 1,421 3,157 42,030 1,400 3,110 45,140 1,391 3,092 48,232 1,388 3,084 51,316 1,256 2,792 54,108 Compo nent 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 Extraction Method: Principal Component Analysis. Scree Plot 6 5 Eigenvalue 4 3 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 Component Number Component Plot in Rotated Space 1,0 Item27 Component 2 Item26 Item28 Item13 Item25Item16 Item04 Item03 Item33 Item05Item01 Item32 Item37 Item31 Item02 Item38 Item40Item06Item34 0,5 0,0 Item39 -0,5 -1,0 -1,0 -0,5 0,0 0,5 Compone nt 1 1,0 1,0 0,5 0,0 po Com -0,5 nent -1,0 3 ANEXO VII Análisis de Diferencias de Medias entre Grupos Oneway - Análisis de Diferencias de Medias entre los Grupos GSE Bajo, GSE Medio, y GSE Alto Descriptives Ptje. Total N 1 2 3 Total Mean 26,49 28,79 29,09 28,11 403 418 380 1201 Std. Deviation 6,023 5,345 4,861 5,558 Std. Error ,300 ,261 ,249 ,160 95% Confidence Interval for Mean Lower Bound Upper Bound 25,90 27,08 28,28 29,30 28,60 29,58 27,80 28,43 Descriptives Ptje. Total Minimum 7 9 15 7 1 2 3 Total Maximum 40 37 38 40 Test of Homogeneity of Variances Ptje. Total Levene Statistic 8,013 df1 2 df2 1198 Sig. ,000 ANOVA Ptje. Total Between Groups Within Groups Total Sum of Squares 1617,989 35454,283 37072,271 df 2 1198 1200 Mean Square 808,994 29,595 F 27,336 Robust Tests of Equality of Means Ptje. Total Statistica Brown-Forsythe 27,477 a. Asymptotically F distributed. df1 2 df2 1169,090 Sig. ,000 Sig. ,000 Post Hoc Tests Multiple Comparisons Dependent Variable: Ptje. Total Tamhane Mean Difference (I-J) (I) GSE (J) GSE Std. Error 1 2 -2,303* ,398 3 -2,600* ,390 2 1 2,303* ,398 3 -,297 ,361 3 1 2,600* ,390 2 ,297 ,361 *. The mean difference is significant at the .05 level. Sig. ,000 ,000 ,000 ,795 ,000 ,795 95% Confidence Interval Lower Bound Upper Bound -3,26 -1,35 -3,53 -1,67 1,35 3,26 -1,16 ,57 1,67 3,53 -,57 1,16 Means Plots Mean of Ptje. Total 29 28 27 26 Bajo Medio GSE Alto Oneway - Análisis de Diferencias de Medias entre los Grupos 1º Medio, 2º Medio, 3º Medio, y 4º Medio Descriptives Ptje. Total N 1 2 3 4 Total Mean 25,67 27,86 29,16 29,97 28,11 313 308 293 287 1201 Std. Deviation 6,062 5,635 5,031 4,295 5,558 Std. Error ,343 ,321 ,294 ,253 ,160 95% Confidence Interval for Mean Lower Bound Upper Bound 25,00 26,35 27,23 28,49 28,58 29,74 29,47 30,47 27,80 28,43 Descriptives Ptje. Total Minimum 7 8 10 15 7 1 2 3 4 Total Maximum 38 38 40 39 40 Test of Homogeneity of Variances Ptje. Total Levene Statistic 12,415 df1 3 df2 1197 Sig. ,000 ANOVA Ptje. Total Between Groups Within Groups Total Sum of Squares 3191,618 33880,653 37072,271 df 3 1197 1200 Mean Square 1063,873 28,305 F 37,587 Robust Tests of Equality of Means Ptje. Total Statistica Brown-Forsythe 38,015 a. Asymptotically F distributed. df1 3 df2 1150,741 Sig. ,000 Sig. ,000 Post Hoc Tests Multiple Comparisons Dependent Variable: Ptje. Total Tamhane Mean Difference (I-J) (I) curso (J) curso Std. Error 1 2 -2,183* ,470 3 -3,486* ,451 4 -4,295* ,426 2 1 2,183* ,470 3 -1,303* ,435 4 -2,111* ,409 3 1 3,486* ,451 2 1,303* ,435 4 -,808 ,388 4 1 4,295* ,426 2 2,111* ,409 3 ,808 ,388 *. The mean difference is significant at the .05 level. Sig. ,000 ,000 ,000 ,000 ,017 ,000 ,000 ,017 ,206 ,000 ,000 ,206 95% Confidence Interval Lower Bound Upper Bound -3,42 -,94 -4,68 -2,29 -5,42 -3,17 ,94 3,42 -2,45 -,15 -3,19 -1,03 2,29 4,68 ,15 2,45 -1,83 ,22 3,17 5,42 1,03 3,19 -,22 1,83 Means Plots 30 Mean of Ptje. Total 29 28 27 26 25 1 2 3 curso 4 T-Test - Análisis de Diferencias de Medias entre los Grupos Masculino y Femenino Group Statistics Ptje. Total sexo M F N 552 649 Mean 28,00 28,20 Std. Deviation 5,581 5,541 Std. Error Mean ,238 ,218 Independent Samples Test Levene's Test for Equality of Variances Ptje. Total Equal variances assumed Equal variances not assumed t-test for Equality of Means df Sig. (2-taile d) Mean Differenc e Std. Error Differe nce F Sig. t ,012 ,912 -,626 1199 ,531 -,202 ,322 -,833 ,430 -,626 1165,6 ,532 -,202 ,322 -,834 ,430 Means Plots 30 29,5 Mean of Ptje. Total 95% Confidence Interval of the Difference Lower Upper 29 28,5 28 27,5 27 Masculino Femenino sexo ANEXO VIII Normas Diferenciales por Subgrupos NORMAS DIFERENCIALES PARA 1º MEDIO SEGÚN G.S.E. NORMAS DIFERENCIALES 1ºM - GSE BAJO NORMAS DIFERENCIALES 1ºM - GSE MEDIO-ALTO PTJE. BRUTO PTJE. Z PERCENTIL PTJE. BRUTO PTJE. Z PERCENTIL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -3,17 -3,02 -2,88 -2,73 -2,59 -2,44 -2,30 -2,15 -2,01 -1,86 -1,72 -1,58 -1,43 -1,29 -1,14 -1,00 -0,85 -0,71 -0,56 -0,42 -0,27 -0,13 0,02 0,16 0,30 0,45 0,59 0,74 0,88 1,03 1,17 1,32 1,46 1,61 1,75 1,89 2,04 2,18 2,33 2,47 2,62 2,76 2,91 3,05 3,20 ------<2 2 4 6 7 8 10 12 15 16 18 22 26 28 33 35 41 49 54 62 68 70 78 82 90 92 97 99 99 > 99 > 99 > 99 -------- 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -5,19 -4,99 -4,79 -4,59 -4,40 -4,20 -4,00 -3,80 -3,60 -3,40 -3,20 -3,00 -2,80 -2,61 -2,41 -2,21 -2,01 -1,81 -1,61 -1,41 -1,21 -1,01 -0,81 -0,62 -0,42 -0,22 -0,02 0,18 0,38 0,58 0,78 0,98 1,17 1,37 1,57 1,77 1,97 2,17 2,37 2,57 2,77 2,96 3,16 3,36 3,56 -----------<1 1 1 1 2 3 4 5 7 10 15 17 22 29 35 42 48 59 67 74 80 88 92 96 98 99 > 99 -------- 2 NORMAS DIFERENCIALES PARA 2º MEDIO SEGÚN G.S.E. NORMAS DIFERENCIALES 2ºM - GSE BAJO NORMAS DIFERENCIALES 2ºM - GSE MEDIO-ALTO PTJE. BRUTO PTJE. Z PERCENTIL PTJE. BRUTO PTJE. Z PERCENTIL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -4,77 -4,58 -4,39 -4,20 -4,01 -3,82 -3,63 -3,44 -3,25 -3,06 -2,87 -2,68 -2,49 -2,30 -2,11 -1,92 -1,73 -1,54 -1,35 -1,16 -0,97 -0,78 -0,59 -0,40 -0,21 -0,02 0,17 0,36 0,55 0,74 0,93 1,12 1,31 1,50 1,69 1,88 2,07 2,26 2,45 2,64 2,83 3,02 3,21 3,40 3,59 --------<1 1 1 1 2 2 3 3 4 5 8 12 18 24 26 28 32 34 39 49 62 75 81 92 96 97 98 > 98 ---------- 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -4,93 -4,75 -4,58 -4,40 -4,22 -4,04 -3,86 -3,69 -3,51 -3,33 -3,15 -2,98 -2,80 -2,62 -2,44 -2,26 -2,09 -1,91 -1,73 -1,55 -1,37 -1,20 -1,02 -0,84 -0,66 -0,49 -0,31 -0,13 0,05 0,23 0,40 0,58 0,76 0,94 1,11 1,29 1,47 1,65 1,83 2,00 2,18 2,36 2,54 2,71 2,89 -------------<1 1 2 2 4 6 7 10 14 16 19 23 26 30 34 39 48 58 65 73 79 87 91 95 > 95 -------- 3 NORMAS DIFERENCIALES PARA 3º Y 4º MEDIO SEGÚN G.S.E Normas Diferenciales 3º-4ºM - GSE BAJO Normas Diferenciales 3º-4ºM - GSE MEDIO-ALTO PTJE. BRUTO PTJE. Z PERCENTIL PTJE. BRUTO PTJE. Z PERCENTIL 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -5,76 -5,55 -5,34 -5,13 -4,92 -4,72 -4,51 -4,30 -4,09 -3,88 -3,67 -3,47 -3,26 -3,05 -2,84 -2,63 -2,42 -2,22 -2,01 -1,80 -1,59 -1,38 -1,18 -0,97 -0,76 -0,55 -0,34 -0,13 0,07 0,28 0,49 0,70 0,91 1,12 1,32 1,53 1,74 1,95 2,16 2,36 2,57 2,78 2,99 3,20 3,41 --------------<2 2 3 3 4 6 8 10 12 15 18 21 26 31 40 52 61 67 79 92 95 97 98 99 99 > 99 ------ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 -6,34 -6,12 -5,90 -5,68 -5,47 -5,25 -5,03 -4,81 -4,59 -4,37 -4,16 -3,94 -3,72 -3,50 -3,28 -3,06 -2,84 -2,63 -2,41 -2,19 -1,97 -1,75 -1,53 -1,32 -1,10 -0,88 -0,66 -0,44 -0,22 0,00 0,21 0,43 0,65 0,87 1,09 1,31 1,52 1,74 1,96 2,18 2,40 2,62 2,84 3,05 3,27 -----------<1 1 1 1 2 2 2 3 4 4 5 5 6 10 13 18 23 31 39 50 61 69 78 84 92 97 99 > 99 -------