Capacidad de discriminación de las preguntas de un examen escrito

94 Rev. agron. noroeste argent. (2014) 34 (2): 94-96 ISSN 0080-2069 (impresa) ISSN 2314-369X (en línea) Capacidad de discriminación de las preguntas de un examen escrito F. A. Rosales* Facultad de Agronomía y Zootecnia. Universidad Nacional de Tucumán. Avenida Néstor Kirchner 1900. 4000 San Miguel de Tucumán, Argentina. * Autor de correspondencia: [email protected] Palabras claves: preguntas escritas, discriminar, conocimiento Las calificaciones o mediciones que proporcionan las evaluaciones (exámenes), como cualquier medición tiene error, pero las decisiones que se toman a partir de la puntuación otorgada, debe obligar a cuantificar su ineludible existencia. El docente debe por lo tanto, estar capacitado para conocer la precisión de las medidas proporcionadas por sus exámenes. La precisión de un instrumento de medición se expresa comparando la lectura obtenida, respecto a un metro, kg, segundo etc, exacto. Sin embargo eso no es posible en los exámenes, por la inexistencia del valor exacto al cual referirlo o compararlo. Según Morales (2012) una de las formas de aumentar la precisión es con la repetición (número de preguntas). A partir de esto, puede buscarse conocer la cuantía en el conocimiento de una sola persona, la comparación de conocimientos entre los integrantes del grupo o ambas. Las evaluaciones tienen estrecha relación con los docentes y alumnos. Con los profesores a través de: objetivos perseguidos, contenidos, criterios de evaluación, procedimientos de análisis y calificación de las respuestas. Con los alumnos pues parte de lo que el alumno estudia, depende del tipo de preguntas y examen que el espera. El objetivo necesario y buscado es entonces discriminar entre los que saben, los que no y los ayudados por el azar. Para lograrlo, Muñiz (1998) concluye en que deben realizarse pruebas o exámenes objetivos, con preguntas con respuestas múltiples. Para Case y Swanson (1998) el uso de preguntas con respuestas múltiples tiene ventajas y desventajas; entre las ventajas están que: evita lo tedioso de corregir “preguntas abiertas” y la tarea se “vuelve” mecánica, simple, objetiva y hasta delegable. Entre las desventajas: se necesita redactar buenas preguntas, planificar o discernir los temas a evaluar (es más fácil o hay más preguntas de lo que es fácil preguntar y no más preguntas de lo verdaderamente importante o de lo que se debe saber) y el criterio de clasificación (memoria, comprensión, interpretación, uso de la información, todo junto). La idea más seguida por los docentes para conocer si la pregunta es de mala calidad es tomar todos o parte de los exámenes con mayor puntuación y marcar las preguntas sin respuestas pues a ellas se les asigna estar mal redactadas o que no se entregó información suficiente. Técnicamente, las pruebas o exámenes tienen un grado de fiabilidad. Para Wikipedia la fiabilidad hace referencia a la ausencia de errores de medida en la evaluación. Para conocerla con profundidad y precisión, se puede usar el “coeficiente de fiabilidad”, ya que expresa la probabilidad de que cada alumno se ubique en el lugar de la escala que le corresponde. También existe el “coeficiente de discriminación”, el “error típico” de un examen (indica el margen de oscilación en la puntuación obtenida que se puede atribuir al azar) y otros. En el presente trabajo se analizará la capacidad de las preguntas a través de las respuestas en exámenes escritos, para identificar las fuentes de error en la medición, relacionadas con la tarea docente y mejorar la calidad de los exámenes. El examen considerado tenía 20 preguntas. La población de alumnos del ensayo fue una de las comisiones cursando Mecanización Agrícola compuesta de 80 alumnos. Para el análisis de los resultados se formaron tres grupos de alumnos: los que su puntuación fue de siete o más; los que su calificación fue menor a cuatro y los que obtuvieron entre cuatro y siete puntos. En el muestreo se consideran sólo a dos de los grupos: el con mayor y el con menor puntuación. De cada uno de ellos fueron tomados 20 individuos. Serán denominados: “grupo de puntuación superior” y “grupo de puntuación inferior”. El análisis más simple consiste en las medias o promedios estadísticos. El primer promedio buscado fue el de respuestas correctas en toda la muestra y en cada uno de los grupos. Los integrantes del grupo de puntuación superior tuvieron un total de 278 respuestas correctas, con lo que el promedio para cada participante fue de 14 respuestas correctas sobre 20 preguntas. Los integrantes del grupo de pun- Recibido 06/08/14; Aceptado 06/10/14; Publicado en línea 03/11/14. Rev. agron. noroeste argent. (2014) 34 (2): 94-96 ISSN 0080-2069 (impresa) ISSN 2314-369X (en línea) 95 Tabla 1. Cantidad de respuestas correctas, capacidad de discriminación e índice de dificultad para cada pregunta. Tabla 2. Índices de discriminación tuación inferior tuvieron un total de 141 respuestas correctas, con lo que el promedio fue de siete respuestas correctas sobre 20 preguntas. El total de respuestas correctas de los dos grupos fue 419, con un promedio de 10,5 respuestas correctas de cada participante. Estos valores o proporciones son usados para definir otras variables. Así se define el índice de dificultad del examen como el cociente entre el promedio de respuestas correctas y el número de preguntas del examen. Para los dos grupos (cuarenta exámenes): Índice de dificultad del examen= Promedio respuestas correctas/Número de preguntas del examen = 10,5/20 = 0.52. Puede determinarse el índice de dificultad para el grupo superior (0,7) y para el grupo inferior (0,35). Su valor aun expresado como porcentaje, no es más que la proporción de respuestas correctas de cada grupo: superior (14/20), inferior (7/20) y total (10,5/20). Queda claro que la denominación de índice de dificultad no guarda relación con lo que expresa, pues el grupo de puntuación superior posee un mayor valor numérico del índice. También se definió el índice de discriminación del examen (IDiE) como el cociente de la diferencia entre la puntuación más alta y la más baja obtenidas respecto al número de preguntas. Índice de discriminación del examen = Puntuación alta – Puntuación baja / Número de preguntas del examen. Su valor es; (15,5 – 5,1) / 20 = 0,45. Este índice marca la diferencia entre el individuo que más sabía y el que menos sabía en las preguntas del examen; marca que esa diferencia fue de casi la mitad del total de preguntas. Otro análisis simple, consiste en considerar cada pregunta en forma individual dentro de cada grupo, consignando las respuestas correctas de los individuos en cada combinación de ellas. En la Tabla 1A se muestra la población de datos. Las columnas están asignadas al número de la pregunta (1 hasta 20) y las filas están asignadas a cada grupo. En la fila superior se lee entonces la cantidad de respuestas correctas obtenidas para cada pregunta en el grupo de puntuación más alta y en la fila inferior al grupo de puntuación más baja. Si se asigna la condición de “pregunta fácil” a aquella con más de 50 % de respuestas correctas, para el grupo con mayor puntuación, 17 tuvieron esa condición y sólo tres preguntas fueron difíciles: 7, 11 y 20. Para el grupo con menor puntuación, la situación fue la inversa: sólo hubo cuatro preguntas fáciles: 6, 13, 17 y 19. Los dos grupos tienen en común que las preguntas 7, 11 y 20 no fueron respondidas; mientras las preguntas 6, 13, 17 y 19 tuvieron respuesta correcta en la mayoría de sus integrantes. Estos dos “grupos” de preguntas, constituyen el 35% de las preguntas del examen o lo que es igual el 35% de las preguntas del examen, fueron muy fáciles o muy difíciles. Se concluye en que ninguna de ellas cumple la función de discriminar a los alumnos por su conocimiento, unas por fáciles (las contestan todos) y las otras por difíciles (no las contesta nadie). En la Tabla N° 1B se muestran coloreadas las respuestas a las preguntas capaces de discriminar a los individuos por su conocimiento. Las preguntas 4, 96 Rev. agron. noroeste argent. (2014) 34 (2): 94-96 8, 9, 10, 12, 14, 16 y 18 son aquellas en las que, el número de respuestas en el grupo de la fila superior (los de mayor puntuación) es por lo menos el doble de las respuestas correctas de la fila con puntuación inferior, ellas constituyen el 40 % del examen. En las preguntas 1, 2, 3 y 5 el número de respuestas correctas en la fila superior es muy próximo a ser el doble de las de fila inferior. Así como en el análisis del examen se mostró su índice de dificultad y su índice de discriminación, para el análisis de las preguntas en forma individual también están definidos. El índice de dificultad para una pregunta, se define como el cociente entre la suma de los aciertos de los dos grupos y el total de individuos de la muestra. En la Tabla N° 1C se presentan sus valores. En las columnas se encuentran los valores que corresponden a cada pregunta, las cuales se numeran en la fila uno. La fila dos tiene la cantidad total de aciertos. La tercera fila muestra el índice de dificultad de cada pregunta. Sus valores van de cero a uno, cuan más alto su valor la respuesta es más fácil, los más altos corresponden a las preguntas 6, 13, 17 y 19 tal como se había marcado en la Tabla N° 1A. El índice de discriminación para cada pregunta, se define como la diferencia entre el número de aciertos para el grupo superior y el número de aciertos para el grupo inferior. Índice de discriminación por pregunta = Número aciertos superior / Número de individuos – Número de aciertos inferior / Número de individuos. Como el denominador es el mismo, la ecuación queda como el cociente entre la diferencia de aciertos de los dos grupos, sobre el número de individuos del grupo. En la Tabla N° 2A se muestran sus valores. Índice de discriminación por pregunta = Número aciertos superior – Número aciertos inferior / número individuos. Índice de discriminación pregunta uno = 17,5 – 9,5 / 20. Sus valores oscilan entre uno y menos uno. Para el caso de que “todos” respondan correctamente o incorrectamente el índice vale cero. Si responden correctamente solamente todos los del grupo superior el índice vale uno. Si responden correctamente solamente todos los del grupo inferior el índice vale menos uno. Una pregunta que discrimina mucho es aquella en la que, las respuestas correctas se dan solamente y en todos los individuos del grupo superior. Si son contestadas sólo por los del grupo inferior su valor será próximo a – 1 (menos uno) e indica que la pregunta debe ser revisada pues esta mal formulada o tiene la existencia de un error que induce a los que no saben a tomarla como correcta. Existe otro índice de discriminación que expresa la proporción de ISSN 0080-2069 (impresa) ISSN 2314-369X (en línea) aciertos del grupo superior respecto al total de aciertos. Se lo denominará índice de discriminación 2; Índice de discriminación dos por pregunta = Número de aciertos superior / Número aciertos superior + Número aciertos inferior. En la Tabla N° 2B se presentan sus valores y se colorean los registros más altos. Se considera que cuando el índice vale 1 (uno) o cuanto más cerca de 1 (uno) este su valor, la discriminación de la pregunta es perfecta. Las curiosidades de los valores numéricos se aprecian en las preguntas número 6 (seis) y 7 (siete). Sin embargo, es muy importante el número de acertantes que tiene la pregunta y que todos sean del grupo superior. En otras palabras el valor del índice será siempre 1 (uno), sin importar el número de acertantes, mientras pertenezcan todos al grupo superior. Pero, el valor de 1 (uno) en el índice, será muy válido mientras el número de acertantes no sea inferior a la mitad de los integrantes del grupo superior. Estos índices transforman en números lo sucedido en el examen, no aportan información sobre la calidad de sus preguntas. El análisis cualitativo de las preguntas se pone de manifiesto por ejemplo en las preguntas 11 y 20, las cuales miden la capacidad de aplicar una información (no la memoria) y cuyos resultados son muy magros. Muchas veces los docentes se dejan tentar por un bajo índice de discriminación de una pregunta, reemplazándola. Sin embargo debe tenerse presente que ningún análisis de resultados puede reemplazar a la cuidadosa elaboración de una pregunta. Puede concluirse que en este examen el 40 % de sus preguntas tienen la capacidad de discriminar a los alumnos por su conocimiento. El 35 % de sus preguntas no tienen la capacidad de discriminar por el conocimiento. Referencias bibliográficas Case S., Swanson M. (1998). Como elaborar preguntas para evaluaciones escritas en el área de ciencias básicas y clínicas. Market. Philadelphia. p 182 Morales P. (2012). Análisis de ítems de pruebas objetivas. http://web.upcomillas.es /personal/otrosdocumentos/analisisitemspruebasobjetivas.pdf Muñiz J. (1998). Teoría Clásica de los tests. Pirámide. Madrid p 242 www.es.wikipedia.org

Capacidad de discriminación de las preguntas de un examen escrito

Documentos relacionados

Productos

Apoyo

Capacidad de discriminación de las preguntas de un examen escrito

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib