Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Radiología. 2013;55(S1):S28---S36 www.elsevier.es/rx ARTÍCULO ESPECIAL Formación continuada. Cómo redactar preguntas con opciones de respuesta múltiple R. Soler Fernández, C. Méndez Díaz y E. Rodríguez García ∗ Servicio de Radiología, Complejo Hospitalario Universitario, A Coruña, España Recibido el 23 de junio de 2012; aceptado el 3 de enero de 2013 Disponible en Internet el 9 de marzo de 2013 PALABRAS CLAVE Evaluación; Formación; Certificación; Formación médica continuada KEYWORDS Evaluation; Education; Certification; Continuing medical education ∗ Resumen La evaluación de la competencia profesional en medicina es una tarea difícil pero indispensable porque permite, en diferentes momentos y desde distintas perspectivas, valorar en qué medida se han adquirido los conocimientos, habilidades, actitudes y valores necesarios para el ejercicio profesional. Las pruebas basadas en preguntas de opciones múltiples han sido y son, una de las herramientas más útiles y utilizadas para evaluar de forma objetiva el aprendizaje en medicina. Cuando están bien diseñadas y se aplican de forma correcta, además de estimular el aprendizaje, pueden incluso medir habilidades cognitivas superiores. Redactar un cuestionario de preguntas con opciones de respuesta múltiple es una tarea difícil que requiere conocimientos sobre la materia que se ha de valorar, aprendizaje de una metodología y tiempo para su elaboración. El objetivo de este trabajo es revisar lo que las preguntas de opciones múltiples pueden evaluar, las reglas y normas que deben tenerse en cuenta para su redacción, los distintos formatos que pueden utilizarse, los errores más frecuentes que suelen cometerse en su elaboración y como analizar los resultados de los exámenes para poder verificar su calidad. © 2012 SERAM. Publicado por Elsevier España, S.L. Todos los derechos reservados. Continuing medical education: How to write multiple choice questions Abstract Evaluating professional competence in medicine is a difficult but indispensable task because it makes it possible to evaluate, at different times and from different perspectives, the extent to which the knowledge, skills, and values required for exercising the profession have been acquired. Tests based on multiple choice questions have been and continue to be among the most useful tools for objectively evaluating learning in medicine. When these tests are well designed and correctly used, they can stimulate learning and even measure higher cognitive skills. Designing a multiple choice test is a difficult task that requires knowledge of the material to be tested and of the methodology of test preparation as well as time to prepare the test. Autor para correspondencia. Correo electrónico: [email protected] (E. Rodríguez García). 0033-8338/$ – see front matter © 2012 SERAM. Publicado por Elsevier España, S.L. Todos los derechos reservados. http://dx.doi.org/10.1016/j.rx.2013.01.001 Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Formación continuada. Cómo redactar preguntas con opciones de respuesta múltiple S29 The aim of this article is to review what can be evaluated through multiple choice tests, the rules and guidelines that should be taken into account when writing multiple choice questions, the different formats that can be used, the most common errors in elaborating multiple choice tests, and how to analyze the results of the test to verify its quality. © 2012 SERAM. Published by Elsevier España, S.L. All rights reserved. Introducción La medicina es una ciencia extensa y compleja, cuya enseñanza y aprendizaje representan un reto en todas las etapas formativas. La evaluación del proceso de aprendizaje es un aspecto fundamental para conocer si se han alcanzado los objetivos de cada fase formativa. El estudiante de medicina o el especialista en formación debe adquirir, además de un elevado volumen de información médica, las habilidades y valores establecidos para el ejercicio de su profesión, la capacidad para pensar de manera crítica, para educar, y la habilidad para comunicarse claramente. Todo ello con sentido humanista y social. Si se consideran esos objetivos educacionales, el médico debe ser educado y evaluado como clínico, como científico, como humanista y como docente1 . La evaluación es una etapa del proceso de aprendizaje que tiene como finalidad comprobar de manera sistemática los resultados obtenidos en relación con unos objetivos especificados con antelación. Las pruebas constituidas por preguntas con opciones de respuesta múltiple (POM) han sido y son los instrumentos más frecuentemente utilizados a lo largo de la educación médica para evaluar formalmente el aprendizaje y el progreso académico de los alumnos de licenciatura y de posgrado; también se utilizan en los exámenes profesionales, de ingreso a las residencias médicas, y de certificación y recertificación1,2 . La gran aceptación de las POM para la evaluación del conocimiento médico se debe, entre otros motivos, a la posibilidad que este método proporciona de plantear un número elevado de preguntas y así abarcar el mayor número de temas tratados en la disciplina, plan de estudios o período formativo que se quiere evaluar. La mayoría de los autores también acepta que cuando las preguntas son pertinentes, están claramente escritas y bien construidas, son útiles para medir procesos cognitivos superiores, como interpretación, síntesis y aplicación del conocimiento, y que estos exámenes son válidos, discriminatorios, económicos y fiables2---4 . De hecho, la fiabilidad es la cualidad principal, y más ampliamente aceptada, de los exámenes de opción múltiple. Además, las POM se pueden aplicar en un tiempo relativamente corto, pueden ser analizadas de forma rápida y objetiva tanto de forma manual mediante el uso de plantillas, etc. como mediante análisis por ordenador que, además, puede servir como almacén de preguntas5 . Todas estas características facilitan que las POM se puedan aplicar simultáneamente a un número alto de estudiantes. Los sistemas de certificación y recertificación de varios países europeos, así como el conocido sistema de EE. UU., el American Board of Radiology, utilizan módulos de autoevaluación basados en las POM. El examen de médicos internos residentes (MIR) es el ejemplo por antonomasia de las POM en España, pero cada vez con mayor frecuencia, esta forma de evaluación se utiliza también en la formación de la especialidad y en la formación continuada de los especialistas. Algunas revistas radiológicas, como Radiología y Radiographics, incorporan cuestionarios con las POM relacionadas con artículos de revisión que permiten a los radiólogos comprobar el nivel de conocimientos adquiridos. Además, esta herramienta se utiliza cada vez con más frecuencia en cursos y congresos presenciales, cursos on-line y cursos de formación en los servicios, para estimular la atención y comprobar los conocimientos adquiridos. Todo esto ha generado mayores requerimientos de los docentes médicos y mayor entrenamiento y conocimientos metodológicos en la redacción de las POM2,6 . Redactar una prueba de POM es una tarea difícil que consume tiempo, incluso para personas entrenadas y habituadas a hacerlo. El primer aspecto a considerar cuando se va a elaborar una POM es que el redactor del cuestionario debe conocer en profundidad el tema a evaluar, así que la correcta redacción de una POM es una verdadera «puesta al día» de esa área del conocimiento y un gran ejercicio intelectual que incrementa los conocimientos del redactor. Los principios y normas de redacción de las pruebas de POM están bien documentados; sin embargo, son frecuentes las interpretaciones erróneas y las alteraciones de estos principios5,6 . En este artículo se revisan las normas generales para la elaboración de exámenes con las POM, los errores que deben evitarse, los formatos más frecuentes y útiles, y como analizar la calidad de los exámenes. Lo que las preguntas de opción múltiple pueden evaluar Los contenidos de aprendizaje pueden ser clasificados en 3 categorías esenciales: conocimientos, destrezas y habilidades. Las POM permiten medir los conocimientos y cuando están bien escritas, son útiles para medir procesos cognitivos superiores, como interpretación, síntesis y aplicación del conocimiento (capacidad para resolver los problemas)2---4 . Conocimientos El tipo de aprendizaje más importante es el conocimiento. Puede caracterizarse por medio de hechos, conceptos, principios y procedimientos. Para el aprendizaje de conocimientos es necesario recordar o comprender7 . Recordar los conocimientos, representa el producto del aprendizaje por medio de la memoria. Comprender los conocimientos implica demostrar que se sabe el significado de un hecho, un concepto, un principio o un procedimiento; lo que ayuda a pensar de forma crítica y creativa para resolver los problemas complejos. Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. S30 R. Soler Fernández et al Figura 1 Análisis de los conocimientos. Las figuras ilustran la diferencia entre una pregunta que exige recordar un conocimiento aislado (pregunta 1) y comprender el significado de un hallazgo (pregunta 2). Las POM permiten medir los conocimientos de forma eficaz. Para demostrar el conocimiento se debe escribir una pregunta que exija recordar un hecho o un dato aislado (figs. 1 y 2). Las preguntas de comprensión requieren que el que está realizando la prueba revise la información dada en el enunciado (historia clínica, viñeta de un paciente) y llegue a una conclusión (por ejemplo, un diagnóstico) (fig. 1)6,7 . Destrezas Una destreza es la precisión con la cual se realiza una actividad o un conjunto de actividades que llevan a un resultado; algunas destrezas son mentales y su desempeño no es siempre obvio6---8 . El mejor examen para medir el dominio de una destreza es por medio de la observación, pero las POM ofrecen una alternativa eficiente para evaluar muchas destrezas6 . Una forma de evaluar las destrezas consiste en plantear un caso clínico y a partir de este, establecer una serie de POM acerca de las técnicas más apropiadas para el estudio del paciente, interpretación de los signos, su diagnóstico y los posibles tratamientos6,8 (fig. 2). Habilidades La adquisición de conocimientos y de destrezas es el medio para conseguir la formación de habilidades cognitivas importantes, con el objetivo final de resolver problemas para alcanzar la competencia profesional. Los exámenes que pretenden medir el nivel de aprendizaje están cada vez más enfocados en las habilidades y no en los conocimientos y las destrezas7,9 . Los formatos de las POM tienen un papel muy limitado en medir las habilidades. Como ocurre con la evaluación de la destreza, la mejor manera de medir las habilidades es la observación de la realización de las mismas. Sin embargo, algunos formatos novedosos de las POM, como el conjunto Figura 2 Análisis de las destrezas y de las habilidades. Conjunto de preguntas que analizan el conocimiento (recuerda cuál es la neoplasia vesical más frecuente) (pregunta 1), las destrezas (conocer cómo influyen otros factores en el diagnóstico) (pregunta 2) y las habilidades (aplica diferentes conocimientos, analiza la información y resuelve el problema) (pregunta 3). Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Formación continuada. Cómo redactar preguntas con opciones de respuesta múltiple S31 Figura 3 Ejemplo de un enunciado que implica recordar un hecho aislado (evalúa la memoria) (pregunta 1) y otro que analiza la aplicación de conocimientos (recordar y comprender) (pregunta 2). de preguntas o miniprueba, pueden contribuir y ser útiles en la evaluación de las habilidades (fig. 2). Principios generales de las preguntas con opciones de respuesta múltiple La National Board of Medical Examiners (NBME), organismo encargado de los exámenes para empezar a ejercer la medicina en Estados Unidos, es considerado por la mayoría de los expertos como una de las instituciones que produce exámenes de calidad con preguntas bien construidas. Esta institución ha publicado un manual sobre como redactar preguntas de opciones múltiples en base a su experiencia en los últimos 20 años6 . Los componentes de una prueba de POM incluyen: el enunciado (sentencia o pregunta), opciones de respuesta y distractores (opciones incorrectas)2,6,10,11 . Enunciado Para que una pregunta de una prueba de POM esté bien formulada debe cumplir 2 criterios básicos: debe referirse a un contenido importante y no añadir dificultades ajenas a la materia que es evaluada2,6,7,9 . Antes de seleccionar el contenido de las preguntas deben haberse establecido los objetivos y niveles del aprendizaje para cada objetivo, de manera que puedan ser evaluados de forma eficaz2,6 . El contenido de las pruebas de POM debe ser concordante con los objetivos del programa de aprendizaje. Los contenidos más importantes deben tener más relevancia que los contenidos de menor importancia, el tiempo dedicado a cada contenido en la prueba debe reflejar la importancia relativa del tema, y la muestra de preguntas debe ser representativa de las metas de enseñanza6 . Las POM deben contener 3 categorías de actividad mental: recordar un hecho aislado (memoria), interpretar la información suministrada para alcanzar la conclusión deseada (comprensión) y resolver el problema (razonamiento)12 . En la figura 3 se ilustra la diferencia entre el enunciado de una pregunta que evalúa el recuerdo de un hecho aislado de otra que analiza la aplicación de conocimientos. La inclusión de datos clínicos e imágenes en el enunciado de una pregunta es una forma excelente de evaluar la aplicación del conocimiento en nuestra especialidad y es el modelo que deberíamos seguir en la redacción de este tipo de examen. Cada pregunta debería comenzar con la presentación del problema clínico del paciente, continuar con la historia clínica y otros datos relevantes de laboratorio o tratamiento e incluir una o dos imágenes radiológicas (fig. 4). Formular las POM utilizando imágenes ayuda a validar la capacidad de resolución de problemas y a identificar a los alumnos que son capaces de memorizar gran cantidad de datos, pero que no pueden utilizar la información de forma efectiva2,6 . En cualquier caso, el contenido de la pregunta debe incluir solo información relevante y necesaria y su enunciado debe ser conciso y claro. Se debe evitar el uso de palabras o expresiones confusas que lleven a errores de interpretación y la pregunta debe poder responderse sin la necesidad de leer cada respuesta13 . Opciones de respuesta El número de opciones de respuesta suele ser entre 4 y 5. Las opciones deben ser claras y cortas, de longitud parecida y tener una conexión gramatical y sintáctica con el enunciado de la pregunta. En las opciones, solo debe haber una única respuesta claramente correcta. Cuando varias respuestas pueden ser verdaderas en términos absolutos, debe quedar claro que la respuesta correcta lo es en términos relativos (cuál es la característica más importante, cuál es el hallazgo semiológico más útil para definir.. . .). Además, debe evitarse incluir respuestas como «todas son correctas. . .» o «todas son incorrectas. . .»2,6 . La respuesta correcta debe variar en su ubicación (a-b-co d) ya que se ha demostrado que existe una tendencia a colocar la respuesta correcta en b o c6,7 . Distractores u opciones incorrectas La redacción de distractores u opciones incorrectas requiere de un profundo conocimiento del tema a evaluar. Los mejores distractores deben responder parcialmente a la verdad, deben poder ser respuestas posibles pero incorrectas2 . Una buena fuente de distractores son los errores comunes, las confusiones que por experiencia sabemos que inducen a cometer errores5,6,12 . Los distractores deben ser homogéneos en su contenido, estar en la misma categoría y ser parecidos a la respuesta correcta. Todos los distractores deben ordenarse de forma lógica (numérica o en orden alfabético), tienen que ser creíbles, gramaticalmente correctos, lógicamente compatibles con el enunciado de la pregunta y de la misma longitud que la respuesta correcta2,6 . Defectos comunes a evitar En la tabla 1 se resumen los defectos más comunes que deben evitarse en la construcción de las POM. Estos Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. S32 R. Soler Fernández et al Figura 4 Ejemplo del formato miniprueba o conjunto de preguntas utilizando una viñeta con imágenes. defectos suelen relacionarse con la habilidad para responder a los exámenes tipo test o con las dificultades añadidas que son irrelevantes con el contenido del aprendizaje. Defectos relacionados con la habilidad para responder exámenes Es importante evitar incluir distractores que no concuerdan gramaticalmente con el enunciado2,6,14 . Una persona Tabla 1 Defectos técnicos más comunes que deben evitarse en la construcción de las POM Relacionados con la habilidad para responder a los exámenes tipo test Distractores que no concuerdan gramaticalmente con el enunciado Incluir términos absolutos (siempre, nunca, todas, ninguna) Utilizar distractores heterogéneos en longitud o complejidad Utilizar distractores ridículos o muy parecidos Repetir palabras del enunciado en los distractores Relacionados con dificultades irrelevantes Utilizar enunciados demasiado largos o negativos (no es, todas son ciertas excepto) Utilizar términos imprecisos (raramente, habitualmente) Distractores complejos con más de un concepto Distractores con números sin orden lógico o con unidades diferentes Incluir ninguna de las anteriores en los distractores con habilidad para responder a un examen descartaría de entrada estas opciones de respuesta. Los términos absolutos son una indicación de que una respuesta es errónea. Palabras como «siempre» o «nunca» no suelen ser verdaderas en la vida real, por lo que casi nunca son la respuesta correcta de la pregunta6 . Debe evitarse que la respuesta correcta sea más larga que el resto de las opciones2,6 . Los autores de preguntas tienden a poner mayor cuidado en la respuesta correcta que en los distractores. Quizás por una tendencia de los autores a ser didácticos, agregan material adicional o información de importancia secundaria que dan pistas sobre la respuesta correcta. Las respuestas incorrectas ridículas, incluso para el que no sabe nada, o muy parecidas y sinónimas son fáciles de excluir porque si una es incorrecta, también lo será la otra. No debe incluirse como opción de respuesta «todo lo anterior» porque si una persona conoce que una de las anteriores es verdadera, solo tiene que escoger (o adivinar) entre 2 (la que sabe que es correcta y todas las respuestas anteriores). Repetir palabras en las opciones que pueden estar en el enunciado, indica una respuesta correcta6,12,14 . Defectos relacionados con dificultades irrelevantes Los defectos debidos a dificultades irrelevantes hacen que la pregunta sea más difícil por razones no relacionadas con el contenido del aprendizaje6,13 . Los enunciados de las preguntas no deben ser excesivamente largos ni engañosos, y deben evitarse términos vagos como «raramente» o «habitualmente» porque dificultan la Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Formación continuada. Cómo redactar preguntas con opciones de respuesta múltiple S33 Figura 5 Ejemplos del formato «Verdadero/Falso» en las POM que se requiere seleccionar como «Verdadero» (pregunta 1) o «Falso» (pregunta 2) la respuesta correcta. compresión de las preguntas y la elección de las opciones de respuesta. Las opciones de respuesta demasiado largas, complicadas y con más de un concepto dificultan la compresión de las preguntas. Las opciones que contienen números deben expresarse de forma homogénea y lógica. Deben seguir un orden creciente o decreciente, con el mismo grado de detalle, haciendo constar las unidades si procede. No es aconsejable mezclar números con porcentajes o rangos y no incluir cifras que engloben otras en las opciones de respuesta2,6 . Incluir «ninguna de las anteriores» como opción de respuesta hace que las preguntas sean más difíciles porque cada opción tiene que analizarse como más o menos verdadera. La mayoría de los autores las consideran además menos discriminantes y hacen que la fiabilidad del test completo sea menor6 . correcta. La razón está en que cuando se responde con duda o ignorancia intentando adivinar la respuesta correcta es más frecuente elegir «Verdadero» como respuesta. La tendencia a responder «Falso» de manera preferente es menos frecuente14 . Otro inconveniente de este formato de preguntas es la ambigüedad. Con frecuencia tiene que adivinarse lo que el autor de la pregunta tenía en mente al redactarla, porque las opciones no son completamente falsas ni completamente verdaderas. Para evitar esta ambigüedad, suelen redactarse preguntas que evalúan el recuerdo de hechos aislados, que comprueban sobre todo los conocimientos de memoria, lo que dificulta la evaluación de la aplicación de los conocimientos, la integración, destrezas o habilidades adquiridas durante el aprendizaje. Como resultado de ello, organismos reconocidos como la NBME, no utiliza formatos de «Verdadero/Falso» en sus exámenes6 . Formatos de las preguntas de respuesta múltiple Preguntas de respuesta correcta única (una mejor respuesta) Los formatos para la elaboración de las POM son múltiples e incluyen los convencionales o de respuesta correcta única, de emparejamiento, «Verdadero/Falso», de opción alternativa, «Verdadero/Falso» múltiple, POM compleja y conjunto de preguntas o miniprueba2 . Los formatos más conocidos y utilizados son las preguntas de «Verdadero/Falso» y las de respuesta correcta única (una mejor respuesta). El conjunto de preguntas o miniprueba es el más novedoso y probablemente el más completo. El formato de preguntas con respuesta correcta única o formato de las POM convencional es el más aceptado y el que se utiliza con más frecuencia6,7,13,14 . Consiste en un enunciado (por ejemplo la presentación de un caso clínico) y una pregunta, seguida de una serie de 5 opciones (una respuesta correcta y 5 distractores). Para que este formato de preguntas esté bien elaborado, la pregunta debe poder responderse con solo leer el enunciado, sin necesidad de las opciones (fig. 6). Las opciones en las preguntas de una mejor respuesta no necesariamente tienen que ser totalmente incorrectas, siempre que las opciones correctas puedan ordenarse de forma lineal, entre más probable y menos probable. Un aspecto muy importante en este formato de las POM es no redactar las preguntas de forma negativa («todas las siguientes son correctas excepto», «cuál de las opciones no es correcta»), porque pueden inducir a equivocaciones aun conociendo la respuesta correcta6,7,12 . Preguntas de «Verdadero/Falso» El formato «Verdadero/Falso» se utiliza con mucha frecuencia en las POM a pesar de que su calidad es muy discutida. En este formato se requiere seleccionar «Verdadero» o «Falso» como respuesta correcta (fig. 5). Uno de los inconvenientes de este formato es la mayor probabilidad de adivinar la solución correcta en algunas de las respuestas, sobre todo cuando la correcta es «Verdadero». Las preguntas cuya respuesta correcta es «Falso» suelen ser más discriminantes y tienen por lo tanto una fiabilidad mayor que las que tienen «Verdadero» como respuesta Conjunto de preguntas o miniprueba El conjunto de preguntas o miniprueba es el formato más novedoso de las POM y el que tiene mayores posibilidades de Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. S34 R. Soler Fernández et al Figura 6 Ejemplo de las POM con respuesta correcta única o mejor respuesta en el que la pregunta puede responderse con solo leer el enunciado. medir el conocimiento en sus niveles más altos, al plantear la solución de problemas o el pensamiento crítico. La NBME6 recomienda que todas las preguntas de un examen sean relevantes, es decir, vinculadas con las tareas del médico y que para evaluar la capacidad de usar la información se deben construir preguntas que evalúen procesos cognitivos superiores (interpretación, síntesis y aplicación de conocimientos). Además, señala que las POM deben constar de una viñeta, una pregunta y de varias opciones de respuesta. La viñeta es la presentación de un paciente; siempre debe incluir edad, sexo, motivo de la consulta, duración de los síntomas, antecedentes y hallazgos en el examen físico. La viñeta puede incluir imágenes clínicas o de una técnica diagnóstica. Las preguntas se ubican a continuación de la presentación del paciente y/o problema, que puede referirse a ciencias básicas, diagnóstico o tratamiento. Cada pregunta aborda un aspecto algo distinto del caso, considerando la situación clínica desde varias perspectivas2 (fig. 4). Las opciones incluyen un listado de 3 o 4 diagnósticos, medicamentos, medidas terapéuticas, hallazgos de laboratorio, localizaciones anatómicas, patógenos o mecanismos fisiopatológicos. Una de las opciones es la respuesta correcta (clave) y las otras son distractores. Todas las opciones deben ser homogéneas en forma y en contenido. Además de los principios generales descritos anteriormente en la elaboración de las POM, es importante tener en cuenta las pistas y el efecto de dependencia. Debe evitarse dar pistas sugiriendo respuestas a preguntas iniciales en las preguntas que se plantean a continuación, porque las personas con habilidad para detectar y utilizar pistas pueden eliminar opciones de respuestas al comparar las listas de opciones entre varias preguntas. El efecto de dependencia de un conjunto de preguntas consiste en formular preguntas con respuestas que es necesario saber para poder responder a otras preguntas. Para evitarlo, las preguntas deben estar enfocadas en aspectos diferentes del paciente. La ventaja de este formato, al plantear un caso clínico desde varias perspectivas, es que intenta no solo evaluar el conocimiento, sino el razonamiento y la solución de problemas, acercándose mucho a una prueba objetiva, estructurada, con múltiples preguntas de base común para la evaluación de la competencia clínica15 . Calidad de los exámenes Una de las tareas más difíciles para elaborar una prueba de POM es medir su calidad. La tabla 2 muestra una lista de pautas para escribir las POM eficaces que deben tenerse en cuenta cuando se analiza la calidad de los exámenes. Para cuantificar la calidad de un examen debe analizarse el índice de calidad de las preguntas y los indicadores o parámetros de las preguntas. Índice de calidad de las preguntas Para la NBME6 , el nivel de aplicación del conocimiento supone que la pregunta promueve un proceso intelectual superior a la memoria o recuerdo. Pensar la respuesta requiere razonamiento, interpretar y relacionar datos, sacar conclusiones y tomar decisiones. La ausencia de alguno de los criterios se considera un «defecto» de construcción; según la cantidad de defectos que tiene la pregunta le corresponde un valor de calidad que varía entre 1 y 5; el valor 5 es el máximo nivel de calidad posible (tabla 3). Tabla 2 Resumen de las guías más importantes para construir las POM eficaces Contenido de las preguntas Concordante con los objetivos del aprendizaje Del mismo nivel de aprendizaje que los objetivos que se están evaluando Refleja diferentes niveles de actividad mental (memoria, comprensión, razonamiento) Enunciado Debe referirse a un contenido importante Incluir solo la información relevante sin añadir dificultades ajenas a la materia evaluada Deben evitarse los términos absolutos (siempre, nunca, todos, ninguno) No utilizar términos imprecisos (no suele, en ocasiones, raramente) Evitar añadir pistas que ayuden a adivinar la respuesta correcta Opciones de respuesta Incluir 4 o 5 opciones de respuesta Tienen que ser claras, cortas, de longitud parecida y concordantes gramaticalmente con el texto Deben relacionarse entre sí (referirse a un diagnóstico, a una prueba de imagen) Debe variarse la posición de la respuesta correcta Seguir un orden lógico (cronológico, numérico) Los distractores tienen que ser posibles, pero incorrectos No repetir palabras claves utilizadas en el enunciado Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Formación continuada. Cómo redactar preguntas con opciones de respuesta múltiple Tabla 3 Escala de valores para calcular el índice de calidad de un examen en su totalidad, utilizando las POM que evalúan un nivel de conocimiento superior índice de calidad de un examen Valor Criterio 1 Pregunta con o sin viñeta, con 3 o más defectos de construcción Pregunta con o sin viñeta, con 2 defectos de construcción Pregunta con o sin viñeta, con un defecto de construcción Pregunta sin viñeta, sin defectos de construcción Pregunta con viñeta, sin defectos de construcción 2 3 4 5 El promedio de los valores de calidad de las preguntas expresa el índice de calidad del examen en su totalidad. Este índice sirve además como un mecanismo de retroalimentación formativo en talleres y sesiones para mejorar la calidad de la producción de las POM. La experiencia adquirida por la NBME en el uso de este índice, indica que se debe intentar al menos obtener un «3» en una pregunta cuando se evalúa un conocimiento básico, pero al menos un «4» en exámenes de mayor importancia6 . Indicadores o parámetros de las preguntas Los indicadores o parámetros de las preguntas que se utilizan para medir la calidad de un examen son fiabilidad, objetividad, dificultad y discriminación. La fiabilidad indica la medida en que los resultados del examen son consistentes y pueden generalizarse. Es la cualidad principal, y la más ampliamente aceptada, de los exámenes de opción múltiple y depende del número de opciones de respuesta incluidas en la prueba, del grado de homogeneidad y discriminación de las preguntas, y del grado de dificultad de la prueba16 . La fiabilidad es un concepto estadístico que representa el grado en el cual las puntuaciones de un examen son parecidas si los alumnos fuesen examinados de nuevo. Se mide con un coeficiente de correlación, entre uno (correlación perfecta) y cero (ninguna correlación), siendo aceptables valores iguales o superiores a 0,82,6 . La objetividad es la cualidad que hace que la calificación e interpretación de la prueba sea independiente del juicio subjetivo del evaluador. Permite comparar el conocimiento de distintas poblaciones en diferentes circunstancias y tiempos. Guarda además una relación muy estrecha con el contenido de la prueba, que debe estructurarse según los objetivos del aprendizaje. La dificultad de una prueba depende del porcentaje de alumnos que responden cada pregunta de forma correcta. Para que la dificultad de una POM sea adecuada, debe contener pocas preguntas que puedan responderse de forma adecuada por más del 90% y menos del 30% de los alumnos. El objetivo de las POM con un nivel de dificultad adecuada S35 es que el 50-75% de los alumnos puedan responder correctamente las preguntas2 . La discriminación de las preguntas se refiere a la diferencia en porcentajes de respuestas correctas entre 2 grupos de alumnos. El índice de discriminación para cada pregunta varía entre −1 y + 1. Cuanto más se acerque a + 1 mayor será la probabilidad de que una pregunta diferencie a los alumnos que conocen la materia objeto del examen de los que no. Se considera que una POM es muy buena si la discriminación es ≥ 60% y que necesita ser revisada cuando la discriminación es ≤ 19%. Una pregunta con un índice de discriminación negativo, indica que los alumnos malos la contestan de forma correcta con más frecuencia que los buenos, y debería evitarse11 . Conclusiones La necesidad de evaluar la competencia profesional en medicina es una demanda constante que requiere de personas entrenadas y cualificadas para redactar los exámenes. Diseñar exámenes de opción múltiple eficaces para medir el aprendizaje de conocimientos, destrezas mentales, actitudes y habilidades para resolver problemas en medicina, constituye un reto que puede alcanzarse con el tiempo, siguiendo una serie de normas y recomendaciones. Establecer los objetivos y niveles de aprendizaje, redactar un enunciado claro y conciso, así como una respuesta correcta y distractores posibles aunque incorrectos, es una tarea que requiere entrenamiento y un gran conocimiento del tema que se va a analizar por parte del evaluador. El enunciado de las preguntas debe referirse a un contenido importante y no añadir dificultades ajenas a la materia que se está evaluando. Las opciones de respuesta deben ser claras y solo una completamente correcta y los distractores, posibles pero incorrectos. Ambos constituyen las principales dificultades para el diseño y elaboración de las POM. Los resultados de los exámenes en medicina, deberían utilizarse para analizar y definir las futuras metas de aprendizaje y de esta manera lograr una mayor calidad en la asistencia. Autorías 1. 2. 3. 4. 5. 6. 7. 8. 9. Responsable de la integridad del estudio: RSF. Concepción del estudio: RSF. Diseño del estudio: RSF. Obtención de los datos: no procede. Análisis e interpretación de los datos: no procede. Tratamiento estadístico: no procede. Búsqueda bibliográfica: RSF, CMD y ERG. Redacción del trabajo: RSF, CMD y ERG. Revisión crítica del manuscrito con aportaciones intelectualmente relevantes: RSF, CMD, ERG. 10. Aprobación de la versión final: RSF, ERG y CMD. Conflicto de intereses Los autores declaran no tener ningún conflicto de intereses. Documento descargado de http://www.elsevier.es el 27/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. S36 R. Soler Fernández et al Bibliografía 1. Reddy S, Vijayakumar S. Evaluating clinical skills of radiation oncology residents: parts i and ii. Int J Cancer. 2000;90: 1---12. 2. Collins J. Education techniques for lifelong learning: writing multiple-choice questions for continuing medical education activities and self-assessment modules. Radiographics. 2006;26:543---51. 3. Anderson J. Multiple choice questions revisited. Med Teach. 2004;26:110---3. 4. McCoubrie P. Improving the fairness of multiple-choice questions: a literature review. Med Teach. 2004;26:709---12. 5. Epstein RM. Assessment in medical education. N Engl J Med. 2007;356:387---96. 6. Case SM, Swanson DB. Guías de la National Board of Medical Examiners (NBME) sobre cómo elaborar preguntas para evaluaciones escritas en el área de ciencias básicas y clínicas. Website de la National Board Of Medical Examiners. Publicada la tercera edición en 2006 [consultado 10 Jun 2012]. Disponible en: http://www.nbme.org/publications/item-writing-manual.html 7. Haladyna TM, Downing SM, Rodríguez M. A review of multiple-choice item writing guidelines. Appl Meas Educ. 2002;15:309---34. 8. Newble DI, Dauphinee D, Woolliscroft JO, MacDonald, Mulholland H, Page G, et al. Guidelines for assessing 9. 10. 11. 12. 13. 14. 15. 16. clinical competence. Teach Learn Med. 1994;6:213--20. Van der Vleuten CP, Newble DI. How can we test clinical reasoning? Lancet. 1995;345:1032---4. Schultheis NM. Writing cognitive educational objectives and multiple-choice test questions. Am J Health Syst Pharm. 1998;55:2397---401. Vydareny KH, Blane CE, Calhoun JG. Guidelines for writing multiple-choice questions in radiology courses. Invest Radiol. 1986;21:871---6. Chew FS. Writing multiple choice questions for AJR integrative Imaging. Am J Roentgenol. 2005;185:S195. Palés-Argullós J. ¿Cómo elaborar correctamente preguntas de elección múltiple? Educ Med. 2010;13:149---55. Morales Vallejo P. Las pruebas objetivas: normas, modalidades y cuestiones discutidas. Website del profesor Pedro Morales Vallejo de la Universidad Pontificia Comillas de Madrid [publicado 17 Dic 2006; consultado 10 Jun 2012]. Disponible en: http://www.upcomillas.es/personal/peter/otrosdocumentos/ PruebasObjetivas.pdf Dresch S, Dastugue M, Parafioriti E, Lanosa G, Torino M. Examen final integrado del ciclo clínico. Análisis y perspectivas. Prens Med Argent. 2005;92:319---27. Schuwirth LW, van der Vleuten CP. Different written assessment methods: what can be said about their strengths and weaknesses? Med Educ. 2004;38:974---9.