Explorando… … las exploraciones Ricard Riel Cabrera Médico de familia. EAP El Clot. Barcelona. Institut Català de la Salut. Inauguramos en este número una nueva sección. Podríamos titularla «Uso adecuado de la exploración...», pero nos ha parecido aún más claro darle un nombre expecífico: «Explorando». En ella vamos a valorar las distintas maniobras exploratorias que usamos para confirmar o descartar un determinado problema de salud. Vamos a valorarlas desde el punto de vista de las evidencias que tenemos sobre su utilidad. Así, intentaremos dar respuesta a preguntas del tipo: — ¿Una maniobra de Lasègue positiva confirma que el paciente tiene una ciatalgia? — ¿Un signo de Blumberg positivo nos ayuda a confirmar una apendicitis? — ¿El signo de Homann es útil para diagnosticar una trombosis venosa profunda? En diferentes números de AMF iremos abordando diversos problemas de salud frecuentes y analizaremos la utilidad de las maniobras exploratorias para confirmarlos. A menudo nos encontraremos con que muchas exploraciones son de dudosa utilidad... Esto nos podría llevar a pensar que no es necesario explorar al paciente. ¡En absoluto! Conocer la real utilidad de una exploración para confirmar un problema de salud nos debe ayudar a mejorar la orientación a través de la anamnesis y a priorizar las exploraciones que sean más útiles, pero, en todo caso, explorar siempre será necesario, cuando menos en beneficio de la confianza del paciente. En este primer artículo se adjunta una orientación sobre la validez y fiabilidad de las pruebas diagnósticas, que nos servirá a lo largo de los diversos trabajos publicados. Esta breve, pero práctica orientación, se completa, si lo deseas, con una ampliación en la versión electrónica. ¡Esperamos que te sea muy útil! Para responder a esa cuestión, deberemos entender dos conceptos básicos. El primero es el de validez de la prueba, su habilidad para distinguir a los enfermos de los que no tienen la enfermedad (ver tabla 1). La validez tiene a su vez dos componentes: sensibilidad y especificidad. La sensibilidad de una prueba se define como la proporción de enfermos que fueron correctamente identificados como positivos por la prueba. La especificidad es la proporción de no enfermos correctamente identificados como negativos por la prueba. Evidentemente, para poder identificar a aquellos sujetos que «realmente» tienen la enfermedad debemos comparar nuestra prueba con un gold standard, a menudo otra prueba ampliamente aceptada como verdad externa, pero que suele ser más costosa o invasi- va que la prueba que estamos evaluando. De este modo, una prueba muy sensible evitará que sujetos verdaderamente enfermos no sean detectados por nuestra prueba. Una prueba muy específica nos será útil para identificar correctamente a la población sana. Pero no debemos confundir sensibilidad y especificidad con la pregunta que muchas veces surge de la consulta diaria: «¿Si el resultado de esta prueba es positivo, cuál es la probabilidad de que el paciente tenga la enfermedad?». La respuesta a esto nos la da el valor predictivo positivo, que es la proporción de sujetos con resultado positivo que realmente tienen la enfermedad. De manera análoga, el valor predictivo negativo nos informa sobre los verdaderos negativos del total de negativos de la prueba. Así como sensibilidad y especificidad son cualidades intrínsecas de la prueba, el valor predictivo dependerá de la población donde apliquemos la prueba. Si la prevalencia de enfermedad es elevada en la población donde aplicamos nuestra prueba, el valor predictivo positivo de la misma será mayor y el negativo, menor. Por esta razón, las pruebas de cribado son más productivas si se dirigen a poblaciones de alto riesgo de sufrir la enfermedad. 29 AMF 2009;5(11):633-634 A diario los médicos realizamos múltiples pruebas diagnósticas. Desde la exploración física que hacemos en consulta hasta complejas pruebas hospitalarias. Sin embargo, todas ellas tienen una misma misión: separar a la población con enfermedad de aquella que no la tiene. La pregunta que nos debemos hacer es cuán buena es la prueba en separar a esas dos poblaciones. 633 Ricard Riel Cabrera Explorando… las exploraciones Pero los médicos rara vez utilizamos una única prueba para estudiar la enfermedad. Es frecuente que realicemos diversas pruebas de manera conjunta (exploración física y radiografía, por ejemplo). ¿Qué sucede entonces cuando evaluamos la sensibilidad o especificidad neta de las diversas pruebas? La respuesta dependerá de la estrategia que apliquemos. Si realizamos las dos pruebas de manera simultánea, ganamos sensibilidad neta (detectaremos a más enfermos) a costa de perder especificidad. En cambio, si realizamos las pruebas de manera secuencial (realizamos una segunda prueba a aquellos que dieron positivo en la primera), obtendremos una pérdida de sensibilidad neta, ganando a cambio especificidad neta. La elección de la estrategia dependerá de lo que nos interese en cada momento: ¿queremos que no se nos escape ningún enfermo (primer caso) o queremos descartar a la población sana (segundo caso)? Junto con la validez que ya hemos comentado, el segundo aspecto a tener en cuenta ante toda prueba diagnóstica es su fiabilidad (precisión o repetitividad). Independientemente de especificidad y sensibilidad, una prueba no es útil si sus resultados no pueden ser replicados al repetir el test. Existen varios factores que pueden contribuir a que una prueba no sea fácilmente replicable: la variación intrasujeto (como la que podemos observar al tomar dos muestras consecutivas de glucosa en el mismo paciente), la variación intraobservador (la que se puede producir cuando un mismo médico valora de manera diferente el Lasègue de un paciente en dos ocasiones) y la variación interobservador (desacuerdo entre dos observadores diferentes de una misma prueba). Este último factor es de especial importancia y ha requerido a menudo un estudio específico. Hay diferentes técnicas epidemiológicas para evaluar las discrepancias entre observadores, pero posiblemente la más utilizada sea el estadístico kappa. Supongamos dos médicos que valoran la auscultación pulmonar según sea patológica o no. Si dichos médicos evaluaran la auscultación al azar, coincidirían un 50% de las veces. Pero es de esperar que no res- 634 pondan al azar y que la coincidencia sea mucho mayor. ¿Cuál será entonces el valor del estadístico kappa? Kappa = (% observado de acuerdo) – (% de acuerdo esperado por azar) 100 – (% de acuerdo esperado por azar) Como se puede sustraer de kappa, si los dos médicos clasificaran las auscultaciones al azar, kappa sería de 0. Landis y Koch1 propusieron que valores de kappa superiores a 0,75 suponían un acuerdo interobservador excelente, mientras que kappas inferiores a 0,4 suponían pobre acuerdo. Kappas entre 0,4 y 0,75 representan un punto intermedio. Tabla 1 Comparación de los resultados de pruebas dicotómicas con la presencia de enfermedad Resultado del test Características verdaderas en la población Enfermos Positivo (+) Negativo (-) No enfermos Verdadero positivo (VP) Falso positivo (FP) Falso negativo (FN) Verdadero negativo (VN) Sensibilidad (S) = VP/(VP + FN) Especificidad (E) = VN/(VN + FP) Valor predictivo positivo (VPP) = VP/+ Valor predictivo negativo (VPN) = VN/– BIBLIOGRAFÍA 1. Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics.1977;33(1):159-74. 2. Gordis L. Assessing the validity and reliability of diagnostic and screening tests. 4.a ed. En: Gordis L, ed. Epidemiology. Philadelphia: Elsevier Saunders, 2009. 3. Gigerenzer G. Making sense of health statistics. Bull World Health Organ. 2009;87(8):567. AMF 2009;5(11):633-634 30