Pruebas diagnósticas y decisiones médicas

Anuncio
Pruebas diagnósticas
y decisiones médicas
C. Diana Nicoll, MD, PhD, MPA
Michael Pignone, MD, MPH
43
La principal tarea del médico es tomar decisiones razonadas en relación con la atención del paciente,
tanto si la información es incompleta como si los resultados clínicos suscitan cierta incertidumbre.
Aunque los datos obtenidos del interrogatorio y la exploración física son a menudo suficientes para
establecer un diagnóstico o definir el tratamiento, tal vez se requiera más información. En tales
situaciones, el clínico recurre con frecuencia a las pruebas diagnósticas.
RENTABILIDAD Y RIESGOS
Cuando se utilizan en forma apropiada, las pruebas diagnósticas pueden ser de gran ayuda para el
médico y también útiles para el procedimiento de detección, por ejemplo, para identificar factores de
riesgo y descubrir alguna enfermedad oculta en personas asintomáticas. El reconocimiento de factores
de riesgo permite una intervención temprana que prevenga la aparición de un trastorno; asimismo,
la detección oportuna de una enfermedad oculta puede disminuir la morbilidad y mortalidad del
padecimiento por la instauración oportuna de tratamiento. Las pruebas de detección recomendadas para
la atención preventiva en adultos asintomáticos de bajo riesgo incluyen medición de la presión arterial y
lípidos séricos. También se recomienda la detección de cánceres mamario, cervicouterino y colónico (la
del cáncer prostático es controvertida, véase el capítulo 1). Las pruebas de detección óptimas cumplen
los criterios listados en el cuadro 43-1.
Cuadro 43–1. Criterios para utilizar los procedimientos de detección
Características de la población
1. Prevalencia de la enfermedad suficientemente elevada.
2. Probabilidad de cumplir las pruebas y tratamientos subsiguientes.
Características de la enfermedad
1. Morbilidad y mortalidad significativas.
2. Tratamiento disponible efectivo y aceptable.
3. Periodo preclínico detectable.
4. Mejor resultado con el tratamiento temprano.
Características de la prueba
1. Sensibilidad y especificidad adecuadas.
2. Costo y riesgo bajos.
3. Prueba confirmatoria disponible y práctica.
Las pruebas también pueden ser útiles con fines diagnósticos, es decir, para establecer o descartar
la presencia de una afección en personas asintomáticas. Algunas pruebas favorecen el diagnóstico
temprano después del inicio de los signos y síntomas, otras permiten delinear el diagnóstico diferencial, y
otras más contribuyen a definir la etapa o actividad del trastorno.
Las pruebas tienen utilidad para la atención al paciente, ya que ayudan a: 1) valorar la gravedad
del padecimiento; 2) precisar el pronóstico; 3) vigilar la evolución de la enfermedad (progresión,
estabilidad o resolución); 4) detectar la recurrencia de la anomalía, y 5) seleccionar fármacos y adecuar
el tratamiento.
Al solicitar pruebas diagnósticas, los médicos deben comparar los posibles beneficios con los costos
y desventajas. Algunos de estos procedimientos conllevan riesgo de morbilidad o mortalidad, como
la angiografía cerebral, que ocasiona accidente vascular cerebral en 0.5% de los casos. Las molestias
vinculadas con pruebas como la colonoscopia disuaden a algunos pacientes de completar el estudio
diagnóstico. Es posible que el resultado de una prueba diagnóstica obligue a solicitar estudios adicionales
o seguimientos frecuentes; por ejemplo, un sujeto con resultado positivo en la prueba de sangre oculta
en heces debe enfrentar el costo significativo, la molestia y el riesgo de la colonoscopia de seguimiento.
Además, el resultado positivo falso en una prueba puede conducir a diagnóstico incorrecto o pruebas
adicionales innecesarias. Considerar a un individuo sano como enfermo a partir de una prueba
diagnóstica con resultado positivo falso puede ocasionar estrés psicológico y exposición a riesgos
innecesarios o tratamientos inapropiados. Una prueba diagnóstica o de detección puede revelar un
trastorno que no se hubiera identificado de otra manera y no habría ocasionado molestias a la persona.
Un ejemplo es el descubrimiento de un cáncer prostático de grado bajo en etapa temprana mediante
antígeno prostático específico en un varón de 84 años con insuficiencia cardiaca congestiva grave
diagnosticada; en este caso, lo más probable es que el individuo no muestre síntomas ni requiera
tratamiento para el tumor en lo que le resta de vida.
Siempre deben comprenderse y considerarse los costos de las pruebas diagnósticas. Es probable que los
costos sean altos o la efectividad desfavorable. El costo de un procedimiento diagnóstico específico, como
la prueba genética molecular por sospecha de cáncer colorrectal hereditario, puede ascender a más de
2 000 dólares. En conjunto, las pruebas diagnósticas representan cerca de 20% de los gastos de
atención a la salud en Estados Unidos. Incluso las pruebas relativamente baratas pueden tener baja
rentabilidad si producen muy pocos beneficios para la salud.
La disponibilidad de pruebas genéticas y moleculares es cada vez mayor. La prueba genética diagnóstica
basada en síntomas (p. ej., la prueba para X frágil en un niño con retraso mental) difiere de otras
pruebas genéticas predictivas (p. ej., evaluación de una persona sana con antecedente familiar de
enfermedad de Huntington) y de pruebas genéticas de predisposición, las cuales indican la sensibilidad
relativa a ciertos trastornos (p. ej., prueba de BRCA-1 para el cáncer mamario). La prueba de portadores
(p. ej., para fibrosis quística) y las pruebas fetales (p. ej., para síndrome de Down) son otras aplicaciones
de evaluaciones genéticas. Todas estas valoraciones requieren asesoría extensa para los pacientes, a fin de
que comprendan el efecto clínico y emocional de los resultados.
Boulware LE et al. Systematic review: the value of the periodic health evaluation. Ann Intern Med. 2007
Feb 20;146(4):289–300. [PMID: 17310053]
Gonzalgo ML et al. Update on PSA testing. J Natl Compr Canc Netw. 2007 Aug;5(7):737–42. [PMID:
17692178]
Kroese M et al. Genetic tests and their evaluation: can we answer the key questions? Genet Med. 2004
Nov–Dec;6(6):475–80. [PMID: 15545742]
McPherson E. Genetic diagnosis and testing in clinical practice. Clin Med Res. 2006 Jun:4(2):123–9.
[PMID: 16809405]
Pignone M et al. Challenges in systematic reviews of economic analyses. Ann Intern Med. 2005 Jun
21;142 (12 Pt 2):1073–9. [PMID: 15968032]
REALIZACIÓN DE LAS PRUEBAS DIAGNÓSTICAS
PREPARACIÓN DE LA PRUEBA
Los factores que afectan al paciente y la muestra son importantes. El elemento determinante en una
prueba de laboratorio bien realizada es la obtención de una muestra apropiada.
Preparación del paciente
La preparación del individuo es esencial para ciertas pruebas; por ejemplo, es necesario el estado de
ayuno para obtener mediciones óptimas de glucosa y triglicéridos; la postura y la ingestión de sodio
deben controlarse en forma estricta cuando se miden los niveles de renina y aldosterona, y debe evitarse
el ejercicio intenso antes de la obtención de muestras para cuantificar cinasa de creatina, ya que la
actividad muscular intensa puede inducir resultados anormales falsos.
Recolección de la muestra
Debe concederse mucha atención a la identificación del paciente y el etiquetado de la muestra. Algunas
veces es importante conocer el momento en que se tomó la muestra. Por ejemplo, para interpretar
en forma correcta los niveles de aminoglucósidos es preciso saber si la muestra se tomó justo antes
(concentración “farmacológica mínima”) o después (concentración “farmacológica máxima”) de
administrar el medicamento. Las concentraciones farmacológicas no pueden interpretarse si la muestra
se obtiene durante la fase de distribución del compuesto (p. ej., los niveles de digoxina cuantificados en
las 6 h siguientes a una dosis oral). La interpretación de sustancias que tienen variación circadiana (p.
ej., cortisol) sólo puede efectuarse en el contexto de la hora del día en que se recogió la muestra.
Deben recordarse asimismo otros principios durante la recolección de muestras. Éstas no deben
extraerse de un sitio proximal a un catéter intravenoso, ya que se contaminarían con la solución
intravenosa. La permanencia de un torniquete por un tiempo excesivo produce hemoconcentración e
incrementa la concentración de sustancias unidas a proteínas, como el calcio. La lisis celular durante la
recolección de una muestra sanguínea produce valores séricos altos falsos de sustancias concentradas
en las células (p. ej., deshidrogenasa láctica y potasio). Las muestras para ciertas pruebas requieren
manipulación o almacenamiento especiales (como las correspondientes a gases sanguíneos). El retraso
en la entrega de muestras al laboratorio motiva que el metabolismo celular continúe, lo que produce
resultados falsos en algunos estudios (p. ej., glucosa sérica baja).
CARACTERÍSTICAS DE LAS PRUEBAS
En el cuadro 43–2 se presentan las características generales de las pruebas diagnósticas útiles. La
mayor parte de los principios detallados a continuación se aplica no sólo a las pruebas de laboratorio y
radiográficas, sino también a elementos del interrogatorio y la exploración física.
Cuadro 43–2. Propiedades de las pruebas diagnósticas útiles
1. La metodología de la prueba se ha descrito de manera detallada, por lo que puede reproducirse en
forma exacta y confiable.
2. Se han confirmado tanto la exactitud como la precisión de la prueba.
3. El intervalo de referencia está bien establecido.
4. La sensibilidad y especificidad se determinaron de forma confiable mediante la comparación con
un método de referencia. La valoración se realizó en diversos pacientes, incluidos los que padecen
trastornos diferentes, pero que a menudo se confunden, y otros con espectro patológico de leve a
grave, con y sin tratamiento. El proceso de selección de los individuos está bien descrito, de modo
que los resultados no se generalizan en forma inapropiada.
5. La contribución independiente al desempeño general de un panel de pruebas está confirmada, si la
prueba es propuesta como parte de un panel de pruebas.
Exactitud
La exactitud de una prueba de laboratorio radica en su correspondencia con el valor verdadero. Una
prueba inexacta es aquella que difiere del valor verdadero, aunque los resultados sean reproducibles
(fig. 43–1A). En el laboratorio clínico, la exactitud de las pruebas se maximiza mediante la calibración del
equipo de laboratorio con material de referencia y la participación en programas externos de control de
calidad.
FIGURA 43–1
Relación entre la exactitud y la precisión de las pruebas diagnósticas. El centro del blanco representa el
valor verdadero de la sustancia de prueba. A: prueba diagnóstica precisa, pero inexacta; con la medición
repetida, la prueba produce resultados muy similares, pero todos están lejos del valor real. B: prueba
imprecisa e inexacta; la medición repetida suministra resultados muy diferentes y éstos están lejos del
valor real. C: una prueba ideal es precisa y exacta.
Precisión
La precisión es una medida de la reproducibilidad de una prueba cuando se repite en la misma muestra.
Si la misma muestra se analiza muchas veces, se esperan algunas variaciones en los resultados, las
cuales se expresan como coeficiente de variación (CV: la desviación estándar dividida entre el promedio).
Una prueba imprecisa es aquella que suministra resultados muy variables con las mediciones repetidas
(fig. 43–1B). La precisión de las pruebas diagnósticas (que se vigila en los laboratorios clínicos con
material de control) debe ser lo bastante buena para distinguir los cambios de importancia clínica en el
estado del paciente a partir de la variabilidad analítica de la prueba. Por ejemplo, el recuento diferencial
manual de leucocitos no tiene la precisión suficiente para advertir cambios importantes en la distribución
de los tipos celulares, ya que se calcula por evaluación subjetiva de una pequeña muestra (100 células).
Las mediciones repetidas en la misma muestra por parte de distintos técnicos proporcionan resultados
muy diferentes. Los recuentos diferenciales automáticos son más precisos porque se obtienen con
aparatos que utilizan características físicas objetivas para clasificar una muestra mucho mayor (10 000
células).
Intervalo de referencia
Los resultados de algunas pruebas diagnósticas se formulan como positivos o negativos, pero otros se
presentan de manera cuantitativa. El uso de intervalos de referencia es una técnica para interpretar
estos últimos resultados.
FIGURA 43–2
El intervalo de referencia suele definirse como el delimitado por 2 desviaciones estándar del resultado
promedio de la prueba (se muestra como 22 y 2) en una pequeña población de voluntarios sanos.
Obsérvese que en este ejemplo los resultados de la prueba tienen una distribución normal, pero muchas
sustancias biológicas poseen distribuciones sesgadas.
Los intervalos de referencia son específicos para cada método y laboratorio. En la práctica, muchas
veces representan los resultados de la prueba encontrados en 95% de una pequeña población que
se presupone sana; por consiguiente, 5% de los pacientes sanos tiene resultados anormales en la
prueba (fig. 43-2). Los resultados ligeramente anormales deben interpretarse en forma crítica, ya que
pueden ser anormales verdaderos o falsos. El médico siempre debe estar consciente de que entre más
pruebas solicite, mayor será la probabilidad de obtener un resultado anormal falso. En una persona
sana sometida a 20 pruebas independientes hay una probabilidad de 64% de que en una se obtengan
resultados fuera del intervalo de referencia (cuadro 43–3). Por el contrario, es factible que valores
dentro del intervalo de referencia no descarten la presencia real de enfermedad, ya que dicho intervalo
no establece la distribución de resultados en pacientes con la enfermedad. Por ello los intervalos de
referencia deben usarse dentro del contexto del conocimiento médico sobre el trastorno en duda.
Cuadro 43–3. Relación entre el número de pruebas y la probabilidad de que una persona
sana tenga uno o más resultados anormales
Número de pruebas
Probabilidad de que uno o más resultados sean anormales
1
5%
6
26%
12
46%
20
64%
Es importante considerar también si los intervalos de referencia publicados son apropiados para el
individuo en estudio, ya que algunos intervalos dependen de la edad, sexo, peso, dieta, hora del día,
nivel de actividad o postura, incluso de la época del año. La variabilidad biológica se presenta tanto entre
individuos como en el mismo sujeto. Por ejemplo, el nivel de estrógeno sérico en las mujeres puede
variar de manera cotidiana, de acuerdo con el ciclo menstrual; el cortisol sérico muestra variación diurna
(en la mañana es mayor y decrece en el transcurso del día), y la vitamina D muestra variación estacional
con valores menores en invierno.
El cuadro 2 del Apéndice detalla los intervalos de referencia para las pruebas comunes de química
sanguínea y hematológicas. Más adelante se describen las características de desempeño de la prueba,
como sensibilidad y especificidad, que son necesarias para interpretar los resultados.
Factores de interferencia
Los resultados de las pruebas diagnósticas pueden alterarse por factores externos (como ingestión de
fármacos) e internos (como estados fisiológicos anormales).
Las interferencias externas influyen en los resultados de las pruebas in vivo o in vitro. In vivo, el
alcohol incrementa la concentración de transpeptidasa de glutamilo γ, y los diuréticos modifican las
concentraciones de sodio y potasio. El tabaquismo induce enzimas hepáticas, lo que reduce los niveles
de sustancias como la teofilina, que se metabolizan en hígado. In vitro, las cefalosporinas pueden
suscitar niveles falsos de creatinina sérica por la interferencia con el método de análisis habitual de los
laboratorios.
Las interferencias internas derivan de estados fisiológicos anormales que influyen en la medición. Por
ejemplo, en sujetos con lipemia notable puede obtenerse un resultado bajo falso de sodio sérico, si la
metodología de la prueba incluye un paso en que se diluya el suero antes de medir el sodio. En virtud
de la posibilidad de interferencia con la prueba, los médicos deben ser cautos ante los resultados
inesperados e investigar razones distintas a la enfermedad que expliquen los resultados anormales,
incluidos los errores del laboratorio.
Sensibilidad y especificidad
Los clínicos deben usar mediciones del desempeño de las pruebas (como su sensibilidad y especificidad),
con el propósito de juzgar la calidad de un método diagnóstico para una enfermedad específica.
La sensibilidad de una prueba es su capacidad para detectar enfermedad, y se expresa como el
porcentaje de pacientes con enfermedad en que la prueba es positiva. Entonces, una prueba con 90%
de sensibilidad dará resultados positivos en el mismo porcentaje de pacientes enfermos y resultados
negativos en 10% de sujetos con enfermedad (falsos negativos). Por lo general, una prueba con alta
sensibilidad ayuda a descartar un diagnóstico, dado que arroja pocos resultados negativos falsos. Por
ejemplo, para descartar infección por el virus que causa el sida, un médico podría elegir un estudio muy
sensible, como el de anticuerpo contra el virus de inmunodeficiencia humana (VIH).
La especificidad de una prueba es su capacidad para detectar ausencia de enfermedad, y se expresa
como el porcentaje de pacientes sin enfermedad en que la prueba es negativa. Así, una prueba con
90% de especificidad arrojará resultados negativos en el mismo porcentaje de sujetos sin enfermedad,
y resultados positivos en 10% de individuos no enfermos (falsos positivos). Una prueba con alta
especificidad contribuye a confirmar el diagnóstico, ya que tiene pocos resultados positivos falsos. Por
ejemplo, para establecer el diagnóstico de artritis gotosa, un médico puede elegir una prueba muy
específica, como la presencia de cristales en forma de aguja con birrefringencia negativa dentro de los
leucocitos en el estudio microscópico del líquido sinovial.
Para determinar la sensibilidad y especificidad de una prueba para una enfermedad particular, la técnica
debe compararse con una “prueba de referencia” que defina el estado real de afección del individuo. Por
ejemplo, la sensibilidad y especificidad de la prueba de detección rápida de antígenos para diagnosticar
faringitis por el estreptococo hemolítico β del grupo A se obtiene mediante la comparación de sus resultados
con los de la prueba de elección para este trastorno, que es el cultivo de exudado faríngeo. La aplicación de la
prueba de elección a los pacientes con prueba positiva para la demostración rápida de antígenos establece
la especificidad. Cuando no se aplica la prueba de elección después de la detección rápida negativa, puede
haber sobreestimación de la sensibilidad, ya que no se identifican los falsos negativos. Sin embargo, en
muchas enfermedades (p. ej., pancreatitis) no hay prueba de elección o su aplicación es muy difícil o costosa;
en tales casos es difícil obtener estimados de confianza a partir de la prueba de sensibilidad y especificidad.
La población de la cual derivan los valores también puede afectar la sensibilidad y especificidad; en
consecuencia, muchos procedimientos diagnósticos se valoran primero en personas con la forma grave
de la enfermedad y en grupos de control jóvenes y sanos. En comparación con la población general, este
grupo de estudio presenta más resultados positivos verdaderos (porque los individuos sufren enfermedad
más avanzada) y más resultados negativos reales (porque el grupo control es sano); por tanto, la
sensibilidad y especificidad de la prueba son más altas de lo que se espera en la población general, ya
que en ésta hay un espectro más amplio de salud y enfermedad. Los médicos deben estar conscientes de
este sesgo de espectro al extrapolar los resultados publicados de las pruebas a su práctica particular.
Otros sesgos, que incluyen la composición del espectro, reclutamiento de población y estándar de
referencia inexistente o inadecuado, así como el sesgo de verificación, se explican en las referencias.
Es importante recordar que la sensibilidad y especificidad informada de la prueba depende del nivel del
análito (umbral) utilizado para distinguir un resultado normal de otro anormal. Si se reduce el umbral, la
sensibilidad aumenta a expensas de menor especificidad; si se incrementa, la sensibilidad disminuye al
tiempo que aumenta la especificidad (fig. 43-3).
La figura 43–4 muestra la forma en que pueden calcularse la sensibilidad y la especificidad con los
resultados de la prueba en pacientes clasificados en forma previa como enfermos o no enfermos, con
base en la prueba de referencia.
Puede comparase el desempeño de dos pruebas diferentes mediante la diagramación de las curvas
de eficacia diagnóstica (ROC) en diversos valores límite de los intervalos de referencia. Las curvas
resultantes, que se obtienen al diagramar la sensibilidad (1-especificidad) para cada prueba, muestran
a menudo cuál es la mejor técnica; la curva ROC de la prueba superior queda siempre arriba y a la
izquierda de la curva de una prueba inferior. En general, la mejor técnica tiene un área mayor bajo
la curva ROC. Por ejemplo, la ilustración de la figura 43-5 muestra las curvas ROC para el antígeno
prostático específico (PSA) y la fosfatasa ácida prostática (PAP) en el diagnóstico de cáncer prostático. La
prueba de PSA es superior porque tiene mayor sensibilidad y especificidad para todos los valores límite.
Akobeng AK. Understanding diagnostic tests 3: Receiver operating characteristic curves. Acta Paediatr.
2007 May;96(5):644–7. [PMID: 17376185]
Christenson RH; Committee on Evidence Based Laboratory Medicine. Evidence-based laboratory
medicine—a guide for critical evaluation of in vitro laboratory testing. Ann Clin Biochem. 2007 Mar:44(Pt
2):111–30. [PMID: 17362577]
FIGURA 43–3
Distribución hipotética de resultados en pruebas para individuos sanos y enfermos. La posición del “punto
límite” entre los resultados “normal” y “anormal” (o “negativo” y “positivo”) determina la sensibilidad
y especificidad de la prueba. Si A es el punto límite, la prueba tendría sensibilidad de 100%, pero
especificidad baja. Si el punto límite es C, la prueba tendría una especificidad de 100%, pero sensibilidad
baja. En muchas pruebas, el punto límite se determina por el intervalo de referencia, es decir, el intervalo
de resultados que esté a menos de 2 desviaciones estándar del resultado promedio para individuos sanos
(punto B). En algunas situaciones, el límite se altera para incrementar la sensibilidad o especificidad.
Franco-Paredes C et al. Rapid HIV testing: a review of the literature and implications for the clinician.
Curr HIV/AIDS Rep. 2006 Nov;3(4):169–75. [PMID: 17032576]
Whiting P et al. Development and validation of methods for assessing the quality of diagnostic accuracy
studies. Health Technol Assess. 2004 Jun;8(25):iii, 1–234. [PMID: 15193208]
Whiting P et al. Sources of variation and bias in studies of diagnostic accuracy: a systematic review. Ann
Intern Med. 2004;140:189–202. [PMID: 14757617]
FIGURA 43–4
Número de pacientes enfermos con prueba positiva
Sensibilidad
Número de pacientes enfermos
Número de pacientes no enfermos con prueba negativa
Especificidad
Probabilidad posterior
a la prueba después de
prueba positiva
Número de pacientes no enfermos
Probabilidad de enfermedad si la prueba es positiva
Cálculo de sensibilidad, especificidad y probabilidad de enfermedad después de una prueba positiva
(probabilidad posterior a la prueba). TP, positivo verdadero; FP, positivo falso; FN, negativo falso; TN,
negativo verdadero.
FIGURA 43–5
1
1
.9
2
4
0.2
.8
6
Sensibilidad
.7
.6
10
0.3
.5
0.4
.4
PSA mg/L
20
.3
PAP U/L
0.6
0.8
.2
1.2
.1
0
.1
.2
.3
.4
.5
1 - Especificidad
.6
.7
.8
Curvas de eficacia diagnóstica (ROC) para el antígeno prostático específico (PSA) y la fosfatasa ácida
prostática (PAP) en el diagnóstico de cáncer prostático. Para todos los valores límite, el PSA tiene mayor
sensibilidad y especificidad; por lo tanto, es una mejor prueba con base en estas características de
eficacia. (Modificada y reproducida con autorización de Nicoll D et al. Routine acid phosphatase testing
for screening and monitoring prostate cancer no longer justified. Clin Chem 1993;39(12):2540-1.)
USO DE PRUEBAS PARA EL DIAGNÓSTICO Y LA ATENCIÓN
El valor de una prueba en una situación clínica específica no sólo depende de la sensibilidad y la
especificidad, sino también de la probabilidad de que el paciente tenga la enfermedad antes de conocer
el resultado de la prueba (probabilidad anterior a la prueba). Los resultados de una prueba útil
modifican en forma sustancial la probabilidad de que el sujeto padezca la afección (probabilidad
posterior a la prueba). La figura 43-4 muestra la forma en que puede calcularse la probabilidad
posterior a la prueba a partir de la sensibilidad y especificidad conocidas y de la probabilidad del
trastorno calculada antes de la prueba (o prevalencia de la enfermedad).
La probabilidad de enfermedad antes de la prueba tiene un profundo efecto sobre la probabilidad
después de la prueba. Como se demuestra en el cuadro 43–4, cuando se emplea una prueba con
sensibilidad y especificidad de 90%, la probabilidad posterior a la prueba puede variar de 8 a 99%,
de acuerdo con la probabilidad de enfermedad antes de la prueba. Además, conforme decrece la
probabilidad antes de la prueba, es más probable que un resultado positivo sea falso.
A manera de ejemplo, supóngase que el médico desea calcular la probabilidad posterior a la prueba
de cáncer prostático si utiliza el procedimiento de PSA y un valor límite de 4 μg/L. A partir de los datos
mostrados en la figura 43–5, la sensibilidad es de 90% y la especificidad de 60%. El médico determina
la probabilidad anterior a la prueba de una enfermedad particular respecto de toda la evidencia y luego
calcula la probabilidad posterior a la prueba mediante el procedimiento que se muestra en la
figura 43–4. La probabilidad anterior a la prueba de que un varón de 50 años de edad, por lo demás
sano, tenga cáncer prostático, es igual a la prevalencia de cáncer prostático en ese grupo de edad
Cuadro 43–4. Influencia de la probabilidad anterior a la prueba sobre la probabilidad
de enfermedad posterior a la prueba cuando se utiliza una técnica con sensibilidad de 90%
y especificidad de 90%
Probabilidad anterior a la prueba
Probabilidad posterior a la prueba
0.01
0.08
0.50
0.90
0.99
0.999
(probabilidad 5 10%), y la probabilidad posterior a la prueba después de ésta (cuando el resultado es
positivo) es sólo de 20%; esto significa que, aunque la prueba sea positiva, todavía hay una probabilidad
de 80% de que el sujeto no tenga cáncer prostático (fig. 43–6A). Si el médico encuentra un ganglio
prostático durante la exploración rectal, la probabilidad anterior a la prueba de cáncer prostático se
incrementa 50% y la probabilidad posterior a la prueba (si se recurre a la misma técnica) es de 69%
(fig. 43–6B). Por último, si el médico prevé que la probabilidad anterior a la prueba es de 98% con base
en un ganglio prostático, dolor óseo y lesiones líticas en las radiografías de columna, la probabilidad
posterior a la prueba con PSA es de 99% (fig. 43–6C). Este ejemplo ilustra que la probabilidad anterior
a la prueba tiene un efecto profundo en la probabilidad posterior a la prueba, y que las pruebas
suministran más información cuando el diagnóstico es muy incierto (probabilidad anterior a la prueba
cercana a 50%) en comparación con un diagnóstico improbable o casi seguro.
de Graaf I et al. Diagnosis of lumbar spinal stenosis: a systematic review of the accuracy of diagnostic
tests. Spine. 2006 May 1;31(10):1168–76. [PMID: 16648755]
Hogg K et al. The emergency department utility of Simplify D-dimer to exclude pulmonary embolism in
patients with pleuritic chest pain. Ann Emerg Med. 2005 Oct;46(4):305–10. [PMID: 16187460]
Roy PM et al. Systematic review and meta-analysis of strategies for the diagnosis of suspected
pulmonary embolism. BMJ. 2005 Jul 30;331(7511):259. [PMID: 16052017]
FIGURA 43–6
0
.1
.2
.5
0
.5
0
.5
1
.69
1
.98 1
.99
Efecto de la probabilidad anterior a la prueba y de la sensibilidad y especificidad de ésta en la
probabilidad de enfermedad posterior a la prueba (véase la explicación en el texto).
RELACIÓN DE PROBABILIDAD DE MOMIOS
Otra forma de calcular la probabilidad de enfermedad posterior a la prueba consiste en recurrir a la
probabilidad de momios. Se combinan la sensibilidad y la especificidad en una entidad llamada índice
de probabilidad (LR):
LR =
Probabilidad del resultado en personas enfermas
Probabilidad del resultado en personas no enfermas
Cuando los resultados se dividen en dos, toda prueba tiene dos índices de probabilidad, uno
correspondiente a un resultado positivo (LR1) y otro a uno negativo (LR2):
LR+ =
=
LR– =
=
Probabilidad de que la prueba sea positiva en personas enfermas
Probabilidad de que la prueba sea positiva en personas no enfermas
Sensibilidad
1 – Especificidad
Probabilidad de que la prueba sea negativa en personas enfermas
Probabilidad de que la prueba sea negativa en personas no enfermas
Sensibilidad
1 – Especificidad
Para las mediciones continuas pueden definirse múltiples índices de probabilidad que correspondan a los
intervalos de resultados (véase un ejemplo en el cuadro 43–5).
Cuadro 43–5. Índices de probabilidad de la ferritina sérica en el diagnóstico de la anemia
ferropénica
Ferritina sérica (µg/L)
LR para anemia ferropénica
$100
0.08
45–99
0.54
35–44
1.83
25–34
2.54
15–24
8.83
51.85
,15
Tomado de Guyatt G et al. Laboratory diagnosis of iron deficiency anemia. J Gen Intern Med
1992;7(2):145-53.
Se pueden encontrar listas de índices de probabilidad en algunos libros de texto, artículos de revistas
y programas computacionales (véase el cuadro 43–6, que incluye valores de muestra). Los índices de
Cuadro 43–6. Ejemplos de índices de probabilidad (LR)
Enfermedad
Prueba
Absceso
Tomografía computarizada de abdomen
9.5
0.06
Coronariopatía
Electrocardiograma de esfuerzo (depresión de 1 mm)
3.5
0.45
Cáncer de pulmón
Radiografía torácica
15
0.42
Hipertrofia ventricular
izquierda
Ecocardiografía
18.4
0.08
Infarto miocárdico
Troponina I
24
0.01
Cáncer prostático
Valoración rectal digital
21.3
0.37
Tomado de http://www.med.unc.edu/medicine/edursrc/lrmain.htm
LR+
LR–
probabilidad pueden calcular en forma rápida la utilidad de una prueba diagnóstica prevista en una
situación particular. El método más sencillo para calcular la probabilidad posterior a la prueba, a partir
de la probabilidad anterior a la prueba y los índices de probabilidad, consiste en emplear un nomograma
(fig. 43–7). El médico une con una línea recta los puntos que representan la probabilidad anterior a la
prueba y el índice de probabilidad, y encuentra la probabilidad posterior a la prueba en el punto en que
la línea recta cruza esta última.
Una manera más formal de calcular la probabilidad posterior a la prueba consiste en usar el índice de
probabilidad como sigue:
Momios antes de la prueba 3 índice de probabilidad 5 momios después de la prueba
Para utilizar esta fórmula, las probabilidades deben convertirse en momios; en tal caso, los momios de
presentar una enfermedad se expresan como la probabilidad de tener la enfermedad dividida entre la
probabilidad de no tenerla. Por ejemplo, una probabilidad de 0.75 es lo mismo que momios de 3:1
(fig. 43–8).
FIGURA 43–7
99
.1
.2
95
.5
1
1000
500
90
2
200
100
50
80
70
10
20
10
5
50
40
20
2
1
5
%
60
30
30
.5
40
.2
.1
.05
50
60
80
.02
.01
.005
90
.002
.001
70
95
20
%
10
5
2
1
.5
.2
99
.1
Nomograma para establecer la probabilidad posterior a la prueba a partir de la probabilidad anterior a
la prueba y los índices de probabilidad. Para cuantificar la probabilidad posterior a la prueba se coloca
una línea recta entre la probabilidad anterior y el índice de probabilidad para la prueba específica. La
probabilidad posterior es el punto en que la línea recta cruza esta última. (Adaptada y reproducida con
autorización de Fagan TJ. Nomogram for Bayes theorem. [Letter.] N Engl J Med 1975;293(5):257.)
FIGURA 43–8
.PNJPT
1SPCBCJMJEBE
QSPCBCJMJEBE
&KFNQMPTJMBQSPCBCJMJEBEFTFOUPODFT
.PNJPT
1SPCBCJMJEBE
m
NPNJPT
NPNJPT
&KFNQMPTJMPTNPNJPTFOUPODFT
1SPCBCJMJEBE
Fórmulas para convertir probabilidades a momios y viceversa.
Para calcular el beneficio de una prueba diagnóstica, el médico cuantifica primero los momios de la
enfermedad anteriores a la prueba, a partir de toda la información clínica disponible, y a continuación
multiplica los momios antes de la prueba por los índices positivo y negativo de probabilidad. Los
resultados son los momios posteriores a la prueba, o los momios de que el paciente tenga la
enfermedad si la prueba es positiva o negativa. Para obtener la probabilidad posterior a la prueba, los
momios se convierten en una probabilidad (fig. 43–8).
Por ejemplo, si el clínico cree que el enfermo tiene una probabilidad de 60% de sufrir un infarto
miocárdico (momios antes de la prueba, 3:2), y la prueba de troponina I es positiva (LR1 5 24), los
momios posteriores a la prueba de padecer un infarto miocárdico son los siguientes:
3
------ o bien 36:1 momios
---- × 24 = 72
2
2
= probabilidad de 97%)
( (3636⁄1)⁄ 1+ 1 = 36
37
Si la prueba de troponina I es negativa (LR2 5 0.01), los momios posteriores a la prueba de tener un
infarto miocárdico son los siguientes:
(
3
0.03 momios
--- × 0.01 = --------2
2
0.03 ⁄ 2
= 0.015 = probabilidad de 1.5%
(0.03⁄ 2) + 1 0.015 + 1
)
Pruebas en secuencia
Hasta el momento se ha descrito el efecto de una sola prueba en la probabilidad de enfermedad; sin
embargo, en la mayor parte de los estudios diagnósticos, los médicos obtienen información clínica de
manera secuencial. Por ejemplo, para calcular los momios posteriores a la prueba después de tres
pruebas, el médico podría cuantificar los momios anteriores a la prueba y usar el índice de probabilidad
adecuado para cada prueba:
Momios anteriores a la prueba 3 LR1 3 LR2 3 LR3 5 momios posteriores a la prueba
Sin embargo, cuando se utiliza este método, el clínico debe estar consciente de una presuposición
importante: las pruebas o hallazgos elegidos deben ser condicionalmente independientes.
Por ejemplo, cuando hay daño celular hepático, las enzimas aminotransferasa de aspartato (AST)
y aminotransferasa de alanina (ALT) se liberan por el mismo proceso, razón por la cual no son
condicionalmente independientes. Si se usan pruebas condicionalmente dependientes de este método
secuencial, se obtiene una probabilidad posterior a la prueba inexacta.
Gisbert JP et al. Accuracy of Helicobacter pylori diagnostic tests in patients with bleeding peptic ulcer: a
systematic review and meta-analysis. Am J Gastroenterol. 2006 Apr;101(4):848–63. [PMID: 16494583]
Hellmich M et al. A ruler for interpreting diagnostic test results. Methods Inf Med. 2005;44(1):124–6.
[PMID: 15778803]
Puhan MA et al. A randomized trial of ways to describe test accuracy: the effect on physicians’ post-test
probability estimates. Ann Intern Med. 2005;143(3):184–9. [PMID: 16061916]
Wells PS et al. Does this patient have deep vein thrombosis? JAMA. 2006 Jan 11;295(2):199–207.
[PMID: 16403932]
Método del umbral para la toma de decisiones
Un aspecto clave para tomar decisiones médicas es la selección del umbral terapéutico, es decir,
la probabilidad de enfermedad en la que está indicado el tratamiento. El umbral de tratamiento se
determina por las consecuencias relativas de acciones diferentes: tratar cuando la enfermedad está
presente; no tratar cuando está ausente; tratar cuando está de hecho ausente, o no hacerlo cuando
está presente. La figura 43-9 muestra una posible forma de reconocer un umbral terapéutico mediante la
consideración del valor (utilidad) de los cuatro posibles resultados.
FIGURA 43–9
Umbral de “tratar/no tratar”. A: el paciente no tiene la enfermedad y no recibe tratamiento (la mayor
utilidad). B: el paciente no tiene la enfermedad y recibe tratamiento (menor utilidad que A). C: el
paciente tiene la enfermedad y recibe tratamiento (menor utilidad que A). D: el paciente tiene la
enfermedad y no recibe tratamiento (menor utilidad que C).
El uso de una prueba diagnóstica está indicado cuando su resultado podría modificar la probabilidad de
enfermedad en el umbral de tratamiento. Por ejemplo, un médico podría optar por la antibioticoterapia
si la probabilidad de faringitis estreptocócica en un sujeto con irritación faríngea es mayor de 25%
(fig. 43-10A). Si después de revisar los datos del interrogatorio y la exploración física, el médico
considera que la probabilidad anterior a la prueba de faringitis estreptocócica es de 15%, una prueba
diagnóstica como el cultivo faríngeo (LR1 5 7) sólo sería útil si el resultado positivo incrementara
la probabilidad posterior a la prueba a más de 25%. El uso del nomograma mostrado en la figura
43-7 indica que la probabilidad posterior a la prueba sería de 55% (fig. 43–10B); por lo tanto,
estaría justificado solicitar la prueba, ya que afectaría el tratamiento del paciente. Por otro lado, si
el interrogatorio y la exploración física señalan que la probabilidad anterior a la prueba de faringitis
estreptocócica es de 60%, el cultivo faríngeo (LR2 5 0.33) sólo estaría indicado si un resultado negativo
redujera la probabilidad posterior a la prueba a menos de 25%. Si se emplea el mismo nomograma,
la probabilidad posterior a la prueba después de un resultado negativo sería de 33% (fig. 43–10C). En
consecuencia, no estaría justificado realizar un cultivo faríngeo, ya que no influye en el tratamiento.
FIGURA 43-10
Método del umbral aplicado a la solicitud de pruebas. Si la prueba prevista no cambia el tratamiento del
paciente, no debe solicitarse. (Véase la explicación en el texto.)
Este método para tomar decisiones se describe en la bibliografía clínica.
Análisis de decisiones
Hasta este punto, el análisis de las pruebas diagnósticas se ha enfocado en las características de la
prueba y los métodos para usarlas en el cálculo de probabilidad de enfermedad para distintas situaciones
clínicas. Aunque son útiles, estos métodos son limitados, porque no incorporan los múltiples resultados
que pueden ocurrir en la clínica, ni los valores que los individuos y médicos dan a tales resultados. Para
incorporar los resultados y los valores a las características de las pruebas, puede emplearse el análisis de
decisiones.
La idea básica del análisis de decisiones es modelar las opciones de una decisión médica, conceder
probabilidades a las acciones alternativas, asignar valores (utilidades) a los diversos resultados y luego
precisar qué decisión aporta el mayor valor esperado (utilidad esperada). Para completar un análisis
de decisión, el médico podría proceder de la siguiente manera: 1) trazar un árbol de decisiones que
muestre los elementos de la decisión médica; 2) asignar probabilidades a las diversas ramas; 3) asignar
valores (utilidades) a los resultados; 4) establecer el valor esperado (utilidad esperada) (el producto
de probabilidad y el valor [utilidad]) de cada rama, y 5) tomar la decisión con el mayor valor esperado
(utilidad esperada).
La figura 43-11 muestra un árbol de decisión en el que se determina si se administra tratamiento
sin pruebas, si se realiza una prueba y después se trata con base en sus resultados, o si no se solicitan
pruebas ni se prescribe tratamiento. El médico comienza el análisis con la elaboración de un árbol
de decisiones que muestre los elementos importantes de la determinación. Una vez trazado el árbol,
el médico asigna probabilidades a todas las ramas. En este caso, todas las probabilidades de rama
pueden calcularse a partir de: 1) la probabilidad de enfermedad antes de la prueba (probabilidad
anterior a la prueba); 2) la probabilidad de un resultado positivo si existe la enfermedad (sensibilidad),
y 3) la probabilidad de un resultado negativo en caso de ausencia de la enfermedad (especificidad). A
continuación, el médico concede un valor (utilidad) a cada resultado.
FIGURA 43–11
Árbol genérico para la toma de decisiones clínicas, en el que las opciones son: 1) tratar al paciente de
manera empírica; 2) realizar la prueba y luego tratar sólo si el resultado es positivo, o 3) prescindir del
tratamiento. El nodo cuadrado se conoce como nodo de decisión y los nodos circulares se denominan
nodos de oportunidad. P, probabilidad de enfermedad antes de la prueba; Sens, sensibilidad; Spec,
especificidad.
Después de calcular el valor esperado (utilidad esperada) de cada rama del árbol de decisión mediante la
multiplicación del valor (utilidad) del resultado por la probabilidad de éste, el médico puede identificar la
alternativa con el mayor valor esperado (utilidad esperada).
Aunque requiere tiempo, el análisis de decisión ayuda a estructurar los problemas clínicos complejos y
tomar decisiones clínicas difíciles.
Gazelle GS et al. Cost-effectiveness analysis in the assessment of diagnostic imaging technologies.
Radiology. 2005 May;235(2):361–70. [PMID: 15858079]
Inadomi JM. Decision analysis and economic modelling: a primer. Eur J Gastroenterol Hepatol
2004;16(6):535–42. [PMID: 15167154]
Medicina basada en evidencias
La medicina basada en evidencias enfatiza el uso de datos de investigación clínica (en lugar de la
intuición y el razonamiento fisiopatológico) como base para tomar decisiones clínicas. La medicina basada
en evidencias se apoya en la identificación de información con sustento metodológico, el reconocimiento
crítico de estudios clínicos y la difusión de resúmenes de evidencia exactos y útiles para tomar decisiones
clínicas informadas. Para resumir la evidencia que se difundirá pueden emplearse revisiones sistemáticas,
al igual que sinopsis de la investigación vigente basada en evidencias. Las revisiones sistemáticas utilizan
a menudo el metaanálisis, que consiste en el uso de técnicas estadísticas para combinar evidencias de
diferentes estudios, a fin de obtener un cálculo más preciso del efecto de una intervención o la exactitud
de una prueba.
Los lineamientos para la práctica clínica son afirmaciones que se desarrollan en forma sistemática, cuya
finalidad es ayudar a los médicos a tomar decisiones sobre la atención a la salud. Los algoritmos
clínicos y los lineamientos para la práctica se han convertido ya en elementos regulares en medicina.
Su utilidad y validez dependen de la calidad de la evidencia que delineó las recomendaciones, su
actualización constante, y su aceptación y aplicación correcta por parte de los clínicos. Aunque algunos
médicos están preocupados por el efecto de los lineamientos en la autonomía profesional y las decisiones
individuales, muchas organizaciones buscan que dichos lineamientos para la práctica se cumplan, como
una medida de calidad de la atención.
Debido a que las decisiones de tratamiento no siempre han incluido el mejor conocimiento médico y los
valores del paciente, hay interés creciente en la toma compartida de decisiones. Se trata de un proceso
en que los médicos proporcionan información de la salud basada en evidencias a los pacientes,
entran en contacto con sus valores y colaboran con ellos para alcanzar una decisión mutua aceptable.
Se ha demostrado que en muchos casos los auxiliares para la toma de decisiones (herramientas que
facilitan la toma compartida de decisiones) mejoran tanto este proceso como sus resultados.
Chung KC et al. A practical guide to meta-analysis. J Hand Surg [Am]. 2006 Dec;31(10):1671–8. [PMID:
17145390]
Ghosh AK et al. Translating evidence-based information into effective risk communication: current
challenges and opportunities. J Lab Clin Med. 2005 Apr;145(4):171–80. [PMID: 15962835]
O’Connor AM et al. Do patient decision aids meet effectiveness criteria of the international patient
decision aid standards collaboration? A systematic review and meta-analysis. Med Decis Making. 2007
Sep–Oct;27(5):554–74. [PMID: 17873255]
Descargar