Descargar PDF

Anuncio
Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
Med Clin (Barc). 2014;142(10):451–456
www.elsevier.es/medicinaclinica
Revisión
Número necesario de tratamientos: interpretación y estimación en análisis
multivariables y con datos censurados
Inés Gómez-Acebo a,*, Trinidad Dierssen-Sotos b y Javier Llorca c
a
Facultad de Medicina, Universidad de Cantabria, Santander, España
Centro de Investigación Biomédica en Red de Epidemiologı´a y Salud Pública (CIBERESP), España
c
Instituto de Formación e Investigación Marqués de Valdecilla (IFIMAV), Santander, España
b
I N F O R M A C I Ó N D E L A R T Í C U L O
R E S U M E N
Historia del artı´culo:
Recibido el 9 de noviembre de 2012
Aceptado el 9 de mayo de 2013
On-line el 11 de julio de 2013
El número necesario de tratamientos se ha recomendado como una forma sencilla de transmitir los
resultados de un estudio, especialmente de un ensayo clı́nico. La mayor parte de las publicaciones lo
estiman a partir de una tabla 2 2, como el inverso de la reducción absoluta de riesgos. No obstante, se
ha llamado la atención sobre algunas limitaciones: la interpretación no resulta tan sencilla como se habı́a
pretendido, frecuentemente se ignora la estimación del intervalo de confianza, y los estudios en los que
se estima una medida de efecto ajustado por factores de confusión no pueden utilizar las tablas 2 2 en
el cálculo del número necesario de tratamientos. En este trabajo revisamos la forma de obtener la
estimación puntual y el intervalo confianza en 4 situaciones: tablas 2 2, regresión logı́stica, método de
Kaplan-Meier y regresión de Cox.
ß 2012 Elsevier España, S.L. Todos los derechos reservados.
Palabras clave:
Ensayos clı́nicos
Estimador de Kaplan-Meier
Estudios epidemiológicos
Número necesario de tratamientos
Reducción absoluta de riesgos
Regresión logı́stica
Regresión de Cox
Number needed to treat: Interpretation and estimation in multivariable analyses
and censored data
A B S T R A C T
Keywords:
Controlled clinical trials
Kaplan-Meier estimation
Epidemiologic method
Number needed to treat
Absolut risk reduction
Logistic regression
Cox regression
Number needed to treat has been recommended as an easy way to transmit results from a trial,
especially controlled clinical trials. Most articles estimate it from a 2 2 table, as the inverse of the
absolute risk reduction. However, some limitations have been pointed out: The interpretation is not as
easy as claimed, confidence intervals are frequently not estimated, and the estimation from 2 2 tables
is inadequate when the main effect measure has been estimated adjusting for confounding factors. In
this paper, we revise how to obtain point estimations and confidence intervals of number needed to treat
in 4 situations: 2 2 tables, logistic regression, Kaplan-Meier method, and Cox regression.
ß 2012 Elsevier España, S.L. All rights reserved.
Introducción
El número necesario de tratamientos (NNT) se define como el
número de pacientes que es necesario tratar para evitar un suceso1.
En un ensayo clı́nico representa el número de pacientes adicionales
que deberı́an recibir el tratamiento experimental en lugar del
tratamiento control para conseguir un resultado positivo adicional,
o bien para prevenir un resultado adverso2. Sin embargo, varios
artı́culos han señalado las limitaciones del NNT3: la interpretación
no es tan sencilla como se habı́a pretendido, el cálculo depende del
* Autor para correspondencia.
Correo electrónico: [email protected] (I. Gómez-Acebo).
tiempo de seguimiento4 y se tiende a presentar el NNT como una
estimación puntual, sin intervalo de confianza, probablemente
porque este puede tener una complejidad adicional.
En este trabajo revisaremos la forma de calcular el NNT cuando
se dispone de datos acumulados (riesgos) o cuando se dispone de
datos de tiempo de seguimiento, su intervalo de confianza y las
dificultades de interpretación que plantea.
Cálculo del número necesario de tratamientos a partir de una
tabla 2 T 2
En el resto del artı́culo consideraremos que la finalidad del
tratamiento es evitar un efecto perjudicial en un ensayo clı́nico, y al
NNT correspondiente lo denominaremos número necesario de
tratamientos para beneficiar (NNTB)5,6.
0025-7753/$ – see front matter ß 2012 Elsevier España, S.L. Todos los derechos reservados.
http://dx.doi.org/10.1016/j.medcli.2013.05.003
Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456
452
Tabla 1
Cálculo del número necesario de tratamientos a partir de una tabla 2 2
Episodios
No episodios
Población
aT
aNT
bT
bNT
nT
nNT
Fracturas vertebrales
No fracturas vertebrales
a
Nomenclatura
Tratamiento experimental
Placebo
Ejemplo: reducción de fracturas vertebrales en mujeres posmenopáusicas con un nuevo medicamento (epidemiolato)
Epidemiolato
8
390
Placebo
20
380
Población
b
400
400
ES: error estándar; IC: intervalo de confianza; NNT: número necesario de tratamientos; RAR: reducción absoluta de riesgo.
a
a
Riesgo en el grupo experimental: RT ¼ nT
T
a
Riesgo en el grupo con placebo: RNT ¼ nNT
NT
aNT
aT
RAR ¼ RNT RT ¼ n n
NT
1
NNT ¼ RAR
¼R
1
NT RT
¼
NT
1
aNT aT
nNT nT
b
8
Riesgo en el grupo con epidemiolato: RT ¼ 400
¼ 0; 02
20
Riesgo en el grupo con placebo: RNT ¼ 400
¼ 0; 05
RAR = 0, 05 0, 02 = 0, 03
1
1
NNT ¼ RAR
¼ 0;03
¼ 33
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
þ 0;050;95
ESðRARÞ ¼ 0;020;98
¼ 0; 013
400
400
IC 95% (RAR): RAR 1, 96 ES(RAR) = 0, 0046 a 0, 0554
1
1
ICðNNT B Þ ¼ 0;0554
; 0;0046
¼ 18 a 217
y su intervalo de confianza puede estimarse con la aproximación
normal, si el tamaño muestral es suficiente. Entonces, el intervalo
de confianza del NNT es (tabla 3)7:
En la tabla 1 se presenta la notación habitual para una tabla
2 2, junto con las definiciones de riesgo en pacientes que reciben
el tratamiento (RT) y en pacientes que no lo reciben (RNT). En estas
condiciones, el NNT se define como el inverso de la reducción
absoluta de riesgo (RAR) (tabla 1):
NNT B ¼
1
1
1
¼
¼
RAR RNT RT naNT naT
NT
ICðNNT B Þ ¼
1
1
¼
RT RNT naT naNT
T
NT
(3)
(1)
Ejemplo
T
De forma general, consideraremos el caso en el que los
pacientes que reciben el tratamiento tienen menor riesgo, con lo
que la fórmula 1 es positiva. En caso contrario, nos halları́amos ante
el número necesario de tratamientos para perjudicar (NNTH), cuya
fórmula es igual a la anterior, pero cambiando el signo del
denominador (tabla 2):
NNT H ¼ NNT B ¼
1
1
;
Lim sup RAR Lim inf RAR
si RT > RNT
La tabla 1 (b) presenta los resultados de un ensayo clı́nico en el
que se investiga la eficacia de un nuevo medicamento (epidemiolato) en la prevención de fracturas vertebrales en mujeres
posmenopáusicas. Ochocientas mujeres han sido asignadas al
azar a 2 ramas: 400 han tomado epidemiolato y 400 han recibido
placebo. La RAR es 0,03, con intervalo de confianza del 95% (IC 95%)
0,005 a 0,055; para evitar una fractura vertebral es necesario tratar
con epidemiolato a 33 mujeres (IC 95% 18 a 217). Es decir, la
estimación puntual indica que en este estudio será necesario tratar
a 33 mujeres para evitar una fractura vertebral, pero la variación al
azar sugiere que el verdadero NNT puede ser tan bueno como una
fractura evitada por cada 18 pacientes tratadas o tan desfavorable
como 217 tratamientos necesarios. El otro aspecto a destacar es la
fuerte asimetrı́a del intervalo de confianza.
Cuando el intervalo de confianza de la RAR incluye el 0 surge
una dificultad añadida en el cálculo e interpretación del intervalo
de confianza del NNT: cuanto menor sea el efecto del tratamiento,
mayor es el NNT; en el extremo, una RAR = 0 significa que el
tratamiento no tiene ningún efecto y entonces serı́a necesario
tratar a infinitos pacientes para obtener un resultado favorable en
(2)
El intervalo de confianza del NNT no debe calcularse
directamente, porque no tiene distribución normal, por ello han
sido propuestas otras aproximaciones7–10. Aunque es posible
emplear métodos bayesianos11, el modo más sencillo es estimar el
intervalo de confianza para la RAR y, en la fórmula 1, sustituir
sucesivamente RAR por el lı́mite superior y por el lı́mite inferior de
su intervalo: el error estándar de la RAR es:
sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
RT ð1 RT Þ RNT ð1 RNT Þ
ESðRARÞ ¼
þ
;
nT
nNT
Tabla 2
Cálculo del número necesario de tratamientos para beneficiar y para perjudicar en distintos escenarios de análisis
Tipo de análisis
NNTB
Tabla 2 2
1
NNT B ¼ RAR
¼R
Regresión logı́stica
NNT B ¼
NNTH
1
NT RT
1
ð1ORÞRNT
1
RARðtÞ
þ
Kaplan-Meier
NNT B ðtÞ ¼
Regresión de Cox
1
NNT B ðtÞ ¼ RARðtÞ
¼
¼
si RT < RNT
OR
ð1ORÞð1RNT Þ
1
ST ðtÞSNT ðtÞ
HR
si OR < 1
si SNT ðtÞ < ST ðtÞ
1
½SNT ðtÞ
NNT H ¼ R
SNT ðtÞ
si HR < 1
NNT H ¼
1
T RNT
1
ðOR1ÞRNT
NNT H ðtÞ ¼
NNT H ðtÞ ¼
si RT > RNT
OR
þ ðOR1Þð1R
NT Þ
1
SNT ðtÞST ðtÞ
1
si OR > 1
si ST ðtÞ < SNT ðtÞ
HR
SNT ðtÞ½SNT ðtÞ
si HR > 1
HR: hazard ratio; NNTB: número necesario de tratamientos para beneficiar; NNTH: número necesario de tratamientos para perjudicar; OR: odds ratio; RAR: reducción absoluta
de riesgo; RNT: riesgo en el grupo no tratado; RT: riesgo en el grupo tratado; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento; ST(t): supervivencia
en el grupo tratado en el tiempo (t) de seguimiento.
Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456
453
Tabla 3
Cálculo del intervalo de confianza del número necesario de tratamientos en distintos escenarios de análisis
Tipo de análisis
Información necesaria
IC 95%
Tabla 2 2
Intervalo de confianza del RAR: Lim inf RAR, Lim sup RAR
Regresión logı́stica
RNT. Intervalo de confianza de la OR: Lim inf OR, Lim sup OR
Kaplan-Meier
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Error estándar del RAR: ES½RARðtÞ ¼ ES½ST ðtÞ2 þ ES½SNT ðtÞ2 .
Intervalo de confianza del RAR: RAR 1, 96 ES[RAR(t)]
Intervalo de confianza del HR: Lim inf HR, Lim sup HR
1
Lim sup RAR
1
Lim sup NNT ¼
Lim inf RAR
1
Lim inf OR
þ
Lim inf NNT B ¼
ð1 Lim inf ORÞRNT ð1 Lim inf ORÞð1 RNT Þ
1
Lim sup OR
Lim sup NNT B ¼
þ
ð1 Lim sup ORÞRNT ð1 Lim sup ORÞð1 RNT Þ
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
1
1
ES½RARðtÞ ¼ ES½ST ðtÞ2 þ ES½SNT ðtÞ2 ; Lim sup
RAR ; Lim inf RAR
Regresión de Cox
Lim inf NNT ¼
Lim infNNT B ðtÞ ¼
1
½SNT ðtÞLim
Lim supNNT B ðtÞ ¼
½SNT ðtÞ
sup HR
1
Lim inf HR
SNT ðtÞ
SNT ðtÞ
HR: hazard ratio; IC 95%: intervalo de confianza del 95%; Lim inf: lı́mite inferior del intervalo de confianza; Lim sup: lı́mite superior del intervalo de confianza; NNTB: número
necesario de tratamientos para beneficiar; RAR: reducción absoluta de riesgo; RNT: riesgo en el grupo no tratado; OR: odds ratio; SNT(t): supervivencia en el grupo no tratado en
el tiempo (t) de seguimiento.
uno de ellos. Como consecuencia, si el intervalo de confianza de la
RAR incluye el 0, el intervalo del NNT pasará por el infinito. Para
ilustrarlo, supongamos que RAR = 0,01 y su IC 95% es -0,01 a 0,03.
Entonces, NNT = 100 y el intervalo de confianza es discontinuo: de
33 a +1 y de -1 a -100. Para facilitar la lectura de este resultado,
Altman5 propuso la siguiente terminologı́a: NNTB = 100 (IC 95%:
NNTH 100 a +1 a NNTB 33), que puede interpretarse como que el
resultado es compatible con valores de NNTB mayores de 33 y con
valores de NNTH mayores de 100; dicho de otra forma, excluye por
inverosı́miles los valores de NNT menores de 33 para evitar una
fractura y los valores de NNT menores de 100 para producirla.
Quizá sea más claro mostrar el intervalo de confianza del NNT en
una figura en la que la escala se ha cambiado para situar el infinito
como eje; por debajo están los valores del NNTH y por encima los
del NNTB5. Ası́ se han representado en la figura 1 los 2 intervalos de
confianza de este ejemplo: en la escala de la izquierda figura la RAR,
y en la de la derecha, el NNT; el intervalo de confianza marcado
como (a) corresponde a una RAR de 0,03 (IC 95% 0,005 a 0,055) y a
un NNT de 33 (IC 95% 18 a 217). El intervalo marcado como (b)
corresponde a una RAR de 0,01 (-0,01 a 0,03) y un NNT de 100 (IC
RAR
.06
(a)
(b)
16.7
.04
25
.02
50
.01
100
0
NNTB
∞
-.01
-100
-.02
-50
-.04
-25
NNT H
Figura 1. Presentación gráfica de la RAR (eje de la izquierda) y del intervalo de
confianza del número necesario de tratamientos (NNT) cambiando la escala (eje
de la derecha): el valor NNT = infinito se sitúa en el eje principal; por debajo de este
eje, los valores indican NNTH, por encima NNTB. El intervalo (a) corresponde a una
RAR de 0,03 (IC 95%: 0,005 a 0,055) y a un NNT de 33 (IC 95%: 18 a 217). El intervalo
(b) corresponde a una RAR de 0,01 (-0,01 a 0,03) y un NNT de 100 (IC 95%: -1 a -100
y 33 a 1). De esta forma, los 2 intervalos de confianza de la figura 1 se convierten en
continuos y simétricos; el hecho de que el intervalo (b) cruce el valor 1 indica que el
resultado es no significativo.
95% -1 a -100 y 33 a +1); esta figura muestra que con el cambio de
escala se consigue que el intervalo de confianza del NNT sea
siempre continuo, simétrico e incluya la estimación puntual.
Cálculo del número necesario de tratamientos con regresión
logı́stica
Con las tablas 2 2 podemos obtener los NNT de estudios cuyos
resultados se expresan en forma de riesgos, tal y como hemos
señalado en el ejemplo previo; sin embargo, en otras ocasiones el
resultado se expresa como odds ratio (OR), como hazard ratio (HR),
etc. En tales casos debe recurrirse a procedimientos diferentes.
Dichos procedimientos pueden exigir disponer de información
adicional –como ocurre con el riesgo basal–, y varı́an de un caso
a otro.
En estudios en los que el efecto de interés sea binario (es decir,
el carácter inmediato permita no requerir el estudio del tiempo
hasta el suceso), es frecuente que la principal medida de efecto sea
la OR ajustada por factores de confusión, obtenida mediante
regresión logı́stica. En estos casos, puede estimarse el NNT si se
conoce el riesgo basal (riesgo en el grupo no tratado)11 (tabla 2).
En un estudio de casos y controles, el riesgo basal debe ser
conocido por una fuente externa al estudio (por ejemplo, un
sistema de vigilancia epidemiológica); en este caso RNT puede
considerarse un parámetro fijo y el intervalo de confianza del NNTB
solo depende de la variabilidad de la OR y puede calcularse como se
indica en la tabla 3.
En cambio, si la regresión logı́stica se ha aplicado a un estudio
de cohortes o a un ensayo clı́nico, la fórmula que se presenta en
la tabla 3 infraestima la amplitud del intervalo del NNT al ignorar la
variabilidad de RNT. Lo correcto en este caso12 es aplicar el método
delta multivariante, aunque este método puede dar intervalos con
cobertura inadecuada si la OR está próxima a 1 o el RNT es cercano a
0 o a 1.
Si el riesgo en el grupo tratado es mayor que en el no tratado, el
NNTH puede estimarse a partir del NNTB cambiando el signo
(tabla 2).
Ejemplo
Hickson et al.13 llevaron a cabo un ensayo clı́nico sobre la
eficacia de probióticos en la prevención de diarrea asociada a
antibióticos; 19 de 56 pacientes del grupo de placebo y 7 de 57 en el
grupo del probiótico desarrollaron diarrea. Utilizando una tabla
2 2 se encuentra RAR = 0,22 (IC 95% 0,07 a 0,37) y NNTB = 5 (IC
Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
454
I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456
Tabla 4
Resultados de supervivencia mediante Kaplan-Meier en un hipotético ensayo clı́nico sobre la eficacia de la estatistina comparada con placebo
Tiempo de
seguimiento
Supervivencia ST(t) (IC 95%)
1 año
0,74 (0,60 a 0,84)
Error estándar
Supervivencia SNT(t) (IC 95%)
0,06
0,61 (0,49 a 0,72)
Estatistina
Error estándar
NNTB
0,06
NNT B ð1 añoÞ ¼ S
T ðtÞSNT ðtÞ
1
0;590;49
Placebo
1
1
¼ 0;740;61
¼ 7; 7
3 años
0,59 (0,44 a 0,71)
0,07
0,49 (0,36 a 0,61)
0,06
NNT B ð3 añosÞ ¼
5 años
0,45 (0,29 a 0,59)
0,08
0,38 (0,26 a 0,50)
0,06
1
NNT B ð5 añosÞ ¼ 0;450;38
¼ 14; 3
¼ 10
IC 95%: intervalo de confianza del 95%; NNT: número necesario de tratamientos; NNTB: número necesario de tratamientos para beneficiar; RAR: reducción absoluta de riesgo;
SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento; NNTH: número necesario de tratamientos para perjudicar.
qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
Error estándar del RAR: ES½RARð3Þ ¼ ES½ST ð3Þ2 þ ES½SNT ð3Þ2 ¼ 0; 072 þ 0; 062 ¼ 0; 09
Intervalo de confianza del RAR: RAR(3) 1, 96 ES[RAR(3)] = 0, 10 1, 96 0, 09 = 0, 08 a 0, 28
1
1
¼ 3; 6; Lim sup ¼ ¼ 12; 5
Lim inf ¼
Intervalo de confianza del NNT:
0; 28
0; 08
Intervalo de con fianza : NNT H 12; 5 a þ 1a NNT B 3; 6
Las columnas de supervivencia y error estándar se obtienen directamente de los paquetes estadı́sticos habituales; la columna del NNT se ha estimado a partir de los datos de
supervivencia y usando la fórmula indicada en la tabla 2. Al pie de la tabla se detallan los cálculos para el intervalo de confianza de la RAR y del NNT a los 3 años de seguimiento.
Obsérvese que en este caso el intervalo de confianza de la RAR incluye el 0 (la estatistina no aumenta la supervivencia), por lo que el intervalo de confianza del NNT debe incluir el
infinito (para conseguir que sobreviva un paciente más serı́a necesario tratar a infinitos pacientes).
95% 3 a 15). Sin embargo, su análisis de regresión logı́stica reveló
que el NNT tenı́a una variabilidad mayor: OR 0,25 (IC 95% 0,07 a
0,85) con NNTB = 4,4 (IC 95% 3,3 a 28). Como en los ejemplos
anteriores, obsérvese la fuerte asimetrı́a del intervalo.
Cálculo del número necesario de tratamientos con datos de
tiempo hasta el suceso
Cuando el efecto de interés es el tiempo hasta el suceso, el
análisis se suele realizar mediante técnicas de supervivencia. En
estos casos es incorrecto utilizar una tabla 2 2 para calcular el
NNT por 3 motivos: 1) el tiempo de seguimiento no es uniforme
para los distintos participantes en el mismo estudio; 2) hay datos
censurados, es decir, pacientes en los que se interrumpe el
seguimiento antes de que ocurra el suceso, y 3) la diferencia entre
los riesgos en los grupos tratado y no tratado no suele ser
constante a lo largo del tiempo de seguimiento, con lo que el NNT
no es constante a lo largo del tiempo. Por tanto, en un ensayo
clı́nico en el que se ha seguido a los pacientes durante 5 años no
tiene sentido hablar de «el NNT», sino de «el NNT para el tiempo de
seguimiento t»; es decir, habrá un NNT al año, otro a los 2 años y
otro a los 5 años. Supongamos, por ejemplo, que una estatina se
prueba en un ensayo clı́nico a 2 años y obtiene un NNT de 10 para
evitar un infarto, y otra estatina se prueba en un ensayo a 3 años y
el NNT para evitar un infarto es de 8; con estos datos no hay
información suficiente para optar por una de las 2 estatinas
porque el tiempo de seguimiento es distinto y la comparación de
los NNT es delicada.
Veremos cómo estimar el NNT en análisis de supervivencia en 2
situaciones distintas: a partir de los estimadores de Kaplan-Meier y
mediante regresión de Cox.
Kaplan-Meier
El método de Kaplan-Meier permite conocer la probabilidad de
supervivencia libre de suceso para cualquier tiempo de seguimiento (t) en los grupos tratado y no tratado. A partir de esas
probabilidades se pueden estimar la reducción absoluta de riesgo y
el NNT (tabla 2).
Para calcular el intervalo de confianza es necesario conocer el
error estándar de la probabilidad de supervivencia, que se obtiene
fácilmente de cualquiera de los programas estadı́sticos habituales
(tabla 3).
Igual que en el resto de las secciones, si la probabilidad del
suceso es mayor en el grupo tratado, entonces se debe calcular el
NNTH como el negativo del NNTB (tabla 2).
Ejemplo
En la tabla 4 se presenta la probabilidad de supervivencia a 1, 3 y
5 años en un ensayo clı́nico hipotético comparando estatistina con
placebo para el tratamiento del ictus isquémico. Los resultados de
supervivencia, su intervalo de confianza y el error estándar se
pueden obtener directamente de los paquetes estadı́sticos
habituales; en la última columna se ha calculado el NNT: para
evitar una muerte en el primer año hace falta tratar con estatistina
a 7,7 pacientes; en los 3 primeros años harı́a falta tratar a 10
pacientes, y en los 5 primeros años, a 14,3 pacientes. Estos
resultados muestran que el NNT no es constante.
Regresión de Cox
La principal medida del efecto en una regresión de Cox es la HR,
que asume riesgos proporcionales: HR es constante a lo largo del
tiempo. Para el resto de este apartado, no es relevante si la HR se ha
estimado de forma bruta o ajustada. Para calcular el NNTB es
necesario disponer de la HR y de la probabilidad de supervivencia
en el grupo no tratado: SNT(t). Este último valor no se obtiene
directamente de la regresión de Cox, pero puede estimarse por el
método de Kaplan-Meier. Para el intervalo de confianza, la opción
que presentamos en la tabla 3 es utilizar el intervalo de HR y
sustituir en la fórmula anterior (de manera análoga a como se ha
hecho en secciones anteriores); sin embargo, este procedimiento
puede infraestimar el intervalo de confianza del NNT porque ignora
la variabilidad debida a la supervivencia en el grupo no tratado. La
alternativa es estimar el intervalo de confianza mediante
bootstrap14.
Ejemplo
Gramenzi et al.15 trataron con interferón alfa a 72 pacientes
cirróticos infectados con el virus de la hepatitis C y los compararon
con otros 72 pacientes sin interferón. A los 2 años, el 1,5% de los
pacientes tratados y el 11% de los no tratados habı́an desarrollado
un hepatocarcinoma; a los 5 años estas cifras habı́an ascendido a
11 y 27%, respectivamente. La HR (tomando como referencia el
grupo no tratado) fue de 0,23 (0,09 a 0,63).
Como muestra la tabla 5, el NNTB a los 2 años fue de 12
pacientes, con un intervalo de confianza amplio y claramente
asimétrico (de 10 a 26). En cambio, a los 5 años solo era necesario
tratar a 5 pacientes (IC 95% 4,1 a 11,1) para evitar un caso de
hepatocarcinoma.
Obsérvese que como la supervivencia sin hepatocarcinoma
disminuye con el tiempo y el HR es menor que 1, el NNTB disminuye
al crecer el tiempo de seguimiento.
Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456
455
Tabla 5
Número necesario de tratamientos con interferón alfa para evitar un caso de hepatocarcinoma en pacientes cirróticos infectados con el virus de la hepatitis C
Tiempo de
seguimiento
Riesgo acumulado de
hepatocarcinoma en
el grupo no tratado
Supervivencia sin
hepatocarcinoma en
el grupo no tratado (SNT)
NNTB
2 años
0,11
0,89
NNT B ðtÞ ¼
5 años
0,27
0,73
NNT B ðtÞ ¼
IC 95% del NNTBa
1
½SNT ðtÞ
HR
SNT ðtÞ
1
½SNT ðtÞ
HR
SNT ðtÞ
¼
1
0;890;23 0;89
¼
1
0;730;23 0;73
¼ 12
10,0 a 25,5
¼5
4,1 a 11,1
IC 95%: intervalo de confianza del 95%; NNTB: número necesario de tratamientos para beneficiar; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento.
La hazard ratio estimada por regresión de Cox fue de 0,23 (IC 95% 0,09-0,63); este intervalo de confianza se utiliza para calcular el intervalo de confianza del NNT. Los datos de
supervivencia y la hazard ratio proceden de Hickson et al.13.
a
Lı́mite inferior del IC a 2 años: NNT B ðtÞ ¼
Lı́mite superior del IC a 2 años: NNT B ðtÞ ¼
1
Lim inf HR
½SNT ðtÞ
SNT ðtÞ
1
½SNT ðtÞ
Lim sup HR
1
SNT ðtÞ
¼
¼
1
0;890;09 0;89
1
0;890;63 0;89
¼ 10
¼ 25; 5
1
Lı́mite inferior del IC a 5 años: NNT B ðtÞ ¼
¼
¼ 4; 1
Lim inf HR
0;730;09 0;73
SNT ðtÞ
½SNT ðtÞ
1
1
¼
¼ 11; 1
Lı́mite superior del IC a 5 años: NNT B ðtÞ ¼
Lim sup HR
0;730;63 0;73
SNT ðtÞ
½SNT ðtÞ
Ejemplo
En el ensayo STOP-NIDDM16, 1.429 pacientes con intolerancia a
la glucosa fueron aleatorizados para recibir acarbosa o placebo;
tras aplicar los criterios de exclusión, en el análisis se incluyeron
682 pacientes en el grupo de acarbosa y 686 en el grupo de placebo.
Fueron seguidos durante una media de 3,3 años y el efecto
principal fue el episodio cardiovascular mayor. Se produjeron 15
sucesos en el grupo de acarbosa y 32 en el grupo de placebo.
Aunque la mayor parte del análisis se realizó –correctamente–
con regresión de Cox, para el cálculo de NNT se trabajó con una
tabla 2 2 como si no hubiera datos censurados; entonces, el
riesgo en el grupo de acarbosa es 2,2%, en el grupo de placebo es
4,7%, la reducción absoluta de riesgo es 2,5% y el NNTB es 40
(los investigadores no aportaron IC 95% para el NNT, pero con estos
datos serı́a de 22,6 a 172,7).
Cuando Hildebrandt et al.17 recalcularon el NNT con técnicas de
supervivencia encontraron un valor de 57,1 con IC 95% no
significativo: NNTB 24,2 a 1 a NNTH 156,6. El uso que hicieron
los autores originales de la tabla 2 2 podı́a introducir cualquier
tipo de sesgo en el NNT (es decir, podı́a infravalorarlo o
sobrevalorarlo, o incluso no tener ningún efecto), pero el intervalo
de confianza siempre será más estrecho con la tabla 2 2 que con
los métodos de supervivencia, porque en la tabla se considera como
muestra efectiva a todos los participantes en el estudio, mientras
que en el análisis de supervivencia la muestra efectiva depende del
momento en que se haya producido la censura.
Discusión
El uso del NNT se ha generalizado en los ensayos clı́nicos,
especialmente a partir de su inclusión en las recomendaciones
CONSORT18,19; varios autores han defendido su empleo como una
forma sencilla e intuitiva de informar sobre la eficacia de
una intervención (NNTB) o sobre sus efectos secundarios (NNTH).
Los problemas del NNT fueron puestos de manifiesto de manera
temprana; Hutton20 abrió su artı́culo crı́tico con una cita de Aldous
Huxley: «He must learn to simplify, but not to the point of
falsification»21 (Nota: hemos corregido ligeramente la cita de
Hutton a partir del original de Huxley).
En el ejemplo de Hickson et al.13 se obtenı́a un NNTB = 5; la
interpretación habitual de esta cifra serı́a que 5 son los pacientes a
los que habrı́a que tratar con un probiótico para evitar una diarrea.
Esta interpretación considera al NNT como un valor fijo e ignora su
carácter probabilı́stico; de hecho, si al tratar a un paciente la
probabilidad de evitar una diarrea es 0,2, tratando a 5 pacientes
la probabilidad de que no se evite ninguna diarrea es del 33% y de
que se evite una es del 41%. La consideración del NNT como un
valor fijo está tan extendida que en la revisión que realizaron
Hildebrandt et al.17 sobre los ensayos clı́nicos publicados en British
Medical Journal, The Lancet, JAMA y The New England Journal of
Medicine, de 34 artı́culos que informaban del NNT solo 6 aportaban
el correspondiente intervalo de confianza.
El cálculo del NNT a partir de una tabla 2 2 es sencillo. Sin
embargo, muchos artı́culos (probablemente la mayorı́a) presentan
resultados ajustados mediante algún método de regresión,
frecuentemente con datos censurados; entonces, el cálculo del
NNT requiere procedimientos más sofisticados que, con frecuencia,
no se utilizan, produciendo estimaciones erróneas del NNT17. Un
problema menor, pero también objeto de controversia, es si el NNT
debe presentarse como número entero o con decimales; a favor del
número entero está el argumento de que resulta más fácil de
transmitir22; en su contra, que da una sensación de precisión que
no se corresponde con la realidad23.
Uno de los argumentos a favor del uso del NNT es que permite
comparar fácilmente 2 o más tratamientos que han sido valorados
en distintos ensayos clı́nicos. Este argumento es discutible por 2
razones: 1) en los estudios en los que el efecto de interés es el
tiempo hasta el suceso no existe un único NNT, sino que este valor
varı́a con el tiempo de seguimiento; si 2 ensayos clı́nicos tienen
diferente tiempo de seguimiento, la comparación de sus NNT será
errónea, y 2) el NNT implica una comparación con el riesgo basal
del grupo placebo, pero los grupos placebo de cada ensayo pueden
tener diferente riesgo basal; por ejemplo, 2 ensayos clı́nicos sobre
medicamentos para evitar las fracturas vertebrales en mujeres
posmenopáusicas se podrı́an realizar en Finlandia y en España; los
riesgos basales pueden ser diferentes por factores dietéticos,
genéticos o de exposición a la luz solar (valores de vitamina D), y no
hay ningún motivo para pensar que un medicamento va a actuar
igual allı́ donde los valores de vitamina D sean más altos. Esto no se
corrige con el ajuste por factores de confusión.
Cuando el intervalo de confianza del RAR no incluye el 0, el
intervalo de confianza del NNT es tan fácil (o tan difı́cil) de
interpretar como el de cualquier otra medida de uso habitual. Pero
si el intervalo del RAR incluye el 0, entonces el intervalo del NNT es
discontinuo y su interpretación resulta compleja.
Desde que el NNT empezó a utilizarse, han aparecido medidas
similares para otras situaciones. El número necesario de cribados
fue propuesto por Rembold24 para indicar cuántas personas deben
someterse a un cribado para obtener un beneficio; por ejemplo,
Nelson et al.25 encuentran que para evitar una muerte por cáncer
de mama mediante mamografı́a anual es necesario invitar a
participar en el cribado a 1.904 mujeres de 39 a 49 años, 1.339 de
50 a 59 años o 377 de 60 a 69 años. El número necesario
de expuestos se sugirió12 para indicar cuántas personas deben
estar expuestas a un factor de riesgo para que se produzca un caso
más de enfermedad; se trata de una adaptación terminológica del
Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato.
I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456
NNTH a los estudios observacionales, pero sin ninguna modificación en la forma de cálculo. Estas 2 extensiones tienen las mismas
propiedades, ventajas e inconvenientes que el NNT original.
Conclusión
Se ha recomendado el uso del NNT como una forma sencilla de
informar sobre la eficacia de una intervención o sobre sus efectos
secundarios; en particular, la declaración CONSORT recomienda
utilizarlo en los resultados de los ensayos clı́nicos. Sin embargo,
algunos estudios han mostrado que el NNT puede no resultar ni
fácil de calcular ni sencillo de interpretar, por lo que su uso
continúa siendo controvertido.
En esta revisión se llama la atención sobre algunas limitaciones
del NNT. En primer lugar, el cálculo sencillo a partir de una tabla
2 2 solo es aplicable en estudios cuyos resultados se expresen en
forma de riesgos no ajustados. Cuando es necesario el ajuste por
factores de confusión se analizan los datos mediante regresión
logı́stica, o cuando se utilizan datos de tiempo de supervivencia, el
cálculo del NNT requiere fórmulas más complejas (tabla 2).
En segundo lugar, el NNT –como cualquier otro parámetro–
tiene una variación al azar; sin embargo, muchos artı́culos
informan del valor puntual del NNT sin incluir su variación al
azar (por ejemplo, mediante el intervalo de confianza). La tabla 3
muestra cómo se puede estimar dicho intervalo, pero quizá lo más
importante es que el intervalo de confianza del NNT se tiene que
interpretar de una forma poco intuitiva, especialmente cuando el
resultado no es significativo.
En tercer lugar, en estudios con seguimiento el NNT no es un
valor fijo, sino que varı́a a lo largo del tiempo. Esto resulta
especialmente importante cuando se pretende comparar los
resultados de 2 ensayos clı́nicos en los que el tiempo de
seguimiento es diferente; la tabla 4 muestra que esta comparación
puede ser errónea.
En resumen, a pesar de su apariencia, estimar e interpretar el
NNT y su variación al azar puede resultar complejo cuando se
realiza un análisis multivariante o un análisis de supervivencia. En
este trabajo se presentan las fórmulas adecuadas y las dificultades
de interpretación.
Conflicto de intereses
Los autores declaran no tener ningún conflicto de intereses.
Agradecimientos
Los autores agradecen al Dr. Jesús González Macı́as la revisión
del artı́culo desde el punto de vista clı́nico.
Bibliografı́a
1. Porta M. A dictionary of epidemiology. 5th ed. New York: Oxford University
Press; 2008.
2. Laupacis A, Sackett DL, Roberts RS. An assessment of clinically useful measures
of the consequences of treatment. N Engl J Med. 1988;318:1728–33.
3. McAlister FA. The ‘‘number needed to treat’’ turns 20–And continues to be used
and misused. CMAJ. 2008;179:549–53.
4. Chatellier G, Zapletal E, Lemaitre D, Menard J, Degoulet P. The number needed to
treat: A clinically useful nomogram in its proper context. BMJ. 1996;312:426–9.
5. Altman DG. Confidence intervals for the number needed to treat. BMJ.
1998;317:1309–12.
6. Lui KJ. A simple logical solution to eliminate the limitations of using the number
needed to treat. Eval Health Prof. 2004;27:206–14.
7. Bender R. Calculating confidence intervals for the number needed to treat.
Control Clin Trials. 2001;22:102–10.
8. Grieve AP. The number needed to treat: A useful clinical measure or a case of the
Emperor’s new clothes? Pharm Stat. 2003;2:87–102.
9. Bickel PJ, Doksum KA. Mathematical statistics: Basic ideas and selected topics.
San Francisco: Holden-Day; 1977.
10. Newcombe RG. Know your limitations: Not just for clinicians. Estimation
of confidence intervals is not straightforward. J Public Health Med. 1999;
21:481–2.
11. Martı́nez-González MA, Seguı́-Gómez M, Delgado-Rodrı́guez M. Cómo
mejorar los intervalos de confianza? Med Clin (Barc). 2010;135:30–4.
12. Bender R, Blettner M. Calculating the ‘‘number needed to be exposed’’ with
adjustment for confounding variables in epidemiological studies. J Clin Epidemiol. 2002;55:525–30.
13. Hickson M, D’Souza AL, Muthu N, Rogers TR, Want S, Rajkumar C, et al. Use of
probiotic Lactobacillus preparation to prevent diarrhoea associated with antibiotics: Randomised double blind placebo controlled trial. BMJ. 2007;335:80–3.
14. Austin PC. Absolute risk reductions and numbers needed to treat can be
obtained from adjusted survival models for time-to-event outcomes. J Clin
Epidemiol. 2010;63:46–55.
15. Gramenzi A, Andreone P, Fiorino S, Camma C, Giunta M, Magalotti D, et al.
Impact of interferon therapy on the natural history of hepatitis C virus related
cirrhosis. Gut. 2001;48:843–8.
16. Chiasson JL, Josse RG, Gomis R, Hanefeld M, Karasik A, Laakso M. Acarbose
treatment and the risk of cardiovascular disease and hypertension in patients
with impaired glucose tolerance: The STOP-NIDDM trial. JAMA. 2003;290:
486–94.
17. Hildebrandt M, Vervölgyi E, Bender R. Calculation of NNTs in RCTs with time-toevent outcomes: A literature review. BMC Med Res Methodol. 2009;9:21.
18. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The
revised CONSORT statement for reporting randomized trials: Explanation and
elaboration. Ann Intern Med. 2001;134:663–94.
19. Cobos-Carbo A, Augustovski F. Declaración CONSORT 2010: actualización de la
lista de comprobación para informar ensayos clı́nicos aleatorizados de grupos
paralelos. Med Clin (Barc). 2011;137:213–5.
20. Hutton JL. Number needed to treat: Properties and problems. J R Stat Soc Ser A
Stat Soc. 2000;163:403–15.
21. Huxley A. Brave new world revisited (1958) [consultado 27 Sep 2012]. Disponible en: http://www.huxley.net/bnw-revisited/
22. Sackett DL. On some clinically useful measures of the effects of treatment. Evid
Based Med. 1996;1:37–8.
23. Stang A, Poole C, Bender R. Common problems related to the use of number
needed to treat. J Clin Epidemiol. 2010;63:820–5.
24. Rembold CM. Number needed to screen: Development of a statistic for disease
screening. BMJ. 1998;317:307–12.
25. Nelson HD, Tyne K, Naik A, Bougatsos C, Chan BK, Humphrey L, U.S. Preventive
Services Task Force. Screening for breast cancer: An update for the U.S. Preventive Services Task Force. Ann Intern Med. 2009;151:727–37. W237-42.
?
456
Descargar