Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Med Clin (Barc). 2014;142(10):451–456 www.elsevier.es/medicinaclinica Revisión Número necesario de tratamientos: interpretación y estimación en análisis multivariables y con datos censurados Inés Gómez-Acebo a,*, Trinidad Dierssen-Sotos b y Javier Llorca c a Facultad de Medicina, Universidad de Cantabria, Santander, España Centro de Investigación Biomédica en Red de Epidemiologı´a y Salud Pública (CIBERESP), España c Instituto de Formación e Investigación Marqués de Valdecilla (IFIMAV), Santander, España b I N F O R M A C I Ó N D E L A R T Í C U L O R E S U M E N Historia del artı´culo: Recibido el 9 de noviembre de 2012 Aceptado el 9 de mayo de 2013 On-line el 11 de julio de 2013 El número necesario de tratamientos se ha recomendado como una forma sencilla de transmitir los resultados de un estudio, especialmente de un ensayo clı́nico. La mayor parte de las publicaciones lo estiman a partir de una tabla 2 2, como el inverso de la reducción absoluta de riesgos. No obstante, se ha llamado la atención sobre algunas limitaciones: la interpretación no resulta tan sencilla como se habı́a pretendido, frecuentemente se ignora la estimación del intervalo de confianza, y los estudios en los que se estima una medida de efecto ajustado por factores de confusión no pueden utilizar las tablas 2 2 en el cálculo del número necesario de tratamientos. En este trabajo revisamos la forma de obtener la estimación puntual y el intervalo confianza en 4 situaciones: tablas 2 2, regresión logı́stica, método de Kaplan-Meier y regresión de Cox. ß 2012 Elsevier España, S.L. Todos los derechos reservados. Palabras clave: Ensayos clı́nicos Estimador de Kaplan-Meier Estudios epidemiológicos Número necesario de tratamientos Reducción absoluta de riesgos Regresión logı́stica Regresión de Cox Number needed to treat: Interpretation and estimation in multivariable analyses and censored data A B S T R A C T Keywords: Controlled clinical trials Kaplan-Meier estimation Epidemiologic method Number needed to treat Absolut risk reduction Logistic regression Cox regression Number needed to treat has been recommended as an easy way to transmit results from a trial, especially controlled clinical trials. Most articles estimate it from a 2 2 table, as the inverse of the absolute risk reduction. However, some limitations have been pointed out: The interpretation is not as easy as claimed, confidence intervals are frequently not estimated, and the estimation from 2 2 tables is inadequate when the main effect measure has been estimated adjusting for confounding factors. In this paper, we revise how to obtain point estimations and confidence intervals of number needed to treat in 4 situations: 2 2 tables, logistic regression, Kaplan-Meier method, and Cox regression. ß 2012 Elsevier España, S.L. All rights reserved. Introducción El número necesario de tratamientos (NNT) se define como el número de pacientes que es necesario tratar para evitar un suceso1. En un ensayo clı́nico representa el número de pacientes adicionales que deberı́an recibir el tratamiento experimental en lugar del tratamiento control para conseguir un resultado positivo adicional, o bien para prevenir un resultado adverso2. Sin embargo, varios artı́culos han señalado las limitaciones del NNT3: la interpretación no es tan sencilla como se habı́a pretendido, el cálculo depende del * Autor para correspondencia. Correo electrónico: [email protected] (I. Gómez-Acebo). tiempo de seguimiento4 y se tiende a presentar el NNT como una estimación puntual, sin intervalo de confianza, probablemente porque este puede tener una complejidad adicional. En este trabajo revisaremos la forma de calcular el NNT cuando se dispone de datos acumulados (riesgos) o cuando se dispone de datos de tiempo de seguimiento, su intervalo de confianza y las dificultades de interpretación que plantea. Cálculo del número necesario de tratamientos a partir de una tabla 2 T 2 En el resto del artı́culo consideraremos que la finalidad del tratamiento es evitar un efecto perjudicial en un ensayo clı́nico, y al NNT correspondiente lo denominaremos número necesario de tratamientos para beneficiar (NNTB)5,6. 0025-7753/$ – see front matter ß 2012 Elsevier España, S.L. Todos los derechos reservados. http://dx.doi.org/10.1016/j.medcli.2013.05.003 Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 452 Tabla 1 Cálculo del número necesario de tratamientos a partir de una tabla 2 2 Episodios No episodios Población aT aNT bT bNT nT nNT Fracturas vertebrales No fracturas vertebrales a Nomenclatura Tratamiento experimental Placebo Ejemplo: reducción de fracturas vertebrales en mujeres posmenopáusicas con un nuevo medicamento (epidemiolato) Epidemiolato 8 390 Placebo 20 380 Población b 400 400 ES: error estándar; IC: intervalo de confianza; NNT: número necesario de tratamientos; RAR: reducción absoluta de riesgo. a a Riesgo en el grupo experimental: RT ¼ nT T a Riesgo en el grupo con placebo: RNT ¼ nNT NT aNT aT RAR ¼ RNT RT ¼ n n NT 1 NNT ¼ RAR ¼R 1 NT RT ¼ NT 1 aNT aT nNT nT b 8 Riesgo en el grupo con epidemiolato: RT ¼ 400 ¼ 0; 02 20 Riesgo en el grupo con placebo: RNT ¼ 400 ¼ 0; 05 RAR = 0, 05 0, 02 = 0, 03 1 1 NNT ¼ RAR ¼ 0;03 ¼ 33 qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi þ 0;050;95 ESðRARÞ ¼ 0;020;98 ¼ 0; 013 400 400 IC 95% (RAR): RAR 1, 96 ES(RAR) = 0, 0046 a 0, 0554 1 1 ICðNNT B Þ ¼ 0;0554 ; 0;0046 ¼ 18 a 217 y su intervalo de confianza puede estimarse con la aproximación normal, si el tamaño muestral es suficiente. Entonces, el intervalo de confianza del NNT es (tabla 3)7: En la tabla 1 se presenta la notación habitual para una tabla 2 2, junto con las definiciones de riesgo en pacientes que reciben el tratamiento (RT) y en pacientes que no lo reciben (RNT). En estas condiciones, el NNT se define como el inverso de la reducción absoluta de riesgo (RAR) (tabla 1): NNT B ¼ 1 1 1 ¼ ¼ RAR RNT RT naNT naT NT ICðNNT B Þ ¼ 1 1 ¼ RT RNT naT naNT T NT (3) (1) Ejemplo T De forma general, consideraremos el caso en el que los pacientes que reciben el tratamiento tienen menor riesgo, con lo que la fórmula 1 es positiva. En caso contrario, nos halları́amos ante el número necesario de tratamientos para perjudicar (NNTH), cuya fórmula es igual a la anterior, pero cambiando el signo del denominador (tabla 2): NNT H ¼ NNT B ¼ 1 1 ; Lim sup RAR Lim inf RAR si RT > RNT La tabla 1 (b) presenta los resultados de un ensayo clı́nico en el que se investiga la eficacia de un nuevo medicamento (epidemiolato) en la prevención de fracturas vertebrales en mujeres posmenopáusicas. Ochocientas mujeres han sido asignadas al azar a 2 ramas: 400 han tomado epidemiolato y 400 han recibido placebo. La RAR es 0,03, con intervalo de confianza del 95% (IC 95%) 0,005 a 0,055; para evitar una fractura vertebral es necesario tratar con epidemiolato a 33 mujeres (IC 95% 18 a 217). Es decir, la estimación puntual indica que en este estudio será necesario tratar a 33 mujeres para evitar una fractura vertebral, pero la variación al azar sugiere que el verdadero NNT puede ser tan bueno como una fractura evitada por cada 18 pacientes tratadas o tan desfavorable como 217 tratamientos necesarios. El otro aspecto a destacar es la fuerte asimetrı́a del intervalo de confianza. Cuando el intervalo de confianza de la RAR incluye el 0 surge una dificultad añadida en el cálculo e interpretación del intervalo de confianza del NNT: cuanto menor sea el efecto del tratamiento, mayor es el NNT; en el extremo, una RAR = 0 significa que el tratamiento no tiene ningún efecto y entonces serı́a necesario tratar a infinitos pacientes para obtener un resultado favorable en (2) El intervalo de confianza del NNT no debe calcularse directamente, porque no tiene distribución normal, por ello han sido propuestas otras aproximaciones7–10. Aunque es posible emplear métodos bayesianos11, el modo más sencillo es estimar el intervalo de confianza para la RAR y, en la fórmula 1, sustituir sucesivamente RAR por el lı́mite superior y por el lı́mite inferior de su intervalo: el error estándar de la RAR es: sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi RT ð1 RT Þ RNT ð1 RNT Þ ESðRARÞ ¼ þ ; nT nNT Tabla 2 Cálculo del número necesario de tratamientos para beneficiar y para perjudicar en distintos escenarios de análisis Tipo de análisis NNTB Tabla 2 2 1 NNT B ¼ RAR ¼R Regresión logı́stica NNT B ¼ NNTH 1 NT RT 1 ð1ORÞRNT 1 RARðtÞ þ Kaplan-Meier NNT B ðtÞ ¼ Regresión de Cox 1 NNT B ðtÞ ¼ RARðtÞ ¼ ¼ si RT < RNT OR ð1ORÞð1RNT Þ 1 ST ðtÞSNT ðtÞ HR si OR < 1 si SNT ðtÞ < ST ðtÞ 1 ½SNT ðtÞ NNT H ¼ R SNT ðtÞ si HR < 1 NNT H ¼ 1 T RNT 1 ðOR1ÞRNT NNT H ðtÞ ¼ NNT H ðtÞ ¼ si RT > RNT OR þ ðOR1Þð1R NT Þ 1 SNT ðtÞST ðtÞ 1 si OR > 1 si ST ðtÞ < SNT ðtÞ HR SNT ðtÞ½SNT ðtÞ si HR > 1 HR: hazard ratio; NNTB: número necesario de tratamientos para beneficiar; NNTH: número necesario de tratamientos para perjudicar; OR: odds ratio; RAR: reducción absoluta de riesgo; RNT: riesgo en el grupo no tratado; RT: riesgo en el grupo tratado; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento; ST(t): supervivencia en el grupo tratado en el tiempo (t) de seguimiento. Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 453 Tabla 3 Cálculo del intervalo de confianza del número necesario de tratamientos en distintos escenarios de análisis Tipo de análisis Información necesaria IC 95% Tabla 2 2 Intervalo de confianza del RAR: Lim inf RAR, Lim sup RAR Regresión logı́stica RNT. Intervalo de confianza de la OR: Lim inf OR, Lim sup OR Kaplan-Meier qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi Error estándar del RAR: ES½RARðtÞ ¼ ES½ST ðtÞ2 þ ES½SNT ðtÞ2 . Intervalo de confianza del RAR: RAR 1, 96 ES[RAR(t)] Intervalo de confianza del HR: Lim inf HR, Lim sup HR 1 Lim sup RAR 1 Lim sup NNT ¼ Lim inf RAR 1 Lim inf OR þ Lim inf NNT B ¼ ð1 Lim inf ORÞRNT ð1 Lim inf ORÞð1 RNT Þ 1 Lim sup OR Lim sup NNT B ¼ þ ð1 Lim sup ORÞRNT ð1 Lim sup ORÞð1 RNT Þ qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi 1 1 ES½RARðtÞ ¼ ES½ST ðtÞ2 þ ES½SNT ðtÞ2 ; Lim sup RAR ; Lim inf RAR Regresión de Cox Lim inf NNT ¼ Lim infNNT B ðtÞ ¼ 1 ½SNT ðtÞLim Lim supNNT B ðtÞ ¼ ½SNT ðtÞ sup HR 1 Lim inf HR SNT ðtÞ SNT ðtÞ HR: hazard ratio; IC 95%: intervalo de confianza del 95%; Lim inf: lı́mite inferior del intervalo de confianza; Lim sup: lı́mite superior del intervalo de confianza; NNTB: número necesario de tratamientos para beneficiar; RAR: reducción absoluta de riesgo; RNT: riesgo en el grupo no tratado; OR: odds ratio; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento. uno de ellos. Como consecuencia, si el intervalo de confianza de la RAR incluye el 0, el intervalo del NNT pasará por el infinito. Para ilustrarlo, supongamos que RAR = 0,01 y su IC 95% es -0,01 a 0,03. Entonces, NNT = 100 y el intervalo de confianza es discontinuo: de 33 a +1 y de -1 a -100. Para facilitar la lectura de este resultado, Altman5 propuso la siguiente terminologı́a: NNTB = 100 (IC 95%: NNTH 100 a +1 a NNTB 33), que puede interpretarse como que el resultado es compatible con valores de NNTB mayores de 33 y con valores de NNTH mayores de 100; dicho de otra forma, excluye por inverosı́miles los valores de NNT menores de 33 para evitar una fractura y los valores de NNT menores de 100 para producirla. Quizá sea más claro mostrar el intervalo de confianza del NNT en una figura en la que la escala se ha cambiado para situar el infinito como eje; por debajo están los valores del NNTH y por encima los del NNTB5. Ası́ se han representado en la figura 1 los 2 intervalos de confianza de este ejemplo: en la escala de la izquierda figura la RAR, y en la de la derecha, el NNT; el intervalo de confianza marcado como (a) corresponde a una RAR de 0,03 (IC 95% 0,005 a 0,055) y a un NNT de 33 (IC 95% 18 a 217). El intervalo marcado como (b) corresponde a una RAR de 0,01 (-0,01 a 0,03) y un NNT de 100 (IC RAR .06 (a) (b) 16.7 .04 25 .02 50 .01 100 0 NNTB ∞ -.01 -100 -.02 -50 -.04 -25 NNT H Figura 1. Presentación gráfica de la RAR (eje de la izquierda) y del intervalo de confianza del número necesario de tratamientos (NNT) cambiando la escala (eje de la derecha): el valor NNT = infinito se sitúa en el eje principal; por debajo de este eje, los valores indican NNTH, por encima NNTB. El intervalo (a) corresponde a una RAR de 0,03 (IC 95%: 0,005 a 0,055) y a un NNT de 33 (IC 95%: 18 a 217). El intervalo (b) corresponde a una RAR de 0,01 (-0,01 a 0,03) y un NNT de 100 (IC 95%: -1 a -100 y 33 a 1). De esta forma, los 2 intervalos de confianza de la figura 1 se convierten en continuos y simétricos; el hecho de que el intervalo (b) cruce el valor 1 indica que el resultado es no significativo. 95% -1 a -100 y 33 a +1); esta figura muestra que con el cambio de escala se consigue que el intervalo de confianza del NNT sea siempre continuo, simétrico e incluya la estimación puntual. Cálculo del número necesario de tratamientos con regresión logı́stica Con las tablas 2 2 podemos obtener los NNT de estudios cuyos resultados se expresan en forma de riesgos, tal y como hemos señalado en el ejemplo previo; sin embargo, en otras ocasiones el resultado se expresa como odds ratio (OR), como hazard ratio (HR), etc. En tales casos debe recurrirse a procedimientos diferentes. Dichos procedimientos pueden exigir disponer de información adicional –como ocurre con el riesgo basal–, y varı́an de un caso a otro. En estudios en los que el efecto de interés sea binario (es decir, el carácter inmediato permita no requerir el estudio del tiempo hasta el suceso), es frecuente que la principal medida de efecto sea la OR ajustada por factores de confusión, obtenida mediante regresión logı́stica. En estos casos, puede estimarse el NNT si se conoce el riesgo basal (riesgo en el grupo no tratado)11 (tabla 2). En un estudio de casos y controles, el riesgo basal debe ser conocido por una fuente externa al estudio (por ejemplo, un sistema de vigilancia epidemiológica); en este caso RNT puede considerarse un parámetro fijo y el intervalo de confianza del NNTB solo depende de la variabilidad de la OR y puede calcularse como se indica en la tabla 3. En cambio, si la regresión logı́stica se ha aplicado a un estudio de cohortes o a un ensayo clı́nico, la fórmula que se presenta en la tabla 3 infraestima la amplitud del intervalo del NNT al ignorar la variabilidad de RNT. Lo correcto en este caso12 es aplicar el método delta multivariante, aunque este método puede dar intervalos con cobertura inadecuada si la OR está próxima a 1 o el RNT es cercano a 0 o a 1. Si el riesgo en el grupo tratado es mayor que en el no tratado, el NNTH puede estimarse a partir del NNTB cambiando el signo (tabla 2). Ejemplo Hickson et al.13 llevaron a cabo un ensayo clı́nico sobre la eficacia de probióticos en la prevención de diarrea asociada a antibióticos; 19 de 56 pacientes del grupo de placebo y 7 de 57 en el grupo del probiótico desarrollaron diarrea. Utilizando una tabla 2 2 se encuentra RAR = 0,22 (IC 95% 0,07 a 0,37) y NNTB = 5 (IC Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. 454 I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 Tabla 4 Resultados de supervivencia mediante Kaplan-Meier en un hipotético ensayo clı́nico sobre la eficacia de la estatistina comparada con placebo Tiempo de seguimiento Supervivencia ST(t) (IC 95%) 1 año 0,74 (0,60 a 0,84) Error estándar Supervivencia SNT(t) (IC 95%) 0,06 0,61 (0,49 a 0,72) Estatistina Error estándar NNTB 0,06 NNT B ð1 añoÞ ¼ S T ðtÞSNT ðtÞ 1 0;590;49 Placebo 1 1 ¼ 0;740;61 ¼ 7; 7 3 años 0,59 (0,44 a 0,71) 0,07 0,49 (0,36 a 0,61) 0,06 NNT B ð3 añosÞ ¼ 5 años 0,45 (0,29 a 0,59) 0,08 0,38 (0,26 a 0,50) 0,06 1 NNT B ð5 añosÞ ¼ 0;450;38 ¼ 14; 3 ¼ 10 IC 95%: intervalo de confianza del 95%; NNT: número necesario de tratamientos; NNTB: número necesario de tratamientos para beneficiar; RAR: reducción absoluta de riesgo; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento; NNTH: número necesario de tratamientos para perjudicar. qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi Error estándar del RAR: ES½RARð3Þ ¼ ES½ST ð3Þ2 þ ES½SNT ð3Þ2 ¼ 0; 072 þ 0; 062 ¼ 0; 09 Intervalo de confianza del RAR: RAR(3) 1, 96 ES[RAR(3)] = 0, 10 1, 96 0, 09 = 0, 08 a 0, 28 1 1 ¼ 3; 6; Lim sup ¼ ¼ 12; 5 Lim inf ¼ Intervalo de confianza del NNT: 0; 28 0; 08 Intervalo de con fianza : NNT H 12; 5 a þ 1a NNT B 3; 6 Las columnas de supervivencia y error estándar se obtienen directamente de los paquetes estadı́sticos habituales; la columna del NNT se ha estimado a partir de los datos de supervivencia y usando la fórmula indicada en la tabla 2. Al pie de la tabla se detallan los cálculos para el intervalo de confianza de la RAR y del NNT a los 3 años de seguimiento. Obsérvese que en este caso el intervalo de confianza de la RAR incluye el 0 (la estatistina no aumenta la supervivencia), por lo que el intervalo de confianza del NNT debe incluir el infinito (para conseguir que sobreviva un paciente más serı́a necesario tratar a infinitos pacientes). 95% 3 a 15). Sin embargo, su análisis de regresión logı́stica reveló que el NNT tenı́a una variabilidad mayor: OR 0,25 (IC 95% 0,07 a 0,85) con NNTB = 4,4 (IC 95% 3,3 a 28). Como en los ejemplos anteriores, obsérvese la fuerte asimetrı́a del intervalo. Cálculo del número necesario de tratamientos con datos de tiempo hasta el suceso Cuando el efecto de interés es el tiempo hasta el suceso, el análisis se suele realizar mediante técnicas de supervivencia. En estos casos es incorrecto utilizar una tabla 2 2 para calcular el NNT por 3 motivos: 1) el tiempo de seguimiento no es uniforme para los distintos participantes en el mismo estudio; 2) hay datos censurados, es decir, pacientes en los que se interrumpe el seguimiento antes de que ocurra el suceso, y 3) la diferencia entre los riesgos en los grupos tratado y no tratado no suele ser constante a lo largo del tiempo de seguimiento, con lo que el NNT no es constante a lo largo del tiempo. Por tanto, en un ensayo clı́nico en el que se ha seguido a los pacientes durante 5 años no tiene sentido hablar de «el NNT», sino de «el NNT para el tiempo de seguimiento t»; es decir, habrá un NNT al año, otro a los 2 años y otro a los 5 años. Supongamos, por ejemplo, que una estatina se prueba en un ensayo clı́nico a 2 años y obtiene un NNT de 10 para evitar un infarto, y otra estatina se prueba en un ensayo a 3 años y el NNT para evitar un infarto es de 8; con estos datos no hay información suficiente para optar por una de las 2 estatinas porque el tiempo de seguimiento es distinto y la comparación de los NNT es delicada. Veremos cómo estimar el NNT en análisis de supervivencia en 2 situaciones distintas: a partir de los estimadores de Kaplan-Meier y mediante regresión de Cox. Kaplan-Meier El método de Kaplan-Meier permite conocer la probabilidad de supervivencia libre de suceso para cualquier tiempo de seguimiento (t) en los grupos tratado y no tratado. A partir de esas probabilidades se pueden estimar la reducción absoluta de riesgo y el NNT (tabla 2). Para calcular el intervalo de confianza es necesario conocer el error estándar de la probabilidad de supervivencia, que se obtiene fácilmente de cualquiera de los programas estadı́sticos habituales (tabla 3). Igual que en el resto de las secciones, si la probabilidad del suceso es mayor en el grupo tratado, entonces se debe calcular el NNTH como el negativo del NNTB (tabla 2). Ejemplo En la tabla 4 se presenta la probabilidad de supervivencia a 1, 3 y 5 años en un ensayo clı́nico hipotético comparando estatistina con placebo para el tratamiento del ictus isquémico. Los resultados de supervivencia, su intervalo de confianza y el error estándar se pueden obtener directamente de los paquetes estadı́sticos habituales; en la última columna se ha calculado el NNT: para evitar una muerte en el primer año hace falta tratar con estatistina a 7,7 pacientes; en los 3 primeros años harı́a falta tratar a 10 pacientes, y en los 5 primeros años, a 14,3 pacientes. Estos resultados muestran que el NNT no es constante. Regresión de Cox La principal medida del efecto en una regresión de Cox es la HR, que asume riesgos proporcionales: HR es constante a lo largo del tiempo. Para el resto de este apartado, no es relevante si la HR se ha estimado de forma bruta o ajustada. Para calcular el NNTB es necesario disponer de la HR y de la probabilidad de supervivencia en el grupo no tratado: SNT(t). Este último valor no se obtiene directamente de la regresión de Cox, pero puede estimarse por el método de Kaplan-Meier. Para el intervalo de confianza, la opción que presentamos en la tabla 3 es utilizar el intervalo de HR y sustituir en la fórmula anterior (de manera análoga a como se ha hecho en secciones anteriores); sin embargo, este procedimiento puede infraestimar el intervalo de confianza del NNT porque ignora la variabilidad debida a la supervivencia en el grupo no tratado. La alternativa es estimar el intervalo de confianza mediante bootstrap14. Ejemplo Gramenzi et al.15 trataron con interferón alfa a 72 pacientes cirróticos infectados con el virus de la hepatitis C y los compararon con otros 72 pacientes sin interferón. A los 2 años, el 1,5% de los pacientes tratados y el 11% de los no tratados habı́an desarrollado un hepatocarcinoma; a los 5 años estas cifras habı́an ascendido a 11 y 27%, respectivamente. La HR (tomando como referencia el grupo no tratado) fue de 0,23 (0,09 a 0,63). Como muestra la tabla 5, el NNTB a los 2 años fue de 12 pacientes, con un intervalo de confianza amplio y claramente asimétrico (de 10 a 26). En cambio, a los 5 años solo era necesario tratar a 5 pacientes (IC 95% 4,1 a 11,1) para evitar un caso de hepatocarcinoma. Obsérvese que como la supervivencia sin hepatocarcinoma disminuye con el tiempo y el HR es menor que 1, el NNTB disminuye al crecer el tiempo de seguimiento. Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 455 Tabla 5 Número necesario de tratamientos con interferón alfa para evitar un caso de hepatocarcinoma en pacientes cirróticos infectados con el virus de la hepatitis C Tiempo de seguimiento Riesgo acumulado de hepatocarcinoma en el grupo no tratado Supervivencia sin hepatocarcinoma en el grupo no tratado (SNT) NNTB 2 años 0,11 0,89 NNT B ðtÞ ¼ 5 años 0,27 0,73 NNT B ðtÞ ¼ IC 95% del NNTBa 1 ½SNT ðtÞ HR SNT ðtÞ 1 ½SNT ðtÞ HR SNT ðtÞ ¼ 1 0;890;23 0;89 ¼ 1 0;730;23 0;73 ¼ 12 10,0 a 25,5 ¼5 4,1 a 11,1 IC 95%: intervalo de confianza del 95%; NNTB: número necesario de tratamientos para beneficiar; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento. La hazard ratio estimada por regresión de Cox fue de 0,23 (IC 95% 0,09-0,63); este intervalo de confianza se utiliza para calcular el intervalo de confianza del NNT. Los datos de supervivencia y la hazard ratio proceden de Hickson et al.13. a Lı́mite inferior del IC a 2 años: NNT B ðtÞ ¼ Lı́mite superior del IC a 2 años: NNT B ðtÞ ¼ 1 Lim inf HR ½SNT ðtÞ SNT ðtÞ 1 ½SNT ðtÞ Lim sup HR 1 SNT ðtÞ ¼ ¼ 1 0;890;09 0;89 1 0;890;63 0;89 ¼ 10 ¼ 25; 5 1 Lı́mite inferior del IC a 5 años: NNT B ðtÞ ¼ ¼ ¼ 4; 1 Lim inf HR 0;730;09 0;73 SNT ðtÞ ½SNT ðtÞ 1 1 ¼ ¼ 11; 1 Lı́mite superior del IC a 5 años: NNT B ðtÞ ¼ Lim sup HR 0;730;63 0;73 SNT ðtÞ ½SNT ðtÞ Ejemplo En el ensayo STOP-NIDDM16, 1.429 pacientes con intolerancia a la glucosa fueron aleatorizados para recibir acarbosa o placebo; tras aplicar los criterios de exclusión, en el análisis se incluyeron 682 pacientes en el grupo de acarbosa y 686 en el grupo de placebo. Fueron seguidos durante una media de 3,3 años y el efecto principal fue el episodio cardiovascular mayor. Se produjeron 15 sucesos en el grupo de acarbosa y 32 en el grupo de placebo. Aunque la mayor parte del análisis se realizó –correctamente– con regresión de Cox, para el cálculo de NNT se trabajó con una tabla 2 2 como si no hubiera datos censurados; entonces, el riesgo en el grupo de acarbosa es 2,2%, en el grupo de placebo es 4,7%, la reducción absoluta de riesgo es 2,5% y el NNTB es 40 (los investigadores no aportaron IC 95% para el NNT, pero con estos datos serı́a de 22,6 a 172,7). Cuando Hildebrandt et al.17 recalcularon el NNT con técnicas de supervivencia encontraron un valor de 57,1 con IC 95% no significativo: NNTB 24,2 a 1 a NNTH 156,6. El uso que hicieron los autores originales de la tabla 2 2 podı́a introducir cualquier tipo de sesgo en el NNT (es decir, podı́a infravalorarlo o sobrevalorarlo, o incluso no tener ningún efecto), pero el intervalo de confianza siempre será más estrecho con la tabla 2 2 que con los métodos de supervivencia, porque en la tabla se considera como muestra efectiva a todos los participantes en el estudio, mientras que en el análisis de supervivencia la muestra efectiva depende del momento en que se haya producido la censura. Discusión El uso del NNT se ha generalizado en los ensayos clı́nicos, especialmente a partir de su inclusión en las recomendaciones CONSORT18,19; varios autores han defendido su empleo como una forma sencilla e intuitiva de informar sobre la eficacia de una intervención (NNTB) o sobre sus efectos secundarios (NNTH). Los problemas del NNT fueron puestos de manifiesto de manera temprana; Hutton20 abrió su artı́culo crı́tico con una cita de Aldous Huxley: «He must learn to simplify, but not to the point of falsification»21 (Nota: hemos corregido ligeramente la cita de Hutton a partir del original de Huxley). En el ejemplo de Hickson et al.13 se obtenı́a un NNTB = 5; la interpretación habitual de esta cifra serı́a que 5 son los pacientes a los que habrı́a que tratar con un probiótico para evitar una diarrea. Esta interpretación considera al NNT como un valor fijo e ignora su carácter probabilı́stico; de hecho, si al tratar a un paciente la probabilidad de evitar una diarrea es 0,2, tratando a 5 pacientes la probabilidad de que no se evite ninguna diarrea es del 33% y de que se evite una es del 41%. La consideración del NNT como un valor fijo está tan extendida que en la revisión que realizaron Hildebrandt et al.17 sobre los ensayos clı́nicos publicados en British Medical Journal, The Lancet, JAMA y The New England Journal of Medicine, de 34 artı́culos que informaban del NNT solo 6 aportaban el correspondiente intervalo de confianza. El cálculo del NNT a partir de una tabla 2 2 es sencillo. Sin embargo, muchos artı́culos (probablemente la mayorı́a) presentan resultados ajustados mediante algún método de regresión, frecuentemente con datos censurados; entonces, el cálculo del NNT requiere procedimientos más sofisticados que, con frecuencia, no se utilizan, produciendo estimaciones erróneas del NNT17. Un problema menor, pero también objeto de controversia, es si el NNT debe presentarse como número entero o con decimales; a favor del número entero está el argumento de que resulta más fácil de transmitir22; en su contra, que da una sensación de precisión que no se corresponde con la realidad23. Uno de los argumentos a favor del uso del NNT es que permite comparar fácilmente 2 o más tratamientos que han sido valorados en distintos ensayos clı́nicos. Este argumento es discutible por 2 razones: 1) en los estudios en los que el efecto de interés es el tiempo hasta el suceso no existe un único NNT, sino que este valor varı́a con el tiempo de seguimiento; si 2 ensayos clı́nicos tienen diferente tiempo de seguimiento, la comparación de sus NNT será errónea, y 2) el NNT implica una comparación con el riesgo basal del grupo placebo, pero los grupos placebo de cada ensayo pueden tener diferente riesgo basal; por ejemplo, 2 ensayos clı́nicos sobre medicamentos para evitar las fracturas vertebrales en mujeres posmenopáusicas se podrı́an realizar en Finlandia y en España; los riesgos basales pueden ser diferentes por factores dietéticos, genéticos o de exposición a la luz solar (valores de vitamina D), y no hay ningún motivo para pensar que un medicamento va a actuar igual allı́ donde los valores de vitamina D sean más altos. Esto no se corrige con el ajuste por factores de confusión. Cuando el intervalo de confianza del RAR no incluye el 0, el intervalo de confianza del NNT es tan fácil (o tan difı́cil) de interpretar como el de cualquier otra medida de uso habitual. Pero si el intervalo del RAR incluye el 0, entonces el intervalo del NNT es discontinuo y su interpretación resulta compleja. Desde que el NNT empezó a utilizarse, han aparecido medidas similares para otras situaciones. El número necesario de cribados fue propuesto por Rembold24 para indicar cuántas personas deben someterse a un cribado para obtener un beneficio; por ejemplo, Nelson et al.25 encuentran que para evitar una muerte por cáncer de mama mediante mamografı́a anual es necesario invitar a participar en el cribado a 1.904 mujeres de 39 a 49 años, 1.339 de 50 a 59 años o 377 de 60 a 69 años. El número necesario de expuestos se sugirió12 para indicar cuántas personas deben estar expuestas a un factor de riesgo para que se produzca un caso más de enfermedad; se trata de una adaptación terminológica del Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 NNTH a los estudios observacionales, pero sin ninguna modificación en la forma de cálculo. Estas 2 extensiones tienen las mismas propiedades, ventajas e inconvenientes que el NNT original. Conclusión Se ha recomendado el uso del NNT como una forma sencilla de informar sobre la eficacia de una intervención o sobre sus efectos secundarios; en particular, la declaración CONSORT recomienda utilizarlo en los resultados de los ensayos clı́nicos. Sin embargo, algunos estudios han mostrado que el NNT puede no resultar ni fácil de calcular ni sencillo de interpretar, por lo que su uso continúa siendo controvertido. En esta revisión se llama la atención sobre algunas limitaciones del NNT. En primer lugar, el cálculo sencillo a partir de una tabla 2 2 solo es aplicable en estudios cuyos resultados se expresen en forma de riesgos no ajustados. Cuando es necesario el ajuste por factores de confusión se analizan los datos mediante regresión logı́stica, o cuando se utilizan datos de tiempo de supervivencia, el cálculo del NNT requiere fórmulas más complejas (tabla 2). En segundo lugar, el NNT –como cualquier otro parámetro– tiene una variación al azar; sin embargo, muchos artı́culos informan del valor puntual del NNT sin incluir su variación al azar (por ejemplo, mediante el intervalo de confianza). La tabla 3 muestra cómo se puede estimar dicho intervalo, pero quizá lo más importante es que el intervalo de confianza del NNT se tiene que interpretar de una forma poco intuitiva, especialmente cuando el resultado no es significativo. En tercer lugar, en estudios con seguimiento el NNT no es un valor fijo, sino que varı́a a lo largo del tiempo. Esto resulta especialmente importante cuando se pretende comparar los resultados de 2 ensayos clı́nicos en los que el tiempo de seguimiento es diferente; la tabla 4 muestra que esta comparación puede ser errónea. En resumen, a pesar de su apariencia, estimar e interpretar el NNT y su variación al azar puede resultar complejo cuando se realiza un análisis multivariante o un análisis de supervivencia. En este trabajo se presentan las fórmulas adecuadas y las dificultades de interpretación. Conflicto de intereses Los autores declaran no tener ningún conflicto de intereses. Agradecimientos Los autores agradecen al Dr. Jesús González Macı́as la revisión del artı́culo desde el punto de vista clı́nico. Bibliografı́a 1. Porta M. A dictionary of epidemiology. 5th ed. New York: Oxford University Press; 2008. 2. Laupacis A, Sackett DL, Roberts RS. An assessment of clinically useful measures of the consequences of treatment. N Engl J Med. 1988;318:1728–33. 3. McAlister FA. The ‘‘number needed to treat’’ turns 20–And continues to be used and misused. CMAJ. 2008;179:549–53. 4. Chatellier G, Zapletal E, Lemaitre D, Menard J, Degoulet P. The number needed to treat: A clinically useful nomogram in its proper context. BMJ. 1996;312:426–9. 5. Altman DG. Confidence intervals for the number needed to treat. BMJ. 1998;317:1309–12. 6. Lui KJ. A simple logical solution to eliminate the limitations of using the number needed to treat. Eval Health Prof. 2004;27:206–14. 7. Bender R. Calculating confidence intervals for the number needed to treat. Control Clin Trials. 2001;22:102–10. 8. Grieve AP. The number needed to treat: A useful clinical measure or a case of the Emperor’s new clothes? Pharm Stat. 2003;2:87–102. 9. Bickel PJ, Doksum KA. Mathematical statistics: Basic ideas and selected topics. San Francisco: Holden-Day; 1977. 10. Newcombe RG. Know your limitations: Not just for clinicians. Estimation of confidence intervals is not straightforward. J Public Health Med. 1999; 21:481–2. 11. Martı́nez-González MA, Seguı́-Gómez M, Delgado-Rodrı́guez M. Cómo mejorar los intervalos de confianza? Med Clin (Barc). 2010;135:30–4. 12. Bender R, Blettner M. Calculating the ‘‘number needed to be exposed’’ with adjustment for confounding variables in epidemiological studies. J Clin Epidemiol. 2002;55:525–30. 13. Hickson M, D’Souza AL, Muthu N, Rogers TR, Want S, Rajkumar C, et al. Use of probiotic Lactobacillus preparation to prevent diarrhoea associated with antibiotics: Randomised double blind placebo controlled trial. BMJ. 2007;335:80–3. 14. Austin PC. Absolute risk reductions and numbers needed to treat can be obtained from adjusted survival models for time-to-event outcomes. J Clin Epidemiol. 2010;63:46–55. 15. Gramenzi A, Andreone P, Fiorino S, Camma C, Giunta M, Magalotti D, et al. Impact of interferon therapy on the natural history of hepatitis C virus related cirrhosis. Gut. 2001;48:843–8. 16. Chiasson JL, Josse RG, Gomis R, Hanefeld M, Karasik A, Laakso M. Acarbose treatment and the risk of cardiovascular disease and hypertension in patients with impaired glucose tolerance: The STOP-NIDDM trial. JAMA. 2003;290: 486–94. 17. Hildebrandt M, Vervölgyi E, Bender R. Calculation of NNTs in RCTs with time-toevent outcomes: A literature review. BMC Med Res Methodol. 2009;9:21. 18. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The revised CONSORT statement for reporting randomized trials: Explanation and elaboration. Ann Intern Med. 2001;134:663–94. 19. Cobos-Carbo A, Augustovski F. Declaración CONSORT 2010: actualización de la lista de comprobación para informar ensayos clı́nicos aleatorizados de grupos paralelos. Med Clin (Barc). 2011;137:213–5. 20. Hutton JL. Number needed to treat: Properties and problems. J R Stat Soc Ser A Stat Soc. 2000;163:403–15. 21. Huxley A. Brave new world revisited (1958) [consultado 27 Sep 2012]. Disponible en: http://www.huxley.net/bnw-revisited/ 22. Sackett DL. On some clinically useful measures of the effects of treatment. Evid Based Med. 1996;1:37–8. 23. Stang A, Poole C, Bender R. Common problems related to the use of number needed to treat. J Clin Epidemiol. 2010;63:820–5. 24. Rembold CM. Number needed to screen: Development of a statistic for disease screening. BMJ. 1998;317:307–12. 25. Nelson HD, Tyne K, Naik A, Bougatsos C, Chan BK, Humphrey L, U.S. Preventive Services Task Force. Screening for breast cancer: An update for the U.S. Preventive Services Task Force. Ann Intern Med. 2009;151:727–37. W237-42. ? 456