Descargar PDF

Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. Med Clin (Barc). 2014;142(10):451–456 www.elsevier.es/medicinaclinica Revisión Número necesario de tratamientos: interpretación y estimación en análisis multivariables y con datos censurados Inés Gómez-Acebo a,*, Trinidad Dierssen-Sotos b y Javier Llorca c a Facultad de Medicina, Universidad de Cantabria, Santander, España Centro de Investigación Biomédica en Red de Epidemiologıá y Salud Pública (CIBERESP), España c Instituto de Formación e Investigación Marqués de Valdecilla (IFIMAV), Santander, España b I N F O R M A C I Ó N D E L A R T Í C U L O R E S U M E N Historia del artıćulo: Recibido el 9 de noviembre de 2012 Aceptado el 9 de mayo de 2013 On-line el 11 de julio de 2013 El número necesario de tratamientos se ha recomendado como una forma sencilla de transmitir los resultados de un estudio, especialmente de un ensayo clı́nico. La mayor parte de las publicaciones lo estiman a partir de una tabla 2 2, como el inverso de la reducción absoluta de riesgos. No obstante, se ha llamado la atención sobre algunas limitaciones: la interpretación no resulta tan sencilla como se habı́a pretendido, frecuentemente se ignora la estimación del intervalo de confianza, y los estudios en los que se estima una medida de efecto ajustado por factores de confusión no pueden utilizar las tablas 2 2 en el cálculo del número necesario de tratamientos. En este trabajo revisamos la forma de obtener la estimación puntual y el intervalo confianza en 4 situaciones: tablas 2 2, regresión logı́stica, método de Kaplan-Meier y regresión de Cox. ß 2012 Elsevier España, S.L. Todos los derechos reservados. Palabras clave: Ensayos clı́nicos Estimador de Kaplan-Meier Estudios epidemiológicos Número necesario de tratamientos Reducción absoluta de riesgos Regresión logı́stica Regresión de Cox Number needed to treat: Interpretation and estimation in multivariable analyses and censored data A B S T R A C T Keywords: Controlled clinical trials Kaplan-Meier estimation Epidemiologic method Number needed to treat Absolut risk reduction Logistic regression Cox regression Number needed to treat has been recommended as an easy way to transmit results from a trial, especially controlled clinical trials. Most articles estimate it from a 2 2 table, as the inverse of the absolute risk reduction. However, some limitations have been pointed out: The interpretation is not as easy as claimed, confidence intervals are frequently not estimated, and the estimation from 2 2 tables is inadequate when the main effect measure has been estimated adjusting for confounding factors. In this paper, we revise how to obtain point estimations and confidence intervals of number needed to treat in 4 situations: 2 2 tables, logistic regression, Kaplan-Meier method, and Cox regression. ß 2012 Elsevier España, S.L. All rights reserved. Introducción El número necesario de tratamientos (NNT) se define como el número de pacientes que es necesario tratar para evitar un suceso1. En un ensayo clı́nico representa el número de pacientes adicionales que deberı́an recibir el tratamiento experimental en lugar del tratamiento control para conseguir un resultado positivo adicional, o bien para prevenir un resultado adverso2. Sin embargo, varios artı́culos han señalado las limitaciones del NNT3: la interpretación no es tan sencilla como se habı́a pretendido, el cálculo depende del * Autor para correspondencia. Correo electrónico: [email protected] (I. Gómez-Acebo). tiempo de seguimiento4 y se tiende a presentar el NNT como una estimación puntual, sin intervalo de confianza, probablemente porque este puede tener una complejidad adicional. En este trabajo revisaremos la forma de calcular el NNT cuando se dispone de datos acumulados (riesgos) o cuando se dispone de datos de tiempo de seguimiento, su intervalo de confianza y las dificultades de interpretación que plantea. Cálculo del número necesario de tratamientos a partir de una tabla 2 T 2 En el resto del artı́culo consideraremos que la finalidad del tratamiento es evitar un efecto perjudicial en un ensayo clı́nico, y al NNT correspondiente lo denominaremos número necesario de tratamientos para beneficiar (NNTB)5,6. 0025-7753/$ – see front matter ß 2012 Elsevier España, S.L. Todos los derechos reservados. http://dx.doi.org/10.1016/j.medcli.2013.05.003 Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 452 Tabla 1 Cálculo del número necesario de tratamientos a partir de una tabla 2 2 Episodios No episodios Población aT aNT bT bNT nT nNT Fracturas vertebrales No fracturas vertebrales a Nomenclatura Tratamiento experimental Placebo Ejemplo: reducción de fracturas vertebrales en mujeres posmenopáusicas con un nuevo medicamento (epidemiolato) Epidemiolato 8 390 Placebo 20 380 Población b 400 400 ES: error estándar; IC: intervalo de confianza; NNT: número necesario de tratamientos; RAR: reducción absoluta de riesgo. a a Riesgo en el grupo experimental: RT ¼ nT T a Riesgo en el grupo con placebo: RNT ¼ nNT NT aNT aT RAR ¼ RNT RT ¼ n n NT 1 NNT ¼ RAR ¼R 1 NT RT ¼ NT 1 aNT aT nNT nT b 8 Riesgo en el grupo con epidemiolato: RT ¼ 400 ¼ 0; 02 20 Riesgo en el grupo con placebo: RNT ¼ 400 ¼ 0; 05 RAR = 0, 05 0, 02 = 0, 03 1 1 NNT ¼ RAR ¼ 0;03 ¼ 33 qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi þ 0;050;95 ESðRARÞ ¼ 0;020;98 ¼ 0; 013 400 400 IC 95% (RAR): RAR 1, 96 ES(RAR) = 0, 0046 a 0, 0554 1 1 ICðNNT B Þ ¼ 0;0554 ; 0;0046 ¼ 18 a 217 y su intervalo de confianza puede estimarse con la aproximación normal, si el tamaño muestral es suficiente. Entonces, el intervalo de confianza del NNT es (tabla 3)7: En la tabla 1 se presenta la notación habitual para una tabla 2 2, junto con las definiciones de riesgo en pacientes que reciben el tratamiento (RT) y en pacientes que no lo reciben (RNT). En estas condiciones, el NNT se define como el inverso de la reducción absoluta de riesgo (RAR) (tabla 1): NNT B ¼ 1 1 1 ¼ ¼ RAR RNT RT naNT naT NT ICðNNT B Þ ¼ 1 1 ¼ RT RNT naT naNT T NT (3) (1) Ejemplo T De forma general, consideraremos el caso en el que los pacientes que reciben el tratamiento tienen menor riesgo, con lo que la fórmula 1 es positiva. En caso contrario, nos halları́amos ante el número necesario de tratamientos para perjudicar (NNTH), cuya fórmula es igual a la anterior, pero cambiando el signo del denominador (tabla 2): NNT H ¼ NNT B ¼ 1 1 ; Lim sup RAR Lim inf RAR si RT > RNT La tabla 1 (b) presenta los resultados de un ensayo clı́nico en el que se investiga la eficacia de un nuevo medicamento (epidemiolato) en la prevención de fracturas vertebrales en mujeres posmenopáusicas. Ochocientas mujeres han sido asignadas al azar a 2 ramas: 400 han tomado epidemiolato y 400 han recibido placebo. La RAR es 0,03, con intervalo de confianza del 95% (IC 95%) 0,005 a 0,055; para evitar una fractura vertebral es necesario tratar con epidemiolato a 33 mujeres (IC 95% 18 a 217). Es decir, la estimación puntual indica que en este estudio será necesario tratar a 33 mujeres para evitar una fractura vertebral, pero la variación al azar sugiere que el verdadero NNT puede ser tan bueno como una fractura evitada por cada 18 pacientes tratadas o tan desfavorable como 217 tratamientos necesarios. El otro aspecto a destacar es la fuerte asimetrı́a del intervalo de confianza. Cuando el intervalo de confianza de la RAR incluye el 0 surge una dificultad añadida en el cálculo e interpretación del intervalo de confianza del NNT: cuanto menor sea el efecto del tratamiento, mayor es el NNT; en el extremo, una RAR = 0 significa que el tratamiento no tiene ningún efecto y entonces serı́a necesario tratar a infinitos pacientes para obtener un resultado favorable en (2) El intervalo de confianza del NNT no debe calcularse directamente, porque no tiene distribución normal, por ello han sido propuestas otras aproximaciones7–10. Aunque es posible emplear métodos bayesianos11, el modo más sencillo es estimar el intervalo de confianza para la RAR y, en la fórmula 1, sustituir sucesivamente RAR por el lı́mite superior y por el lı́mite inferior de su intervalo: el error estándar de la RAR es: sffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi RT ð1 RT Þ RNT ð1 RNT Þ ESðRARÞ ¼ þ ; nT nNT Tabla 2 Cálculo del número necesario de tratamientos para beneficiar y para perjudicar en distintos escenarios de análisis Tipo de análisis NNTB Tabla 2 2 1 NNT B ¼ RAR ¼R Regresión logı́stica NNT B ¼ NNTH 1 NT RT 1 ð1ORÞRNT 1 RARðtÞ þ Kaplan-Meier NNT B ðtÞ ¼ Regresión de Cox 1 NNT B ðtÞ ¼ RARðtÞ ¼ ¼ si RT < RNT OR ð1ORÞð1RNT Þ 1 ST ðtÞSNT ðtÞ HR si OR < 1 si SNT ðtÞ < ST ðtÞ 1 ½SNT ðtÞ NNT H ¼ R SNT ðtÞ si HR < 1 NNT H ¼ 1 T RNT 1 ðOR1ÞRNT NNT H ðtÞ ¼ NNT H ðtÞ ¼ si RT > RNT OR þ ðOR1Þð1R NT Þ 1 SNT ðtÞST ðtÞ 1 si OR > 1 si ST ðtÞ < SNT ðtÞ HR SNT ðtÞ½SNT ðtÞ si HR > 1 HR: hazard ratio; NNTB: número necesario de tratamientos para beneficiar; NNTH: número necesario de tratamientos para perjudicar; OR: odds ratio; RAR: reducción absoluta de riesgo; RNT: riesgo en el grupo no tratado; RT: riesgo en el grupo tratado; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento; ST(t): supervivencia en el grupo tratado en el tiempo (t) de seguimiento. Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 453 Tabla 3 Cálculo del intervalo de confianza del número necesario de tratamientos en distintos escenarios de análisis Tipo de análisis Información necesaria IC 95% Tabla 2 2 Intervalo de confianza del RAR: Lim inf RAR, Lim sup RAR Regresión logı́stica RNT. Intervalo de confianza de la OR: Lim inf OR, Lim sup OR Kaplan-Meier qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi Error estándar del RAR: ES½RARðtÞ ¼ ES½ST ðtÞ2 þ ES½SNT ðtÞ2 . Intervalo de confianza del RAR: RAR 1, 96 ES[RAR(t)] Intervalo de confianza del HR: Lim inf HR, Lim sup HR 1 Lim sup RAR 1 Lim sup NNT ¼ Lim inf RAR 1 Lim inf OR þ Lim inf NNT B ¼ ð1 Lim inf ORÞRNT ð1 Lim inf ORÞð1 RNT Þ 1 Lim sup OR Lim sup NNT B ¼ þ ð1 Lim sup ORÞRNT ð1 Lim sup ORÞð1 RNT Þ qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi 1 1 ES½RARðtÞ ¼ ES½ST ðtÞ2 þ ES½SNT ðtÞ2 ; Lim sup RAR ; Lim inf RAR Regresión de Cox Lim inf NNT ¼ Lim infNNT B ðtÞ ¼ 1 ½SNT ðtÞLim Lim supNNT B ðtÞ ¼ ½SNT ðtÞ sup HR 1 Lim inf HR SNT ðtÞ SNT ðtÞ HR: hazard ratio; IC 95%: intervalo de confianza del 95%; Lim inf: lı́mite inferior del intervalo de confianza; Lim sup: lı́mite superior del intervalo de confianza; NNTB: número necesario de tratamientos para beneficiar; RAR: reducción absoluta de riesgo; RNT: riesgo en el grupo no tratado; OR: odds ratio; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento. uno de ellos. Como consecuencia, si el intervalo de confianza de la RAR incluye el 0, el intervalo del NNT pasará por el infinito. Para ilustrarlo, supongamos que RAR = 0,01 y su IC 95% es -0,01 a 0,03. Entonces, NNT = 100 y el intervalo de confianza es discontinuo: de 33 a +1 y de -1 a -100. Para facilitar la lectura de este resultado, Altman5 propuso la siguiente terminologı́a: NNTB = 100 (IC 95%: NNTH 100 a +1 a NNTB 33), que puede interpretarse como que el resultado es compatible con valores de NNTB mayores de 33 y con valores de NNTH mayores de 100; dicho de otra forma, excluye por inverosı́miles los valores de NNT menores de 33 para evitar una fractura y los valores de NNT menores de 100 para producirla. Quizá sea más claro mostrar el intervalo de confianza del NNT en una figura en la que la escala se ha cambiado para situar el infinito como eje; por debajo están los valores del NNTH y por encima los del NNTB5. Ası́ se han representado en la figura 1 los 2 intervalos de confianza de este ejemplo: en la escala de la izquierda figura la RAR, y en la de la derecha, el NNT; el intervalo de confianza marcado como (a) corresponde a una RAR de 0,03 (IC 95% 0,005 a 0,055) y a un NNT de 33 (IC 95% 18 a 217). El intervalo marcado como (b) corresponde a una RAR de 0,01 (-0,01 a 0,03) y un NNT de 100 (IC RAR .06 (a) (b) 16.7 .04 25 .02 50 .01 100 0 NNTB ∞ -.01 -100 -.02 -50 -.04 -25 NNT H Figura 1. Presentación gráfica de la RAR (eje de la izquierda) y del intervalo de confianza del número necesario de tratamientos (NNT) cambiando la escala (eje de la derecha): el valor NNT = infinito se sitúa en el eje principal; por debajo de este eje, los valores indican NNTH, por encima NNTB. El intervalo (a) corresponde a una RAR de 0,03 (IC 95%: 0,005 a 0,055) y a un NNT de 33 (IC 95%: 18 a 217). El intervalo (b) corresponde a una RAR de 0,01 (-0,01 a 0,03) y un NNT de 100 (IC 95%: -1 a -100 y 33 a 1). De esta forma, los 2 intervalos de confianza de la figura 1 se convierten en continuos y simétricos; el hecho de que el intervalo (b) cruce el valor 1 indica que el resultado es no significativo. 95% -1 a -100 y 33 a +1); esta figura muestra que con el cambio de escala se consigue que el intervalo de confianza del NNT sea siempre continuo, simétrico e incluya la estimación puntual. Cálculo del número necesario de tratamientos con regresión logı́stica Con las tablas 2 2 podemos obtener los NNT de estudios cuyos resultados se expresan en forma de riesgos, tal y como hemos señalado en el ejemplo previo; sin embargo, en otras ocasiones el resultado se expresa como odds ratio (OR), como hazard ratio (HR), etc. En tales casos debe recurrirse a procedimientos diferentes. Dichos procedimientos pueden exigir disponer de información adicional –como ocurre con el riesgo basal–, y varı́an de un caso a otro. En estudios en los que el efecto de interés sea binario (es decir, el carácter inmediato permita no requerir el estudio del tiempo hasta el suceso), es frecuente que la principal medida de efecto sea la OR ajustada por factores de confusión, obtenida mediante regresión logı́stica. En estos casos, puede estimarse el NNT si se conoce el riesgo basal (riesgo en el grupo no tratado)11 (tabla 2). En un estudio de casos y controles, el riesgo basal debe ser conocido por una fuente externa al estudio (por ejemplo, un sistema de vigilancia epidemiológica); en este caso RNT puede considerarse un parámetro fijo y el intervalo de confianza del NNTB solo depende de la variabilidad de la OR y puede calcularse como se indica en la tabla 3. En cambio, si la regresión logı́stica se ha aplicado a un estudio de cohortes o a un ensayo clı́nico, la fórmula que se presenta en la tabla 3 infraestima la amplitud del intervalo del NNT al ignorar la variabilidad de RNT. Lo correcto en este caso12 es aplicar el método delta multivariante, aunque este método puede dar intervalos con cobertura inadecuada si la OR está próxima a 1 o el RNT es cercano a 0 o a 1. Si el riesgo en el grupo tratado es mayor que en el no tratado, el NNTH puede estimarse a partir del NNTB cambiando el signo (tabla 2). Ejemplo Hickson et al.13 llevaron a cabo un ensayo clı́nico sobre la eficacia de probióticos en la prevención de diarrea asociada a antibióticos; 19 de 56 pacientes del grupo de placebo y 7 de 57 en el grupo del probiótico desarrollaron diarrea. Utilizando una tabla 2 2 se encuentra RAR = 0,22 (IC 95% 0,07 a 0,37) y NNTB = 5 (IC Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. 454 I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 Tabla 4 Resultados de supervivencia mediante Kaplan-Meier en un hipotético ensayo clı́nico sobre la eficacia de la estatistina comparada con placebo Tiempo de seguimiento Supervivencia ST(t) (IC 95%) 1 año 0,74 (0,60 a 0,84) Error estándar Supervivencia SNT(t) (IC 95%) 0,06 0,61 (0,49 a 0,72) Estatistina Error estándar NNTB 0,06 NNT B ð1 añoÞ ¼ S T ðtÞSNT ðtÞ 1 0;590;49 Placebo 1 1 ¼ 0;740;61 ¼ 7; 7 3 años 0,59 (0,44 a 0,71) 0,07 0,49 (0,36 a 0,61) 0,06 NNT B ð3 añosÞ ¼ 5 años 0,45 (0,29 a 0,59) 0,08 0,38 (0,26 a 0,50) 0,06 1 NNT B ð5 añosÞ ¼ 0;450;38 ¼ 14; 3 ¼ 10 IC 95%: intervalo de confianza del 95%; NNT: número necesario de tratamientos; NNTB: número necesario de tratamientos para beneficiar; RAR: reducción absoluta de riesgo; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento; NNTH: número necesario de tratamientos para perjudicar. qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi qffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi Error estándar del RAR: ES½RARð3Þ ¼ ES½ST ð3Þ2 þ ES½SNT ð3Þ2 ¼ 0; 072 þ 0; 062 ¼ 0; 09 Intervalo de confianza del RAR: RAR(3) 1, 96 ES[RAR(3)] = 0, 10 1, 96 0, 09 = 0, 08 a 0, 28 1 1 ¼ 3; 6; Lim sup ¼ ¼ 12; 5 Lim inf ¼ Intervalo de confianza del NNT: 0; 28 0; 08 Intervalo de con fianza : NNT H 12; 5 a þ 1a NNT B 3; 6 Las columnas de supervivencia y error estándar se obtienen directamente de los paquetes estadı́sticos habituales; la columna del NNT se ha estimado a partir de los datos de supervivencia y usando la fórmula indicada en la tabla 2. Al pie de la tabla se detallan los cálculos para el intervalo de confianza de la RAR y del NNT a los 3 años de seguimiento. Obsérvese que en este caso el intervalo de confianza de la RAR incluye el 0 (la estatistina no aumenta la supervivencia), por lo que el intervalo de confianza del NNT debe incluir el infinito (para conseguir que sobreviva un paciente más serı́a necesario tratar a infinitos pacientes). 95% 3 a 15). Sin embargo, su análisis de regresión logı́stica reveló que el NNT tenı́a una variabilidad mayor: OR 0,25 (IC 95% 0,07 a 0,85) con NNTB = 4,4 (IC 95% 3,3 a 28). Como en los ejemplos anteriores, obsérvese la fuerte asimetrı́a del intervalo. Cálculo del número necesario de tratamientos con datos de tiempo hasta el suceso Cuando el efecto de interés es el tiempo hasta el suceso, el análisis se suele realizar mediante técnicas de supervivencia. En estos casos es incorrecto utilizar una tabla 2 2 para calcular el NNT por 3 motivos: 1) el tiempo de seguimiento no es uniforme para los distintos participantes en el mismo estudio; 2) hay datos censurados, es decir, pacientes en los que se interrumpe el seguimiento antes de que ocurra el suceso, y 3) la diferencia entre los riesgos en los grupos tratado y no tratado no suele ser constante a lo largo del tiempo de seguimiento, con lo que el NNT no es constante a lo largo del tiempo. Por tanto, en un ensayo clı́nico en el que se ha seguido a los pacientes durante 5 años no tiene sentido hablar de «el NNT», sino de «el NNT para el tiempo de seguimiento t»; es decir, habrá un NNT al año, otro a los 2 años y otro a los 5 años. Supongamos, por ejemplo, que una estatina se prueba en un ensayo clı́nico a 2 años y obtiene un NNT de 10 para evitar un infarto, y otra estatina se prueba en un ensayo a 3 años y el NNT para evitar un infarto es de 8; con estos datos no hay información suficiente para optar por una de las 2 estatinas porque el tiempo de seguimiento es distinto y la comparación de los NNT es delicada. Veremos cómo estimar el NNT en análisis de supervivencia en 2 situaciones distintas: a partir de los estimadores de Kaplan-Meier y mediante regresión de Cox. Kaplan-Meier El método de Kaplan-Meier permite conocer la probabilidad de supervivencia libre de suceso para cualquier tiempo de seguimiento (t) en los grupos tratado y no tratado. A partir de esas probabilidades se pueden estimar la reducción absoluta de riesgo y el NNT (tabla 2). Para calcular el intervalo de confianza es necesario conocer el error estándar de la probabilidad de supervivencia, que se obtiene fácilmente de cualquiera de los programas estadı́sticos habituales (tabla 3). Igual que en el resto de las secciones, si la probabilidad del suceso es mayor en el grupo tratado, entonces se debe calcular el NNTH como el negativo del NNTB (tabla 2). Ejemplo En la tabla 4 se presenta la probabilidad de supervivencia a 1, 3 y 5 años en un ensayo clı́nico hipotético comparando estatistina con placebo para el tratamiento del ictus isquémico. Los resultados de supervivencia, su intervalo de confianza y el error estándar se pueden obtener directamente de los paquetes estadı́sticos habituales; en la última columna se ha calculado el NNT: para evitar una muerte en el primer año hace falta tratar con estatistina a 7,7 pacientes; en los 3 primeros años harı́a falta tratar a 10 pacientes, y en los 5 primeros años, a 14,3 pacientes. Estos resultados muestran que el NNT no es constante. Regresión de Cox La principal medida del efecto en una regresión de Cox es la HR, que asume riesgos proporcionales: HR es constante a lo largo del tiempo. Para el resto de este apartado, no es relevante si la HR se ha estimado de forma bruta o ajustada. Para calcular el NNTB es necesario disponer de la HR y de la probabilidad de supervivencia en el grupo no tratado: SNT(t). Este último valor no se obtiene directamente de la regresión de Cox, pero puede estimarse por el método de Kaplan-Meier. Para el intervalo de confianza, la opción que presentamos en la tabla 3 es utilizar el intervalo de HR y sustituir en la fórmula anterior (de manera análoga a como se ha hecho en secciones anteriores); sin embargo, este procedimiento puede infraestimar el intervalo de confianza del NNT porque ignora la variabilidad debida a la supervivencia en el grupo no tratado. La alternativa es estimar el intervalo de confianza mediante bootstrap14. Ejemplo Gramenzi et al.15 trataron con interferón alfa a 72 pacientes cirróticos infectados con el virus de la hepatitis C y los compararon con otros 72 pacientes sin interferón. A los 2 años, el 1,5% de los pacientes tratados y el 11% de los no tratados habı́an desarrollado un hepatocarcinoma; a los 5 años estas cifras habı́an ascendido a 11 y 27%, respectivamente. La HR (tomando como referencia el grupo no tratado) fue de 0,23 (0,09 a 0,63). Como muestra la tabla 5, el NNTB a los 2 años fue de 12 pacientes, con un intervalo de confianza amplio y claramente asimétrico (de 10 a 26). En cambio, a los 5 años solo era necesario tratar a 5 pacientes (IC 95% 4,1 a 11,1) para evitar un caso de hepatocarcinoma. Obsérvese que como la supervivencia sin hepatocarcinoma disminuye con el tiempo y el HR es menor que 1, el NNTB disminuye al crecer el tiempo de seguimiento. Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 455 Tabla 5 Número necesario de tratamientos con interferón alfa para evitar un caso de hepatocarcinoma en pacientes cirróticos infectados con el virus de la hepatitis C Tiempo de seguimiento Riesgo acumulado de hepatocarcinoma en el grupo no tratado Supervivencia sin hepatocarcinoma en el grupo no tratado (SNT) NNTB 2 años 0,11 0,89 NNT B ðtÞ ¼ 5 años 0,27 0,73 NNT B ðtÞ ¼ IC 95% del NNTBa 1 ½SNT ðtÞ HR SNT ðtÞ 1 ½SNT ðtÞ HR SNT ðtÞ ¼ 1 0;890;23 0;89 ¼ 1 0;730;23 0;73 ¼ 12 10,0 a 25,5 ¼5 4,1 a 11,1 IC 95%: intervalo de confianza del 95%; NNTB: número necesario de tratamientos para beneficiar; SNT(t): supervivencia en el grupo no tratado en el tiempo (t) de seguimiento. La hazard ratio estimada por regresión de Cox fue de 0,23 (IC 95% 0,09-0,63); este intervalo de confianza se utiliza para calcular el intervalo de confianza del NNT. Los datos de supervivencia y la hazard ratio proceden de Hickson et al.13. a Lı́mite inferior del IC a 2 años: NNT B ðtÞ ¼ Lı́mite superior del IC a 2 años: NNT B ðtÞ ¼ 1 Lim inf HR ½SNT ðtÞ SNT ðtÞ 1 ½SNT ðtÞ Lim sup HR 1 SNT ðtÞ ¼ ¼ 1 0;890;09 0;89 1 0;890;63 0;89 ¼ 10 ¼ 25; 5 1 Lı́mite inferior del IC a 5 años: NNT B ðtÞ ¼ ¼ ¼ 4; 1 Lim inf HR 0;730;09 0;73 SNT ðtÞ ½SNT ðtÞ 1 1 ¼ ¼ 11; 1 Lı́mite superior del IC a 5 años: NNT B ðtÞ ¼ Lim sup HR 0;730;63 0;73 SNT ðtÞ ½SNT ðtÞ Ejemplo En el ensayo STOP-NIDDM16, 1.429 pacientes con intolerancia a la glucosa fueron aleatorizados para recibir acarbosa o placebo; tras aplicar los criterios de exclusión, en el análisis se incluyeron 682 pacientes en el grupo de acarbosa y 686 en el grupo de placebo. Fueron seguidos durante una media de 3,3 años y el efecto principal fue el episodio cardiovascular mayor. Se produjeron 15 sucesos en el grupo de acarbosa y 32 en el grupo de placebo. Aunque la mayor parte del análisis se realizó –correctamente– con regresión de Cox, para el cálculo de NNT se trabajó con una tabla 2 2 como si no hubiera datos censurados; entonces, el riesgo en el grupo de acarbosa es 2,2%, en el grupo de placebo es 4,7%, la reducción absoluta de riesgo es 2,5% y el NNTB es 40 (los investigadores no aportaron IC 95% para el NNT, pero con estos datos serı́a de 22,6 a 172,7). Cuando Hildebrandt et al.17 recalcularon el NNT con técnicas de supervivencia encontraron un valor de 57,1 con IC 95% no significativo: NNTB 24,2 a 1 a NNTH 156,6. El uso que hicieron los autores originales de la tabla 2 2 podı́a introducir cualquier tipo de sesgo en el NNT (es decir, podı́a infravalorarlo o sobrevalorarlo, o incluso no tener ningún efecto), pero el intervalo de confianza siempre será más estrecho con la tabla 2 2 que con los métodos de supervivencia, porque en la tabla se considera como muestra efectiva a todos los participantes en el estudio, mientras que en el análisis de supervivencia la muestra efectiva depende del momento en que se haya producido la censura. Discusión El uso del NNT se ha generalizado en los ensayos clı́nicos, especialmente a partir de su inclusión en las recomendaciones CONSORT18,19; varios autores han defendido su empleo como una forma sencilla e intuitiva de informar sobre la eficacia de una intervención (NNTB) o sobre sus efectos secundarios (NNTH). Los problemas del NNT fueron puestos de manifiesto de manera temprana; Hutton20 abrió su artı́culo crı́tico con una cita de Aldous Huxley: «He must learn to simplify, but not to the point of falsification»21 (Nota: hemos corregido ligeramente la cita de Hutton a partir del original de Huxley). En el ejemplo de Hickson et al.13 se obtenı́a un NNTB = 5; la interpretación habitual de esta cifra serı́a que 5 son los pacientes a los que habrı́a que tratar con un probiótico para evitar una diarrea. Esta interpretación considera al NNT como un valor fijo e ignora su carácter probabilı́stico; de hecho, si al tratar a un paciente la probabilidad de evitar una diarrea es 0,2, tratando a 5 pacientes la probabilidad de que no se evite ninguna diarrea es del 33% y de que se evite una es del 41%. La consideración del NNT como un valor fijo está tan extendida que en la revisión que realizaron Hildebrandt et al.17 sobre los ensayos clı́nicos publicados en British Medical Journal, The Lancet, JAMA y The New England Journal of Medicine, de 34 artı́culos que informaban del NNT solo 6 aportaban el correspondiente intervalo de confianza. El cálculo del NNT a partir de una tabla 2 2 es sencillo. Sin embargo, muchos artı́culos (probablemente la mayorı́a) presentan resultados ajustados mediante algún método de regresión, frecuentemente con datos censurados; entonces, el cálculo del NNT requiere procedimientos más sofisticados que, con frecuencia, no se utilizan, produciendo estimaciones erróneas del NNT17. Un problema menor, pero también objeto de controversia, es si el NNT debe presentarse como número entero o con decimales; a favor del número entero está el argumento de que resulta más fácil de transmitir22; en su contra, que da una sensación de precisión que no se corresponde con la realidad23. Uno de los argumentos a favor del uso del NNT es que permite comparar fácilmente 2 o más tratamientos que han sido valorados en distintos ensayos clı́nicos. Este argumento es discutible por 2 razones: 1) en los estudios en los que el efecto de interés es el tiempo hasta el suceso no existe un único NNT, sino que este valor varı́a con el tiempo de seguimiento; si 2 ensayos clı́nicos tienen diferente tiempo de seguimiento, la comparación de sus NNT será errónea, y 2) el NNT implica una comparación con el riesgo basal del grupo placebo, pero los grupos placebo de cada ensayo pueden tener diferente riesgo basal; por ejemplo, 2 ensayos clı́nicos sobre medicamentos para evitar las fracturas vertebrales en mujeres posmenopáusicas se podrı́an realizar en Finlandia y en España; los riesgos basales pueden ser diferentes por factores dietéticos, genéticos o de exposición a la luz solar (valores de vitamina D), y no hay ningún motivo para pensar que un medicamento va a actuar igual allı́ donde los valores de vitamina D sean más altos. Esto no se corrige con el ajuste por factores de confusión. Cuando el intervalo de confianza del RAR no incluye el 0, el intervalo de confianza del NNT es tan fácil (o tan difı́cil) de interpretar como el de cualquier otra medida de uso habitual. Pero si el intervalo del RAR incluye el 0, entonces el intervalo del NNT es discontinuo y su interpretación resulta compleja. Desde que el NNT empezó a utilizarse, han aparecido medidas similares para otras situaciones. El número necesario de cribados fue propuesto por Rembold24 para indicar cuántas personas deben someterse a un cribado para obtener un beneficio; por ejemplo, Nelson et al.25 encuentran que para evitar una muerte por cáncer de mama mediante mamografı́a anual es necesario invitar a participar en el cribado a 1.904 mujeres de 39 a 49 años, 1.339 de 50 a 59 años o 377 de 60 a 69 años. El número necesario de expuestos se sugirió12 para indicar cuántas personas deben estar expuestas a un factor de riesgo para que se produzca un caso más de enfermedad; se trata de una adaptación terminológica del Documento descargado de http://www.elsevier.es el 21/11/2016. Copia para uso personal, se prohíbe la transmisión de este documento por cualquier medio o formato. I. Gómez-Acebo et al / Med Clin (Barc). 2014;142(10):451–456 NNTH a los estudios observacionales, pero sin ninguna modificación en la forma de cálculo. Estas 2 extensiones tienen las mismas propiedades, ventajas e inconvenientes que el NNT original. Conclusión Se ha recomendado el uso del NNT como una forma sencilla de informar sobre la eficacia de una intervención o sobre sus efectos secundarios; en particular, la declaración CONSORT recomienda utilizarlo en los resultados de los ensayos clı́nicos. Sin embargo, algunos estudios han mostrado que el NNT puede no resultar ni fácil de calcular ni sencillo de interpretar, por lo que su uso continúa siendo controvertido. En esta revisión se llama la atención sobre algunas limitaciones del NNT. En primer lugar, el cálculo sencillo a partir de una tabla 2 2 solo es aplicable en estudios cuyos resultados se expresen en forma de riesgos no ajustados. Cuando es necesario el ajuste por factores de confusión se analizan los datos mediante regresión logı́stica, o cuando se utilizan datos de tiempo de supervivencia, el cálculo del NNT requiere fórmulas más complejas (tabla 2). En segundo lugar, el NNT –como cualquier otro parámetro– tiene una variación al azar; sin embargo, muchos artı́culos informan del valor puntual del NNT sin incluir su variación al azar (por ejemplo, mediante el intervalo de confianza). La tabla 3 muestra cómo se puede estimar dicho intervalo, pero quizá lo más importante es que el intervalo de confianza del NNT se tiene que interpretar de una forma poco intuitiva, especialmente cuando el resultado no es significativo. En tercer lugar, en estudios con seguimiento el NNT no es un valor fijo, sino que varı́a a lo largo del tiempo. Esto resulta especialmente importante cuando se pretende comparar los resultados de 2 ensayos clı́nicos en los que el tiempo de seguimiento es diferente; la tabla 4 muestra que esta comparación puede ser errónea. En resumen, a pesar de su apariencia, estimar e interpretar el NNT y su variación al azar puede resultar complejo cuando se realiza un análisis multivariante o un análisis de supervivencia. En este trabajo se presentan las fórmulas adecuadas y las dificultades de interpretación. Conflicto de intereses Los autores declaran no tener ningún conflicto de intereses. Agradecimientos Los autores agradecen al Dr. Jesús González Macı́as la revisión del artı́culo desde el punto de vista clı́nico. Bibliografı́a 1. Porta M. A dictionary of epidemiology. 5th ed. New York: Oxford University Press; 2008. 2. Laupacis A, Sackett DL, Roberts RS. An assessment of clinically useful measures of the consequences of treatment. N Engl J Med. 1988;318:1728–33. 3. McAlister FA. The ‘‘number needed to treat’’ turns 20–And continues to be used and misused. CMAJ. 2008;179:549–53. 4. Chatellier G, Zapletal E, Lemaitre D, Menard J, Degoulet P. The number needed to treat: A clinically useful nomogram in its proper context. BMJ. 1996;312:426–9. 5. Altman DG. Confidence intervals for the number needed to treat. BMJ. 1998;317:1309–12. 6. Lui KJ. A simple logical solution to eliminate the limitations of using the number needed to treat. Eval Health Prof. 2004;27:206–14. 7. Bender R. Calculating confidence intervals for the number needed to treat. Control Clin Trials. 2001;22:102–10. 8. Grieve AP. The number needed to treat: A useful clinical measure or a case of the Emperor’s new clothes? Pharm Stat. 2003;2:87–102. 9. Bickel PJ, Doksum KA. Mathematical statistics: Basic ideas and selected topics. San Francisco: Holden-Day; 1977. 10. Newcombe RG. Know your limitations: Not just for clinicians. Estimation of confidence intervals is not straightforward. J Public Health Med. 1999; 21:481–2. 11. Martı́nez-González MA, Seguı́-Gómez M, Delgado-Rodrı́guez M. Cómo mejorar los intervalos de confianza? Med Clin (Barc). 2010;135:30–4. 12. Bender R, Blettner M. Calculating the ‘‘number needed to be exposed’’ with adjustment for confounding variables in epidemiological studies. J Clin Epidemiol. 2002;55:525–30. 13. Hickson M, D’Souza AL, Muthu N, Rogers TR, Want S, Rajkumar C, et al. Use of probiotic Lactobacillus preparation to prevent diarrhoea associated with antibiotics: Randomised double blind placebo controlled trial. BMJ. 2007;335:80–3. 14. Austin PC. Absolute risk reductions and numbers needed to treat can be obtained from adjusted survival models for time-to-event outcomes. J Clin Epidemiol. 2010;63:46–55. 15. Gramenzi A, Andreone P, Fiorino S, Camma C, Giunta M, Magalotti D, et al. Impact of interferon therapy on the natural history of hepatitis C virus related cirrhosis. Gut. 2001;48:843–8. 16. Chiasson JL, Josse RG, Gomis R, Hanefeld M, Karasik A, Laakso M. Acarbose treatment and the risk of cardiovascular disease and hypertension in patients with impaired glucose tolerance: The STOP-NIDDM trial. JAMA. 2003;290: 486–94. 17. Hildebrandt M, Vervölgyi E, Bender R. Calculation of NNTs in RCTs with time-toevent outcomes: A literature review. BMC Med Res Methodol. 2009;9:21. 18. Altman DG, Schulz KF, Moher D, Egger M, Davidoff F, Elbourne D, et al. The revised CONSORT statement for reporting randomized trials: Explanation and elaboration. Ann Intern Med. 2001;134:663–94. 19. Cobos-Carbo A, Augustovski F. Declaración CONSORT 2010: actualización de la lista de comprobación para informar ensayos clı́nicos aleatorizados de grupos paralelos. Med Clin (Barc). 2011;137:213–5. 20. Hutton JL. Number needed to treat: Properties and problems. J R Stat Soc Ser A Stat Soc. 2000;163:403–15. 21. Huxley A. Brave new world revisited (1958) [consultado 27 Sep 2012]. Disponible en: http://www.huxley.net/bnw-revisited/ 22. Sackett DL. On some clinically useful measures of the effects of treatment. Evid Based Med. 1996;1:37–8. 23. Stang A, Poole C, Bender R. Common problems related to the use of number needed to treat. J Clin Epidemiol. 2010;63:820–5. 24. Rembold CM. Number needed to screen: Development of a statistic for disease screening. BMJ. 1998;317:307–12. 25. Nelson HD, Tyne K, Naik A, Bougatsos C, Chan BK, Humphrey L, U.S. Preventive Services Task Force. Screening for breast cancer: An update for the U.S. Preventive Services Task Force. Ann Intern Med. 2009;151:727–37. W237-42. ? 456

Descargar PDF

Documentos relacionados

Productos

Apoyo

Descargar PDF

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib