Subido por harold gutierrez londoño

no inferioridad

Anuncio
ESTUDIOS CLÍNICOS DE NO-INFERIORIDAD
REVISIÓN CONTEMPORÁNEA
Avances Cardiol 2009;29(1):76-81
Estudios clínicos de no-inferioridad y de equivalencia: metodología,
análisis e interpretación de los resultados
Dr. Salvatore Pluchino1
1
Cátedra de Farmacología, Instituto de Medicina Experimental, Facultad de Medicina, Universidad Central de
Venezuela. Caracas, Venezuela
RESUMEN
Los estudios controlados con placebo son el método ideal
para evaluar la eficacia del tratamiento médico. Debido
al gran número de tratamientos de comprobada eficacia en
ciertas aplicaciones, los estudios controlados con placebo
son a menudo poco éticos. Los estudios de no-inferioridad y
de equivalencia son apropiados para evaluar la eficacia de
un tratamiento experimental versus un control activo cuando
se plantea la hipótesis que el tratamiento experimental puede
no ser superior a un tratamiento de comprobada eficacia,
pero es clínica y estadísticamente no inferior. El diseño y el
reporte de estos estudios deben de seguir las recomendaciones
CORRESPONDENCIA
Ave. Ernesto Blohm con Ave. La Estancia, Centro Banaven,
Torre B, Piso 3, Chacao, Caracas-Venezuela. Apartado 64745.
Chacao. Caracas 1060
E-mail: [email protected]
Tel: +58-414-129.40.13 Fax: +58-212-959.37.70 - Buzón
0062
DECLARACIÓN DE CONFLICTO DE INTERÉS DE
LOS AUTORES
El autor desempeña cargos de asesor científico externo
a fundaciones y empresas: entre estas, está la empresa
farmacéutica Boehringer Ingelheim de Venezuela.
AGRADECIMIENTO
El autor agradece la colaboración fundamental del Dr.
Orlando Ortiz en la revisión del texto y en la conformación
del manuscrito.
Recibido en: septiembre 22, 2008
Aceptado en: enero 13, 2009
76
del Grupo CONSORT. Para tal fin, es indispensable
seleccionar un óptimo control activo. La eficacia del control
activo debería ser documentada a través de buenos estudios
históricos controlados con placebo; a partir de estos datos
es indispensable determinar el margen de no-inferioridad.
Los resultados del nuevo tratamiento deben ser comparados
con el control activo por análisis múltiples, incluyendo el
placebo putativo. El término de no-inferioridad es usado
cuando se refiere a un estudio de una sola cola (diferencia
en respuesta menor que ∆); equivalencia cuando se refiere a
estudios de dos colas (diferencia en respuesta entre - ∆ y +
∆). Para documentar los planteamientos teóricos se recurre
a datos de estudios publicados recientemente, relacionados
con moléculas eficaces en el control de la presión arterial y
en la reducción de los índices de mortalidad en enfermedades
cardiovasculares.
Palabras clave: Estudio clínico, control con placebo, control
activo, no-inferioridad, equivalencia.
Non-inferiority and equivalence clinical trials:
Methodology, analysis and interpretation of
the results
SUMMARY
Placebo-controlled trials are the ideal for evaluating medical
treatment efficacy. Given the large number of proven effective
treatment in several areas, placebo-controlled trials are often
unethical. The non-inferiority and equivalence trials are
appropriate for evaluation of the efficacy of an experimental
Vol. 29, Nº 1, marzo 2009
PLUCHINO S
treatment versus an active control when it is hypothesized that
the experimental treatment may not be superior to a proven
effective treatment, but is clinically and statistically not inferior
in effectiveness. The design and reporting of these studies
must follow the CONSORT statements. An active control
must be selected. Good historical placebo-controlled trials
documenting the efficacy of the active control must exist. From
these historical trials, a margin of non-inferiority must be
determined. The results of the new treatment must be compared
with active control through multiple analysis, including a
putative placebo comparison. The term non-inferiority is
used when referring to a 1-sided trial (difference in response
lower than ∆); equivalence, when referring to 2-sided trials
(difference in response between - ∆ and + ∆). In order to give
practical data, results of published trials related to active
molecules effective in the control of blood pressure and in
reducing mortality in cardiovascular diseases are used.
Key words: Clinical trial, placebo control, active control,
non-inferiority, equivalence.
La necesidad de la comparación entre grupos
es universalmente aceptada en los estudios
médicos clínicos. En el terreno de las drogas y de
los biológicos, el estudio controlado con placebo
representa el diseño ideal. En efecto, el estudio
clínico tradicional es diseñado para demostrar
que una nueva terapia es superior a una terapia ya
establecida o a un placebo inactivo; en estos casos,
los estudios están diseñados y realizados como
estudios de superioridad. Sin embargo, a medida
que el arsenal terapéutico se enriquece con terapias
siempre más eficaces, los márgenes para demostrar
superioridad se estrechan siempre más. Por otro
lado, el uso de estudios controlados con placebo
para la evaluación de nuevos tratamientos médicos
se hace éticamente problemático.
El diseño de estudios de no-inferioridad es la
respuesta de mayor importancia para la solución del
problema; en lugar del grupo control con placebo
se usa un control activo, representado por un
tratamiento cuya eficacia ha sido fehacientemente
demostrada. El objetivo del diseño de noinferioridad con control activo no es el de demostrar
la superioridad de un nuevo tratamiento experimental
en investigación sobre el control activo. Más bien, la
finalidad es establecer que el efecto del tratamiento
experimental, cuando es comparado con el control
Avances Cardiol
activo, no está por debajo de cierto margen de noinferioridad (1).
Si la no-inferioridad queda establecida,
la utilidad del nuevo tratamiento puede ser
fundamentada sobre ventajas tradicionales como
seguridad, mejor tolerabilidad, conveniencia en los
esquemas de la posología, costos o en la posibilidad
de disponer de tratamientos alternos mediante
fármacos con diferentes mecanismos de acción
dirigidos a mejorar patologías similares.
Muchos nuevos aspectos y temores acompañan
estos estudios especialmente por lo que se refiere a
su diseño, implementación, análisis e interpretación.
Entre estos resaltan los siguientes:
1. Seleccionar un control activo.
2. Obtener datos históricos a partir de estudios
clínicos controlados con placebo que establezcan
la eficacia del control activo.
3. Determinar un margen de no-inferioridad con
relevancia clínica.
4. Diseñar estudios en los cuales los datos
provenientes de estudios controlados con placebo
sean todavía relevantes.
5. Implementar estudios con adecuado poder
estadístico.
6. Realizar análisis que establezcan la noinferioridad del nuevo tratamiento experimental
y la superioridad del nuevo tratamiento sobre el
placebo, aunque no hay comparación directa del
nuevo tratamiento con el placebo.
Los estudios de no-inferioridad con control
activo se llevan a cabo con una frecuencia creciente,
especialmente en aquellas patologías para las cuales
se dispone de múltiples alternativas terapéuticas
que hacen los estudios controlados con placebo
no éticos (aplicaciones cardiovascular, oncológica
o de inmunodeficiencia adquirida).
Un estudio de no-inferioridad pretende
determinar si un nuevo tratamiento no es peor que
una terapia de referencia. Debido al hecho que
una prueba de exacta igualdad es imposible, es
77
ESTUDIOS CLÍNICOS DE NO-INFERIORIDAD
necesario predefinir un margen de no-inferioridad
(∆) del efecto del nuevo tratamiento con relación
a un resultado específico en el paciente (ejemplo:
reducción de la mortalidad).
Los estudios de equivalencia son muy similares
excepto que la finalidad de estos estudios es la
de determinar si la diferencia en los efectos entre
dos terapias está comprendida entre un pequeño
intervalo previamente especificado (2,3).
Los estudios de equivalencia no son frecuentes
porque la mayoría de estos estudios pretende
determinar la no-inferioridad.
De acuerdo con las pautas establecidas en la
Conferencia Internacional sobre Armonización,
el término no-inferioridad es usado cuando nos
referimos a un estudio de una cola (diferencia en
respuesta menor que ∆) (Figura 1); equivalencia,
cuando nos referimos a estudios de dos colas
(diferencia en respuesta entre -∆ y +∆) (4) (Figura
2).
Este artículo está principalmente enfocado a los
estudios de no-inferioridad, pero puede ser aplicado
también a los estudios de equivalencia de dos colas.
Nuestro objetivo es el de proveer al clínico práctico
la herramienta primordial para la interpretación de
los estudios de no-inferioridad.
Figura 1. Posibles resultados de no-inferioridad. A y B: no-inferior;
C y D: no concluyente; E: inferior.
78
Figura 2. Posibles resultados de equivalencia. A, C, G: Inciertos;
B y H: no equivalentes; D, E, F: equivalentes.
Reporte de los estudios clínicos de no-inferioridad
y equivalencia
Con la finalidad de ayudar a los autores a mejorar
el reporte de los estudios controlados y aleatorios
han sido establecidas unas recomendaciones que
trataremos de seguir en la descripción de los aspectos
que caracterizan este artículo.
Las recomendaciones identificadas como
CONSORT (Consolidate Standard of Reporting
Trials) deben ser aplicadas también a los estudios
de no-inferioridad y de equivalencia en vista que
presentan dificultades particulares en el diseño,
conducta, análisis e interpretación (5-8). La calidad
de los reportes publicados de este tipo de estudios
resulta frecuentemente inadecuada. De una
búsqueda entre 1 191 estudios dirigidos a investigar
no-inferioridad o equivalencia publicados en el 2003
y 2004, solamente 162 fueron seleccionados (116
estudios de no-inferioridad y 46 de equivalencia) por
satisfacer ciertos prerrequisitos metodológicos. De
estos, solamente 33 obedecían a los requerimientos
de calidad; sin embargo, 4 de ellos (12,1 %)
resultaron altamente engañosos por pretender
demostrar no-inferioridad o equivalencia, aunque
sus resultados no permitían esa conclusión (9).
Determinación del margen de no-inferioridad
(M)
El paso crítico en la determinación de la
Vol. 29, Nº 1, marzo 2009
PLUCHINO S
no-inferioridad terapéutica es la selección de la
diferencia marginal. Desde un punto de vista
estadístico, el margen debe ser obtenido a partir
de un metaanálisis de los efectos del control activo
en estudios históricos; estos deberían mostrar una
consistente superioridad del control activo sobre
el placebo. Además, la población del protocolo
experimental asignada al control activo en el estudio
en curso debería ser idéntica a aquellas usadas en los
estudios históricos. El margen de no-inferioridad
es definido en términos de la fracción (f) del efecto
del tratamiento con el control activo que debería
ser preservada, es decir, cuan cerca debe estar el
nuevo tratamiento a la eficacia del control activo
para que el nuevo tratamiento sea considerado no
inferior al control activo.
En ciertas aplicaciones, cuando se evalúa la
mortalidad, la FDA ha sugerido un valor de f igual
a 0,5; esto implica que la terapia experimental
logra la no-inferioridad con respecto al control
activo si preserva la mitad de la eficacia de este
último. En recientes estudios cardiovasculares de
no-inferioridad han sido usados como márgenes
clínicamente aceptables riesgos relativos de 1,15
a 1,20 (diferencias relativas de 15 a 20 puntos
porcentuales). Es el caso del estudio VALIANT
que demuestra la no-inferioridad de la nueva terapia
(Valsartan: 160 mg dos veces diarias) en relación al
control activo (captopril: 50 mg tres veces diarias):
RR 1,02 (0,94 a 1,11; IC 95 % de dos colas). El
límite alto del intervalo de confianza estuvo dentro
del margen de no-inferioridad preestablecido (RR
= 1,13)(10).
La no-inferioridad de losartan (50 mg una vez
al día) comparativamente con captopril (50 mg tres
veces al día) no fue confirmada ni en pacientes
con insuficiencia cardíaca (11) ni en pacientes
después de infarto agudo al miocardio (12): estos
hallazgos enfatizan que en el diseño de un estudio
la importancia no reside solamente en la droga
seleccionada sino también en la dosis y el intervalo
entre dosis (13).
Aplicación de las recomendaciones CONSORT
Un estudio de no-inferioridad o de equivalencia
Avances Cardiol
requiere que la eficacia del tratamiento de referencia
esté bien establecida. Es particularmente importante
que los métodos diseñados para el nuevo estudio
sean lo más cercanos posible a aquellos usados en
previos estudios de superioridad que demuestran
el efecto de la terapia de control versus el placebo.
En particular, es importante que los criterios de
inclusión y exclusión, que definen la población de
los pacientes, la dosificación del control activo, el
uso de medicación concomitante, la variable de la
respuesta primaria y su modalidad de medición,
sean las mismas que las aplicadas en los precedentes
estudios de superioridad. Evidentemente, cuando
el margen de inferioridad es fijado a expensas de
metaanálisis de estudios históricos, es muy difícil
que todas estas variables coincidan. En efecto, lo
resultados de muy pocos estudios son comparables
debido a la diversidad de las características de
los pacientes, de la medicación concomitante y
del objetivo primario simple o compuesto. Estas
consideraciones dificultan la aplicación de las
recomendaciones CONSORT.
Recientemente se conocieron los resultados del
estudio ONTARGET (14), diseñado para demostrar
la no-inferioridad de telmisartan (80 mg al día) con
respecto a ramipril (10 mg al día) en pacientes con
enfermedad vascular o diabetes de alto riesgo sin
insuficiencia cardíaca: la población fue similar a
aquella incluida en el estudio HOPE, diseñado para
demostrar la superioridad de ramipril (10 mg al
día) sobre el placebo (15). ONTARGET constituye
un ejemplo de un estudio de no-inferioridad de
muy alta calidad, aporta enseñanzas fundamentales
para la práctica clínica e ilustra la complejidad de
diseñar, conducir, analizar e interpretar estudios
que comparan nuevos tratamientos que actúan en
manera similar a terapias ya establecidas.
El objetivo primario del estudio ONTARGET
fue la determinación de la incidencia de muerte
por causas cardiovasculares, infarto al miocardio,
accidente cerebrovascular u hospitalización por
falla cardíaca. El objetivo secundario fue la muerte
por causas cardiovasculares, infarto al miocardio
o accidente cerebrovascular, que corresponde
al objetivo primario del estudio HOPE. Estas
similitudes determinan condiciones ideales para la
79
ESTUDIOS CLÍNICOS DE NO-INFERIORIDAD
T versus P = T/P = T/C x C/P
aplicación de las recomendaciones CONSORT.
En efecto, el margen de no-inferioridad fue
determinado a expensas de los resultados del estudio
HOPE: un total de 651 pacientes en el grupo ramipril
murieron por causas cardiovasculares o tuvieron un
infarto al miocardio o un accidente cerebro-vascular,
comparativamente con 826 pacientes en el grupo
placebo, lo cual arroja un riesgo relativo de 0,78
(0,70 - 0,86, IC 95 %, P<0,001). El riesgo relativo
fue transformado en un exceso de riesgo para el
placebo de 1,26 (826/651) cuando es comparado con
ramipril; por lo tanto, un margen de 1,13 aseguraba
que el telmisartan retendría por lo menos la mitad del
efecto del ramipril, si el límite alto del intervalo de
confianza de 97,5 % de una sola cola para el riesgo
relativo fuera menor de ese valor. De acuerdo con
los resultados del estudio ONTARGET, telmisartan
fue claramente no-inferior a ramipril, tanto por el
análisis de todos los pacientes incluidos después
de la distribución aleatoria (análisis ITT, “intention
to treat”) como después del análisis por protocolo
(análisis PP, “per protocol”) (Tabla 1). Este último
punto y la comparación con un óptimo control
activo constituyen dos de las recomendaciones
fundamentales de CONSORT.
En cualquiera de los dos análisis, el límite
alto del intervalo de confianza estuvo dentro del
margen de no-inferioridad preestablecido (M=1,13).
Además, el límite bajo del intervalo de confianza
resultó mayor que el valor correspondiente a un
análisis de dos colas (1 - 0,13 = 0,87), lo cual
permite concluir que la terapia experimental fue
equivalente al control activo (límite bajo y límite
alto del intervalo de confianza ampliamente dentro
de -∆ y +∆).
Una importante recomendación de CONSORT
corresponde a la comparación de la terapia
experimental con el “placebo putativo”, para
demostrar que la terapia experimental es superior al
placebo, aunque en el estudio de no-inferioridad o
equivalencia no se haya incluido un grupo placebo
(16)
. Para tal fin es necesario usar los datos del control
activo versus la terapia experimental conjuntamente
con los datos históricos del control activo versus
placebo:
80
donde T representa la terapia experimental, C el
control activo y P el placebo.
Para una demostración práctica de este dato
podemos recurrir una vez más a los resultados
de los estudios HOPE y ONTARGET, donde T
representa el Telmisartan, C el Ramipril y P el
placebo (Tabla 2).
Tabla 1
Enfoque por análisis múltiple
Análisis
Comparadores
Riesgo
relativo
ITT Telmisartan vs ramipril
PP Telmisartan vs ramipril
1,01 (0,94-1,09;
IC 95 %)
1,00 (0,92-1,09;
IC 95 %)
Noinferioridad
P< 0,0033
P< 0,006
ITT, PP: Ver texto. IC: Intervalo de confianza.
Tabla 2
Comparación indirecta telmisartan /placebo
Comparación entre estudios
HOPE R / P
ONTAGET T / R
Telmisartan / P putativo
Riesgo Relativo; IC
0,78 (0,70 - 0,85; IC 95 %)
1,02 (0,94 - 1,09; IC 95 %)
0,79 (0,70 - 0,89; IC 95 %)
R: ramipril; T: telmisartan; P: placebo; IC: Intervalo de confianza.
En un estudio de no-inferioridad o equivalencia
el nuevo tratamiento aún siendo no inferior al
control activo puede tener ventajas en seguridad,
conveniencia en la posología o en el costo. En el
estudio ONTARGET, la discontinuación permanente
de los pacientes durante la realización del estudio
(5,5 años) fue del 7,2 % para ramipril y del 5,1 % para
telmisartan. La mayor discontinuación registrada en
el grupo ramipril fue debida a una mayor incidencia
de tos (4,2 % vs 1,1 %, RR 0,26 - P< 0,001) y de
angioedema (0,3 % vs 0,1 %, RR 0,4 - P< 0,01).
Vol. 29, Nº 1, marzo 2009
PLUCHINO S
CONCLUSIONES
Los reportes de los estudios de no-inferioridad
y de equivalencia deben ser suficientemente
claros para permitir al lector una interpretación
fidedigna de los resultados. El Grupo CONSORT
continúa la actualización y la ampliación de sus
recomendaciones. Los clínicos deben mantener
claro el concepto que un resultado negativo en
un estudio de superioridad nunca probará que las
terapias investigadas son equivalentes. Los estudios
de no-inferioridad y de equivalencia requieren una
calidad de ejecución muy alta para arrojar resultados
confiables. Los márgenes de no-inferioridad
o de equivalencia son a menudo muy amplios
para permitir conclusiones clínicamente válidas;
pretender haber demostrado la no-inferioridad o la
equivalencia puede resultar engañosa si el estudio no
ha sido conducido con una metodología apropiada
y de muy alta calidad. Los clínicos deberían ser
escépticos sobre los resultados de los estudios si
no están reportados la justificación del margen
de la equivalencia, el cálculo del tamaño de la
muestra que tome en cuenta este mismo margen,
la presentación de los dos análisis (ITT y PP) y el
intervalo de confiabilidad para los resultados.
Los estudios de no-inferioridad y de
equivalencia son indicados en ciertas áreas; si se
sigue estrictamente la metodología específica estos
estudios pueden aportar nuevos conocimientos.
REFERENCIAS
1. Temple R, Ellenberg SS. Placebo-controlled trials and
active-control trials in the evaluation of new treatments.
Part 1: ethical and scientific issues. Ann Intern Med.
2000;133:464-470.
2. Jones B, Jarvis P, Lewis JA, Ebbutt AF. Trials to assess
equivalence: The importance of rigorous methods. BMJ.
1996;313:36-39.
3. Siegel JP. Equivalence and noninferiority trials. Am
Heart J. 2000;139(Suppl):166-170.
Avances Cardiol
4. ICH topic E9: Statistical principles for clinical trails.
US Food and Drug Administration. Available at: http://
www.fda.gov/cber/gdlns/ICHclinical.pdf. Accessed October
24, 2005
5. Begg C, Cho M, Eastwood S, et al. Improving the
quality of reporting of randomized controlled trials: The
CONSORT statement. JAMA. 1996;276:637-643.
6. Moher D, Schulz KF, Altman DG, for the CONSORT Group. The CONSORT statement: Revised
recommendations for improving the quality of
reports of parallel-group randomized trials. Lancet.
2001;357:1191-1194.
7. Altman DG, Schulz KF, Mother D, Egger M, Davidoff F,
Elbourne D, et al. The revised CONSORT statement for
reporting randomized trials: Explanation and elaboration.
Ann Intern Med. 2001;134:663-694.
8. Ioannidis JPA, Evans SJW, Gotzsche PC, O’neill RT,
Altman D, Schulz K, et al. Better reporting of harms
in randomized trials: An extension of the CONSORT
statement. Ann Intern Med. 2004;141:781-788.
9. Le Henanff A, Giraudeau B, Baron G, Ravaud P. Quality of
Reporting of Noninferiority and Equivalente Randomized
Trials. JAMA. 2006;295(10):1147-1151.
10. Pfeffer MA, McMurray JJ, Velásquez EJ, Rouleau JL,
Kober L, Maggioni AP et al. Valsartan, captopril, or both
in myocardial infarction complicated by heart failure,
left ventricular dysfunction, or both. N Engl J Med.
2003;349:1893-1906.
11. ELITE II Investigators. Effect of losartan compared with
captopril on mortality in patients with symptomatic heart
failure: Randomised trial-the Losartan Heart Failure Survival
Study ELITE II. Lancet. 2000;355:1582-1587.
12. OPTIMAAL Study Group. Effects of losartan and captopril
on mortality and morbidity in high-risk patients alter acute
myocardial infarction: The OPTIMAAL randomised trial.
Lancet. 2002;360:752-760.
13. McMurray J. ACE Inhibitors in Cardiovascular DiseaseUnbeatable? N Engl J Med. 2008;358:1615-1616.
14. The ONTARGET Investigators. Telmisartan, ramipril, or
both in patients at high risk for vascular events. N Engl
J Med. 2008;358(15):1547-1559.
15. The Heart Outcomes Prevention Evaluation Study
Investigators. Effects of an angiotensin converting-enzyme
inhibitor, ramipril, on cardiovascular events in high risk
patients. N Engl J Med. 2000;342(3):145-153.
16. D´Agostino RB, Massaro JM, Sullivan LM. Noninferiority trials: Design concepts and issues – the
encounters of academic consultants in statistics. Statist
Med. 2003;22:169-186.
81
Descargar