ESTUDIOS CLÍNICOS DE NO-INFERIORIDAD REVISIÓN CONTEMPORÁNEA Avances Cardiol 2009;29(1):76-81 Estudios clínicos de no-inferioridad y de equivalencia: metodología, análisis e interpretación de los resultados Dr. Salvatore Pluchino1 1 Cátedra de Farmacología, Instituto de Medicina Experimental, Facultad de Medicina, Universidad Central de Venezuela. Caracas, Venezuela RESUMEN Los estudios controlados con placebo son el método ideal para evaluar la eficacia del tratamiento médico. Debido al gran número de tratamientos de comprobada eficacia en ciertas aplicaciones, los estudios controlados con placebo son a menudo poco éticos. Los estudios de no-inferioridad y de equivalencia son apropiados para evaluar la eficacia de un tratamiento experimental versus un control activo cuando se plantea la hipótesis que el tratamiento experimental puede no ser superior a un tratamiento de comprobada eficacia, pero es clínica y estadísticamente no inferior. El diseño y el reporte de estos estudios deben de seguir las recomendaciones CORRESPONDENCIA Ave. Ernesto Blohm con Ave. La Estancia, Centro Banaven, Torre B, Piso 3, Chacao, Caracas-Venezuela. Apartado 64745. Chacao. Caracas 1060 E-mail: salvatore.pluchino@cantv.net Tel: +58-414-129.40.13 Fax: +58-212-959.37.70 - Buzón 0062 DECLARACIÓN DE CONFLICTO DE INTERÉS DE LOS AUTORES El autor desempeña cargos de asesor científico externo a fundaciones y empresas: entre estas, está la empresa farmacéutica Boehringer Ingelheim de Venezuela. AGRADECIMIENTO El autor agradece la colaboración fundamental del Dr. Orlando Ortiz en la revisión del texto y en la conformación del manuscrito. Recibido en: septiembre 22, 2008 Aceptado en: enero 13, 2009 76 del Grupo CONSORT. Para tal fin, es indispensable seleccionar un óptimo control activo. La eficacia del control activo debería ser documentada a través de buenos estudios históricos controlados con placebo; a partir de estos datos es indispensable determinar el margen de no-inferioridad. Los resultados del nuevo tratamiento deben ser comparados con el control activo por análisis múltiples, incluyendo el placebo putativo. El término de no-inferioridad es usado cuando se refiere a un estudio de una sola cola (diferencia en respuesta menor que ∆); equivalencia cuando se refiere a estudios de dos colas (diferencia en respuesta entre - ∆ y + ∆). Para documentar los planteamientos teóricos se recurre a datos de estudios publicados recientemente, relacionados con moléculas eficaces en el control de la presión arterial y en la reducción de los índices de mortalidad en enfermedades cardiovasculares. Palabras clave: Estudio clínico, control con placebo, control activo, no-inferioridad, equivalencia. Non-inferiority and equivalence clinical trials: Methodology, analysis and interpretation of the results SUMMARY Placebo-controlled trials are the ideal for evaluating medical treatment efficacy. Given the large number of proven effective treatment in several areas, placebo-controlled trials are often unethical. The non-inferiority and equivalence trials are appropriate for evaluation of the efficacy of an experimental Vol. 29, Nº 1, marzo 2009 PLUCHINO S treatment versus an active control when it is hypothesized that the experimental treatment may not be superior to a proven effective treatment, but is clinically and statistically not inferior in effectiveness. The design and reporting of these studies must follow the CONSORT statements. An active control must be selected. Good historical placebo-controlled trials documenting the efficacy of the active control must exist. From these historical trials, a margin of non-inferiority must be determined. The results of the new treatment must be compared with active control through multiple analysis, including a putative placebo comparison. The term non-inferiority is used when referring to a 1-sided trial (difference in response lower than ∆); equivalence, when referring to 2-sided trials (difference in response between - ∆ and + ∆). In order to give practical data, results of published trials related to active molecules effective in the control of blood pressure and in reducing mortality in cardiovascular diseases are used. Key words: Clinical trial, placebo control, active control, non-inferiority, equivalence. La necesidad de la comparación entre grupos es universalmente aceptada en los estudios médicos clínicos. En el terreno de las drogas y de los biológicos, el estudio controlado con placebo representa el diseño ideal. En efecto, el estudio clínico tradicional es diseñado para demostrar que una nueva terapia es superior a una terapia ya establecida o a un placebo inactivo; en estos casos, los estudios están diseñados y realizados como estudios de superioridad. Sin embargo, a medida que el arsenal terapéutico se enriquece con terapias siempre más eficaces, los márgenes para demostrar superioridad se estrechan siempre más. Por otro lado, el uso de estudios controlados con placebo para la evaluación de nuevos tratamientos médicos se hace éticamente problemático. El diseño de estudios de no-inferioridad es la respuesta de mayor importancia para la solución del problema; en lugar del grupo control con placebo se usa un control activo, representado por un tratamiento cuya eficacia ha sido fehacientemente demostrada. El objetivo del diseño de noinferioridad con control activo no es el de demostrar la superioridad de un nuevo tratamiento experimental en investigación sobre el control activo. Más bien, la finalidad es establecer que el efecto del tratamiento experimental, cuando es comparado con el control Avances Cardiol activo, no está por debajo de cierto margen de noinferioridad (1). Si la no-inferioridad queda establecida, la utilidad del nuevo tratamiento puede ser fundamentada sobre ventajas tradicionales como seguridad, mejor tolerabilidad, conveniencia en los esquemas de la posología, costos o en la posibilidad de disponer de tratamientos alternos mediante fármacos con diferentes mecanismos de acción dirigidos a mejorar patologías similares. Muchos nuevos aspectos y temores acompañan estos estudios especialmente por lo que se refiere a su diseño, implementación, análisis e interpretación. Entre estos resaltan los siguientes: 1. Seleccionar un control activo. 2. Obtener datos históricos a partir de estudios clínicos controlados con placebo que establezcan la eficacia del control activo. 3. Determinar un margen de no-inferioridad con relevancia clínica. 4. Diseñar estudios en los cuales los datos provenientes de estudios controlados con placebo sean todavía relevantes. 5. Implementar estudios con adecuado poder estadístico. 6. Realizar análisis que establezcan la noinferioridad del nuevo tratamiento experimental y la superioridad del nuevo tratamiento sobre el placebo, aunque no hay comparación directa del nuevo tratamiento con el placebo. Los estudios de no-inferioridad con control activo se llevan a cabo con una frecuencia creciente, especialmente en aquellas patologías para las cuales se dispone de múltiples alternativas terapéuticas que hacen los estudios controlados con placebo no éticos (aplicaciones cardiovascular, oncológica o de inmunodeficiencia adquirida). Un estudio de no-inferioridad pretende determinar si un nuevo tratamiento no es peor que una terapia de referencia. Debido al hecho que una prueba de exacta igualdad es imposible, es 77 ESTUDIOS CLÍNICOS DE NO-INFERIORIDAD necesario predefinir un margen de no-inferioridad (∆) del efecto del nuevo tratamiento con relación a un resultado específico en el paciente (ejemplo: reducción de la mortalidad). Los estudios de equivalencia son muy similares excepto que la finalidad de estos estudios es la de determinar si la diferencia en los efectos entre dos terapias está comprendida entre un pequeño intervalo previamente especificado (2,3). Los estudios de equivalencia no son frecuentes porque la mayoría de estos estudios pretende determinar la no-inferioridad. De acuerdo con las pautas establecidas en la Conferencia Internacional sobre Armonización, el término no-inferioridad es usado cuando nos referimos a un estudio de una cola (diferencia en respuesta menor que ∆) (Figura 1); equivalencia, cuando nos referimos a estudios de dos colas (diferencia en respuesta entre -∆ y +∆) (4) (Figura 2). Este artículo está principalmente enfocado a los estudios de no-inferioridad, pero puede ser aplicado también a los estudios de equivalencia de dos colas. Nuestro objetivo es el de proveer al clínico práctico la herramienta primordial para la interpretación de los estudios de no-inferioridad. Figura 1. Posibles resultados de no-inferioridad. A y B: no-inferior; C y D: no concluyente; E: inferior. 78 Figura 2. Posibles resultados de equivalencia. A, C, G: Inciertos; B y H: no equivalentes; D, E, F: equivalentes. Reporte de los estudios clínicos de no-inferioridad y equivalencia Con la finalidad de ayudar a los autores a mejorar el reporte de los estudios controlados y aleatorios han sido establecidas unas recomendaciones que trataremos de seguir en la descripción de los aspectos que caracterizan este artículo. Las recomendaciones identificadas como CONSORT (Consolidate Standard of Reporting Trials) deben ser aplicadas también a los estudios de no-inferioridad y de equivalencia en vista que presentan dificultades particulares en el diseño, conducta, análisis e interpretación (5-8). La calidad de los reportes publicados de este tipo de estudios resulta frecuentemente inadecuada. De una búsqueda entre 1 191 estudios dirigidos a investigar no-inferioridad o equivalencia publicados en el 2003 y 2004, solamente 162 fueron seleccionados (116 estudios de no-inferioridad y 46 de equivalencia) por satisfacer ciertos prerrequisitos metodológicos. De estos, solamente 33 obedecían a los requerimientos de calidad; sin embargo, 4 de ellos (12,1 %) resultaron altamente engañosos por pretender demostrar no-inferioridad o equivalencia, aunque sus resultados no permitían esa conclusión (9). Determinación del margen de no-inferioridad (M) El paso crítico en la determinación de la Vol. 29, Nº 1, marzo 2009 PLUCHINO S no-inferioridad terapéutica es la selección de la diferencia marginal. Desde un punto de vista estadístico, el margen debe ser obtenido a partir de un metaanálisis de los efectos del control activo en estudios históricos; estos deberían mostrar una consistente superioridad del control activo sobre el placebo. Además, la población del protocolo experimental asignada al control activo en el estudio en curso debería ser idéntica a aquellas usadas en los estudios históricos. El margen de no-inferioridad es definido en términos de la fracción (f) del efecto del tratamiento con el control activo que debería ser preservada, es decir, cuan cerca debe estar el nuevo tratamiento a la eficacia del control activo para que el nuevo tratamiento sea considerado no inferior al control activo. En ciertas aplicaciones, cuando se evalúa la mortalidad, la FDA ha sugerido un valor de f igual a 0,5; esto implica que la terapia experimental logra la no-inferioridad con respecto al control activo si preserva la mitad de la eficacia de este último. En recientes estudios cardiovasculares de no-inferioridad han sido usados como márgenes clínicamente aceptables riesgos relativos de 1,15 a 1,20 (diferencias relativas de 15 a 20 puntos porcentuales). Es el caso del estudio VALIANT que demuestra la no-inferioridad de la nueva terapia (Valsartan: 160 mg dos veces diarias) en relación al control activo (captopril: 50 mg tres veces diarias): RR 1,02 (0,94 a 1,11; IC 95 % de dos colas). El límite alto del intervalo de confianza estuvo dentro del margen de no-inferioridad preestablecido (RR = 1,13)(10). La no-inferioridad de losartan (50 mg una vez al día) comparativamente con captopril (50 mg tres veces al día) no fue confirmada ni en pacientes con insuficiencia cardíaca (11) ni en pacientes después de infarto agudo al miocardio (12): estos hallazgos enfatizan que en el diseño de un estudio la importancia no reside solamente en la droga seleccionada sino también en la dosis y el intervalo entre dosis (13). Aplicación de las recomendaciones CONSORT Un estudio de no-inferioridad o de equivalencia Avances Cardiol requiere que la eficacia del tratamiento de referencia esté bien establecida. Es particularmente importante que los métodos diseñados para el nuevo estudio sean lo más cercanos posible a aquellos usados en previos estudios de superioridad que demuestran el efecto de la terapia de control versus el placebo. En particular, es importante que los criterios de inclusión y exclusión, que definen la población de los pacientes, la dosificación del control activo, el uso de medicación concomitante, la variable de la respuesta primaria y su modalidad de medición, sean las mismas que las aplicadas en los precedentes estudios de superioridad. Evidentemente, cuando el margen de inferioridad es fijado a expensas de metaanálisis de estudios históricos, es muy difícil que todas estas variables coincidan. En efecto, lo resultados de muy pocos estudios son comparables debido a la diversidad de las características de los pacientes, de la medicación concomitante y del objetivo primario simple o compuesto. Estas consideraciones dificultan la aplicación de las recomendaciones CONSORT. Recientemente se conocieron los resultados del estudio ONTARGET (14), diseñado para demostrar la no-inferioridad de telmisartan (80 mg al día) con respecto a ramipril (10 mg al día) en pacientes con enfermedad vascular o diabetes de alto riesgo sin insuficiencia cardíaca: la población fue similar a aquella incluida en el estudio HOPE, diseñado para demostrar la superioridad de ramipril (10 mg al día) sobre el placebo (15). ONTARGET constituye un ejemplo de un estudio de no-inferioridad de muy alta calidad, aporta enseñanzas fundamentales para la práctica clínica e ilustra la complejidad de diseñar, conducir, analizar e interpretar estudios que comparan nuevos tratamientos que actúan en manera similar a terapias ya establecidas. El objetivo primario del estudio ONTARGET fue la determinación de la incidencia de muerte por causas cardiovasculares, infarto al miocardio, accidente cerebrovascular u hospitalización por falla cardíaca. El objetivo secundario fue la muerte por causas cardiovasculares, infarto al miocardio o accidente cerebrovascular, que corresponde al objetivo primario del estudio HOPE. Estas similitudes determinan condiciones ideales para la 79 ESTUDIOS CLÍNICOS DE NO-INFERIORIDAD T versus P = T/P = T/C x C/P aplicación de las recomendaciones CONSORT. En efecto, el margen de no-inferioridad fue determinado a expensas de los resultados del estudio HOPE: un total de 651 pacientes en el grupo ramipril murieron por causas cardiovasculares o tuvieron un infarto al miocardio o un accidente cerebro-vascular, comparativamente con 826 pacientes en el grupo placebo, lo cual arroja un riesgo relativo de 0,78 (0,70 - 0,86, IC 95 %, P<0,001). El riesgo relativo fue transformado en un exceso de riesgo para el placebo de 1,26 (826/651) cuando es comparado con ramipril; por lo tanto, un margen de 1,13 aseguraba que el telmisartan retendría por lo menos la mitad del efecto del ramipril, si el límite alto del intervalo de confianza de 97,5 % de una sola cola para el riesgo relativo fuera menor de ese valor. De acuerdo con los resultados del estudio ONTARGET, telmisartan fue claramente no-inferior a ramipril, tanto por el análisis de todos los pacientes incluidos después de la distribución aleatoria (análisis ITT, “intention to treat”) como después del análisis por protocolo (análisis PP, “per protocol”) (Tabla 1). Este último punto y la comparación con un óptimo control activo constituyen dos de las recomendaciones fundamentales de CONSORT. En cualquiera de los dos análisis, el límite alto del intervalo de confianza estuvo dentro del margen de no-inferioridad preestablecido (M=1,13). Además, el límite bajo del intervalo de confianza resultó mayor que el valor correspondiente a un análisis de dos colas (1 - 0,13 = 0,87), lo cual permite concluir que la terapia experimental fue equivalente al control activo (límite bajo y límite alto del intervalo de confianza ampliamente dentro de -∆ y +∆). Una importante recomendación de CONSORT corresponde a la comparación de la terapia experimental con el “placebo putativo”, para demostrar que la terapia experimental es superior al placebo, aunque en el estudio de no-inferioridad o equivalencia no se haya incluido un grupo placebo (16) . Para tal fin es necesario usar los datos del control activo versus la terapia experimental conjuntamente con los datos históricos del control activo versus placebo: 80 donde T representa la terapia experimental, C el control activo y P el placebo. Para una demostración práctica de este dato podemos recurrir una vez más a los resultados de los estudios HOPE y ONTARGET, donde T representa el Telmisartan, C el Ramipril y P el placebo (Tabla 2). Tabla 1 Enfoque por análisis múltiple Análisis Comparadores Riesgo relativo ITT Telmisartan vs ramipril PP Telmisartan vs ramipril 1,01 (0,94-1,09; IC 95 %) 1,00 (0,92-1,09; IC 95 %) Noinferioridad P< 0,0033 P< 0,006 ITT, PP: Ver texto. IC: Intervalo de confianza. Tabla 2 Comparación indirecta telmisartan /placebo Comparación entre estudios HOPE R / P ONTAGET T / R Telmisartan / P putativo Riesgo Relativo; IC 0,78 (0,70 - 0,85; IC 95 %) 1,02 (0,94 - 1,09; IC 95 %) 0,79 (0,70 - 0,89; IC 95 %) R: ramipril; T: telmisartan; P: placebo; IC: Intervalo de confianza. En un estudio de no-inferioridad o equivalencia el nuevo tratamiento aún siendo no inferior al control activo puede tener ventajas en seguridad, conveniencia en la posología o en el costo. En el estudio ONTARGET, la discontinuación permanente de los pacientes durante la realización del estudio (5,5 años) fue del 7,2 % para ramipril y del 5,1 % para telmisartan. La mayor discontinuación registrada en el grupo ramipril fue debida a una mayor incidencia de tos (4,2 % vs 1,1 %, RR 0,26 - P< 0,001) y de angioedema (0,3 % vs 0,1 %, RR 0,4 - P< 0,01). Vol. 29, Nº 1, marzo 2009 PLUCHINO S CONCLUSIONES Los reportes de los estudios de no-inferioridad y de equivalencia deben ser suficientemente claros para permitir al lector una interpretación fidedigna de los resultados. El Grupo CONSORT continúa la actualización y la ampliación de sus recomendaciones. Los clínicos deben mantener claro el concepto que un resultado negativo en un estudio de superioridad nunca probará que las terapias investigadas son equivalentes. Los estudios de no-inferioridad y de equivalencia requieren una calidad de ejecución muy alta para arrojar resultados confiables. Los márgenes de no-inferioridad o de equivalencia son a menudo muy amplios para permitir conclusiones clínicamente válidas; pretender haber demostrado la no-inferioridad o la equivalencia puede resultar engañosa si el estudio no ha sido conducido con una metodología apropiada y de muy alta calidad. Los clínicos deberían ser escépticos sobre los resultados de los estudios si no están reportados la justificación del margen de la equivalencia, el cálculo del tamaño de la muestra que tome en cuenta este mismo margen, la presentación de los dos análisis (ITT y PP) y el intervalo de confiabilidad para los resultados. Los estudios de no-inferioridad y de equivalencia son indicados en ciertas áreas; si se sigue estrictamente la metodología específica estos estudios pueden aportar nuevos conocimientos. REFERENCIAS 1. Temple R, Ellenberg SS. Placebo-controlled trials and active-control trials in the evaluation of new treatments. Part 1: ethical and scientific issues. Ann Intern Med. 2000;133:464-470. 2. Jones B, Jarvis P, Lewis JA, Ebbutt AF. Trials to assess equivalence: The importance of rigorous methods. BMJ. 1996;313:36-39. 3. Siegel JP. Equivalence and noninferiority trials. Am Heart J. 2000;139(Suppl):166-170. Avances Cardiol 4. ICH topic E9: Statistical principles for clinical trails. US Food and Drug Administration. Available at: http:// www.fda.gov/cber/gdlns/ICHclinical.pdf. Accessed October 24, 2005 5. Begg C, Cho M, Eastwood S, et al. Improving the quality of reporting of randomized controlled trials: The CONSORT statement. JAMA. 1996;276:637-643. 6. Moher D, Schulz KF, Altman DG, for the CONSORT Group. The CONSORT statement: Revised recommendations for improving the quality of reports of parallel-group randomized trials. Lancet. 2001;357:1191-1194. 7. Altman DG, Schulz KF, Mother D, Egger M, Davidoff F, Elbourne D, et al. The revised CONSORT statement for reporting randomized trials: Explanation and elaboration. Ann Intern Med. 2001;134:663-694. 8. Ioannidis JPA, Evans SJW, Gotzsche PC, O’neill RT, Altman D, Schulz K, et al. Better reporting of harms in randomized trials: An extension of the CONSORT statement. Ann Intern Med. 2004;141:781-788. 9. Le Henanff A, Giraudeau B, Baron G, Ravaud P. Quality of Reporting of Noninferiority and Equivalente Randomized Trials. JAMA. 2006;295(10):1147-1151. 10. Pfeffer MA, McMurray JJ, Velásquez EJ, Rouleau JL, Kober L, Maggioni AP et al. Valsartan, captopril, or both in myocardial infarction complicated by heart failure, left ventricular dysfunction, or both. N Engl J Med. 2003;349:1893-1906. 11. ELITE II Investigators. Effect of losartan compared with captopril on mortality in patients with symptomatic heart failure: Randomised trial-the Losartan Heart Failure Survival Study ELITE II. Lancet. 2000;355:1582-1587. 12. OPTIMAAL Study Group. Effects of losartan and captopril on mortality and morbidity in high-risk patients alter acute myocardial infarction: The OPTIMAAL randomised trial. Lancet. 2002;360:752-760. 13. McMurray J. ACE Inhibitors in Cardiovascular DiseaseUnbeatable? N Engl J Med. 2008;358:1615-1616. 14. The ONTARGET Investigators. Telmisartan, ramipril, or both in patients at high risk for vascular events. N Engl J Med. 2008;358(15):1547-1559. 15. The Heart Outcomes Prevention Evaluation Study Investigators. Effects of an angiotensin converting-enzyme inhibitor, ramipril, on cardiovascular events in high risk patients. N Engl J Med. 2000;342(3):145-153. 16. D´Agostino RB, Massaro JM, Sullivan LM. Noninferiority trials: Design concepts and issues – the encounters of academic consultants in statistics. Statist Med. 2003;22:169-186. 81