Medicina basada en evidencias Medicina basada en evidencias Joseph Bernstein, MD, MS Resumen La medicina basada en evidencias (MBE) utiliza y valora la información para ayudar a tomar las decisiones más correctas. En contra de lo que se cree normalmente, para utilizar la MBE hay que aceptar la existencia de incertidumbres en la toma de las mencionadas decisiones; esto se debe a lo difícil que resulta lograr una información que sea a la vez veraz y completa. Tras aceptar la incertidumbre como algo inherente a la medicina, los defensores de la MBE aconsejan utilizar un proceso de toma de decisiones que incluye cinco fases: formulación de preguntas que puedan tener respuesta, reunión de evidencias, evaluación de las mismas, puesta en práctica (aplicación) de las evidencias válidas y valoración del proceso. La formulación de preguntas con respuesta requiere de una clasificación de las características de los casos para compararlas con las de evidencias obtenidas en estudios previos. La evaluación de las evidencias utiliza métodos epidemiológicos que estimen su validez y aplicabilidad. La puesta en práctica hace referencia a un plan clínico basado en las evidencias obtenidas, en la opinión del médico y en las preferencias del paciente. Por último, la MBE requiere de una valoración y un perfeccionamiento continuos. Los métodos de la MBE son muy importantes en la medicina contemporánea, puesto que los profesionales trabajan bajo intensas presiones, que les obligan a buscar los mejores resultados posibles, y en un entorno de conocimientos médicos cada vez más amplios. J Am Acad Orthop Surg (Ed Esp) 2004;3:152-160 J Am Acad Orthop Surg 2004;12:80-88 La medicina basada en evidencias (MBE) es un fenómeno cada vez más frecuente (fig. 1); pero ¿qué es exactamente? Para evaluar el valor de la MBE1 y estimar su impacto práctico, lo primero que hay que hacer es definirla. Por lo tanto, mi primera intención es comentar dicha definición y revisar los métodos de valoración crítica epidemiológicos en los que se basa. Otro asunto más sutil, pero tal vez más interesante, es saber por qué ha aumentado tanto recientemente el interés por la MBE. Decir que la MBE es una nueva forma de práctica médica parece indicar que los métodos tradicionales no se basaban en evidencias. No se trata de una crítica directa; nadie ha comparado, por ejemplo, la medicina occidental con la necromancia o la astrología. Sin embargo, se mantiene la insinuación de que la práctica médica carece de base científica. 152 El argumento más fuerte que apoya la idea de que la medicina carece de fundamento científico proviene de estudios que publican variaciones enormes con respecto a la prevalencia de una determinada enfermedad. Por ejemplo, la tasa de lumbalgia tratada quirúrgicamente en los pacientes de Medicare de Santa Bárbara es 5 veces superior a la del Bronx.2 Teniendo en cuenta que es poco probable que en realidad la prevalencia de la enfermedad difiera tanto, es probable que exista un tipo de pacientes para el que los médicos de California, basándose en opiniones científicas, recomiendan la cirugía, mientras que los médicos del Bronx, apoyados en los mismos conocimientos científicos, no la aconsejan. Podría pensarse que o tienen razón los médicos de California o la tienen los médicos del Bronx, pero no ambos a la vez. Hay que dejar claro que una amplia variación no demuestra que la medicina no sea científica. También, que de que incluso la mejor evidencia sólo puede reducir, pero no eliminar totalmente, la incertidumbre y la variación. Definición de medicina basada en evidencias El término MBE hace referencia a un proceso de utilización y valoración de la información que puede ayudar a los médicos a tomar sus decisiones profesionales. La definición que se menciona a continuación es la de Sackett y cols.:3 «La MBE es la utilización meticulosa, explícita y sensata de las mejores evidencias existentes para ayudar a tomar decisiones referentes al tratamiento de los pacientes. La práctica de la MBE implica integrar las experiencias clínicas individuales y las mejores evidencias derivadas de investigaciones sistemáticas.» Llama la atención que en dicha definición no se mencionan los ensayos aleatorizados controlados. Tampoco hace referencia a los estudios de coste-eficacia ni a los algoritmos. Lo que sí menciona de forma tácita es que el proceso de El Dr. Bernstein es Attending Surgeon, Veterans Hospital, Philadelphia, PA y Senior Fellow, Leonard Davis Institute of Health Economics, University of Pennsylvania School of Medicine, Philadelphia. Ni el Dr. Bernstein ni su departamento asociado han recibido ayudas ni poseen acciones en empresas u organismos relacionados directa o indirectamente con el tema de este artículo. Copyright 2004 by the American Academy of Orthopaedic Surgeons. Journal of the American Academy of Orthopaedic Surgeons (Edición Española) 28 Joseph Bernstein, MD, MS 2.000 1.500 1.000 500 0 1994 1995 1996 1997 1998 1999 2000 Figura 1. Diagrama del número de citas por año que se encontraron en MEDLINE bajo el epígrafe de «medicina basada en evidencias» (1994-2000). toma de decisiones médicas es difícil. ¿Por qué los médicos tienen que realizar esfuerzos «explícitos y sensatos»?. La toma de decisiones resulta difícil porque los médicos se enfrentan al dilema de basarlas en informaciones imperfectas o inadecuadas. A esto se le llama «el principio de incertidumbre en la toma de decisiones clínicas»; según dicho principio, no es posible tener una información que sea al mismo tiempo verídica y completa. Para entender el fundamento de este dilema, hay que comprender cuál es la naturaleza del conocimiento médico. chos comprobados no es una garantía de seguridad. Si descartamos todo lo que no está comprobado, podríamos rechazar muchas verdades no demostradas. Un diagrama de Venn, que represente el universo del conocimiento médico, es de gran ayuda para ilustrar dicha cuestión (fig. 2). Una parte de dicho universo incluye afirmaciones que sin duda son ciertas (círculo A). También existe un grupo de afirmaciones que han sido comprobadas (círculo B). La intersección de los círculos A y B (área C) representa las afirmaciones que han sido comprobadas y que son ciertas, es decir la información validada que todos los médicos deseamos. Sin embargo, el área C obviamente no contiene sólo verdades; de hecho el área C es una zona del área A. Precisamente aquí está el dilema. Si nos limitamos sólo a las afirmaciones del área C, dejaremos de tener acceso a las afirmaciones veraces que no han sido comprobadas (área D). Sin embargo, si aceptamos lo no comprobado del área D, también nos arriesgamos a utilizar falsas afirmaciones que están fuera del área A. Debemos elegir entre utilizar sólo los datos validados, que pueden ser inadecua- Conocimiento médico El decano de la Facultad de Medicina de la Universidad de Cornell dio una vez la bienvenida a una clase de nuevos alumnos con la siguiente frase: «La mitad de lo que les vamos a enseñar es falso y la otra mitad es verdadero. El problema es que no sabemos qué mitad es verdadera y cuál es falsa». Aunque parece una broma, en realidad la verdad que aquí se encierra es muy seria. Si nos guiamos por lo que ha ocurrido en la historia, es previsible que mucho de lo que actualmente damos por cierto cambie o se modifique en el futuro. Sabemos que al menos parte de la información de la que disponemos es errónea. Ante esa circunstancia, ¿qué hay que hacer?. Desde luego, limitar nuestra práctica a he- 29 dos, o aventurarnos más allá de lo comprobado y emplear ideas posiblemente incorrectas. La existencia de verdades no comprobadas puede atribuirse a la falta de recursos; es decir, no hay tiempo ni dinero suficiente para comprobar todo. El problema es que incluso con recursos ilimitados todavía habrá algunas afirmaciones ciertas cuya verdad no pueda establecerse. Esto precisamente fue demostrado en 1930 por Kurt Gödel en su sorprendente teorema de la «incompletitud».4 Una traducción en lenguaje común del teorema dice que «no todas las afirmaciones verdaderas son probablemente verdaderas». Por lo tanto nos quedan dos opciones poco atractivas: la imperfección por un lado y la inadecuación por el otro. Sin embargo, todavía hay que elegir. Recordemos la fábula del asno hambriento, que fue colocado exactamente equidistante a dos montones de paja; al sentirse atraído del mismo modo en ambas direcciones acabó muriéndose de hambre. En la práctica no podemos confiar en encontrar para cada caso la información perfecta. En realidad, las decisiones hay que tomarlas con U A Verdadero Verdadero pero no comprobado D B Comprobado C E Comprobado y falso F Comprobado y verdadero Ni verdadero ni comprobado Figura 2. Diagrama de Venn que representa el universo (U) del conocimiento médico. El área A indica todas las afirmaciones verdaderas mientras que el área B representa todas las afirmaciones que han sido comprobadas. El área C indica todas las afirmaciones validadas (comprobadas y verdaderas), pero no contiene todas las verdades. Éstas se han perdido en el área D, que representa las verdades que no han sido comprobadas (verdaderas pero sin comprobar). El área E indica el conocimiento invalidado, es decir, todas las afirmaciones comprobadas pero falsas. El área F incluye aquellas afirmaciones que ni son verdaderas ni han sido comprobadas. El médico que utiliza los conocimientos no comprobados espera que estén en el área D, aunque de hecho pueden estar en el área F. Vol 3, N.o 3, Mayo/Junio 2004 153 Medicina basada en evidencias la información que tengamos a mano, sabiendo que dicha información a veces es imprecisa. Los métodos de la MBE pueden ayudarnos a tomar decisiones aun con esta incertidumbre. Utilización de la medicina basada en evidencias Vamos a considerar el caso del señor Pérez, un paciente con fractura abierta de tibia que fue tratado con una férula en su hospital local, y después fue enviado a un traumatólogo interesado en aplicar la MBE. Dicho médico pensó que el paciente necesitaba una operación. Sin embargo, no tenía claro si era mejor realizar una osteosíntesis interna o una fijación externa. Si nuestra idea es utilizar un tratamiento sólo cuando se haya demostrado su eficacia en estudios prospectivos aleatorizados a doble ciego controlados y de gran escala, ninguna forma de tratamiento será la adecuada, puesto que dichos estudios no suelen existir. Si el médico continúa con la férula y no elige ningún otro tratamiento, en realidad estaría eligiendo una tercera opción: dejar al paciente con la férula inicial. Es decir, siempre hay que tomar una decisión. Para realizar una elección con sabiduría y no dejarla a la suerte, Sackett y Haynes5 aconsejan los cinco pasos fundamentales de la MBE: (1) formular preguntas que puedan responderse (2) reunir evidencias, (3) valorarlas, (4) ponerlas en práctica y (5) evaluar el proceso. Primer paso: formular preguntas que puedan responderse Uno no puede consultar la bibliografía y preguntar ¿qué haré con el señor Pérez?. La pregunta debe transformarse en otra que pueda responderse. Esto supone en realidad hacer tres preguntas. ¿Quién es el señor Pérez? ¿Cuáles son las opciones? ¿Qué puede ocurrir si elijo una de las opciones? Por tanto, formular preguntas que puedan responderse re- 154 quiere definir al paciente, los posibles tratamientos existentes y los mejores resultados. Para definir al paciente, lo primero que hay que hacer es tener un diagnóstico. Después se deben identificar las características del paciente que parezcan relevantes para el tratamiento. Los factores que describen a un paciente son su edad, sexo, historia clínica y, por ejemplo, la localización de la fractura, el grado de la lesión y la posible existencia de enfermedades asociadas. Es decir, no hay estudios que hablen exclusivamente del señor Pérez, sino de pacientes que comparten características entre sí. Así pues, el médico debe decidir mediante su «experiencia clínica individual» qué características son importantes. Por ejemplo, la mayoría de los médicos estaría de acuerdo en que un estudio de fracturas tibiales en mujeres adultas sería relevante para el caso del señor Pérez, mientras que un estudio de fracturas tibiales en muchachos pre-adolescentes no lo sería. Puede parecer obvio que la edad es más determinante que el sexo, aunque dicha circunstancia en realidad expresa una experiencia clínica individual. Es poco probable que los autores de un estudio sobre fracturas pediátricas incluyan un aviso explícito de no aplicar sus conclusiones a pacientes adultos. El siguiente paso consiste en identificar los posibles tratamientos. Ésta también es una decisión personalizada, puesto que algunas de las opciones referidas en la bibliografía pueden no estar disponibles o no ser prácticas. Existen circunstancias que pueden limitar las posibles opciones, como son la escasez de medios, las limitaciones de las habilidades médicas o la presencia de otras lesiones. El concepto de que «la bibliografía sugiere la técnica X pero para mis recursos la técnica Y es mejor» es válido. Desde luego, uno debe considerar que si sus recursos no pueden resolver un problema, lo mejor sería enviar el paciente a otro médico. El paso final consiste en definir los resultados de interés. No todos los resultados que los investigadores publican son necesariamente aplicables a la decisión de tratar al señor Pérez. Un estudio sobre los resultados del tratamiento de fracturas tibiales puede mencionar el período de consolidación, el de hospitalización, el porcentaje de pacientes que lograron la consolidación, la incidencia de complicaciones y otros parámetros. La decisión sobre qué aspectos son importantes y en qué medida, dependerá de cada paciente. Segundo paso: reunión de las evidencias La recopilación de un gran número de artículos sobre una determinada materia es algo relativamente fácil. Sin embargo, reunir «las mejores evidencias disponibles de una investigación sistemática»3 puede resultar más difícil. Si se realiza incorrectamente, una búsqueda bibliográfica puede saturarse de citas irrelevantes. Esto debe hacernos recordar al lamento del anciano marinero de Coleridge cuando decía: «agua, agua por todas partes, y ni una gota para beber». Cuando uno se enfrenta a un número inmenso de estudios, la identificación del «mejor» puede ser una tarea titánica. Este artículo no pretende enseñar cómo realizar una búsqueda bibliográfica correctamente; tal vez, ningún artículo pueda hacerlo. En realidad, uno adquiere la habilidad para ello mediante la práctica. En cierta medida, aprender a efectuar búsquedas bibliográficas se asemeja al aprendizaje de la artroscopia: uno empieza haciendo un curso, pero después necesita mejorar constantemente. Tercer paso: valoración de las evidencias Los defensores de la MBE dicen que los médicos deben evaluar las evidencias médicas del mismo modo que los jueces los asuntos legales. Esto nos hace recordar que la valoración de evidencias médicas es una tarea realizada por seres humanos y sujeta por tanto a errores (consultar Apéndice en http://www5.aaos.org/jaaos/pdf/ v12n2a10.pdf). Dicha comparación Journal of the American Academy of Orthopaedic Surgeons (Edición Española) 30 Joseph Bernstein, MD, MS con los asuntos legales también pone de relieve la incoherencia de la opinión de algunos críticos según los cuales la medicina no se basa en evidencias simplemente porque algunas afirmaciones médicas no han sido demostradas de forma perfecta. Después de todo, la gente no dice que la mayoría de los asesinos son sentenciados sin evidencias sólo porque unos pocos hayan sido fotografiados en el momento de cometer el crimen. Por el contrario, se acepta que existen varios tipos de evidencias legales, y que unos son mejores que otros. De hecho, incluso la identificación mediante testigos y la confesión son imperfectas. Además, en la medicina como en el derecho, la importancia de la materia que hay que resolver mediante evidencias afecta directamente al grado de certeza que sea necesario.6 Por lo tanto, la pregunta no es: «¿Es perfecta la evidencia? La pregunta debería ser: ¿Cuan buena es la evidencia?». En la investigación clínica no todas las fuentes de evidencias se crean de la misma forma. Si consideramos los estudios que publican resultados terapéuticos, la mayoría de los epidemiólogos estarían de acuerdo con la pirámide de evidencias que se menciona a continuación: Ensayo controlado aleatorizado Estudio prospectivo de cohorte Estudio retrospectivo de cohorte Estudio de casos-control Serie de casos Caso clínico Opinión de experto Observación personal Las características de cada uno de los tipos mencionados se resumen en la tabla 1. La citada pirámide tiene una jerarquía por la que cada apartado de la lista representa un método supuestamente mejor que el que está por debajo de él. Por ejemplo, un estudio de cohorte que demuestra X supera a una serie de casos que demuestre lo contrario. Sin embargo, también son legítimas incluso las formas de evidencia de la parte baja de la lista. Por lo tanto, cuando no existen evidencias, incluso un caso clínico puede dar legitimidad a una determinada decisión. Una evidencia débil no significa que haya falta de evidencias. 31 Tabla 1 Definición de los tipos de estudio utilizados en la investigación clínica Tipo de estudio Caso clínico Serie de casos Casos-control Cohorte retrospectiva Cohorte prospectiva Ensayo controlado aleatorizado Definición Publicación de un sólo paciente Publicación de muchos pacientes que han seguido el mismo tratamiento, pero sin grupo control o grupo para comparar Estudio en el que los grupos de pacientes se separan por la presencia o ausencia de enfermedad, y que se estudian por la exposición previa a la enfermedad que se considere de interés Estudio en el que los grupos de pacientes se separan en razón de su exposición a la enfermedad o de su tratamiento, pero en los que la exposición ocurre antes de iniciar el estudio Estudio en el que los grupos de pacientes se separan en razón de su exposición a la enfermedad o de su tratamiento, pero en los que la exposición ocurre después de iniciar el estudio Estudio en el que los pacientes se asignan al azar al grupo de tratamiento o al grupo control, y son seguidos de forma prospectiva Considerando la jerarquía de evidencias como una pirámide, puede destacarse una cosa importante: las mejores formas de evidencia suelen ser las más raras. Por ejemplo, en una revisión de una muestra bibliográfica ortopédica de casi 500 artículos, 33 fueron ensayos controlados aleatorizados, aunque muchos de ellos mos- traban métodos estadísticamente inadecuados7 (fig. 3). El ensayo controlado aleatorizado frente a la serie de casos Los hallazgos de un ensayo controlado aleatorizado suponen la mejor forma de evidencia médica. Para apreciar las ventajas de los ensayos contro- Casos-control 2% Serie de casos 64% Cohorte retrospectiva 8% Cohorte prospectiva 1% Caso clínico 18% Ensayo controlado aleatorizado 7% Figura 3. Distribución de los diferentes tipos de estudio entre los artículos de un año del Journal of Bone and Joint Surgery (americano y británico) y del Clinical Orthopaedics and Related Research.7 Vol 3, N.o 3, Mayo/Junio 2004 155 Medicina basada en evidencias lados aleatorizados hay que compararlos con métodos peores, como, por ejemplo, las series de casos. Imaginemos una serie de casos de 50 pacientes con artrosis de rodilla tratados mediante desbridamiento artroscópico con resultado exitoso. ¿Demostraría ésta serie la eficacia de dicha intervención? Tal vez no. Hay que tener en cuenta que dicho estudio puede ser erróneo por los siguientes sesgos: Selección del paciente: Si sólo se ofreció la intervención a aquellos pacientes de los que se esperaba que respondieran bien, la eficacia publicada se ha sobrestimado. Falta de contexto: Se dice que la operación ha sido un éxito, ¿pero comparada con qué? Para decir que un tratamiento es eficaz hace falta como mínimo compararlo con otro grupo tratado de otra forma. Incluso una mejoría comprobada mediante parámetros objetivos no es suficiente para indicar que un tratamiento es realmente eficaz; tal vez la evolución natural de la artrosis incluye períodos de mejorías debidas al azar. Para confirmar el valor real del tratamiento debería añadirse un grupo que no haya recibido tratamiento (ni siquiera un placebo). Pérdida de datos: Un estudio retrospectivo puede no incluir todos los pacientes tratados. Pueden perderse historiales. Además, los pacientes interrogados sobre sus síntomas de hace años pueden no recordarlos de forma adecuada. Exclusiones sutiles: Los estudios retrospectivos de una intervención no suelen incluir datos de los pacientes a los que se les aconsejó dicha intervención y que finalmente no aceptaron ser operados. Este hecho también implica un sesgo. Los pacientes que estaban demasiado enfermos para ser operados, y que por tanto fueron tratados de forma no quirúrgica, fueron excluidos del grupo quirúrgico. Por tanto, dicha circunstancia también puede afectar a los resultados. Disonancia cognitiva: Un paciente que decide operarse y acepta todos los riesgos de la cirugía puede autoconvencerse de que la operación mereció la pena, incluso sin ser verdad, para de esa forma validar la decisión que tomó. Por la misma razón, un cirujano que realiza una intervención 156 puede no ser imparcial a la hora de valorar su propio trabajo. La forma de contrarrestar los mencionados sesgos es la realización de un estudio controlado aleatorizado prospectivo y a doble ciego. En este tipo de ensayos, los pacientes que cumplen determinados criterios de inclusión se asignan a diferentes grupos de tratamiento. Esta distribución arbitraria evita el sesgo de los resultados derivados de ofrecer el tratamiento sólo a aquellos pacientes con más probabilidades de responder a él satisfactoriamente. Para que sirva de comparación, hay que crear un grupo de control. Además, la naturaleza prospectiva de los ensayos permite que los investigadores definan por adelantado las variables de interés, para de esa forma asegurar que se toman datos de todos los pacientes. Los sesgos por exclusión pueden corregirse mediante un «análisis con intención de tratar», en el que los pacientes se consideran en razón del grupo al que fueron asignados y no por el tratamiento que recibieron. Además, el hecho de que el paciente y al investigador desconozcan el tratamiento realizado (lo que se llama doble ciego) sirve para limitar el sesgo de los efectos psicológicos. El valor de los ensayos controlados aleatorizados precisamente subyace en su resistencia al sesgo, aunque desafortunadamente no son infalibles. En un extremo están los ensayos controlados aleatorizados que parecen demostrar los beneficios de la homeopatía,8 que para Park no sólo están en desacuerdo con los principios de la medicina sino también en conflicto con las leyes de la biología, química y física. Es bastante más probable que dichos ensayos sean erróneos o que presenten lo que se denomina ruido estadístico. Que p = 0,005 sea el criterio de significación estadística implica que aceptamos a priori un 5% de probabilidades de que un estudio pueda mostrar diferencias donde en realidad no las hay. Los ensayos controlados y aleatorizados ofrecen buenas evidencias. Sin embargo, no son perfectos. Si el lector tiene dudas al respecto, considere esta anécdota narrada por Skrabanek y McCormick.10 Un paciente fue incluido en un estudio controlado, aleatorizado, prospectivo y doble ciego para investigar los efectos de un determinado fármaco. Un día, de repente, preguntó a su médico por qué se le había cambiado la medicación. El médico, sin conocer a qué grupo había sido asignado el paciente, le contestó que no sabía bien a qué se refería. A pesar de todo, contestó al paciente: «¿Qué le hace pensar que se le ha cambiado su medicación?». A lo que el enfermo respondió: «Hasta ahora, cuando tiraba las pastillas por el retrete, se hundían; sin embargo, cuando las he tirado durante esta semana, flotan». Estudios de casos-control Debido a sus limitaciones, los ensayos controlados y aleatorizados pueden no ser la mejor forma de evidencia. De hecho, algunas preguntas son contestadas mejor por otros métodos. Para valorar, por ejemplo, el riesgo de una determinada lesión a largo plazo, los estudios de casos-control pueden ser los más adecuados. Si queremos averiguar si la carrera de larga distancia produce artrosis de cadera, por ejemplo, sería absurdo crear un ensayo aleatorizado de sujetos, hacerles correr maratones y, a continuación, varias décadas después, medir la tasa de artrosis en ambos grupos. Una forma mejor de contestar a esa pregunta sería realizar un estudio de casos-control; el investigador recogería los datos de los pacientes que sufren artrosis en el presente y que hacían carreras de larga distancia, y los compararía con los de un grupo de control de sujetos sin artrosis. El método de casos-control es sin duda alguna imperfecto, puesto que algunos sujetos pueden recordar mejor que otros las circunstancias previas a la presentación de los síntomas. Además, en los casos-control la relación causa-efecto se sugiere, no se comprueba. Sin embargo, cuando entre la exposición a una determinada enfermedad y la presentación de la misma haya transcurrido mucho tiempo, o cuando la enfermedad estudiada sea rara, los estudios de casos-control suelen ser los mejores. Opinión del experto La opinión de un experto está cerca de la parte inferior de la pirámide Journal of the American Academy of Orthopaedic Surgeons (Edición Española) 32 Joseph Bernstein, MD, MS de evidencias, posición que sin duda tiene un significado metafórico: la enseñanza de los expertos es la base sobre las que se apoya el conocimiento. Los buenos estudiantes preguntan a sus profesores y consultan los libros de texto (no los artículos de las revistas) cuando quieren comenzar a estudiar una determinada área de conocimiento. Sin embargo, como forma de evidencia, la opinión de los expertos está subordinada a la investigación sistemática. De hecho, la historia está repleta de ejemplos en los que los expertos se equivocaron de forma impresionante.11 Por ejemplo, William Harvey fue ferozmente criticado por los «expertos» por su idea radical de la circulación sanguínea. Scott12 ha referido que en la cirugía ortopédica también existen ejemplos parecidos. La mejor forma de respaldar algo es apelar a la autoridad. Por ejemplo, no hace demasiado tiempo muchos argumentos de los psicoanalistas comenzaban así: «Como observó Freud,…». La cirugía ortopédica se sustenta en bases más objetivas que el psicoanálisis, aunque comparte con él un hecho: que el entrenamiento profesional se realiza en forma de un aprendiz que trata de imitar a un maestro. Teniendo en cuenta que solemos aceptar las enseñanzas de los expertos en cuestiones básicas, puede resultarnos difícil rechazar sus razonamientos cuando especulen con ellos. Sin embargo, debemos aceptarlos. Una vez más hay que recordar la jerarquía de las evidencias: la opinión del experto es mejor que la del que no lo es, pero peor que la derivada de una buena investigación clínica. Observación personal La observación personal es la peor forma de evidencia. Podemos engañarnos con nuestras propias observaciones, incluso aunque seamos conscientes de ello e intentemos compensarlo. Hay que recordar en primer lugar que las observaciones personales se basan en pequeñas muestras. Imaginemos un investigador que estudia la anticoagulación en prótesis totales de rodilla. Si observa un grupo de 10 pacientes que no reciben medicación 33 y no sufren tromboembolismo, podría erróneamente concluir que los anticoagulantes no son necesarios. Sin embargo, si el riesgo de embolia pulmonar sin profilaxis es por ejemplo del 3%, las probabilidades de que el médico no vea una embolia en un grupo de 10 pacientes sin tratamiento son aproximadamente de 3 a 1. Lógicamente, como dicha complicación es rara, que los anticoagulantes son necesarios sólo puede deducirse a partir de grandes series. Por otro lado, las observaciones personales son estudios sin control. Como señalan Redelmeier y Tversky,13 la gente quiere que el mundo tenga sentido e inventa explicaciones para lo que quiere ver, independientemente de que dichas explicaciones sean ciertas. Si un paciente es tratado y queda bien es humano que crea que se curó gracias al tratamiento, simplemente porque la curación siguió al tratamiento. Esto recuerda a la falacia post hoc ergo propter, que confunde las asociaciones en el tiempo con las relaciones causa-efecto. Si existiera un grupo de control para comparar los resultados sería menos probable cometer errores. Por último, las observaciones personales están sometidas a sesgos de recuerdo. Por ejemplo, si no hemos sido capaces de detectar un sarcoma sinovial del tibial posterior en un paciente que se torció el tobillo, podemos sobreestimar la posibilidad de este poco común diagnóstico en los pacientes que veamos más adelante con torcedura de tobillo. Cuarto paso: puesta en práctica de las evidencias La correcta realización de la pregunta clínica es importante para valorar las opciones terapéuticas de un determinado paciente. Una adecuada consulta y valoración de las evidencias nos ayudará a conocer los posibles resultados de dichas opciones. Para tomar una decisión, el médico simplemente debe elegir la mejor opción de una lista. A veces el proceso es muy directo; otras puede resultar más incierto. Las causas de dicha incertidumbre son básicamente dos. La primera se refiere a las lla- Vol 3, N.o 3, Mayo/Junio 2004 madas zonas de vacío en las evidencias, por las que el médico se ve obligado a interpolar. La segunda se debe a que el valor asignado a alguno de los resultados puede ser variable. Es decir, incluso entendiendo bien desde el punto de vista científico los posibles tratamientos, las incertidumbres y las variaciones suelen abundar. Imaginemos el siguiente caso: un atleta de 21 años, con dolor, inflamación y molestias en la interlínea articular 2 días después de torcerse la rodilla. Tras recoger la información y revisar las evidencias de la historia clínica, la exploración física, los estudios de imagen y la aspiración de líquido articular, el médico concluye que el paciente tiene una rotura del menisco interno en la zona de unión menisco-sinovial (la denominada zona roja), sin que haya ninguna otra lesión. En ese momento hay tres opciones terapéuticas posibles: la reparación meniscal, la meniscectomía y el tratamiento conservador. La forma lógica de elegir la mejor de ellas es utilizar un árbol de decisión14 (fig. 4). En dicho árbol, lógicamente, se incluyen todas las opciones. Las ramas que salen de ellas conducen a unos nódulos terminales que representan los posibles resultados de una determinada opción. A cada rama se le asigna un peso específico proporcional a la probabilidad de que se llegue a un determinado resultado, y a los nódulos terminales se les asigna valores que corresponden con los de cada resultado. La utilidad esperada de una determinada opción terapéutica se puede calcular computando la media del peso de los resultados que hacen elegir dicha opción. La utilidad esperada es la suma de los valores de utilidad de cada nódulo terminal (estado del resultado) multiplicado por la probabilidad de que dicho resultado tenga lugar. Por tanto, elegir la mejor opción terapéutica significa elegir la opción con un mayor valor esperado. Para rellenar el árbol de decisión del ejemplo que estamos analizando, hay que utilizar la siguiente información hipotética referente a los resultados. Las roturas de la zona roja 157 Medicina basada en evidencias Meniscectomía Utilidad = P1 · UO1 + P2 · UO2 Rotura meniscal en zona roja Reparación meniscal Utilidad = P3 · UO3 + P4 · UO4 Tratamiento conservador Utilidad = P5 · UO5 + P6 · UO6 P1 P2 P3 P4 P5 P6 Resultados1 Resultados2 Resultados3 Resultados4 Resultados5 Resultados6 Figura 4. Árbol de decisión simple referente a las opciones y resultados de las roturas meniscales en zona roja. Los recuadros de la derecha representan los resultados del tratamiento. Las líneas que van hacia ellos se han sopesado según la probabilidad de que alcancen un determinado resultado. P1 es la probabilidad de que se obtenga el resultado1. Para simplificar, sólo se muestran dos resultados por tratamiento, aunque en realidad podrían ser más. El valor de un tratamiento es P1 · UO1, que es la suma de todos los resultados posibles de un tratamiento. Px = probabilidad de lograr un resultado. UOx = utilidad del Resultadox. <1 cm tienen una probabilidad de cicatrizar sin cirugía del 90%. En la población joven, la meniscectomía tiene una probabilidad de aliviar los síntomas del 99% a las 6 semanas, aunque también tiene un 40% de probabilidades de que aparezca artrosis a los 10 años. La reparación de una zona meniscal roja tiene un 75% de probabilidades de éxito. Puede parecer que con dichos datos podríamos hacer la selección del mejor tratamiento; sin embargo, realmente nos falta la información más importante. Es decir, la valoración del paciente de los posibles resultados. De hecho, los valores que los pacientes relacionan con los resultados suelen variar. En el caso de la rotura meniscal en zona roja, podría considerarse que la reparación meniscal es la elección más adecuada. Sin embargo, imaginemos la actitud de un estudiante de un equipo de baloncesto de instituto 158 que quiere jugar el campeonato nacional dentro de 2 meses. Es probable que la casi certeza de que a las 6 semanas de la meniscectomía podrá volver a jugar puede inducirle a olvidar el riesgo de artrosis y a dar demasiada importancia a los beneficios de la meniscectomía. Por el contrario, un paciente cuyo padre haya muerto durante una intervención quirúrgica puede valorar en exceso el tratamiento conservador, incluso poniendo en riesgo su propia rodilla. Teniendo en cuenta que muchas intervenciones de cirugía ortopédica se hacen para aliviar los síntomas, el factor más importante para recomendar una intervención suele ser la utilidad que se asigna al posible resultado de un determinado tratamiento. A veces es difícil encontrar dicha utilidad. Para ello hay que estar seguro de que todos los resultados se presentan sin sesgo y que los valores de utilidad se recogen de forma correcta. Hay que emplear una escala en la que todas las posibilidades puedan estar expresadas. Por ejemplo, «muerte perioperatoria» y «capacidad de caminar los 18 hoyos de un campo de golf» son algunos de los resultados que tienen interés cuando se va a realizar una prótesis total de cadera. Aunque parezca que dichos resultados no son comparables, los pacientes arriesgarán la vida para poder jugar al golf. El paciente también puede tener aversión al riesgo y no tener en cuenta la utilidad futura en su valor neto actual. Así pues, el tratamiento «apropiado» de una rotura meniscal periférica dependerá de las preferencias del paciente, incluso aunque existan evidencias de un buen resultado. Por eso, pueden realizarse más intervenciones de columna lumbar en Santa Bárbara que en el Bronx, simplemente porque los ciudadanos de cada barrio tienen diferentes valores de utilidades y diferentes preferencias personales. No hay que olvidar que también puede haber otras explicaciones. Por otro lado, la lista de las evidencias de los resultados de las roturas meniscales tiene zonas vacías. No existe información sobre el tamaño de las roturas de los pacientes, ni sobre la precisión de un cálculo aproximado basado en los estudios de imagen. Se sabe cuál es la tasa de cicatrización de las roturas <1 cm, ¿pero es dicha tasa 0 para las roturas más grandes o depende del tamaño de la rotura? ¿Qué pasa si el tejido no cicatriza?. Por último, ¿cuáles son las complicaciones de la cirugía, y qué probabilidades hay de que ocurran? Para tomar una decisión acertada en este caso hacen falta más datos, de forma que el árbol de decisiones resultará más complejo que el que se muestra en la figura 4. Por ejemplo, hay que ampliar el resultado para cuando fracase el tratamiento conservador, puesto que la meniscectomía o la reparación meniscal pueden intentarse si el tratamiento conservador no funciona. También hay que considerar la opción quirúrgica de la artroscopia diagnóstica, puesto que puede ocurrir que se Journal of the American Academy of Orthopaedic Surgeons (Edición Española) 34 Joseph Bernstein, MD, MS encuentre una pequeña rotura y se opte por no realizar la reparación meniscal, o que se encuentre una rotura irreparable y se decida realizar finalmente una meniscectomía. Por último, las variables dicotómicas, como los términos «cicatrizado» o «fallo de la reparación» son en realidad grados de una misma línea continua. El ejemplo mencionado demuestra que incluso un caso aparentemente sencillo y con muchos datos referentes a los resultados puede ser complejo. En palabras de Eddy, se podría decir que «excede en mucho a la capacidad mental humana».15 Hasta que aparezcan métodos que permitan discernir el deseo de los pacientes y se inventen recomendaciones para aplicar sus preferencias, las evidencias médicas recogidas no serán de gran utilidad. Quinto paso: valoración del proceso La valoración del rendimiento es esencial para la práctica de la MBE, aunque puede tener sus problemas. La mayor dificultad reside en que tradicionalmente la valoración se ha basado en observaciones personales, y por tanto dicha evidencia está sujeta a sesgo. Además, uno puede liarse con la estadística cuando trabaja con números pequeños. A causa de las limitaciones de la observación personal, es mejor realizar la valoración como parte de un esfuerzo conjunto. Por ejemplo, la utilización de un registro de intervenciones de artroplastias articulares puede ser de gran ayuda. Incluso la recogida de datos de organizaciones médicas pueden proporcionar una retroalimentación positiva útil. Imaginemos un médico de atención primaria que no manda ni un solo estudio de densitometría ósea al año. La revisión de la utilización de datos de dicho médico podría sugerir que no está prestando suficiente atención a la prevención de la osteoporosis. Por eso, en el proceso de valoración es importante estimular la cooperación entre médicos, con el fin de alcanzar el éxito. 35 Resistencia a la medicina basada en evidencias La resistencia a la práctica de la MBE suele verse entre médicos que conocen su teoría pero no la practican. Dichos médicos pueden estar molestos por creer que la práctica de la MBE exige un alto nivel de conocimientos matemáticos. Sin embargo, en realidad, la MBE no precisa de un especial manejo de los números. El médico que practique la MBE no necesita ser estadístico; sólo debe saber cómo utilizar lo que los estadísticos producen. La analogía de Greenhalgh dice que no se pide a los médicos que fabriquen coches, sino sólo que sepan conducirlos.16 Mayor resistencia pueden presentar los médicos que piensan que la MBE es un pretexto que limita su autonomía profesional, es decir, los que piensan que bajo las normas de la MBE los médicos quedan reducidos a ser meros autómatas. Imitando los hechos de Nottinghamshire en el siglo XIX, en los que los Luditas rompieron los telares de algodón para proteger sus empleos, tales médicos pueden menoscabar la MBE aduciendo que detiene el progreso. También es importante tener en cuenta las resistencias de los médicos bien intencionados que consideran que la MBE no es práctica. Dichas resistencias son legítimas, puesto que los médicos tienen cada vez menos tiempo libre, por lo que la lectura y valoración de la bibliografía les hace consumir mucho tiempo. Por ejemplo, en el año 2000, MEDLINE citó 479 artículos sólo de la revista Spine. La mirada superficial de dicha revista puede consumir más tiempo del que disponen los médicos para la lectura. Los creadores de la MBE conocen tal dificultad y por ello animan a grupos de médicos a realizar revisiones sistemáticas, de forma de que de dichas revisiones se extraiga directrices prácticas. Una revisión sistemática no es aquélla en la un experto presenta su punto de vista y lo apoya en la bibliografía. Por el contrario, se trata de una recogida de bibliografía según un esquema organizado para después valorarla en comparación con un determinado estándar. Es de- Vol 3, N.o 3, Mayo/Junio 2004 cir, una revisión sistemática no necesariamente debe ser escrita por un experto, y de hecho no debería ser así. De las revisiones sistemáticas lógicamente se extraen directrices. Una directriz basada en una revisión sistemática satisface los tres primeros pasos de la MBE: la formulación de una pregunta que pueda responderse, la recogida de evidencias y su valoración. Ofrecen a los médicos una revisión completa, sin obligarles a consultar personalmente la bibliografía primaria. La clave es que la directriz debe ser suficientemente sólida como para tener en cuenta las variaciones de diferentes médicos y las preferencias de los pacientes. Como contrapartida, los médicos no podrán aplicar sus directrices de forma rígida. Como mencionó en el siglo XIV el cirujano francés Henri de Mondeville: «cualquiera que crea que la misma cosa puede ser buena para todo es un gran idiota, puesto que la medicina no la practica la humanidad en general sino un médico en particular».17 Resumen La MBE puede simplemente parecer una frase nueva; sin embargo, se sustenta en un viejo concepto: es un asunto de resultados empíricos. La idea la inició hace 100 años el cirujano ortopédico Codman, destacando la medición de los resultados finales. De hecho, los métodos de la MBE se utilizaron ya en el siglo XIX en París, cuando las sangrías fueron desacreditadas por Pierre Louis. Louis llevó a cabo lo que el New York Times describió como uno de los primeros ensayos clínicos: «Trató a gente con neumonía mediante sangría precoz y agresiva o mediante medidas menos agresivas; al final del experimento, el Dr. Louis contó los cadáveres y encontró que había más en la fosa donde se enterró a los de las sangrías que en la otra».18 Dicho resultado (y no ninguna reserva teórica) fue lo que hizo que se abandonaran las sangrías de la práctica médica. A pesar de su venerable árbol genealógico, la MBE está obligada a res- 159 Medicina basada en evidencias ponder a las demandas contemporáneas. La proliferación de información, en primer lugar por la expansión de Internet,19 pero también por la expansión de las revistas tradicionales, hace que el médico tenga que hilvanar la recogida y valoración de la información. El problema no es la falta de datos sino su exceso. Necesitamos dar sentido a un mar de información, y la MBE tal vez pueda hacerlo. Por último, hay que tener en cuenta los límites científicos. El dramaturgo Berthold Brecht (que casualmente fue estudiante de medicina) escribió: «El objetivo principal de la ciencia no es abrir una puerta de infinito deseo; es poner un límite a un error infinito» (La vida de Galileo). Así pues, cuando decimos que la MBE se basa en la ciencia lo que queremos decir no es que la MBE sea una estrategia para tener razón todo el tiempo (la ciencia no puede darla), sino que es una herramienta para disminuir las probabilidades de equivocación. Probablemente el objetivo de reducir al mínimo el error está a nuestro alcan- Agradecimientos: A Kevin Freedman, MD, Kirsten Hickerson, MSN y Kames Bernstein por sus comentarios. Mis pensamientos con respecto a la MBE estuvieron influidos directamente por cuatro libros10,15,16,20 e indirectamente, pero no menos, por el libro de Douglas Hofstadter titulado Gödel Escher Bach.4 Agradezco a la OREF y a Zimmer (Warsw, IN) su Premio para el Desarrollo de Carrera Quirúrgica. 8. Linde K, Melchart D: Randomized controlled trials of individualized homeopathy: A state-of-the-art review. J Altern Complement Med 1998;4:371-388. 9. Park RL: (ed): Voodoo Science: The Road From Foolishness to Fraud. New York, NY: Oxford University Press, 2000. 10. Skrabanek P, McCormick J: (eds): Follies and Fallacies in Medicine. Buffalo, NY: Prometheus Books, 1990. 11. Hellman H: (ed): Great Feuds in Medicine: Ten of the Liveliest Disputes Ever. NewYork, NY: John Wiley and Sons, 2001. 12. Scott WN: Preface, in Insall JN, Scott WN(eds): Surgery of the Knee, ed 3. New York, NY: Churchill Livingstone, 2001, p xiii. 13. Redelmeier DA, Tversky A: On the belief that arthritis pain is related to the weather. Proc Natl Acad Sci USA 1996; 93:2895-2896. 14. Bernstein J: Decision analysis. J Bone Joint Surg Am 1997;79:1404-1414. 15. Eddy DM: (ed): Clinical Decision Mak-ing: From Theory to Practice. Sudbury, MA: Jones and Bartlett, 1996. 16. Greenhalgh T: (ed): How to Read a Paper: The Basics of Evidence Based Med-icine, ed 2. London, England: BMJ Books, 2001. 17. Skrabanek P: Fat heads. National Review 1995;47:43. 18. Patterson K: What Doctors Don’t Know (Almost Everything). New York Times. May 5, 2002:6,74. 19. Beredjiklian PK, Bozentka DJ, Steinberg DR, Bernstein J: Evaluating the source and content of orthopaedic information on the Internet: The case of carpal tunnel syndrome. J Bone Joint Surg Am 2000;82:15401543. 20. Guyatt G, Rennie D: (eds): Users’ Guides to the Medical Literature: A Manual for Evidence-Based Clinical Practice. Chicago, IL: American Medical Association Press, 2002. ce. En realidad, su búsqueda es responsabilidad nuestra. Bibliografía 2. Lalwani SI, Olive DL: Problems withevidence-based medicine. J Am Assoc Gynecol Laparosc 1999;6:237-240. 2. Dartmouth Medical School: The Dartmouth Atlas of Musculoskeletal Health Care. Chicago, IL: AHA Press, 2000. 3. Sackett DL, Rosenberg WM, Gray JA, Haynes RB, Richardson WS: Editorial: Evidence based medicine: What it is and what it isn’t. BMJ 1996;312:71-72. 4. Hofstadter DR: (ed): Gödel, Escher, Bach: An Eternal Golden Braid. New York, NY: Basic Books, 1999. 5. Sackett DL, Haynes B: On the need for evidence based medicine. Evidence-Based Med 1995;1:4-5. 6. Pauker SG, Kassirer JP: The threshold approach to clinical decision making. N Engl J Med 1980;302:1109-1117. 7. Freedman KB, Back S, Bernstein J: Sample size and statistical power of randomised controlled trials in orthopaedics. J Bone Joint Surg Br 2001;83:397-402. 160 Journal of the American Academy of Orthopaedic Surgeons (Edición Española) 36