UTILIDAD DE LAS PRUEBAS DIAGNOSTICAS EN LA PRÁCTICA CLÍNICA: MEDICINA DE LABORATORIO BASADA EN LA EVIDENCIA CURSO DE FORMACIÓN CONTINUADA A DISTANCIA 2011-2012 ACTUALIZACIONES EN EL LABORATORIO CLÍNICO Nº 3 I.S.S.N.- 1988-7477 Título: Actualizaciones en el Laboratorio Clínico Editor: Asociación Española de Biopatología Médica Maquetación: AEBM Fecha de Distribución: enero de 2012 Utilidad de las pruebas diagnosticas en la práctica clínica: Medicina de laboratorio basada en la Evidencia Cuadrado Cenzual M.A., Ortega Madueño I., Arroyo M.Hospital Clínico San Carlos. Servicio Análisis Clínicos. Madrid 1. INTRODUCCION Dentro del ámbito del laboratorio médico cada día nos encontramos con múltiples publicaciones en las que se evalúan la aplicación de nuevos marcadores o pruebas de laboratorio para el diagnóstico precoz o más específico de una enfermedad, para la prevención o para el seguimiento terapéutico. Este desarrollo tan dinámico de pruebas y de tecnología hace que nos encontremos siempre en una espiral continua de innovación y desarrollo (1,2). Esto es debido en gran parte a que los test diagnósticos aportan un gran valor en la práctica asistencial diaria. La presión de los clínicos de poder disponer de los tests más actuales y el deseo de los profesionales del laboratorio de poder servir de apoyo en todas las actividades clínicas con carteras de prestaciones amplias, son los factores más significativos para su implantación (3,4). Todo los factores anteriormente expuestos son los que van a favorecer la aparición en la literatura de múltiples estudios sobre la validez de nuevas pruebas diagnósticas con diseños deficientes que provocan serios sesgos en su 687 interpretación y que hace que dichos tests sean utilizados de forma rutinaria sin ser totalmente evaluados y que conduzcan a los clínicos incluso a tomar decisiones incorrectas en sus pautas de actuación diagnósticas y sobre todo terapéuticas (3, 5, 6). De esta forma, a lo largo de los años y después de publicaciones muy controvertidas, se ha puesto en evidencia que el valor de los test en la práctica clínica diaria es mucho más limitado de lo que previamente se suponía e incluso en algunos casos hasta su mala utilización puede provocar confusión en la decisión clínica (3, 7, 8). En este sentido, hay que destacar que las lecturas críticas de artículos, las revisiones sistemáticas y los meta análisis son los que han demostrado de forma eficaz que muchos estudios, probablemente la mayoría, son de muy escasa calidad debido sobre todo a presentar fallos de base en sus diseños. En general se ha demostrado como la exactitud y la precisión diagnósticas es demasiado optimista debido a que la deficiencia en los diseños dan lugar a sesgos en los resultados. (1,9). Este reconocimiento de los problemas existentes en relación con la calidad de los estudios publicados sobre ensayos clínicos controlados, y randomizados dió lugar a la publicación del INFORME CONSORT (Consolidated Standards of Reporting Trials) (7,10). Dicho informe se basó en la experiencia del Grupo de Trabajo de la Fundación Cochrane sobre los Métodos de Diagnóstico y de Screening. Fundamentalmente hacía especial énfasis en la necesidad de mejorar la calidad de 688 los estudios sobre la eficacia de las pruebas diagnósticas mediante el desarrollo de un checklist de ítems fácilmente identificables en los estudios sobre precisión y exactitud diagnóstica. La medicina de laboratorio también nos proporciona uno de los ejemplos más claros de ausencia de haber practicado una buena base de medicina basada en la evidencia, quizás los mejores ejemplos estén en la gran variabilidad que existe entre los diferentes hospitales en relación con las estrategias de utilización de los tests de laboratorio para los mismos cuadros clínicos (3, 11). Por lo tanto, no es sorprendente que existan críticas severas en el ámbito de la medicina de laboratorio manifestado a través de la literatura en la que se describe el uso inapropiado o inadecuado de la utilización de los tests diagnósticos (12, 13). Un proceso riguroso de evaluación del test diagnóstico antes de introducirlo en la práctica clínica diaria podría no solamente reducir el número de consecuencias clínicas indeseadas relacionadas con la errónea estimación de la eficacia del test, sino que también reduciría los costes sanitarios al prevenir la disminución de la utilización de tests innecesarios. 2.0 MEDICINA BASADA EN LA EVIDENCIA La Medicina basada en el Evidencia (MBE) se define como "el uso consciente, explícito y juicioso de la mejor evidencia actual en la toma de decisiones relacionada con el cuidado de un paciente" y surge en 1992 en la Universidad de 689 Mc- Master en Canadá con el grupo del Dr. Gord Guyatt, aunque se tienen antecedentes de esta práctica clínica desde el siglo XIX (14). Pero, ¿qué es la evidencia en nuestro ámbito de trabajo?. La evidencia se podría definir como una investigación clínicamente relevante especialmente centrada en el paciente, enfocada a la precisión y exactitud clínica de las pruebas diagnósticas, el poder de los marcadores pronósticos y la seguridad de las pautas terapéuticas (15, 16). Si bien durante mucho tiempo la MBE se ha erigido en un paradigma de la práctica médica (17). Actualmente, sin embargo nos encontramos con diferentes puntos de vista sobre la aplicabilidad de la MBE. Algunos expertos afirman que la medicina basada en la evidencia adolece de un estricto rigor científico-estadístico, mostrando demasiado énfasis en el enfoque estadístico y basando las decisiones más en un aspecto de gestión que en la experiencia y el juicio clínico (18). El sector crítico de este enfoque basado en la evidencia destaca que para realizar este tipo análisis de los datos de una manera reproducible y fiable, es necesario realizar grandes ensayos controlados randomizados con un diseño muy estricto y con criterios muy rígidos, anulando en su enfoque la opinión y la experiencia de los expertos clínicos (19). Los defensores de la medicina basada en la evidencia, sin embargo, destacan el hecho de que si bien la experiencia clínica es una parte esencial en la práctica asistencial de un médico competente esta experiencia debe basarse en una 690 observación fiable; y en este contexto se debe apoyar en el análisis de los datos de una manera reproducible, fiable y sin sesgos (20, 21). 3.0 MEDICINA DE LABORATORIO BASADA EN LA EVIDENCIA La aplicación de la MBE al laboratorio clínico es más reciente, hablándose del término Medicina del Laboratorio basado en la Evidencia (MLBE) en los albores del año 2000 (16, 22, 23). La MLBE integra la toma de decisiones clínicas de la mejor evidencia investigada para el uso de pruebas de laboratorio con la experiencia clínica del médico y las necesidades, expectativas e inquietudes del paciente, dicho de otra forma, la MLBE es la “información recopilada de forma sistemática y evaluada de manera crítica cuya fuente son estudios de investigación bien diseñados, para responder preguntas específicas de diagnóstico, diagnóstico diferencial, seguimiento, monitorización y pronóstico, el cual proporciona un marco explícito para la toma de decisiones médicas”. La medicina de laboratorio basa sus principios en la aplicación de una ciencia básica analítica a la utilización clínica, como los biomarcadores para las distintas enfermedades y estrategias de atención sanitaria. En parte, esta aplicación incluye optimizar la cuantificación de los biomarcadores con respecto a exactitud, precisión y otras características técnicas (16, 24, 25). 691 Curiosamente, hasta la fecha, la medicina basada en la evidencia parece haber tenido un limitado impacto en el ámbito del laboratorio clínico. Es más, hay algunos datos que sugieren que en la revisión de la literatura científica hay muy poca constancia de la utilización de los tests diagnósticos aplicando criterios fiables de evidencia científica (20, 22). Existen muchas publicaciones que proporcionan guías sobre la efectividad de las diferentes intervenciones o actuaciones clínicas (14, 24), sin embargo existen muy pocas que hayan estudiado específicamente la efectividad de los tests diagnósticos. Los estudios de revisiones sistemáticas sobre test diagnósticos nos pueden proporcionar información sobre una visión crítica general de la evidencia (26, 27, 28). Esto puede ser debido en parte, a que los profesionales del laboratorio clínico nos hemos preocupado sobre todo en que los métodos y técnicas utilizados en nuestros laboratorios sean analíticamente aceptables, cuidamos todos los aspectos de control de calidad en todas sus etapas: preanalítica, analitica y postanaliticas además de la evaluación externa, pero ¿son las pruebas que utilizamos clínicamente relevantes, ¿son de utilidad para el médico?, ¿es conveniente introducir o sustituir una prueba?, ¿es conveniente una prueba a pesar de su coste de laboratorio? (29, 20, 25). En definitiva, estas preguntas son las que se intentan responder precisamente a través de la Medicina del Laboratorio basada en la Evidencia MLBE, en la búsqueda de mejorar la calidad en el impacto clínico de la información de la pruebas 692 diagnósticas (exactitud diagnóstica), mejorar el resultado de los pacientes (efectividad diagnóstica) reducir los costes (eficiencia), utilizar los límites de decisión clínica en vez de los valores de referencia, tener la evidencia que soporte la validez, importancia y uso clínico de la pruebas de laboratorio (3, 5, 23) (Tabla 1). MEDICINA DE LABORATORIO BASADA EN LA EVIDENCIA FASE PREANALITICA FASE POSTANALITICA Eliminar magnitudes o pruebas de escasa Exactitud diagnóstica. Mejorar la calidad y la utilidad antes de que se difunda su uso (stop relevancia clínica de la información de la starting) prueba. Eliminar del catálogo de prestaciones pruebas Efectividad clínica. Mejores resultados para los obsoletas que no han demostrado su eficacia pacientes. en la práctica clínica (start stopping) Utilizar los límites de decisión clínica Introducir nuevas pruebas si la evidencia Coste efectividad. Incremento de eficiencia de demuestra su efectividad (start starting o stop las pruebas diagnósticas stopping). Tabla 1. Objetivos de la medicina de laboratorio basada en la evidencia Un test diagnostico debe solicitarse únicamente cuando se plantea una cuestión y cuando haya evidencia de que su resultado nos proporcionará información para responder dicha cuestión. Hay varias razones por las que un médico puede solicitar 693 un test diagnóstico (14), sin embargo la naturaleza de la pregunta que tiene que ser respondida y la decisión a tomar, a menudo dependerán del estado clínico en el que paciente se encuentre, (“decisión-making”). De este modo, el resultado de un test diagnóstico debe ser considerado como parte de la toma de decisiones dentro del proceso asistencial del paciente. Este tipo de enfoque fue descrito por Fryback and Thornbury (21) quienes establecieron la relación entre la toma de decisiones clínicas y la eficacia de los tests diagnósticos. Es decir, en términos de beneficios clínicos podemos asegurar que un test puede mejorar el proceso diagnóstico y/o la estrategia terapéutica y de forma general el proceso asistencial de los pacientes, así como los resultados sanitarios (Figura 1). Figura 1. (C. P. Price Evidence-based Laboratory Medicine: Supporting Decision-Making Clinical Chemistry 2000;46:8 1041–50) 694 3.1 PASOS A SEGUIR EN LA PRACTICA DE LA MLBE La práctica de la MLBE al igual que la MBE tiene cuatro etapas a seguir: Identificación de la pregunta Hallazgos de evidencia científica en la revisión de la literatura Valoración crítica de la mejor evidencia disponible, incorporando los principios de la valoración tecnológica de la salud (revisión bibliográfica de artículos publicados en relación con la pregunta utilizando un análisis crítico) Implementación de la mejor práctica , incorporando los principios de la auditoría clínica (monitorización de la nueva prueba valorando si ha sido implementada satisfactoriamente y si los resultados resisten a los hallazgos de la investigación original publicada en la literatura, siendo una parte importante de la gestión de la calidad) Es por ello que la puesta en práctica de la MLBE nos lleva a ser otro tipo de profesionales, más reflexivos y no rutinarios, nos permite desarrollar habilidades en el uso de las nuevas tecnologías como el internet y el análisis crítico de la literatura dirigido al diagnóstico clínico avanzado, por la investigación y diseminación del nuevo conocimiento, combinando métodos de epidemiología clínica, estadística y ciencias sociales con la tradicional fisiopatología; por la evaluación del papel de las investigaciones diagnósticas en el proceso de toma de decisiones clínicas con énfasis en el resultado. Este nuevo profesional de laboratorio puede ayudar en la mejora de la calidad de los hallazgos científicos y 695 en el traslado de los resultados de investigaciones de buena calidad en la práctica diaria, convirtiéndose así en un nuevo reto (14, 22). Figura 2. (Price CP “Evidencia-based Laboratory Medicine: Supporting Decision-Making” Clinical Chemistry 2000; 46:8 1041-50) 3.1.1 PRIMER PASO: FORMULAR LA CUESTION CLINICA DEFINIR LA PREGUNTA El punto de comienzo es identificar o definir la cuestión clínica que queremos preguntarnos. La capacidad de tomar una decisión clínica con la ayuda de los resultados de la prueba de laboratorio, sería por lo tanto el objetivo. Hay muchos ejemplos para poder ilustrar este punto, pero no siempre se reconoce que un test pueda ser utilizado para excluir “rule out” o incluir “rule in” una 696 decisión. Mucha de la literatura sobre la medicina de laboratorio se ha enfocado preferentemente a que un test de laboratorio sea del tipo de “rule in”, pero a veces excluir “rule out” puede ser uno de los pasos más importantes dentro de la cascada de decisiones a tomar a lo largo del proceso asistencial del paciente (5). Sin embargo casi no existen evaluaciones sobre la efectividad de una estrategia de exclusión (por ejemplo la estrategia de la utilización en la tira reactiva de análisis de orina de resultados negativos de leucocitos y nitritos como excluyentes de una infección urinaria). ¿Cómo formular una cuestión clinica para que se pueda responder? La MLBE se centra en un tipo de cuestiones que son muy especificas y basadas en el paciente (por ejemplo: qué beneficio se espera en un paciente de 60 años diabético y normotenso con microalbuminuria al tratarlo con los inhibidores de la enzima convertidora de angiotensina (IECA)) Los cuatro componentes para que una pregunta pueda ser respondida se centran en el acrónimo PICO (paciente, intervención, comparación y resultado) P: representa al paciente, o a la población I: representa la investigación C: representa la comparación de la investigación con el gold standard O “Outcome”: representa los resultados de interés Aplicado al ejemplo presentado, sería: P hombre de 60 años con síntomas de prostatismo I medida de PSA 697 C examen rectal O correcto diagnostico de cáncer de próstata 3.1.2 SEGUNDO PASO: HALLAR LA EVIDENCIA: INVESTIGAR EN LA LITERATURA EN ARTICULOS RELEVANTES Una vez que hemos formulado la cuestión clínica de manera que se pueda responder, comienza la investigación sobre la búsqueda de la evidencia. Las bases de datos más utilizadas para ello son la de PUBMED, Ovid y Up-to Date. Cuando se realizan las búsquedas en estas bases de datos se recomienda utilizar MeSH (Medical Subjects Headings). Se trata de un sistema de vocabulario que se utiliza para indexar los artículos para MEDLINE/PubMed. La terminología MeSH nos aporta una vía consistente de encontrar información (29) Otra estrategia de búsqueda con PubMed es el “Clinical Query” que nos va a permitir búsquedas por casos clínicos, etiología, diagnóstico, terapia y pronóstico Otra opción útil es la utilización de “Limites” (por ejemplo, por años, por lenguaje, por tipo de artículo). Una vez encontrada la mejor evidencia en la literatura pasamos a: 3.1.3 TERCER Y CUARTO PASOS: EVALUAR DE FORMA CRITICA LA EVIDENCIA PARA SU VALIDEZ Y UTILIDAD Y APLICAR LOS DATOS EVALUADOS EN LA PRACTICA CLINICA Una vez que se ha investigado en la literatura por la evidencia, los resultados de los estudios se evalúan de forma crítica para establecer su validez. 698 La evaluación de la validez incluye los siguientes cuestiones: ¿Existe una comparación con un estandar de referencia diagnóstico en una comparación ciega? ¿El test diagnóstico se evalúa en una población adecuada de pacientes y equiparable a los pacientes de interés? (el grupo de pacientes evaluados deberán ser similares en edad, sexo raza, ambulantes o ingresados etc.) Muchos estudios se realizan sobre población preferentemente sana y luego queremos aplicar los resultados a nuestra población preferentemente enferma. Todas estas variables introducen “bias” o sesgos que suelen sobreestimar la utilidad del test y suele ser la causa de las enormes diferencias o de la amplia variabilidad que se observan en los resultados sobre la sensibilidad y la especificidad de una prueba diagnóstica determinada. Es fundamental trabajar sobre artículos que describan el uso del test en una estructura clínica comparable a los pacientes de interés. ¿Se ha realizado el estándar de referencia en todos los pacientes? A veces cuando son pruebas diagnósticas caras o cruentas, no se realizan en todos lo pacientes. Este hecho introduce un sesgo de verificación en la evaluación de la clasificación de los falsos negativos como verdaderos negativos ¿El test fue validado en un segundo grupo independiente de pacientes? ¿Los parámetros de Sensibilidad, Especificidad etc., se han confirmado aplicándolos a un segundo grupo independiente de pacientes? Este punto es 699 de especial relevancia para nuevos parámetros donde las evaluaciones iniciales no se realizan en la práctica clínica diaria Si un estudio fracasa en uno o más de estos criterios, puede tener grandes carencias y sesgos de base que limitan su validez para utilizarlos en la MLBE. Hay que ser conscientes que es muy difícil encontrar en la literatura estudios que cumplan todos los requisitos, especialmente la cuestión de utilizar poblaciones de pacientes totalmente comparables. En este punto es de especial ayuda para la evaluación de estudios diagnósticos la guía/iniciativa STARD (Standards for Reporting Diagnostic Accuracy) Bossuyt que nos facilitan un check list de 25 items (30, 31, 32) que ha sido diseñanda para mejorar los estudios de validez diagnóstica. Desde que el sistema STARD fue publicado en el 2003, hay cierta evidencia de que la calidad de los estudios sobre pruebas diagnósticas publicados ha mejorado ostensiblemente. No obstante, no hay que olvidar que se trata de un trabajo que está siempre en evolución, cuyo objetivo es comprender los factores que contribuyen a la variabilidad y los diferentes sesgos con el fin de mejorar de forma continua. Esto significa que el checklist será periódicamente actualizado. Estas actualizaciones pueden buscarse en la página web de STARD (www.consort- statement.org\stardstatement.htm, http://www.stard-statement.org/). 700 Tabla 2. Criterios que emplea la Iniciativa STARD (Patrick M. Bossuyt, 1*Towards Complete and Accurate Repoof Studies of Diagnostic Accuracy: The STARD Initiative. Clin Chem 2003;49:1-6) 701 3.2 SENSIBILIDAD, ESPECIFICIDAD, COCIENTES DE PROBABILIDAD VALORES PREDICTIVOS Y No es el objetivo de este artículo detallar toda la metodología de la Investigación Clínica en la Medicina del laboratorio basada en la Evidencia, pero nos parece de particular interés dejar claros una serie de conceptos básicos en el análisis de validez de las pruebas diagnósticas La validez de una prueba diagnóstica se define como su capacidad para señalar correctamente la presencia o ausencia de la enfermedad Se expresa matemáticamente en índices: sensibilidad, especificidad, valor predictivo positivo y valor predictivo negativo . La sensibilidad y especificidad clínicas, no deben confundirse con los conceptos de sensibilidad y especificidad analíticos Parte del análisis de pacientes sospechosos de padecer la enfermedad, en los que se realiza la prueba problema Sus resultados se comparan con la distribución real de la enfermedad: resultados obtenidos en el mismo grupo de pacientes mediante una prueba de referencia 3.2.1 SENSIBILIDAD Y ESPECIFICIDAD Este enfoque clinico se conoce como analisis Bayesano e implica el cálculo de parámetros en una matriz de 2x2 que lo que describe es la habilidad o capacidad del test para identificar la condición de enfermedad (Tabla 3). 702 La sensibilidad (S) es la capacidad de una prueba para identificar a aquellos que tienen la enfermedad. La especificidad (E) es la capacidad de una prueba para identificar correctamente a aquellos que no tienen la enfermedad. ENFERMEDAD positiva PRUEBA negativa SENSIBILIDAD: VP/(VP+FN) presente ausente Verdadero Falso Positivo Positivo (VP) (FP) a b Falso Verdadero Negativo Negativo (FN) (VN) c d a+c b+d a+b c+d ESPECIFIDAD: VN /(VN+FP) Tabla 3. Tabla 2 x 2 para estudiar la validez de pruebas diagnósticas Una frase útil para recordar la diferencia entre ellos es “LA SENSIBILIDAD ES LA POSITIVIDAD EN LA ENFERMEDAD Y LA ESPECIFICIDAD ES LA NEGATIVIDAD EN LA SALUD” (figura 3) 703 Figura 3. (Wong ET. Improving laboratory testing: can we get physicians to focus on outcome? Clin Chem 1995;41:1241–7) 3.2.2 VALOR PREDICTIVO DE UNA PRUEBA Calcula la probabilidad de una persona de presentar o no la enfermedad dado el resultado de la prueba diagnóstica El Valor Predictivo Positivo (VPP) representa la probabilidad de que el paciente tenga la enfermedad al obtenerse un resultado positivo (VPP=VP/(VP+FP) El Valor Predictivo Negativo (VPN) representa la probabilidad de que el paciente no tenga la enfermedad al obtenerse un resultado negativo (VPN= VN / (VN+FN) 704 MIENTRAS QUE LA SENSIBILIDAD “EXCLUYE” (el 100% de sensibilidad corresponde a un 100% de valores predictivos negativos) LA ESPECIFICIDAD “INCLUYE” (el 100% de especificidad corresponde al 100% de valores predictivos positivos) (Figura 4). Figura 4. (Escrig-Sos J, Martínez-Ramos D y Miralles-Tena JM. Pruebas diagnósticas: nociones básicas para su correcta interpretación y uso. Cir Esp. 2006;79(5):267-73) En la mayoría de las situaciones la sensibilidad y/o la especificidad no son del 100% por lo que en estos casos los valores predictivos positivos y negativos van a depender de la prevalencia de la enfermedad. Como se muestra en la Tabla 4, cuanto mayor sea la prevalencia, mayor es el Verdadero Positivo y cuanto menor sea la prevalencia mayor es el Verdadero Negativo. 705 Tabla 4. Ejemplo de los cambios en los valores predictivos según la prevalencia, para una sensibilidad del 90% y una especificidad del 95% En definitiva, el objetivo prioritario del proceso diagnóstico no es solamente tener el 100% de certeza sino que es sobre todo reducir el nivel de incertidumbre a un nivel que permita optimizar las decisiones clínicas y terapéuticas. La situación ideal sería “UNICAMENTE SOLICITAR UN TEST DE LABORATORIO SI EL RESULTADO VA A INFLUENCIAR UN CAMBIO EN EL MANEJO DEL PACIENTE” 3.2.3 LOS COCIENTES DE PROBABILIDAD (Likelihood ratios) Compara la probabilidad de que un determinado resultado de una prueba se produzca en un paciente con la enfermedad de estudio con la probabilidad de que el mismo resultado se obtenga en un paciente libre de esa enfermedad. También se utiliza el concepto de Odds, ya que de lo que se trata es de una razón de probabilidades. Pueden ser muy útiles en evaluar la potencial utilidad de un test. De esta forma, cocientes de probabilidad positivos >10 o cocientes negativos <0,1 pueden 706 generar grandes cambios en la probabilidad post-test de la enfermedad, mientras que cocientes de 0,5-2 van a tener muy poco efecto. No se ven influenciados por la prevalencia de la enfermedad. Finalmente, hemos de tener en cuenta que el objetivo prioritario del proceso diagnóstico es el de reducir el nivel de incertidumbre a la hora de tomar las decisiones diagnósticas y terapéuticas óptimas. En este sentido y aplicado a nuestro ámbito de trabajo, únicamente debería solicitarse un test determinado de laboratorio cuando el resultado obtenido influya en el manejo del paciente CURVAS ROC La curva ROC es un gráfico en el que se observan todos los pares sensibilidad/especificidad resultantes de la variación continua de los puntos de corte en todo el rango de resultados observados (27). En el eje yy’ o de ordenadas se sitúa la sensibilidad o fracción de verdaderos positivos o grupo afectado. En el eje xx’ se sitúa la fracción de falsos positivos o 1-especificidad, definida como FP/VN + FP y calculada en el subgrupo no afectado. Cada punto de la curva representa un par S/1-E correspondiente a un nivel de decisión determinado. Una prueba con discriminación perfecta, sin solapamiento de resultados en las dos poblaciones, tiene una curva ROC que pasa por la esquina superior izquierda, donde S y E toman valores máximos (S y E = 1). Una prueba sin discriminación, con igual distribución de resultados en los dos subgrupos, da lugar a una línea diagonal de 45º, desde la esquina inferior 707 izquierda hasta la superior derecha. La mayoría de las curvas ROC caen entre estos dos extremos. Cualitativamente, cuanto más próxima es una curva ROC a la esquina superior izquierda, más alta es la exactitud global de la prueba. De la misma forma, si se dibujan en un mismo gráfico las curvas obtenidas con distintas pruebas diagnósticas, aquella que esté situada más hacia arriba y hacia la izquierda tiene mayor exactitud: por simple observación se obtiene una comparación cualitativa. Las curvas ROC son índices de la exactitud diagnostica y proporcionan un criterio unificador en el proceso de evaluación de una prueba (15), debido a sus diversas aplicaciones (Figura 5). Figura 5. Ejemplo de curva ROC 708 El uso de las curvas ROC en la evaluación de pruebas diagnósticas presenta las siguientes ventajas: Son una representación fácilmente comprensible de la capacidad de discriminación de la prueba en todo el rango de puntos de corte Son simples, gráficas y fáciles de interpretar visualmente No requieren un nivel de decisión particular porque está incluido todo el espectro de puntos de corte Son independientes de la prevalencia, ya que la sensibilidad y la especificidad se obtienen en distintos subgrupos. Por tanto, no es necesario tener cuidado para obtener muestras con prevalencia representativa de la población 709 BIBLIOGRAFIA 1. Antman EM, Lau J, Kupelnick B, Mosteller F, Chalmers TC. A comparison of results of meta-analyses of randomized control trials and recommendations of clinical experts. Treatments for myocardial infarction. JAMA 1992;268:240–8. 2. Wong ET. Improving laboratory testing: can we get physicians to focus on outcome? Clin Chem 1995;41:1241–7. 3. Lundberg GD. How clinicians should use the diagnostic laboratory in a changing medical world. Clin Chim Acta 1999;280:3–11. 4. Kricka LJ, Parsons D, Coolen RB. Healthcare in the United States and the practice of laboratory medicine. Clin Chim Acta 1997; 267:5–32. 5. Price CP, Barnes IC. Laboratory medicine in the United Kingdom: 1948-1998 and beyond. Clin Chim Acta 2000;290:5–36. 6. Van Walraven C, Naylor CD. Do we know what inappropriate laboratory utilization is? A systematic review of laboratory clinical audits. JAMA 1998;280:550–8. 7. Begg CB. Biases in the assessment of diagnostic tests. Stat Med 1987;6:411–23. 8. Reid CK, Lachs MS, Feinstein AR. Use of methodological standards in diagnostic test research. Getting better but still not good. JAMA 1995;274:645–51. 710 9. Lijmer JG, Mol BW, Heisterkamp S, Bonsel GJ, Prins MH, van der Meulen JHP, et al. Empirical evidence of design-related bias in studies of diagnostic tests. JAMA 1999;282:1061–6. 10. Begg C, Cho M, Eastwood S, Horton R, Moher D, Olkin I, et al. Improving the quality of reporting of randomized controlled trials. The CONSORT Statement. JAMA 1996;276:637–641 11. Woolf SH, Grol R, Hutchinson A, Eccles M, Grimshaw J. Potential benefits, limitations, and harms of clinical guidelines. Br Med J 1999;318:527–30. 12. Guyatt GH, Oxman AD, Ali M, Willan A, McIlroy W, Patterson C. Laboratory diagnosis of iron-deficiency anemia: an overview. J Gen Intern Med 1992;7:145–53. 13. Storrow AB, Gibler WB. The role of cardiac markers in the emergency department. Clin Chim Acta 1999;284:187–96. 14. Guyatt G. Evidence-based medicine. A new approach to teaching the practice of medicine. JAMA 1992;268:2420–5. 15. Moore RA. Evidence-based clinical biochemistry. Ann Clin Biochem 1997;34:3–7. 16. Price CP. Evidence-Based Laboratory Medicine: supporting decision-making. Clin Chem 2000; 46: 1041-50. 17. McQueen MJ. Overview of Evidence-Based Medicine: Challenges for Evidence-Based Laboratory Medicine. Clin Chem 2001; 47: 1536-46. 18. Charlton BG, Miles A. The rise and fall of EBM. Q J Med 1998;91:371–4. 711 19. Sackett DL, Rosenberg WMC, Gray JAM, Haynes RB, Richardson WS. Evidence-based medicine: what it is and what it isn’t. Br Med J 1996;312:71–2 20. Hawkins Robert C: The Evidence Based Medicine Approach to Diagnostic Testing: practicalities and limtations. Clin Biochem Rev 2005 May; 26(2): 7– 18. 21. Irwig L, Tosteson ANA, Gatsonis C, Lau J, Colditz G, Chalmers TC, et al. Guidelines for meta-analyses evaluating diagnostic tests. Ann Intern Med 1994;120:667–76. 22. Horvart AR. What evidence is there for biochemical testing? eJIFCC. 2003. Disponible en: http://www.ifcc.org/ejifcc/ vol14no3/140310200306n.htm 23. Bissell MG, ed. Laboratory-related measures of patient outcomes: an introduction. Washington: AACC Press, 2000:1–193. 24. Barth JH, Seth J, Howlett TA, Freedman DB. A survey of endocrine function testing by clinical biochemistry laboratories in the UK. Ann Clin Biochem 1995;32:442–9. 25. Christenson RH. Committee on Evidence Based Laboratory Medicine of the International Federation for Clinical Chemistry Laboratory Medicine. Evidence-Based Laboratory Medicine - a guide for critical evaluation of in vitro laboratory testing. Ann Clin Biochem 2007; 44(Pt 2): 111-30. 26. Jaeschke R, Guyatt G, Sackett DL. Users’ guides to the medical literature. III. How to use an article about a diagnostic tests. A. Are the results of the 712 study valid? Evidence-Based Medicine Working Group. JAMA 1994;271:389– 91. 27. Moses LE, Shapiro D. Combining independent studies of a diagnostic test into a summary ROC curve: data-analytic approaches and some additional considerations. Stat Med 1993; 12:1293–316. 28. Moore RA, Fingerova H. Evidence-based laboratory medicine: using current best evidence to treat individual patients. In: Price CP, Hicks JM, eds. Pointof-care testing. Washington: AACC Press, 1999;265–88 29. Escrig-Sos J, Martínez-Ramos D y Miralles-Tena JM Pruebas diagnósticas: nociones básicas para su correcta interpretación y uso Cir Esp. 2006;79(5):267-73 30. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, Lijmer JG, Moher D, Rennie D, de Vet HCW for the STARD Group. Towards complete and accurate reporting of studies of diagnostic accuracy: the STARD initiative. Clin Biochem 2003;36:1–7. 31. Bossuyt PM, Reitsma JB, Bruns DE, Gatsonis CA, Glasziou PP, Irwig LM, Moher D, Rennie D, deVet HCW, Lijmer JG. The STARD statement for reporting studies of diagnostic accuracy: explanation, and elaboration. Clin Chem 2003;49:7–18. 32. Matthew McQueen. Evidence-based laboratory medicine: addressing bias, generalisability and applicability in studies on diagnostic accuracy The STARD initiative- Clinical Biochemistry 36 (2003) 1–7 713 33. Sackett DL, Strauss S, Rosenberg W, Richardson WS. Evidence Based Medicine: how to practice and teach EBM (2nd ed) Churchill Livingstone Toronto 2000 34. Web de la IFCC (http:// www.ifcc.org/divisions/emd/c-eblm/ceblm.asp). 714