Sesgos y errores en la investigación epidemiológica Introducción El propósito primario de la investigación es conducir una investigación científica o académica de un fenómeno o responder una pregunta importante. Limitantes de la investigación basada en el método científico • Cada estudio de investigación tiene errores. • Ningún estudio único aprueba o rechaza una hipótesis. • Aspectos éticos pueden limitar a los investigadores. • Control adecuado es difícil de mantener en un estudio. Validez y precisión • Validez: – Capacidad del estudio para estimar un parámetro lo mas cercano posible al verdadero valor. – Dos tipos: • Interna – grado al cual los resultados de una observación son correctos para el grupo estudiado en particular. • Externa (generalizabilidad) – extensión a la cual los resultados pueden ser aplicados más allá de la muestra en estudio. Validez y precisión • Precisión: – Se refiere al grado de dispersión que tendrian mediciones repetidas del parametro, alrededor de un valor determinado. Explicaciones para asociaciones artificiales • Sesgo de información • Sesgo de selección • Fracaso para controlar variables confusoras • Falacia ecológica • Variablidad de muestreo o azar Errores en estudios epidemiológicos • Error aleatorio – Cálculo de tamaño de muestra • Error sistemático – Sesgo de selección – Sesgo de medición – Confusión • Validez – Validez interna – Validez externa Error aleatorio • Las mediciones repetidas en el mismo sujeto o en diferentes de la misma población varían de forma no predecible. • Da lugar a disminución de la precisión en la medición de la asociación. Error aleatorio • Fuentes de error aleatorio – Error de muestreo – Variación biológica – Error de medición Cálculo de tamaño de muestra Variables a considerar – Nivel requerido de significancia estadística del resultado esperado. – Oportunidad aceptable de no encontrar el efecto real. – Magnitud del efecto en investigación. – Cantidad de enfermedad en la población. – Tamaños relativo de los grupos siendo comparados. Errores sistemáticos (sesgos) • Ocurre cuando hay una tendencia de producir resultados que difieren de manera sistemática de los verdaderos valores. • Un estudio con un error sistemático pequeño es considerado altamente seguro Errores sistemáticos (sesgos) • Validez no es afectada por el tamaño de muestra • Sesgos principales – Sesgo de selección – Sesgo de medición (clasificación) – Confusión Sesgo de selección • Ocurre cuando hay una diferencia sistemática entre las características de las personas seleccionadas para un estudio y las características de aquellas que no lo fueron. • Distorsión del efecto que resulta de la forma en que los participantes son aceptados en los estudios. Sesgo de selección • Efecto del trabajador saludable. riesgo para cierta enfermedad en poblaciónes laborales industriales, más bajo que en la población en general. • Perdidas al seguimiento en los estudios de cohorte. • Selección de voluntarios. Fuentes de sesgo de selección • Voluntarios para un estudio son casi siempre selectivo. • Participantes pagados pueden ser diferentes de la población general Fuentes de sesgo de selección • Datos de hospitales y clínicas están basados en una población selectiva • Enfermedad o factor en investigación hace a las personas no disponibles para el estudio. Sesgo de información • Es una distorsión en la estimación del efecto de interés que resulta de una medición sistematicamente equivocada de la exposición o el evento. • Diferencia entre el valor de la magnitud del verdadero efecto o exposición y el valor encontrado en la medición. • “SESGO DE MALACLASIFICACION” Sesgo de información • “Sesgo de malaclasificación no diferencial” – Cuando el error tiene la misma magnitud para todos los grupos que se están comparando. – Lleva a que el parámetro de interés se subestime. Sesgo del parámetro hacia el valor nulo • “Sesgo de malaclasificación diferencial” – La magnitud del error es mas grande en un grupo que en el otro u otros. Es decir los expuestos tienen una mayor probabilidad de ser mal clasificados o viceversa. “Sesgo de memoria” – Puede llevar el valor del parámetro hacia el valor nulo o inflar su valor. Efecto de la malaclasificacion no diferencial sobre la enfermedad Expuestos Enfermos 400 No expuestos 200 No enfermos 600 800 Sensibilidad en expuestos = 0.8 Sensibilidad en no expuestos = 0.8 Especificidad en expuestos = 0.9 Especificidad en no expuestos = 0.9 400 / 1000 RR 2.0 200 / 1000 Efecto de la malaclasificacion no diferencial sobre la enfermedad Estado verdadero (Expuestos) Clasificación Enfermos del estado por la No prueba enfermos Enfermos No enfermos 320 60 80 540 Efecto de la malaclasificacion no diferencial sobre la enfermedad Estado verdadero (No expuestos) Clasificación del estado Enfermos por la prueba No enfermos Enfermos No enfermos 160 80 40 720 Efecto de la malaclasificacion no diferencial sobre la enfermedad Tabla resultado de la malaclasificación Expuestos Enfermos´ 380 No expuestos 240 No enfermos´ 620 760 RR=? Causas del sesgo de información • Instrumento mal diseñado • Errores u omisiones en el protocolo por el uso del instrumento • Pobre ejecución del protocolo durante la recolección de los datos • Limitaciones debidas a características del sujeto (mala memoria) • Errores en la entrad de datos y el análisis Errores en el diseño del instrumento • Falta de cobertura de todas las fuentes de la exposición o el evento en un cuestionario. • Inclusión de exposiciones que no tienen el verdadero agente. • El instrumento mide un período de tiempo que no es el de interés real. • Mal fraseo de las preguntas que llevan a mal entendimiento Errores u omisiones en el protocolo para el uso del instrumento • Fallas para especificar el protocolo en suficiente detalle • Fallas para especificar un método que permita manejar situaciones no anticipadas consistentemente • Fallas para estandarizar el instrumento periódicamente a través de la colección de los datos Pobre ejecución del protocolo del estudio • Falla del recolector de los datos para seguir el protocolo de la misma manera para todos los sujetos. • Falla de los sujetos de estudio para leer las instrucciones en los cuestionarios auto-administrados • Manipulación o análisis inapriopiado de especimenes biológicos. • Influencia de la personalidad, sexo o raza del entrevistador sobre el entrevistado. Limitaciones debidas a las características del sujeto • Limitaciones de memoria de los sujetos incluyendo un recuerdo inadecuado de la exposición y la influencia de las exposiciones recientes en el recuerdo de exposiciones pasadas. • Limitaciones en el conocimiento y el recuerdo sobre las exposiciones del sujeto por parte de familiares o amigos. • Tendencia de los sujetos a sobre-reportar conductas deseables socialmente y sub-reportar las contrarias. • Variabilidad alta en las características biológicas. Errores durante la entrada de los datos y el análisis • Errores de digitación. • Errores en las tablas de conversión usadas para convertir las respuestas de los sujetos a unidades del agente activo. • Errores de programación al crear las variables para el análisis. • Categorización inadecuada de variables continuas Reducción del sesgo de mala clasificación • Uso de medidas múltiples o de diversas fuentes de información. – Se examinan las totalmente concordantes y las totalmente discordantes y se excluyen las otras. – Se pide una tercera opinión. Reducción del sesgo de mala clasificación • Procedimientos de control de calidad – Diseño del instrumento – Preparación de la recolección de datos. – Control de calidad durante la recolección de datos. – Control de calidad durante el procesamiento de datos. Confusión • Ocurre cuando otra asociación existe en la población en estudio y está asociada con la enfermedad y con la exposición siendo estudiadas • Cuando los efectos de dos exposiciones (factores de riesgo) no han sido separados, y conclusiones incorrectas son extraídas de que el efecto es debido a una y no a la otra variable. Confusión • Puede crear la apariencia de una relación causa-efecto que realmente no existe • Para que una variable sea confusora, deberá ser un determinante (factor de riesgo) de la enfermedad y la exposición siendo estudiados • Edad y clase social son confusores comunes Controlando confusión con el diseño del estudio • Aleatorización. • Restricción - limita el ingreso en el estudio a aquellos con características particulares • Emparejando por variables potencialmente confusoras. Controlando confusión durante el análisis • Estratificación. Categorías bien definidas y homogéneas (estratos) de la variable confusora. • Modelaje estadístico (Analisis multivariable). Se controlan múltiples confusores al mismo tiempo. Falacia ecológica • El error que ocurre al asumir que debido a dos o más características expresadas como índices del grupo ocurren juntas, y que por lo tanto están asociadas. • A menos que estudios ecológicos puedan crear tasas específicas para subpoblaciones, no son origen de una asociación. Errores de revisiones sistemáticas y meta-análisis • Algunos estudios pueden ser omitidos si los autores están interesados es apoyar un punto de vista en particular. • Sesgo de publicación - estudios con efectos negativos pueden no ser publicados, y por lo tanto excluidos. Referencias • D Kleinbaum et al. Epidemiological methods. • Hernandez Avila et al. Sesgos en estudios epidemiológicos. • http://www.bettycjung.net • http://www.bettycjung.net/Bite.htm