Interpretación de pruebas estadísticas y epidemiológicas César A. Gutiérrez Villafuerte Población (N) Muestreo Muestra (n) s p x Estadísticos Parámetros Inferencia Hipótesis Estadística Es una proposición sobre los parámetros de una o más poblaciones. Son proposiciones sobre la población, no sobre la muestra. Son conjeturas que se hacen antes de empezar el muestreo. Hipótesis Nula y Alternativa Hipótesis nula: Suposición que se hace sobre el valor del parámetro de la población antes de empezar el muestreo (situación actual). Se representa con el símbolo H0. Estudios en que se comparan grupos: Es la situación de la no diferencia entre los grupos. Hipótesis alternativa: Conclusión que se acepta cuando los datos no apoyan la hipótesis nula. Se representa simbólicamente como H1. Supongamos que estamos en un juicio: Sentencia del juez Condición real del acusado Inocente Culpable Inocente Correcto Incorrecto Culpable Incorrecto Correcto Tipo de errores Resultado de la prueba de hipótesis Población (Hipótesis nula) Verdadera Falsa Aceptar H0 Correcto Error tipo II Rechazar H0 Error tipo I Correcto Nivel de confianza y poder (potencia) Nivel de confianza: 1 - Se trabaja generalmente con un 95%. Potencia: 1- Se trabaja generalmente con una potencia mínima del 80% Valor p Es la probabilidad de llegar al resultado obtenido si la hipótesis nula es cierta. Si p = 1 (100%), el resultado apoya totalmente H0. Si p = 0 (0%), el resultado no apoya totalmente H0. También se interpreta como la probabilidad que nuestros resultados se deben al azar. Valor p La H0 se rechaza si el valor p calculado es menor que el nivel de significación () establecido. El nivel de significación más empleado es el 0.05. Valor p Esto significa que para un valor p<0.05: La probabilidad que → H0 sea cierta es baja me quedo con la alternativa La probabilidad que → mis resultados se deban al azar es baja es muy probable que la diferencia sea verdadera Diferencia o asociación estadísticamente significativa Objetivo: Comparar el efecto hipolipemiante del maíz morado con simvastatina Objetivo: Comparar el efecto hipolipemiante del maíz morado con simvastatina. µ µ Maíz morado Simvastatina x1 x1 x2 x2 x3 x3 xn xn Si los efecto hipolipemiantes del maíz morado y la simvastatina son iguales... se esperaría que las diferencias entre las muestras sean cercanas a cero. µ Maíz morado - µ Simvastatina = 0 X1 - X1 ≈ 0 X2 - X2 ≈ 0 X3 . . . Xn - X3 . . . Xn ≈ 0 . . . 0 - ≈ Pero habrá diferencias que se alejarán de cero. Si representamos gráficamente las diferencias de las medias entre las n muestras obtenidas de cada grupo, bajo el supuesto que las medias poblacionales son iguales, tenemos: -4 -3 -2 -1 0 1 2 3 4 Nosotros no conocemos los valores poblacionales, solo sabemos los valores de las medias muestrales. µ µ Maíz morado Simvastatina x1 x1 x1 maíz morado – x1 simvastatina Si la diferencia entre las medias muestrales cayera en la línea vertical, ¿cuál sería la conclusión más razonable? -4 -3 -2 -1 0 1 2 3 4 Nosotros no conocemos los valores poblacionales, solo sabemos los valores de las medias muestrales. µ µ Maíz morado Simvastatina x1 x1 x1 maíz morado – x1 simvastatina Si la diferencia entre las medias muestrales cayera en la línea vertical, ¿cuál sería la conclusión más razonable? -4 -3 -2 -1 0 1 2 3 4 Medidas de asociación en epidemiología Las medidas que nos ayudan a obtener esta información son: Riesgo relativo (RR) Odds ratio (OR) Riesgo relativo El RR es una razón que relaciona el riesgo absoluto (incidencia) en dos grupos de población que difieren por el grado de exposición a un factor determinado. Indica cuantas veces es mayor la probabilidad de sufrir una enfermedad entre quienes están expuestos al factor, respecto a los no expuestos. Riesgo relativo Enfermedad Exposición Presente Ausente Total Presente a b a+b Ausente c d c+d Riesgo Relativo = a / (a + b) c / (c + d) Odds ratio No siempre es posible calcular la incidencia en los estudios de investigación. Se calcula entonces la Odds Ratio (razón de ventaja, razón de chances, razón de momios, razón de productos cruzados, razón de probabilidades, razón de disparidad). Para un evento E, que ocurre con probabilidad P, la Odds se define como: P / (1 - P) Es decir, la probabilidad de “éxito” entre la probabilidad de “no éxito”. Odds ratio Enfermedad Exposición Presente Ausente Total Presente a b a+b Ausente c d c+d Odds Ratio = a / (a+b) b / (a+b) c / (c+d) d / (c+d) = a b c d = ad bc Odds ratio Enfermedad Exposición Presente Ausente Presente a b Ausente c d Total a+c b+d Odds Ratio = a / (a+c) c / (a+c) b / (b+d) d / (b+d) = a c b d = ad bc Interpretación del RR y OR OR RR = Ie = Io Sin efecto Ie < Io factor protector 0 Ie Io Ie > Io factor de riesgo 1 Interpretación del RR y OR RR = 3 RR = 2 ¿Los expuestos tienen dos veces más riesgo o tienen dos veces el riesgo? ¿Los expuestos tienen tres veces más riesgo o tienen tres veces el riesgo? 3% 2% 1% Incidencia en expuestos Incidencia en no expuestos 1% Incidencia en expuestos Incidencia en no expuestos Interpretación del RR y OR RR = 1.33 RR = 1.5 Los expuestos tienen 1.5 veces el riesgo de los no expuestos. También: los expuestos tienen 50% más riesgo. Los expuestos tienen 1.33 veces el riesgo de los no expuestos. También: los expuestos tienen 33% más riesgo. 4% 3% 3% 2% Incidencia en expuestos Incidencia en no expuestos Incidencia en expuestos Incidencia en no expuestos Interpretación del RR y OR RR = 0.67 RR = 0.20 Los expuestos tienen 0.67 veces el riesgo de los no expuestos. También: los expuestos tienen 33% menos riesgo. Los expuestos tienen 0.20 veces el riesgo de los no expuestos. También: los expuestos tienen 80% menos riesgo. 3% 3% 2% 0.6% Incidencia en expuestos Incidencia en no expuestos Incidencia en expuestos Incidencia en no expuestos Interpretación del RR y OR Veces el riesgo RR-1 % más 1-RR % menos 0 1 2 3 4 Interpretación del RR y OR Al reportar los valores de RR y OR, deben estar acompañados de sus intervalos de confianza. Si el RR u OR incluye la unidad (1), el RR u OR encontrado no es significativo. Table 2. Relative risks and 95% confidence intervals of coronary heart disease in women according to frequency of nut consumption (1 oz serving) Additional adjustment for dietary variables Frequency of nut consumption Almost never 1 1-3/month to once/week 2-4 times/week 5 times/week 0.91 (0.81 to 1.03) 0.78 (0.61 to 0.99) 0.66 (0.47 to 0.93) ¿Cuándo la OR es un buen estimador del RR? 1. Cuando los “casos” son representativos, en relación a la historia de exposición, de todas las personas con la enfermedad en la población de la cual los casos son seleccionados. 2. Cuando los “controles” son representativos, en relación a la historia de exposición, de todas las personas sin la enfermedad en la población de la cual los casos son seleccionados. 3. Cuando la enfermedad es poco frecuente. Riesgo (Incidencia) Odds ( (riegso/(1-riesgo) ) 0.001 0.001 0.005 0.005 0.010 0.010 0.050 0.053 0.100 0.111 0.200 0.250 0.300 0.429 0.400 0.667 0.500 1.000 0.750 3.000 0.900 9.000 0.950 0.990 19.000 99.000 Gracias por su atención cgutierrezv@epiredperu.net www.epiredperu.net