Programa de Efectividad Clínica 2003 DATOS CATEGORICOS – Bioestadística Vilma E. Irazola COMPARACION DE PROPORCIONES Revisión de conceptos: Continuos Tipos de datos Discretos Categóricos Ejemplo: Variable a a medir: ingreso en $ diabetes . Medidas de resumen: T. central X p S2 p(1–p) Variabilidad SD p (1 − p ) Medidas de precisión de la estimación: Error Standard SD n p (1 − p ) n Distribución binomial: Decimos que una variable tiene distribución binomial si: 1 Programa de Efectividad Clínica 2003 - Bioestadística Vilma E. Irazola la variable tiene sólo dos valores, dos resultados, posibles, cada resultado tiene una determinada probabilidad de ocurrencia, que no cambia a lo largo del tiempo en que se realiza el estudio y, si al realizar n mediciones de la variable, estas n mediciones son independientes entre sí. X ≈ Bi (n, p ) Test de hipótesis para proporciones: Test binomial exacto a) Comparación directa Test Z para proporciones Test Chi2 b) Tablas de distribución de frecuencias Test exacto de Fisher Comparación directa de proporciones 1. Test binomial exacto La tasa aceptada de complicaciones intraoperatorias de la cirugía de revascularización miocárdica (CRM) es del 5%, según datos de la literatura. En un centro C, se toma una muestra aleatoria de las CRM llevadas a cabo en lo últimos 2 meses y se obtienen los siguientes datos: Número de CRM analizadas : 18 p̂ = 0.10 Número de CRM complicadas : 2 Pregunta: ¿Considera que la tasa de complicaciones intraoperatorias de este centro es superior a la reportada en la literatura? H0 : la tasa de complicaciones es igual a la reportada en la literatura H1 : la tasa de complicaciones es superior a la reportada en la literatura Si llamamos p a la proporción de CRM infectadas que encontramos en nuestra muestra y p0 a la proporción reportada en la literatura: H0 : p̂ = p0 H1 : p̂ > p0 H0 : p̂ = .05 H1 : p̂ > .05 Ahora bien, ¿con qué tamaño de la muestra (N) estamos trabajando? Cuando trabajamos con proporciones, aplicamos la siguiente regla: 2 Programa de Efectividad Clínica 2003 Bioestadística Vilma E. Irazola Considero tamaño muestral grande si, np ≥ 5 n(1-p) y ≥ 5 En el ejemplo: np = 18 * 0.05 = 0.9 y n (1-p) = 18 * 0.95 = 17 Dado que np < 5, considero que estoy trabajando con un tamaño muestral pequeño ⇒ Decido aplicar el test binomial exacto. En estos caos, cuando H0 es cierta, la variable “Complicaciones intraoperatorias” (que llamaremos genéricamente X) tiene distribución binomial: X ≈ Bi ( 18, 0.05) Entonces, ¿Cuál es la probabilidad (p) de observar 2 o más CRM con complicaciones en una muestra de tamaño 18, si la H0 fueracierta? La respuesta está en la tabla de distribución binomial: p = p ( 2 ) + p ( 3 ) + p ( 4 ) + p ( 5 ) + p ( 6 ) + p ( 7 ) + ........... + p ( 18 ) Me fijo en la tabla: p = 0.1683 + 0.0473 + 0.0093 + 0.0014 + 0.0002 + 0.0000 + …. = 0.2265 Valor de p Conclusión: No se observó diferencia significativa entre la tasa de complicaciones del centro y la reportada en la literatura. En Stata: ID paciente 1 2 3 4 ... 18 complicaciones 0 0 1 0 ... 1 0 = Sin complicaciones 1 = Con complicaciones bitest complicaciones=.05 Variable | N Observed k Expected k Assumed p Observed p -------------+-----------------------------------------------------------complicaciones | 18 2 .9 0.05000 0.11111 Pr(k >= 2) = 0.226477 Pr(k <= 2) = 0.941871 (one-sided test) (one-sided test) Ejercicio: 3 Programa de Efectividad Clínica 2003 Bioestadística Vilma E. Irazola De los pacientes que son atendidos en el hospital Alvarez, el 20% no tienen cobertura en salud. La impresión de algunos médicos es que esta proporción está aumentando. Para corroborar esta hipótesis se toma una muestra de 15 pacientes atendidos en los últimos 3 meses y se observa que 7 pacientes no tenían cobertura. En base a estos datos, ¿considera que la tasa de pacientes sin cobertura se ha incrementado? N = p0 = p= H0 : H1 : Tamaño muestral? np = n(1-p) = Test de hipótesis: Valor de p: Conclusión: 2. Test z para una proporción (una muestra) Teorema central del límite para proporciones: Cuando el n de la muestra es suficientemente grande, la proporción observada p̂ tiene distribución aproximadamente normal, con media p y error estándar: p (1 − p) n Retomamos el ejemplo de las complicaciones de CRM, pero esta vez tomamos una muestra más grande: La tasa aceptada de complicaciones intraoperatorias de la CRM es del 5%, según datos de la literatura. En un centro C, se toma una muestra aleatoria de las CRM llevadas a cabo en el último año. Número de CRM analizadas : 200 p̂ = 0.11 Número de CRM complicadas : 22 Pregunta: ¿Considera que la tasa de complicaciones de este centro es superior a la reportada en la literatura? H0 : la tasa de complicaciones es igual a la reportada en la literatura H1 : la tasa de complicaciones es mayor a la reportada en la literatura Si llamamos p a la proporción de CRM complicadas que encontramos en nuestra muestra y p0 a la proporción reportada en la literatura: 4 Programa de Efectividad Clínica 2003 H0 : p = p 0 H1 : p > p0 Bioestadística ó Vilma E. Irazola H0 : p = .05 H1 : p > .05 ¿Podemos utilizar una aproximación normal? np = 200 * 0.05 = 10 n (1-p) = 200 * 0.95 = 190 Se deben cumplir AMBAS condiciones. Test Z para proporciones: Z= Conclusión: pˆ − p 0 0.11 − 0.05 = = 4 ⇒ p = 0.000 ( p 0 (1 − p 0 ) 0.05 * 0.95 200 n La tasa de complicaciones intraoperatorias en este centro es superior a la reportada en la literatura. En Stata: p0 prtest infec=0.05 Nombre de la variable One-sample test of proportion infec: Number of obs = 200 -----------------------------------------------------------------------------Variable | Mean Std. Err. z P>|z| [95% Conf. Interval] ---------+-------------------------------------------------------------------infec | .11 .0221246 4.97183 0.0000 .0666365 .1533635 -----------------------------------------------------------------------------Ho: proportion(infec) = .05 Ha: infec < .05 z = 3.893 P < z = 1.0000 Ha: infec ~= .05 z = 3.893 P > |z| = 0.0001 Ha: infec > .05 z = 3.893 P > z = 0.0000 ¿Cómo se construye un IC alrededor de nuestra estimación? IC = p ± Z1-α ES IC 95% = pˆ ± 1.96 pˆ * (1 − pˆ ) n 5 Programa de Efectividad Clínica 2003 Vilma E. Irazola 0.11* 0.89 = 0.11 ± 0.04 ⇒ (0.07 − 0.15) 200 IC 95% = 0.11 ± 1.96 Conclusión: Bioestadística Dado que el valor de referencia (5%) no está incluido dentro del IC construido alrededor de la proporción estimada, concluyo que la tasa de complicaciones de este centro es diferente a la reportada en la literatura, concretamente, es mayor. En Stata: Nombre de la variable ci complicac Variable | Obs Mean Std. Err. [95% Conf. Interval] ---------+------------------------------------------------------------complicac| 200 .11 .0221802 .0662617 .1537383 3. Test z para comparación de 2 proporciones (dos muestras) Se lleva a cabo un ECA para investigar la eficacia de la droga A en el tratamiento de pacientes con insuficiencia cardíaca moderada a grave. El end point primario del estudio es mortalidad a los 6 meses y los resultados obtenidos son los siguientes: Grupo tratado Grupo placebo Total n total 250 252 502 n fallecidos 33 54 88 p (muerte) p1 = 33 / 250 = 0.13 p2 = 54 / 252 = 0.21 p = 88 / 502 = 0.18 Si llamamos p1 a la proporción de pacientes fallecidos en el grupo tratado y p2 a la proporción de pacientes fallecidos en el grupo control: H0 : p1 = p2 H1 : p1 ≠ p2 ¿Podemos utilizar una aproximación normal? n1p1 n1 (1-p1) n2p2 n2 (1-p2) = = = = 250 * 250 * 252 * 252 * 0.13 0.87 0.21 0.79 = 33 = 218 = 53 = 199 Se deben cumplir las CUATRO condiciones. 6 Programa de Efectividad Clínica 2003 Bioestadística Vilma E. Irazola Test Z para comparación de dos proporciones: Z= Conclusión: p1 − p 2 1 1 p(1 − p) * + n1 n 2 = 0.13 − 0.21 1 1 0.18 * 0.82 * + 250 252 = 2.35 ⇒ p = 0.01 Los pacientes tratados con la droga A presentaron significativamente menor que aquellos que recibieron placebo. una mortalidad En Stata: prtest complic, by(tto) Two-sample test of proportion 0 : Number of obs = 1 : Number of obs = 250 252 -----------------------------------------------------------------------------Variable | Mean Std. Err. z P>|z| [95% Conf. Interval] ---------+-------------------------------------------------------------------0 | .132 .021408 6.16591 0.0000 .090041 .173959 1 | .2142857 .0258481 8.29019 0.0000 .1636244 .2649471 ---------+-------------------------------------------------------------------diff | -.0822857 .0335623 -.1480666 -.0165048 | under Ho: .0337879 -2.43536 0.0149 -----------------------------------------------------------------------------Ho: proportion(trat) - proportion(place) = diff = 0 Ha: diff < 0 z = -2.435 P < z = 0.0074 Ha: diff ~= 0 z = -2.435 P > |z| = 0.0149 Ha: diff > 0 z = -2.435 P > z = 0.9926 ¿Cómo se construye un IC para la diferencia de proporciones? IC = p ± Z1-α ES IC 95% = p1 − p 2 ± 1.96 IC 95% = 0.08 ± 1.96 p1 * (1 − p1 ) p 2 * (1 − p 2 ) + n1 n2 0.13 * 0.87 021* 079 + = 0.08 ± 0.06 ⇒ (0.02 − 0.14) 250 252 Para comparar dos proporciones, cuando no puedo aplicar la aproximación normal: test exacto de Fisher. 7