datos categoricos – comparacion de proporciones

Anuncio
Programa de Efectividad Clínica 2003
DATOS CATEGORICOS –
Bioestadística
Vilma E. Irazola
COMPARACION DE PROPORCIONES
Revisión de conceptos:
Continuos
Tipos de datos
Discretos
Categóricos
Ejemplo:
Variable a
a medir:
ingreso en $
diabetes .
Medidas de resumen:
T. central
X
p
S2
p(1–p)
Variabilidad
SD
p (1 − p )
Medidas de precisión de la estimación:
Error Standard
SD
n
p (1 − p )
n
Distribución binomial:
Decimos que una variable tiene distribución binomial si:
1
Programa de Efectividad Clínica 2003
-
Bioestadística
Vilma E. Irazola
la variable tiene sólo dos valores, dos resultados, posibles,
cada resultado tiene una determinada probabilidad de ocurrencia, que no cambia a lo largo
del tiempo en que se realiza el estudio
y, si al realizar n mediciones de la variable, estas n mediciones son independientes entre
sí.
X ≈ Bi (n, p )
Test de hipótesis para proporciones:
Test binomial exacto
a) Comparación directa
Test Z para proporciones
Test Chi2
b) Tablas de distribución de frecuencias
Test exacto de Fisher
Comparación directa de proporciones
1. Test binomial exacto
La tasa aceptada de complicaciones intraoperatorias de la cirugía de revascularización miocárdica
(CRM) es del 5%, según datos de la literatura. En un centro C, se toma una muestra aleatoria de
las CRM llevadas a cabo en lo últimos 2 meses y se obtienen los siguientes datos:
Número de CRM analizadas : 18
p̂ = 0.10
Número de CRM complicadas : 2
Pregunta: ¿Considera que la tasa de complicaciones intraoperatorias de este centro es superior a
la reportada en la literatura?
H0 : la tasa de complicaciones es igual a la reportada en la literatura
H1 : la tasa de complicaciones es superior a la reportada en la literatura
Si llamamos p a la proporción de CRM infectadas que encontramos en nuestra muestra y p0 a la
proporción reportada en la literatura:
H0 :
p̂ = p0
H1 :
p̂ > p0
H0 :
p̂ = .05
H1 :
p̂ > .05
Ahora bien, ¿con qué tamaño de la muestra (N) estamos trabajando?
Cuando trabajamos con proporciones, aplicamos la siguiente regla:
2
Programa de Efectividad Clínica 2003
Bioestadística
Vilma E. Irazola
Considero tamaño muestral grande si,
np
≥
5
n(1-p)
y
≥
5
En el ejemplo:
np = 18 * 0.05 = 0.9
y
n (1-p) = 18 * 0.95 = 17
Dado que np < 5, considero que estoy trabajando con un tamaño muestral pequeño ⇒ Decido
aplicar el test binomial exacto.
En estos caos, cuando H0 es cierta, la variable “Complicaciones intraoperatorias” (que llamaremos
genéricamente X) tiene distribución binomial:
X ≈ Bi ( 18, 0.05)
Entonces, ¿Cuál es la probabilidad (p) de observar 2 o más CRM con complicaciones en una
muestra de tamaño 18, si la H0 fueracierta? La respuesta está en la tabla de distribución binomial:
p = p ( 2 ) + p ( 3 ) + p ( 4 ) + p ( 5 ) + p ( 6 ) + p ( 7 ) + ........... + p ( 18 )
Me fijo en la tabla:
p = 0.1683 + 0.0473 + 0.0093 + 0.0014 + 0.0002 + 0.0000 + …. =
0.2265
Valor de p
Conclusión: No se observó diferencia significativa entre la tasa de complicaciones del centro y la
reportada en la literatura.
En Stata:
ID
paciente
1
2
3
4
...
18
complicaciones
0
0
1
0
...
1
0 = Sin complicaciones
1 = Con complicaciones
bitest complicaciones=.05
Variable
|
N
Observed k
Expected k
Assumed p
Observed p
-------------+-----------------------------------------------------------complicaciones |
18
2
.9
0.05000
0.11111
Pr(k >= 2) = 0.226477
Pr(k <= 2) = 0.941871
(one-sided test)
(one-sided test)
Ejercicio:
3
Programa de Efectividad Clínica 2003
Bioestadística
Vilma E. Irazola
De los pacientes que son atendidos en el hospital Alvarez, el 20% no tienen cobertura en salud.
La impresión de algunos médicos es que esta proporción está aumentando. Para corroborar esta
hipótesis se toma una muestra de 15 pacientes atendidos en los últimos 3 meses y se observa que
7 pacientes no tenían cobertura.
En base a estos datos, ¿considera que la tasa de pacientes sin cobertura se ha incrementado?
N =
p0 =
p=
H0 :
H1 :
Tamaño muestral?
np =
n(1-p) =
Test de hipótesis:
Valor de p:
Conclusión:
2. Test z para una proporción (una muestra)
Teorema central del límite para proporciones: Cuando el n de la muestra es suficientemente
grande, la proporción observada p̂ tiene distribución aproximadamente normal, con media p y error
estándar:
p (1 − p)
n
Retomamos el ejemplo de las complicaciones de CRM, pero esta vez tomamos una muestra más
grande:
La tasa aceptada de complicaciones intraoperatorias de la CRM es del 5%, según datos de la
literatura. En un centro C, se toma una muestra aleatoria de las CRM llevadas a cabo en el último
año.
Número de CRM analizadas :
200
p̂ = 0.11
Número de CRM complicadas :
22
Pregunta: ¿Considera que la tasa de complicaciones de este centro es superior a la reportada en
la literatura?
H0 : la tasa de complicaciones es igual a la reportada en la literatura
H1 : la tasa de complicaciones es mayor a la reportada en la literatura
Si llamamos p a la proporción de CRM complicadas que encontramos en nuestra muestra y p0 a la
proporción reportada en la literatura:
4
Programa de Efectividad Clínica 2003
H0 : p = p 0
H1 : p > p0
Bioestadística
ó
Vilma E. Irazola
H0 : p = .05
H1 : p > .05
¿Podemos utilizar una aproximación normal?
np
= 200 * 0.05 = 10
n (1-p) = 200 * 0.95 = 190
Se deben cumplir AMBAS
condiciones.
Test Z para proporciones:
Z=
Conclusión:
pˆ − p 0
0.11 − 0.05
=
= 4 ⇒ p = 0.000
( p 0 (1 − p 0 )
0.05 * 0.95
200
n
La tasa de complicaciones intraoperatorias en este centro es superior a la
reportada en la literatura.
En Stata:
p0
prtest infec=0.05
Nombre de
la variable
One-sample test of proportion
infec: Number of obs =
200
-----------------------------------------------------------------------------Variable |
Mean
Std. Err.
z
P>|z|
[95% Conf. Interval]
---------+-------------------------------------------------------------------infec |
.11
.0221246
4.97183
0.0000
.0666365
.1533635
-----------------------------------------------------------------------------Ho: proportion(infec) = .05
Ha: infec < .05
z = 3.893
P < z = 1.0000
Ha: infec ~= .05
z = 3.893
P > |z| = 0.0001
Ha: infec > .05
z = 3.893
P > z = 0.0000
¿Cómo se construye un IC alrededor de nuestra estimación?
IC
= p ± Z1-α ES
IC 95% = pˆ ± 1.96
pˆ * (1 − pˆ )
n
5
Programa de Efectividad Clínica 2003
Vilma E. Irazola
0.11* 0.89
= 0.11 ± 0.04 ⇒ (0.07 − 0.15)
200
IC 95% = 0.11 ± 1.96
Conclusión:
Bioestadística
Dado que el valor de referencia (5%) no está incluido dentro del IC construido
alrededor de la proporción estimada, concluyo que la tasa de complicaciones de
este centro es diferente a la reportada en la literatura, concretamente, es mayor.
En Stata:
Nombre de
la variable
ci complicac
Variable |
Obs
Mean
Std. Err.
[95% Conf. Interval]
---------+------------------------------------------------------------complicac|
200
.11
.0221802
.0662617
.1537383
3. Test z para comparación de 2 proporciones (dos muestras)
Se lleva a cabo un ECA para investigar la eficacia de la droga A en el tratamiento de pacientes con
insuficiencia cardíaca moderada a grave. El end point primario del estudio es mortalidad a los 6
meses y los resultados obtenidos son los siguientes:
Grupo tratado
Grupo placebo
Total
n total
250
252
502
n fallecidos
33
54
88
p (muerte)
p1 = 33 / 250 = 0.13
p2 = 54 / 252 = 0.21
p = 88 / 502 = 0.18
Si llamamos p1 a la proporción de pacientes fallecidos en el grupo tratado y p2 a la proporción de
pacientes fallecidos en el grupo control:
H0 : p1 = p2
H1 : p1 ≠ p2
¿Podemos utilizar una aproximación normal?
n1p1
n1 (1-p1)
n2p2
n2 (1-p2)
=
=
=
=
250 *
250 *
252 *
252 *
0.13
0.87
0.21
0.79
= 33
= 218
= 53
= 199
Se deben cumplir las
CUATRO condiciones.
6
Programa de Efectividad Clínica 2003
Bioestadística
Vilma E. Irazola
Test Z para comparación de dos proporciones:
Z=
Conclusión:
p1 − p 2
1
1
p(1 − p) *  +
 n1 n 2



=
0.13 − 0.21
1 
 1
0.18 * 0.82 * 
+

 250 252 
= 2.35 ⇒ p = 0.01
Los pacientes tratados con la droga A presentaron
significativamente menor que aquellos que recibieron placebo.
una
mortalidad
En Stata:
prtest complic, by(tto)
Two-sample test of proportion
0 : Number of obs =
1 : Number of obs =
250
252
-----------------------------------------------------------------------------Variable |
Mean
Std. Err.
z
P>|z|
[95% Conf. Interval]
---------+-------------------------------------------------------------------0 |
.132
.021408
6.16591
0.0000
.090041
.173959
1 | .2142857
.0258481
8.29019
0.0000
.1636244
.2649471
---------+-------------------------------------------------------------------diff | -.0822857
.0335623
-.1480666
-.0165048
| under Ho:
.0337879 -2.43536
0.0149
-----------------------------------------------------------------------------Ho: proportion(trat) - proportion(place) = diff = 0
Ha: diff < 0
z = -2.435
P < z = 0.0074
Ha: diff ~= 0
z = -2.435
P > |z| = 0.0149
Ha: diff > 0
z = -2.435
P > z = 0.9926
¿Cómo se construye un IC para la diferencia de proporciones?
IC
= p ± Z1-α ES
IC 95% = p1 − p 2 ± 1.96
IC 95% = 0.08 ± 1.96
p1 * (1 − p1 ) p 2 * (1 − p 2 )
+
n1
n2
0.13 * 0.87 021* 079
+
= 0.08 ± 0.06 ⇒ (0.02 − 0.14)
250
252
Para comparar dos proporciones, cuando no puedo aplicar la aproximación normal: test exacto de
Fisher.
7
Descargar