Tamaño muestral ¿Cómo estimar n adecuadamente?

Anuncio
Tamaño muestral ¿Cómo estimar n adecuadamente?
Estimación puntual
Marta Cuntín González
Biostatech Advice, Training and Innovation in Biostatistics
Índice
• Conceptos básicos
• Diseño
• Problemas
• ¿Qué es necesario?
• Finalidades más comunes + Ejemplos prácticos
• Software disponible
2
Introducción
• Un error demasiado habitual es iniciar un estudio, sin plantear ni
determinar todos los aspectos que pueden llevarnos a lograr resultados
sólidos y representativos.
• Eso suele suceder al no realizar un adecuado diseño de experimentos.
• Realizar los cálculos del tamaño muestral a posteriori una vez que ya
realizamos el análisis.
3
Conceptos básicos
• Población: Conjunto de elementos que son objeto de estudio.
• Individuo: Cada uno de los elementos de la población. El número total de
individuos de la población se suele denotar por N.
• Muestra: Parte de la población con la que realmente se realiza el estudio.
• Tamaño: Número de elementos del que se compone la muestra y se suele
representar por n.
• Variable de estudio: Carácterística que queremos estudiar en la población
4
FEGAS
Diseño
• Naturaleza propia de los datos a estudiar.
Distribución espacial
Aleatoria
Agregados
Uniforme
5
Problemas y finalidades
• Tiempo
• Coste
• Pérdidas
• Bajas ocurrencias
• Complejidad de la metodología
FINALIDADES:
• Extrapolar
• Solidez
6
¿Qué es necesario para el cálculo?
No hay una única respuesta.
En términos generales, depende de:
•
•
•
•
•
7
El objetivo del estudio
La precisión deseada
Conocimiento/experiencia
Fijar los errores
La variabilidad de las variables
Objetivos más comunes para la determinación
del tamaño muestral
• Evaluar un porcentaje, prevalencia o proporción: p
• Evaluar una media: µ
• Evaluar la comparación entre dos proporciones: p1 = p2
• Evaluar la comparación entre dos medias: µ1 = µ2
8
FEGAS
Estimación por intervalo de confianza
Evaluando nuestra estimación (porcentaje o media) mediante un intervalo de
confianza.
Intervalo de confianza: intervalo calculado en base a la muestra que contiene
al parámetro poblacional con una cierta probabilidad llamada nivel de
confianza (1-α).
IC(1  )  Estimación  Z /2 SE, Estimación  Z /2SE 
9
Estimando una proporción
Asumiendo un margen de error d:
Z /2
Z  pq

n
2
 /2
Nivel de significación α
Nivel de confianza 1- α
d
2
p̂(1 p̂)
d
n
Si no conocemos el valor del
porcentaje
Margen de error
•
10
¿Cuándo se necesitará mayor tamaño muestral?
 Mayor sea el nivel de confianza
 Mayor sea el porcentaje
 Menor margen de error
Mediante estudios previos
Sin información: p=0.5
Ejemplo
Objetivo
Determinar la prevalencia de una determinada enfermedad en pacientes
celíacos en una consulta de atención primaria con una confianza del 95%.
¿Qué sabemos?
Estudios previos indican que la prevalencia de dicha enfermedad se sitúa entre
el 10% y el 50%.
¿Cómo determinamos el tamaño muestral necesario?
z /2 

n
d
11
2
2
pq
Necesitamos:
Nivel de confianza: 1-α = 0.95
Margen error d: Hay que fijarlo
Valor porcentaje a estimar:
Diferentes valores prevalencia
Ejemplo
Precisión (en %) del IC 95% para distintas
prevalencias
Tamaño muestral 10% 20%
30%
40%
50%
1200
1,7
2,3
2,6
2,8
2,8
1040
1,8
2,4
2,8
3,0
3,0
880
2,0
2,6
3,0
3,2
3,3
d  z / 2
pq
0,1x0,9
 1,96
 0,0169741
n
1200
Para un mismo tamaño n:
12
1,7%
p
d
Para una misma prevalencia p: n
d
Estimando una media
Conocida la variabilidad de la población
Asumiendo un margen de error d:
Z /2
n
2
d
2
Nivel de significación α
Nivel de confianza 1- α
Margen de error
•¿Cuándo se necesitará mayor tamaño muestral?
 Mayor sea el nivel de confianza
 Mayor sea la variabilidad
 Menor margen de error
13
2
Z /2
Variabilidad

n
d
Estimando una media
Conocida sólo la variabilidad de la muestra
Asumiendo un margen de error d:
2
n
2
t 2s
Nivel de significación α
Nivel de confianza 1- α
2
d
• ¿Cuándo se necesitará mayor tamaño muestral?
 Mayor sea el nivel de confianza
 Mayor sea la variabilidad
 Menor margen de error
14
Estimación de la variabilidad
Varianza de la muestra
Margen de error
Ejemplo
En un área sanitaria la distribución del peso al nacer de niños que cumplen su
período de gestación de 40 semanas es aproximadamente normal con una
desviación estándar de 430 gramos.
Un investigador planea llevar a cabo un estudio para estimar el peso medio al
nacer de los niños que llegan al término del embarazo y cuyas madres
fumaron durante ese período, asumiendo que la desviación estándar es la
misma. Si el investigador desea que el error no supere los 50 gr con una
confianza del 95%. ¿Qué tamaño de muestra se requiere en este estudio?
Desviación poblacional σ = 430 gramos
Nivel de confianza 1- α = 0.95
Margen de error d = 50 gramos
15
z2 / 2 2 1,962 4302
n

 285
2
2
d
50
Ejemplo
z2 / 2 2 1,962 4302
n

 285
2
2
d
50
¿Y si cambiamos los parámetros?
2
2
2
2
z

1
,
96
460
Desviación poblacional σ = 460 gramos n   / 2

 326
2
2
d
50
Nivel de confianza 1- α = 0.99
Margen de error d = 70 gramos
16
z2 / 2 2 2,582 4602
n

 493
2
2
d
50
z2 / 2 2 1,962 4602
n

 145
2
2
d
70
Software disponible
Software disponible
Granmo
Ene 3.0
G *Power
17
G*Power
Universidad de Dusseldorf
18
Descargar