Tamaño muestral ¿Cómo estimar n adecuadamente? Estimación puntual Marta Cuntín González Biostatech Advice, Training and Innovation in Biostatistics Índice • Conceptos básicos • Diseño • Problemas • ¿Qué es necesario? • Finalidades más comunes + Ejemplos prácticos • Software disponible 2 Introducción • Un error demasiado habitual es iniciar un estudio, sin plantear ni determinar todos los aspectos que pueden llevarnos a lograr resultados sólidos y representativos. • Eso suele suceder al no realizar un adecuado diseño de experimentos. • Realizar los cálculos del tamaño muestral a posteriori una vez que ya realizamos el análisis. 3 Conceptos básicos • Población: Conjunto de elementos que son objeto de estudio. • Individuo: Cada uno de los elementos de la población. El número total de individuos de la población se suele denotar por N. • Muestra: Parte de la población con la que realmente se realiza el estudio. • Tamaño: Número de elementos del que se compone la muestra y se suele representar por n. • Variable de estudio: Carácterística que queremos estudiar en la población 4 FEGAS Diseño • Naturaleza propia de los datos a estudiar. Distribución espacial Aleatoria Agregados Uniforme 5 Problemas y finalidades • Tiempo • Coste • Pérdidas • Bajas ocurrencias • Complejidad de la metodología FINALIDADES: • Extrapolar • Solidez 6 ¿Qué es necesario para el cálculo? No hay una única respuesta. En términos generales, depende de: • • • • • 7 El objetivo del estudio La precisión deseada Conocimiento/experiencia Fijar los errores La variabilidad de las variables Objetivos más comunes para la determinación del tamaño muestral • Evaluar un porcentaje, prevalencia o proporción: p • Evaluar una media: µ • Evaluar la comparación entre dos proporciones: p1 = p2 • Evaluar la comparación entre dos medias: µ1 = µ2 8 FEGAS Estimación por intervalo de confianza Evaluando nuestra estimación (porcentaje o media) mediante un intervalo de confianza. Intervalo de confianza: intervalo calculado en base a la muestra que contiene al parámetro poblacional con una cierta probabilidad llamada nivel de confianza (1-α). IC(1 ) Estimación Z /2 SE, Estimación Z /2SE 9 Estimando una proporción Asumiendo un margen de error d: Z /2 Z pq n 2 /2 Nivel de significación α Nivel de confianza 1- α d 2 p̂(1 p̂) d n Si no conocemos el valor del porcentaje Margen de error • 10 ¿Cuándo se necesitará mayor tamaño muestral? Mayor sea el nivel de confianza Mayor sea el porcentaje Menor margen de error Mediante estudios previos Sin información: p=0.5 Ejemplo Objetivo Determinar la prevalencia de una determinada enfermedad en pacientes celíacos en una consulta de atención primaria con una confianza del 95%. ¿Qué sabemos? Estudios previos indican que la prevalencia de dicha enfermedad se sitúa entre el 10% y el 50%. ¿Cómo determinamos el tamaño muestral necesario? z /2 n d 11 2 2 pq Necesitamos: Nivel de confianza: 1-α = 0.95 Margen error d: Hay que fijarlo Valor porcentaje a estimar: Diferentes valores prevalencia Ejemplo Precisión (en %) del IC 95% para distintas prevalencias Tamaño muestral 10% 20% 30% 40% 50% 1200 1,7 2,3 2,6 2,8 2,8 1040 1,8 2,4 2,8 3,0 3,0 880 2,0 2,6 3,0 3,2 3,3 d z / 2 pq 0,1x0,9 1,96 0,0169741 n 1200 Para un mismo tamaño n: 12 1,7% p d Para una misma prevalencia p: n d Estimando una media Conocida la variabilidad de la población Asumiendo un margen de error d: Z /2 n 2 d 2 Nivel de significación α Nivel de confianza 1- α Margen de error •¿Cuándo se necesitará mayor tamaño muestral? Mayor sea el nivel de confianza Mayor sea la variabilidad Menor margen de error 13 2 Z /2 Variabilidad n d Estimando una media Conocida sólo la variabilidad de la muestra Asumiendo un margen de error d: 2 n 2 t 2s Nivel de significación α Nivel de confianza 1- α 2 d • ¿Cuándo se necesitará mayor tamaño muestral? Mayor sea el nivel de confianza Mayor sea la variabilidad Menor margen de error 14 Estimación de la variabilidad Varianza de la muestra Margen de error Ejemplo En un área sanitaria la distribución del peso al nacer de niños que cumplen su período de gestación de 40 semanas es aproximadamente normal con una desviación estándar de 430 gramos. Un investigador planea llevar a cabo un estudio para estimar el peso medio al nacer de los niños que llegan al término del embarazo y cuyas madres fumaron durante ese período, asumiendo que la desviación estándar es la misma. Si el investigador desea que el error no supere los 50 gr con una confianza del 95%. ¿Qué tamaño de muestra se requiere en este estudio? Desviación poblacional σ = 430 gramos Nivel de confianza 1- α = 0.95 Margen de error d = 50 gramos 15 z2 / 2 2 1,962 4302 n 285 2 2 d 50 Ejemplo z2 / 2 2 1,962 4302 n 285 2 2 d 50 ¿Y si cambiamos los parámetros? 2 2 2 2 z 1 , 96 460 Desviación poblacional σ = 460 gramos n / 2 326 2 2 d 50 Nivel de confianza 1- α = 0.99 Margen de error d = 70 gramos 16 z2 / 2 2 2,582 4602 n 493 2 2 d 50 z2 / 2 2 1,962 4602 n 145 2 2 d 70 Software disponible Software disponible Granmo Ene 3.0 G *Power 17 G*Power Universidad de Dusseldorf 18