Tamaño de muestra en investigaciones biomédicas Subárea de Bioética en Investigación CENDEISSS Guía • Conceptos generales ▫ ▫ ▫ ▫ Población Muestra Individuo Validez científica • Muestra en estudios comparativos • Muestra en estudios descriptivos • Consejos • La preparación de un proyecto de investigación es una tarea compleja • decidir sobre los individuos que se incluirán en el estudio: – Qué características tendrán «criterios de inclusión y exclusión», – a cuántos pacientes se estudiará «tamaño de la muestra» – cómo se elegirán para que entren a formar parte del estudio «técnica de muestreo». • Estudiar a toda la población, que sería la manera más exacta de conocer lo que se pretende estudiar, es casi imposible en la práctica. Población • Es el conjunto de elementos o individuos que reúnen las características que se pretenden estudiar. – «población finita» Cuando se conoce el número de individuos que la componen – «población infinita» cuando no se conoce su número • Existen tres niveles de población, según su tamaño y accesibilidad: – «población diana» es el conjunto de elementos o individuos al cual se pretenden inferir los resultados obtenidos • generalmente es muy numerosa y no está al alcance de los investigadores. – «población accesible» es la que reúne las mismas características que la anterior, pero con menor número de individuos, y por tanto susceptible de estudio • es la que delimita el investigador con los criterios de inclusión y exclusión. – «población de estudio» es de la que realmente se recogen los datos; suele ser la muestra de estudio Muestra • Es el grupo de individuos que realmente se estudiarán, es un subconjunto de la población. «representativa» • Generalizar a la población los resultados obtenidos – definir con claridad los criterios de inclusión y exclusión – utilizar las técnicas de muestreo apropiadas para garantizar dicha representatividad. Individuo • Es cada uno de los integrantes de la población o muestra en los que se estudiarán las características de interés determinadas por los objetivos del estudio. • Tras la definición de las características de la población a través de los criterios de inclusión y exclusión – DECISIÓN: si se estudia a toda la población o –en caso de que ésta sea demasiado grande– número de sujetos representativo • ni pocos ni demasiados, sino simplemente los necesarios. Validez Científica • Qué pasa? – Muchos --- exposición innecesaria a riesgos, pérdida de tiempo, recursos, etc. – Pocos --- no se encuentren diferencias entre dos grupos, cuando en realidad sí las hay. • Validez Interna: el grado por el cual el investigador saca las conclusiones correctas acerca de lo que en realidad pasó en el estudio. • Validez Externa: es el grado en que estas conclusiones pueden aplicarse apropiadamente a la población afuera del estudio. (generalizabilidad) • ANTI-ÉTICO Muestra insuficiente • # individuos que serán excluidos o los se pueden rehusar a participar • # que se perderán en el seguimiento (lost to follow-up) • A veces el investigador asegura que tendrá la muestra necesaria. • A veces se debe hacer un pequeño estudio piloto. • ESTRATEGIAS: – – – – – – Expandir los criterios de inclusión Eliminar criterios de exclusión innecesarios Alargar el tiempo de reclutamiento de participantes Adquirir fuentes adicionales de participantes Hacer el estudio multicéntrico Cambiar el diseño metodológico Estudios Comparativos (observacionales analíticos y experimentales) Cálculo de muestra y Poder • Como hacemos para determinar si los resultados de un estudio son verdaderos o son debido a la casualidad? • Casualidad Eliminando sesgo ▫ asignación al azar ▫ Cegamiento ▫ # muestra • factor que influye en la posibilidad de que nuestros resultados puedan ser incorrectos. # inadecuado de muestra ▫ Cuantos individuos tenemos que estudiar con el fin de llegar lo más cerca a una respuesta correcta? Qué es el Poder y por qué es importante? • Claridad en una cosa… • Un ejemplo ▫ El caso de la trombolisis en infarto agudo de miocardio (IAM). ▫ Tx adecuado de acuerdo a la etiología de la enfermedad… ▫ estudios sucesivos no podían probar el beneficio ▫ Un estudio con adecuado “poder” (mega ensayo) que se pudo probar los pequeños pero importantes beneficios de la trombolisis IAM • trombolisis vs placebo ▫ mortalidad en un cierto número de días. (resultado primario o variable resultado) • Ej: mortalidad el día 21 Estudio comparativo 2 hipótesis ▫ 1) La hipótesis nula es que no hay diferencia entre los tratamientos en términos de mortalidad. ▫ 2) La hipótesis alternativa es que hay una diferencia entre los tratamientos en términos de mortalidad. IAM • Al tratar de determinar si los dos grupos son lo mismo (aceptar la hipótesis nula) o SI son diferentes (la aceptación de la hipótesis alternativa) se pueden cometer 2 tipos de error. ▫ Error de tipo I o error α (falso positivo) ▫ se dice que se ha producido cuando se rechaza la hipótesis nula incorrectamente (osea, decimos que es verdadera y que no hay diferencia entre los dos grupos) y reportamos una diferencia entre los dos los grupos estudiados. Nivel de confianza 1- α . Criterio más común es aceptar un riesgo α ≤ 0.05 ▫ Error de tipo II o error β (falso negativo) ▫ se dice que ocurre cuando aceptamos la hipótesis nula incorrectamente (es decir, es falso y hay una diferencia entre los dos grupos que es la hipótesis alternativa) y reportamos que no hay diferencia entre los dos grupos. El criterio más común es aceptar un riesgo β de 0.10 y 0.20. -poder estadístico▫ Cálculos de poder nos dice cuántos pacientes se necesitan para evitar cometer errores tipo I y tipo II • Establecer la magnitud de la diferencia que se pretende encontrar entre los dos grupos (1015%) ▫ Diferencia clínicamente significativa 30% mortalidad ---- 28% ---- 20% • Definir si la hipótesis será «unilateral» o «bilateral». ▫ Esto se refiere a que si al comparar dos grupos la hipótesis es que los resultados diferirán sin poder predecir de seguro cuál grupo resulta mejor o más favorable (bilateral, porque A puede ser mejor que B o viceversa), o definitivamente se postula que, específicamente, uno de los grupos dará mejores resultados. La precisión y la variabilidad de las mediciones Seleccionar la prueba estadística a utilizar • Las fórmulas están basadas en supuestos matemáticos que obviamente difieren entre cada prueba estadística. • Basado en el tipo de variables de las hipótesis ▫ Variables continuas --- “t” test Comparar medias ▫ Variables dicotónomas ---- chi cuadrado Comparar proporciones Siempre para hipótesis bilateral Para unilateral se utiliza Z test Resumen 1. Magnitud de la diferencia a detectar que tenga interés clínicamente relevante. 2. Tener una idea aproximada de los parámetros de la variable que se estudia (bibliografía, estudios previos). 3. Seguridad del estudio (riesgo de cometer un error α) 4. Poder estadístico (1 - β) (riesgo de cometer un error β) 5. Definir si la hipótesis va a ser unilateral o bilateral. 6. Tipo de prueba estadística Ejemplo de comparación de dos proporciones • Se desea evaluar si el tratamiento T2 es mejor que el tratamiento T1 para el alivio del dolor para lo que se diseña un ensayo clínico. Se sabe por datos previos que la eficacia del fármaco habitual está alrededor del 70 % y se considera clínicamente relevante si el nuevo fármaco alivia el dolor en un 90 %. El nivel de riesgo se fija en 0,05 y se desea una potencia estadística de un 80 %. Ejemplo de comparación de dos medias • Se desea utilizar un nuevo fármaco hipoglicemiante y se considera que sería clínicamente eficaz si lograse un descenso de 15 mg/dl respecto al tratamiento habitual hipoglicemiante estándar. Por estudios previos sabemos que la desviación estándar de la glicemia en pacientes que reciben el tratamiento habitual es de 16 mg/dl. Se acepta un riesgo de 0,05 y se desea una potencia estadística del 90 % para detectar diferencias, si es que existen Estudios Descriptivos • Algunos principios son diferentes ▫ No tienen variable predictora o variable resultado ▫ No hay comparación de grupos Conceptos de hipótesis no aplican. • Usualmente se calculan medias o proporciones ▫ Intervalos de confianza Es una medida de precisión del estimado de la muestra. El investigador lo pone (95% o 99%) MUESTREO PARA DETERMINAR PREVALENCIAS • La frecuencia esperada de enfermedad. ▫ puede parecer de entrada un contrasentido ▫ “a ver que sale” ▫ “mi hipótesis es que hay un n% de enfermedad, voy a comprobarlo” • El tamaño de la población ▫ Finita ▫ Infinita • La precisión exigida • El nivel de confianza • n= Tamaño de la muestra, • z= 1,96 para el 95% de confianza, 2,56 para el 99% • p= Frecuencia esperada del factor a estudiar • q= 1- p • B= Precisión o error admitido • p??? ---p =0,5 (50 %) que maximiza el tamaño muestral Muestreo para determinar una media • (a) El nivel de confianza o seguridad, para un nivel de seguridad del 95 %, α=1,96 , para un nivel de seguridad del 99 % α= 2,58 ; • (b) La precisión con que se desea estimar el parámetro • (c) Una idea de la varianza s2 de la distribución de la variable cuantitativa que se supone existe en la población. (desviación estándar) Ejemplo • Si se desea conocer la media de la glucemia basal de una población, con una seguridad del 95 % y una precisión de ± 3 mg/dl y se tiene información a través un estudio piloto o de una revisión bibliográfica que la varianza es de 250 mg/dl Consejos • Haga el cálculo de la muestra con bastante anterioridad • Tener cuidado al categorizar las variables, algunas dicotómicas pueden parecer continuas si se expresan en % ▫ vivo o muerto --- # vivos. • SIEMPRE considere las pérdidas ▫ Pérdida de información, abandono, no respuesta… ▫ Hay fórmulas ▫ 10% o 15% • Siempre se necesitan parámetros previos, el investigador debe ESFORZARSE para obtenerlos. ▫ PERMISOS DE ARCHIVO!! • Gracias!!