medigraphic Artemisa en línea Dermatología Rev Mex 2005;49:91-93 Metodología de la investigación aplicada a la dermatología Estudios para determinar prevalencia María Luisa Peralta* P or su finalidad los estudios para determinar prevalencia son descriptivos. Los estudios descriptivos, de acuerdo con el número de puntos en el tiempo en los cuales se recolectan datos, pueden ser transversales o longitudinales. Son transversales cuando se toman datos de un momento determinado (una medición) y su finalidad es describir el nivel o estado de una o diversas variables en un punto en el tiempo. Son longitudinales cuando se efectúa seguimiento, es decir, varias mediciones de la(s) misma(s) variable(s) en momentos diferentes, con la finalidad de estudiar cómo evolucionan o cambian a través del tiempo o si existe relación entre ellas. ESTUDIOS DE PREVALENCIA Y ASOCIACIÓN CRUZADA La prevalencia es la proporción de individuos que poseen una característica particular en un momento determinado, por definición son estudios transversales. Cuando la población de interés es accesible en su totalidad, por ejemplo, la prevalencia de Corynebacterium sp en niños con queratosis plantar que acuden a un determinado centro de atención dermatológica, por ser poco frecuente, no es necesario una muestra, simplemente se estudia toda la población. Se requiere calcular el tamaño de una muestra cuando estudiar a toda la población es poco práctico o costoso. Así se obtienen los valores probables de las variables * Médica familiar y maestra en ciencias. Correspondencia: Dra. María Luisa Peralta. Av. Vértiz 464, col. Buenos Aires, CP 06780, México, DF. E-mail: luisaperalta@netscape.net La versión completa de este artículo también está disponible en internet: www.revistasmedicasmexicanas.com.mx Dermatología Rev Mex Volumen 49, Núm. 2, marzo-abril, 2005 de interés de la población a partir de los valores obtenidos en la muestra; a esto se le llama inferencia o estimación estadística de la prevalencia. Para que la estimación sea realmente representativa de la población es indispensable que el muestreo sea al azar (forma de pdf elaborado seleccionar a los por sujetos medigraphic de estudio). Requiere también que se registre el número de no respuestas y las causas de las mismas. Si es un porcentaje pequeño y sus motivos no están relacionados con la variable de estudio la validez de los resultados es mayor. Cuando sólo se estima la prevalencia se le denomina estudio transversal descriptivo y cuando, además, se explora la relación entre dos o más variables se le llama transversal analítico. El alcance de este diseño permite hacer conclusiones acerca de la frecuencia probable de la(s) variable(s) en la población de interés y si es analítico, sospechar probables factores de riesgo. Los resultados obtenidos son la base para estudios analíticos posteriores. Cuando se planea realizar un estudio de prevalencia debe conocerse perfectamente la variable motivo del estudio, saber en qué otras poblaciones se ha medido, de estas poblaciones qué características son similares a la población que se pretende estudiar, qué otras variables pueden influir en su manifestación o son consecuencia de la variable en estudio, etc. Esto tiene dos objetivos: el primero, establecer qué otras variables es importante medir, ya que incluir variables que no tengan utilidad clara para el motivo de estudio sólo genera mayor gasto de tiempo, dinero y esfuerzo; favorece que se complique el análisis y que los resultados principales sean confusos. En segundo lugar, que el cálculo del tamaño de muestra sea lo más apegado posible a la realidad. Para calcular el tamaño de muestra es necesario revisar los siguientes conceptos: identificar la naturaleza de la variable de interés, su escala de medición, las medidas de resumen y dispersión y, en 91 Peralta ML caso de duda, consultar los números anteriores de esta serie. Si se tiene más de una variable de interés deberá realizarse el cálculo para todas y utilizar el mayor tamaño obtenido. Con las mediciones efectuadas en la muestra se obtiene el valor de la variable de interés, que puede ser una media o una proporción; esto se conoce como estimación puntual. Sin embargo, a partir del valor observado en una única muestra no puede conocerse con exactitud el verdadero valor en la población de origen, es tan sólo una aproximación, pero puede calcularse un intervalo de valores en el cual es muy probable que se encuentre la estimación puntual real de la población; a esto se le llama intervalo de confianza. Para calcular el tamaño de muestra se toman en cuenta la amplitud y el nivel de confianza de este intervalo. Ambos valores se fijan en función de los intereses del investigador, respetando ciertas normas. La amplitud del intervalo se establece de acuerdo con la magnitud de la precisión que desea obtenerse en la estimación; a medida que el investigador requiera mayor precisión tendrá que establecer un intervalo más estrecho y, por lo tanto, aumentará el tamaño de muestra. El nivel de confianza es la probabilidad de que el valor real de la población se encuentre dentro del intervalo de confianza. Por consenso se ha aceptado como ideal un intervalo de confianza del 95% (IC95%), lo cual quiere decir que hay 95% de probabilidad de que la media o proporción real de la población se encuentre dentro de los límites del intervalo calculado. El investigador puede aumentar la confianza pero el resultado será un mayor tamaño de muestra. Al 5% complemento de la confianza se le denomina alfa y es el riesgo que existe de que la prevalencia real de la población se encuentre fuera del intervalo determinado por la muestra, este 5% se traduce en una distribución zeta de dos colas como 1.96. Por último, será necesario determinar la variabilidad de la variable de interés en la población. En caso de variables cuantitativas es la variancia, si es cualitativa la proporción que se supone existe en la población. En la mayor parte de los casos este dato no se conoce, pero puede obtenerse de poblaciones similares, mediante revisión bibliográfica o, en última instancia, tomar al azar 10 a 30 sujetos para medir la variable y calcular su variación. A mayor variabilidad 92 o frecuencia de la variable, mayor tamaño de muestra (ejemplos 1 y 2). En los cálculos anteriores no se toma en cuenta el tamaño de la población, se asume que es infinito. Cuando se conoce el número total de sujetos de una población de estudio puede hacerse una corrección, para ajustar el número de sujetos necesarios en función del tamaño de la población: n 2 = n 1/ [1+(n 1/N), donde n 1 es el tamaño de muestra calculado para poblaciones infinitas y N el tamaño de la población. RESULTADOS Y ANÁLISIS ESTADÍSTICO En la sección de resultados debe tenerse especial pdf elaborado por cuidado en que semedigraphic presenten en forma sistemática y sin comentarios. Se inicia por describir las características generales de la muestra que se estudió, ya sea en forma numérica, con medidas de resumen, en cuadros o gráficas; un mismo resultado no debe presentarse en más de una de estas tres formas. En seguida, el resultado de la estimación motivo del estudio, el porcentaje o promedio encontrado en la muestra con su desviación estándar y sus intervalos de confianza. Y, por último, si se hallaron relaciones entre los resultados del análisis bivariado o multivariado. Se describió otra variedad de estudios transversales en la cual el objetivo no fue determinar la prevalencia, sino comparar una o más variables de dos o más grupos. Estos estudios se denominan transversales comparativos y también son de tipo exploratorio. Su muestreo es no probabilístico y, por lo regular, de casos consecutivos. En este tipo de diseño lo esencial es obtener grupos que sean comparables. Entre los estudios descriptivos se encuentra el reporte de casos, que puede ser transversal o longitudinal. El primer caso consiste en la descripción de las variables de interés de un grupo de personas en un momento determinado. Un reporte longitudinal de casos, también llamado seguimiento de cohorte, describe la evolución de las variables de interés de un grupo de personas que tienen una determinada enfermedad en común. En ambos casos son los estudios que tienen menor alcance, no permiten determinar prevalencias, comparaciones y, mucho menos, determinar eficacia e inocuidad de ningún tratamiento. Sólo son informativos. Dermatología Rev Mex Volumen 49, Núm. 2, marzo-abril, 2005 Estudios para determinar prevalencia Ejemplo 1 Estimar la media de la concentración urinaria de arsénico de los habitantes de un poblado en que se sospecha contaminación del agua potable. Como no se conoce la variabilidad en una situación similar se efectuó determinación urinaria de arsénico a 10 personas e hipotéticamente se obtuvieron, en promedio, 100 µg/dL y desviación estándar de 70 µg/ dL. La precisión deseada era de ± 30 µg/dL. Fórmula para estimar una media n= Zα2 S2 e2 n= (1.96)2(70)2 30 2 n = 21 personas Resultados: el promedio y desviación estándar de arsénico en los sujetos de la muestra fue de 150 ± 50 µg/dL (IC95% 127-173). Interpretación: con 95% de probabilidad la concentración promedio de arsénico en orina de los habitantes de esa población se encontró entre 127 y 173 µg/dL. Para calcular el tamaño de la muestra se utilizó una desviación estándar mayor a la que en realidad se encontró, lo cual quiere decir que la variación de las concentraciones de arsénico en la población es menor a la que se sospechó y ocasiona que la estimación tenga mayor precisión (para el cálculo se utilizó precisión de ± 30 µg/dL y el intervalo de confianza obtenido con la muestra fue de ± 23 µg/dL). Ejemplo 2 Determinar la prevalencia de dermatitis atópica en lactantes hijos de mujeres con trabajo remunerado. La prevalencia de dermatitis atópica en la infancia reportada en la bibliografía va del 5 al 20%, aunque se supone que entre los niños hijos de madres trabajadoras podría ser mayor, por lo que se utilizará 30% como prevalencia probable. En la fórmula se saca su complemento 30-100 = 70, donde p es la prevalencia probable y q es su complemento en su forma decimal. Se desea precisión de ± 5%, que en decimales es 0.05. Fórmula para estimar una proporción n= Zα2 p(q) e2 n= (1.96)2 (0.30)(0.70) (0.05)2 n = 323 pacientes En el programa Epi Info se ingresa en statcalc el tamaño de muestra y los estudios de población. Solicita cuatro datos, el primero es el tamaño de la población, si se conoce se anota y se efectúa el cálculo con ajuste pdf elaborado finita, por medigraphic de población si no se conoce no se llena ese campo. El segundo dato es la prevalencia que se sospecha en la población (variabilidad); si no se conoce se deja 50%, que dará el máximo tamaño de muestra necesario. El tercero es el error máximo aceptable en la estimación, es decir, la precisión. Por último se selecciona el nivel de confianza deseado. En el caso del ejemplo 2 no se llena el tamaño de población, enexpected frequency se anota la prevalencia probable en el ejemplo 30.0; worst acceptable corresponde a la precisión, como se estipuló del 5%, y esto se le resta a la prevalencia probable, por lo tanto sería 25.0. El resultado se busca en la confianza, que corresponde a 95%. Resultados: la prevalencia de dermatitis atópica en los sujetos de la muestra fue de 25% (IC95% 20-30%). Interpretación: con probabilidad de 95% la prevalencia de dermatitis atópica en lactantes hijos de mujeres con trabajo remunerado se encuentra entre 20 y 30%. BIBLIOGRAFÍA 1. 2. Clayton D, Hills M. Statistical models in epidemiology. Oxford: Oxford University Press, 1993. McNeil D. Epidemiological research methods. New York: John Wiley & Sons, 1999. XXII Congreso Mexicano de Dermatología Morelia, 2006 Del 24 al 28 de octubre del 2006 Dermatología Rev Mex Volumen 49, Núm. 2, marzo-abril, 2005 93