ESTADÍSTICA INFERENCIAL ESTADÍSTICA INFERENCIAL Sesión No. 9 Nombre: Pruebas de hipótesis referentes al valor de la media de la población Contextualización Los métodos estadísticos y las técnicas de muestreo son fundamentales en el desarrollo de un proceso de investigación en ciencias exactas, sociales o de la comunicación. Por medio de ellos se recolectan, organizan, analizan y presentan datos para la formulación de conclusiones y la consecuente toma de decisiones. En general, en un estudio de carácter social se desea investigar las características que posee una población. Si es posible estudiar a todos sus miembros, se dice que se realiza un censo; sin embargo, las más de las veces no se dispone de recursos —personal, tiempo y dinero— para llevar a cabo un estudio tan amplio. 1 ESTADÍSTICA INFERENCIAL Introducción al Tema Así, cuando no es factible realizar un censo, una alternativa es seleccionar sólo a una parte del total de esta población, parte a la que se denomina muestra. Dicha muestra se estudia y analiza para determinar las características que la describen. Si es de tamaño adecuado y ha sido seleccionada correctamente (es decir, en forma aleatoria para eliminar el sesgo y las tendencias propias del investigador), las características que la describen pueden generalizarse al total de la población y, por tanto, se dice de esa muestra que es representativa. La parte de la estadística que analiza y describe a una muestra se conoce como estadística descriptiva, mientras que a la parte de la estadística que se ocupa de generalizar al total de la población las características obtenidas al analizar una muestra se le llama estadística inferencial. El muestreo es, precisamente, uno de los principales aspectos a considerar en el estudio de las pruebas de hipótesis. 2 ESTADÍSTICA INFERENCIAL Explicación Determinación del tamaño de muestra requerido para probar la media. Muestreo probabilístico Los métodos estadísticos y las técnicas de muestreo son fundamentales en el desarrollo de un proceso de investigación en ciencias exactas, sociales o de la comunicación. Por medio de ellos se recolectan, organizan, analizan y presentan datos para la formulación de conclusiones y la consecuente toma de decisiones. Si la muestra es de tamaño adecuado y ha sido seleccionada correctamente, las características que la describen pueden generalizarse al total de la población, por lo que se dice que es representativa. La parte de la estadística que analiza y describe a una muestra se conoce como estadística descriptiva, mientras que a la parte de la estadística que se ocupa de generalizar al total de la población las características obtenidas al analizar a una muestra se le llama estadística inferencial. Ahora bien, con respecto al estudio de las muestras, es importante reflexionar sobre los siguientes puntos: • Los datos arrojados al estudiar los elementos de una muestra conllevan un determinado grado de incertidumbre como resultado de diversos factores. • Dado que los datos de una muestra conllevan un determinado grado de incertidumbre. • Un proceso de muestreo estadístico permite medir, establecer y acotar, en términos de probabilidad. • En un proceso de muestreo no es posible lograr un nivel de confianza del cien por ciento ni un error muestral de cero. Se denomina parámetros a aquellos atributos que se desea determinar de una población sujeta a estudio. Ante la imposibilidad de estudiar a la totalidad de la población, se obtienen los atributos o descriptores de una muestra 3 ESTADÍSTICA INFERENCIAL representativa, a los cuales se conoce como estadígrafos o estadísticas. Los estadígrafos permiten, a partir de métodos de estadística inferencial, llevar a cabo la estimación de los parámetros de una población. Los parámetros poblacionales que con mayor frecuencia se desea conocer son: • μ, media. • σ2 , varianza. • σ, desviación estándar. • p, proporción. Por otra parte, los estadígrafos o estadísticas que generalmente se obtienen de una muestra son: • , media • s2, varianza. • s, desviación estándar. • p, proporción. A los estimadores de los parámetros poblacionales obtenidos al analizar una muestra se les denota con circunflejo: • • • • µ̂ , estimador 2 de la media poblacional. , estimador de la varianza poblacional. , estimador de la desviación estándar poblacional. P̂ , estimador de la proporción poblacional. Por ejemplo, en un estudio social puede ser de interés determinar, entre otros atributos, el valor promedio μ de los ingresos mensuales, estatura, peso y grado y escolaridad de la población. Asimismo, puede ser importante calcular qué proporción P de los habitantes de un país consumen tabaco, alcohol y estupefacientes, o qué proporción de ellos padece una cierta enfermedad. Una vez determinados los atributos o estadígrafos de la misma, se procederá, por 4 ESTADÍSTICA INFERENCIAL medio de la estadística inferencial, a estimar los parámetros de toda la población de la que fue tomada. Este proceso se ilustra en el siguiente esquema: Características de la muestra Como ya señalamos, para realizar un adecuado proceso de inferencia estadística, la muestra debe ser representativa. Para ello debe cumplir con los siguientes puntos: 1. La muestra debe ser aleatoria. Para evitar en lo posible el sesgo en las inferencias, la conformación de la muestra debe ser al azar. 2. El tamaño de la muestra debe ser lo suficientemente grande. En tanto mayor sea el tamaño de una muestra, mayor será su semejanza con el total de la población. La determinación del tamaño de una muestra depende del atributo estadístico o parámetro poblacional a medir. Los más frecuentes son: • μ, media • σ2 , varianza diferencia de medidas μ1 – μ2 • P, proporción diferencia de proporciones, P – P De tal manera, para estimar el valor de cada uno de los parámetros anteriores se emplea su fórmula correspondiente. Aunque las fórmulas son diferentes, todas incluyen para su cálculo dos elementos fundamentales establecidos por el investigador, a saber: el nivel de confianza y el error estándar. El segundo elemento remite a la precisión buscada en la estimación. Se busca que el error 5 ESTADÍSTICA INFERENCIAL estándar sea bajo y, en consecuencia, la precisión sea alta. El error estándar indica el porcentaje máximo de discrepancia que se está dispuesto a aceptar entre el parámetro poblacional y su respectivo estimador. Por ejemplo, sean su estimador. La discrepancia o diferencia entre ellos se denomina error muestral y se expresa por: e= Asimismo, sea eα el error estándar o margen de error a aceptar entre el parámetro poblacional y su estimador. Esto significa que dado eα , e debe satisfacer: e ≤ eα Tamaño de la muestra para la media poblacional La fórmula para determinar el tamaño de la muestra para estimar la media poblacional está dada por: Donde: • n es el tamaño de la muestra • σ es la desviación estándar poblacional • zα/2 es el nivel de confianza • eα es el error estándar o margen de error Es común emplear la desviación estándar muestral s como estimador de la desviación estándar poblacional σ, por lo que la fórmula para el cálculo del tamaño de la muestra quedaría como sigue: 6 ESTADÍSTICA INFERENCIAL Conclusión Las muestras que se utilizan en este medio de estudio no sólo pueden ser personas, sino que también se trata de elementos físicos tangibles y en ocasiones elementos no tangibles, esto será determinado por es tipo de estudio que se realice y los objetivos que se deseen alcanzar. Las muestras se toman de un pequeño universo, el cual puede o no ser parte de otro mas grande y se define como un elemento en la investigación en curso, por ejemplo, se puede tomar una muestra de gente enferma de tos, dentro de el universo de una institución de salud, en la cual se pueden encontrar personas con distintos padecimientos. Definir el universo o segmento se hace antes de cualquier procedimiento matemático que contenga el trabajo. 7 ESTADÍSTICA INFERENCIAL Método del valor p para pruebas de hipótesis referentes a la media de la población. Pruebas de hipótesis para la media poblacional con tamaño de muestra grande (n > 30). Las pruebas de hipótesis para la media poblacional se clasifican en pruebas de un extremo y de dos extremos. 1. Prueba de un extremo: H 0 : µ = µ0 H a : µ > µ0 (o H a : µ < µ0 ) Estadística de prueba: Región de rechazo: z > z < (o z < − z ) En donde zα corresponde al valor de z tal que P(z>zα)=α. Asimismo, μ0 corresponde al valor crítico de la prueba. 2. Prueba de dos extremos: H 0 : µ = µ0 H a : µ ≠ µ0 Estadística de prueba: Región de rechazo: En donde corresponde al valor de z tal que P(z > )= ). Asimismo, μ 0 corresponde al valor crítico de la prueba. En ambos casos, α corresponde a la 8 ESTADÍSTICA INFERENCIAL probabilidad de cometer un error del tipo I. En pruebas de hipótesis, se le conoce como nivel de significancia de la prueba y se desea que sea bajo e, incluso, cercano a cero. Ejemplo: Una compañía pone a la venta un enjuague bucal que contiene una cierta cantidad por mililitro de un elemento químico que puede dañar la capa de esmalte. La norma establece que el nivel permitido de tal componente químico no debe sobrepasar las dos unidades por mililitro. Se sospecha que la compañía que fabrica este producto no está atendiendo a la norma, por lo que las autoridades sanitarias inician una investigación analizando una muestra representativa de 100 elementos. Calculando el nivel medio de sustancia por mililitro de la muestra, se obtiene un valor de 2.01, con una desviación estándar s de 0.3. Elabore una prueba de hipótesis para la media con un nivel de significancia α del 1 por ciento. Solución: Se trata de una prueba de un extremo: Asimismo, se tiene que: =2.01 s= 0.3 n=100 H0 : µ = Ha : µ > 2 =0.01 De las tablas de distribución normal, se tiene que: El valor de conforma el valor critico que nos permite definir la región de rechazo: z>2.33 finalmente, se calcula la estadística de prueba: Como z < 2.33 , se acepta la hipótesis nula H0 : µ = 2 9 ESTADÍSTICA INFERENCIAL Nivel de significancia observado o valor p Este nivel de significancia observado o valor p de una prueba estadística se refiere a la probabilidad (bajo el supuesto de que H0 es verdadera) de encontrar un valor de la estadística de prueba que contradiga a la hipótesis nula y, en consecuencia, sustente la hipótesis alternativa en por lo menos la misma medida en que lo hace el valor que se calcula a partir de los datos de la muestra. 10 ESTADÍSTICA INFERENCIAL Actividad de Aprendizaje Instrucciones: Con la finalidad de reforzar los conocimientos adquiridos a lo largo de esta sesión, ahora tendrás que realizar una actividad en la cual a través de un cuadro sinóptico expliques los tipos de hipótesis y los elementos que definen a cada una de éstas. Puedes realizarlo en cualquier programa, al final tendrás que guardarlo como imagen en formato JPG, con la finalidad de subirlo a la plataforma de la asignatura. 11 ESTADÍSTICA INFERENCIAL Bibliografía García, M. (2005). Introducción a la teoría de la probabilidad. México: Fondo de Cultura Económica. Hernández, A. y O. Hernández (2003). Elementos de probabilidad y estadística. México: Sociedad Matemática Mexicana. Meyer, P. (1986). Probabilidad y aplicaciones estadísticas. E.U.: Addison-Wesley Iberoamericana. Ulloa, V. y V. Quijada (2006). Estadística aplicada a la comunicación. México: UNAM. Lipschutz, S. (1988). Probabilidad. México: McGraw-Hill. 12