ESTADÍSTICA INFERENCIAL

Anuncio
ESTADÍSTICA INFERENCIAL
ESTADÍSTICA INFERENCIAL
Sesión No. 9
Nombre: Pruebas de hipótesis referentes al valor de la media de
la población
Contextualización
Los métodos estadísticos y las técnicas de muestreo son fundamentales en el
desarrollo de un proceso de investigación en ciencias exactas, sociales o de la
comunicación. Por medio de ellos se recolectan, organizan, analizan y presentan
datos para la formulación de conclusiones y la consecuente toma de decisiones.
En general, en un estudio de carácter social se desea investigar las
características que posee una población. Si es posible estudiar a todos sus
miembros, se dice que se realiza un censo; sin embargo, las más de las veces
no se dispone de recursos —personal, tiempo y dinero— para llevar a cabo un
estudio tan amplio.
1
ESTADÍSTICA INFERENCIAL
Introducción al Tema
Así, cuando no es factible realizar un censo, una alternativa es seleccionar sólo
a una parte del total de esta población, parte a la que se denomina muestra.
Dicha muestra se estudia y analiza para determinar las características que la
describen. Si es de tamaño adecuado y ha sido seleccionada correctamente (es
decir, en forma aleatoria para eliminar el sesgo y las tendencias propias del
investigador), las características que la describen pueden generalizarse al total
de la población y, por tanto, se dice de esa muestra que es representativa.
La parte de la estadística que analiza y describe a una muestra se conoce
como estadística descriptiva, mientras que a la parte de la estadística que se
ocupa de generalizar al total de la población las características obtenidas al
analizar una muestra
se le llama estadística inferencial. El muestreo es,
precisamente, uno de los principales aspectos a considerar en el estudio de las
pruebas de hipótesis.
2
ESTADÍSTICA INFERENCIAL
Explicación
Determinación del tamaño de muestra requerido para probar la
media. Muestreo probabilístico
Los métodos estadísticos y las técnicas de muestreo son fundamentales en el
desarrollo de un proceso de investigación en ciencias exactas, sociales o de la
comunicación. Por medio de ellos se recolectan, organizan, analizan y presentan
datos para la formulación de conclusiones y la consecuente toma de decisiones.
Si la muestra es de tamaño adecuado y ha sido seleccionada correctamente, las
características que la describen pueden generalizarse al total de la población,
por lo que se dice que es representativa. La parte de la estadística que analiza y
describe a una muestra se conoce como estadística descriptiva, mientras que a
la parte de la estadística que se ocupa de generalizar al total de la población las
características obtenidas al analizar a una muestra se le llama estadística
inferencial. Ahora bien, con respecto al estudio de las muestras, es importante
reflexionar sobre los siguientes puntos:
• Los datos arrojados al estudiar los elementos de una muestra conllevan un
determinado grado de incertidumbre como resultado de diversos factores.
• Dado que los datos de una muestra conllevan un determinado grado de
incertidumbre.
• Un proceso de muestreo estadístico permite medir, establecer y acotar, en
términos de probabilidad.
• En un proceso de muestreo no es posible lograr un nivel de confianza del cien
por ciento ni un error muestral de cero.
Se denomina parámetros a aquellos atributos que se desea determinar de una
población sujeta a estudio. Ante la imposibilidad de estudiar a la totalidad de la
población,
se
obtienen
los
atributos o
descriptores
de
una
muestra
3
ESTADÍSTICA INFERENCIAL
representativa, a los cuales se conoce como estadígrafos o estadísticas. Los
estadígrafos permiten, a partir de métodos de estadística inferencial, llevar a
cabo la estimación de los parámetros de una población. Los parámetros
poblacionales que con mayor frecuencia se desea conocer son:
•
μ, media.
•
σ2 , varianza.
•
σ, desviación estándar.
•
p, proporción.
Por otra parte, los estadígrafos o estadísticas que generalmente se obtienen de
una muestra son:
•
, media
•
s2, varianza.
•
s, desviación estándar.
•
p, proporción.
A los estimadores de los parámetros poblacionales obtenidos al analizar una
muestra se les denota con circunflejo:
•
•
•
•
µ̂ , estimador
2
de la media poblacional.
, estimador de la varianza poblacional.
, estimador de la desviación estándar poblacional.
P̂ , estimador de la proporción poblacional.
Por ejemplo, en un estudio social puede ser de interés determinar, entre otros
atributos, el valor promedio μ de los ingresos mensuales, estatura, peso y grado
y escolaridad de la población. Asimismo, puede ser importante calcular qué
proporción P de los habitantes de un país consumen tabaco, alcohol y
estupefacientes, o qué proporción de ellos padece una cierta enfermedad. Una
vez determinados los atributos o estadígrafos de la misma, se procederá, por
4
ESTADÍSTICA INFERENCIAL
medio de la estadística inferencial, a estimar los parámetros de toda la población
de la que fue tomada. Este proceso se ilustra en el siguiente esquema:
Características de la muestra
Como ya señalamos, para realizar un adecuado proceso de inferencia
estadística, la muestra debe ser representativa. Para ello debe cumplir con los
siguientes puntos:
1. La muestra debe ser aleatoria. Para evitar en lo posible el sesgo en las
inferencias, la conformación de la muestra debe ser al azar.
2. El tamaño de la muestra debe ser lo suficientemente grande. En tanto mayor
sea el tamaño de una muestra, mayor será su semejanza con el total de la
población. La determinación del tamaño de una muestra depende del atributo
estadístico o parámetro poblacional a medir. Los más frecuentes son:
• μ, media
• σ2 , varianza
diferencia de medidas μ1 – μ2
• P, proporción
diferencia de proporciones, P – P
De tal manera, para estimar el valor de cada uno de los parámetros anteriores se
emplea su fórmula correspondiente. Aunque las fórmulas son diferentes, todas
incluyen para su cálculo dos elementos fundamentales establecidos por el
investigador, a saber: el nivel de confianza y el error estándar. El segundo
elemento remite a la precisión buscada en la estimación. Se busca que el error
5
ESTADÍSTICA INFERENCIAL
estándar sea bajo y, en consecuencia, la precisión sea alta. El error estándar
indica el porcentaje máximo de discrepancia que se está dispuesto a aceptar
entre el parámetro poblacional y su respectivo estimador. Por ejemplo, sean
su estimador. La discrepancia o diferencia entre
ellos se denomina error muestral y se expresa por:
e=
Asimismo, sea eα el error estándar o margen de error a aceptar entre el
parámetro poblacional y su estimador. Esto significa que dado eα , e debe
satisfacer: e ≤ eα
Tamaño de la muestra para la media poblacional
La fórmula para determinar el tamaño de la muestra para estimar la media
poblacional está dada por:
Donde:
• n es el tamaño de la muestra
• σ es la desviación estándar poblacional
• zα/2 es el nivel de confianza
• eα es el error estándar o margen de error
Es común emplear la desviación estándar muestral s como estimador de la
desviación estándar poblacional σ, por lo que la fórmula para el cálculo del
tamaño de la muestra quedaría como sigue:
6
ESTADÍSTICA INFERENCIAL
Conclusión
Las muestras que se utilizan en este medio de estudio no sólo pueden ser
personas, sino que también se trata de elementos físicos tangibles y en
ocasiones elementos no tangibles, esto será determinado por es tipo de estudio
que se realice y los objetivos que se deseen alcanzar.
Las muestras se toman de un pequeño universo, el cual puede o no ser parte de
otro mas grande y se define como un elemento en la investigación en curso, por
ejemplo, se puede tomar una muestra de gente enferma de tos, dentro de el
universo de una institución de salud, en la cual se pueden encontrar personas
con distintos padecimientos. Definir el universo o segmento se hace antes de
cualquier procedimiento matemático que contenga el trabajo.
7
ESTADÍSTICA INFERENCIAL
Método del valor p para pruebas de hipótesis referentes a la
media de la población. Pruebas de hipótesis para la media
poblacional con tamaño de muestra grande (n > 30).
Las pruebas de hipótesis para la media poblacional se clasifican en pruebas de
un extremo y de dos extremos.
1. Prueba de un extremo:
H 0 : µ = µ0
H a : µ > µ0
(o
H a : µ < µ0 )
Estadística de prueba:
Región de rechazo:
z > z < (o z < − z )
En donde zα corresponde al valor de z tal que P(z>zα)=α. Asimismo, μ0
corresponde al valor crítico de la prueba.
2. Prueba de dos extremos:
H 0 : µ = µ0
H a : µ ≠ µ0
Estadística de prueba:
Región de rechazo:
En donde
corresponde al valor de z tal que P(z >
)=
). Asimismo, μ 0
corresponde al valor crítico de la prueba. En ambos casos, α corresponde a la
8
ESTADÍSTICA INFERENCIAL
probabilidad de cometer un error del tipo I. En pruebas de hipótesis, se le conoce
como nivel de significancia de la prueba y se desea que sea bajo e, incluso,
cercano a cero.
Ejemplo: Una compañía pone a la venta un enjuague bucal que contiene una
cierta cantidad por mililitro de un elemento químico que puede dañar la capa de
esmalte. La norma establece que el nivel permitido de tal componente químico
no debe sobrepasar las dos unidades por mililitro. Se sospecha que la compañía
que fabrica este producto no está atendiendo a la norma, por lo que las
autoridades sanitarias inician una investigación analizando una muestra
representativa de 100 elementos. Calculando el nivel medio
de sustancia por
mililitro de la muestra, se obtiene un valor de 2.01, con una desviación estándar
s de 0.3. Elabore una prueba de hipótesis para la media con un nivel de
significancia α del 1 por ciento.
Solución: Se trata de una prueba de un extremo:
Asimismo, se tiene que:
=2.01
s= 0.3
n=100
H0 : µ =
Ha : µ > 2
=0.01
De las tablas de distribución normal, se tiene que:
El valor de
conforma el valor critico que nos permite definir la región
de rechazo: z>2.33 finalmente, se calcula la estadística de prueba:
Como z < 2.33 , se acepta la hipótesis nula H0 : µ = 2
9
ESTADÍSTICA INFERENCIAL
Nivel de significancia observado o valor p
Este nivel de significancia observado o valor p de una prueba estadística se
refiere a la probabilidad (bajo el supuesto de que H0 es verdadera) de encontrar
un valor de la estadística de prueba que contradiga a la hipótesis nula y, en
consecuencia, sustente la hipótesis alternativa en por lo menos la misma medida
en que lo hace el valor que se calcula a partir de los datos de la muestra.
10
ESTADÍSTICA INFERENCIAL
Actividad de Aprendizaje
Instrucciones:
Con la finalidad de reforzar los conocimientos adquiridos a lo largo de esta
sesión, ahora tendrás que realizar una actividad en la cual a través de un cuadro
sinóptico expliques los tipos de hipótesis y los elementos que definen a cada una
de éstas.
Puedes realizarlo en cualquier programa, al final tendrás que guardarlo como
imagen en formato JPG, con la finalidad de subirlo a la plataforma de la
asignatura.
11
ESTADÍSTICA INFERENCIAL
Bibliografía
García, M. (2005). Introducción a la teoría de la probabilidad. México: Fondo de
Cultura Económica.
Hernández, A. y O. Hernández (2003). Elementos de probabilidad y estadística.
México: Sociedad Matemática Mexicana.
Meyer, P. (1986). Probabilidad y aplicaciones estadísticas. E.U.: Addison-Wesley
Iberoamericana.
Ulloa, V. y V. Quijada (2006). Estadística aplicada a la comunicación. México:
UNAM.
Lipschutz, S. (1988). Probabilidad. México: McGraw-Hill.
12
Descargar