2 DISTRIBUCIÓN MUESTRAL DE LA MEDIA LOGRO DE LA SESIÓN Al finalizar la sesión de aprendizaje el estudiante conoce y aplica la distribución muestral de la media. La distribución muestral es la distribución de probabilidad de una estadística obtenida a partir de todas las posibles muestras de tamaño n, elegidas al azar de una población determinada. Las distribuciones muestrales adoptan diferentes formas según las estadísticas investigadas y las características de la población estudiada. Las aplicaciones de las distribuciones muestrales son aplicaciones del teorema del límite central. 2.1 Distribución muestral de la media Consiste en tomar de una población todas las muestras posibles de tamaño n. Luego se calcula las medias de cada muestra, obteniéndose así la distribución de todas las medias muestrales posibles: 2.1.1. Si la varianza σ2 es conocida Sea X 1 , X 2 , · · · , X n una muestra aleatoria de tamaño n escogida de una población f (x) que tiene una media µ y varianza σ2 , entonces: ³ ´ µX = E X = µ ³ ´ σ2 σ2 = V ar X = X n ³ ´ Para n suficientemente grande (n ≥ 30): X ≈ N µ X , σ2 . Entonces, X Z= UTP Sede Arequipa X − µX σX 1 ≈ N (0; 1) Guia 02 DISTRIBUCIÓN MUESTRAL DE LA MEDIA σ Donde: µ X = µ y σ X = p n Notas: ³ ´ Si la población es normal N (µ, σ2 ), entonces X ∼ N µ X , σ2 para n ≥ 2. X ³ ´ Si la población no es normal (población discreta o continua), entonces X ≈ N µ X , σ2 para n ≥ 30. X Si el muestreo es con o sin reposición en una población infinita, o con reposición en una población finita, σ2 entonces, σ2 = . X n ¶ µ 2 ¶µ N −n σ 2 , donde Si el muestreo es sin reposición en una población finita de tamaño N , entonces, σ = X n N −1 N −n se denomina factor de corrección para la población finita. Observe que cuando N → +∞ el factor de N −1 corrección tiende a uno. 2.1.2. Si la varianza σ2 es desconocida 2.1.2.1. Si la muestra es grande (n ≥ 30) Sea X 1 , X 2 , · · · , X n una muestra aleatoria de tamaño n escogida de una población f (x) (población no normal) que ³ ´ S2 b 2 , donde, µ X = µ y σ b2 = tiene una media µ y varianza σ2 , entonces: X ≈ N µ X , σ X X n Por tanto, X − µX Z= ≈ N (0; 1) bX σ 2.1.2.2. Si la muestra es pequeña (n < 30) Sea X 1 , X 2 , · · · , X n una muestra aleatoria de tamaño n escogida de una población normal N (µ, σ2 ) que tiene una media µ y varianza σ2 , entonces: X −µ T= ∼ t (n−1) bX σ S bX = p Donde, σ n Distribución t de Student: Se dice que una variable aleatoria X tiene distribución t de Student con m grados de libertad y se escribe X ∼ t (m) , si su función densidad de probabilidad es dado por: ¡ ¢ Γ m+1 2 ¡ ¢³ f (x) = p mπΓ m 2 1 1+ x2 m ´ m+1 ; − ∞ < x < ∞, m = 1, 2, 3, · · · 2 La distribución t de Student es muy similar una distribución normal N (0, 1), ya que ambas tienen como dominio todos los reales, son simétricas con respecto a su media cero. Las dos tienen gráficas de su función densidad en forma de una campana. A medida que m tome valores mayores a 30, la distribución t de Student se aproxima cada vez más a la distribución normal estándar N (0, 1). Propiedad: Sean Z una variable aleatoria N (0, 1) y V una variable aleatoria χ2(n) . Si Z y V son independientes, entonces la distribución de la variable: Z T = q ∼ t (m) V m UTP Sede Arequipa 2 Guia 02 E STADÍSTICA I NFERENCIAL Figura 2.1: Gráfica de la distribución t de Student y la distribución normal estándar Ejemplo 2.1 Se tiene una población de 4 obreros calificados, los cuales tienen los siguientes ingresos por laborar horas extras a la semana: $758, $618, $550, $589. a. Calcule la media y la varianza de la población. b. Si se extrae una muestra aleatoria de tamaño 2, sin reposición, calcule la media y la varianza de la media muestral. c. Si se extrae una muestra aleatoria de tamaño 2, con reposición, calcule la media y la varianza de la media muestral. UTP Sede Arequipa 3 Guia 02 DISTRIBUCIÓN MUESTRAL DE LA MEDIA d. Si se extrae una muestra aleatoria de tamaño 50, con reposición, calcule la distribución de la media muestral. e. Calcule el error estándar de la media de las muestras aleatorias elegidas con reposición de tamaño 2 y 50. ¿Cuál es el efecto del tamaño de muestra en el valor del error estándar? Ejemplo 2.2 El tiempo que los operarios de una fábrica textil utilizan para confeccionar una camisa, es una variable aleatoria que tiene distribución normal con una media de 15 minutos y desviación estándar de 4 minutos. Si se seleccionan muestras aleatorias de 15 camisas. a. Determine la distribución muestral del tiempo medio empleado para su confección. b. Calcule la probabilidad de que la media para el tiempo de confección de las muestras aleatorias sea menor que 16 minutos. UTP Sede Arequipa 4 Guia 02 E STADÍSTICA I NFERENCIAL c. Calcule la probabilidad de que la media para el tiempo de confección de las muestras aleatorias se encuentre entre 13 y 17 minutos. Ejemplo 2.3 El precio del petróleo por galón, vendido a nivel nacional tiene una media de 1.2 dólares y una desviación estándar de 0.2 dólares, el precio del petróleo por galón se distribuye de forma normal entre las diferentes gasolineras que existen a nivel nacional. a. Si un inspector estatal desea observar una diferencia máxima entre la media muestral y la media poblacional de 0.05 dólares, con una probabilidad del 95 %, ¿cuántas gasolineras deberá de tomar como muestra? b. Si se toma una muestra de 62 gasolineras, ¿cuál es la probabilidad de que el precio medio por galón de petróleo se encuentre entre 1.14 y 1.26 dólares? UTP Sede Arequipa 5 Guia 02 DISTRIBUCIÓN MUESTRAL DE LA MEDIA EJERCICIOS ADICIONALES 1. Para la seguridad del presidente de la república se adquirió cinco camionetas blindadas; entre las tantas variables que se puede observar, el peso de la camioneta es muy importante ya que, si hubiese un atentado, la capacidad de la camioneta para salir del del lugar y ponerse a salvo depende mucho del peso. A continuación, se muestra el peso en kilogramos de las cinco camionetas adquiridas para la seguridad del presidente (Considere estas cinco camionetas como la población de vehículos a disposición del presidente) 3800kg, 3750kg, 3900kg, 3850kg, 4000kg. a. Para cualquier muestra de tamaño 40, donde el muestreo es con reposición. Calcule la distribución muestral de la media para la variable en observación. b. Para la muestra de tamaño 40 ¿Cuál es la probabilidad de que la media muestral sea al menos 3850 kilogramos? (muestreo con reposición). 2. La demanda diaria de un producto es una variable aleatoria con función de probabilidad: x 0 1 2 3 4 p(x) 0.30 0.20 0.25 0.10 0.15 a. Determine la distribución muestral de la demanda promedio de 36 días. b. ¿Cuál es la probabilidad de que la demanda promedio de 36 días esté entre 1 y 2? 3. El salario anual promedio de la población para los especialistas en cumplimiento ambiental es de $63500 y una desviación estándar de $7500. Se toma una muestra aleatoria de 35 especialistas que proviene de esta población. a. Determine la distribución de la media muestral. b. ¿Cuál es la probabilidad de que el salario promedio de la muestra sea mayor a $60000? c. ¿Cuál es la probabilidad de que el salario promedio de la muestra este entre $62000 y $65000? 4. Las botellas de la bebida Rica Kola familiar tienen un contenido medio de 2.5 litros y una desviación estándar de 0.1 litros. a. Si se toma una muestra aleatoria de 36 botellas, calcule la probabilidad que las botellas tengan una media de llenado mayor a 2.48 litros. b. ¿Cuántas botellas se deberán escoger para que la media muestral difiera de la media poblacional en a lo más 0.05 litros con una probabilidad de 0.994? 5. Una empresa vende bloques de mármol cuyo peso se distribuye normalmente con media de 200 kilogramos. a. Calcular la varianza del peso de los bloques, si la probabilidad de que el peso esté entre 165 Kg. y 235 Kg., es 0.9876. b. Si se toma una muestra de 50 bloques, calcular la probabilidad de que el peso medio de la muestra sea inferior a 202 Kg. TAREA DOMICILIARIA 1. La agencia de aduanas de Estados Unidos revisa a todos los pasajeros que llegan del extranjero cuando entran al país. La agencia informa que en promedio se encuentra que 42 personas diarias, con una desviación estándar de 11, llevan material de contrabando al entrar a Estados Unidos a través del aeropuerto John F. Kennedy de Nueva York. ¿Cuál es la probabilidad que en 5 días en el aeropuerto, el número promedio de pasajeros que llevan contrabando excedan los 50? UTP Sede Arequipa 6 Guia 02 E STADÍSTICA I NFERENCIAL 2. La vida media de unas baterías para radio portátil es 35 horas. La distribución de los tiempos de vida de estas baterías sigue una distribución normal con desviación estándar de 5.5 horas. Como parte del programa de pruebas de sus artículos el fabricante de radios portátiles prueba una muestra de 25 baterías. ¿Cuál es la probabilidad de que la vida media de la muestra sea mayor que 36 horas? 3. Un proceso automático envasa café en frascos cuyo peso neto tiene una media de 500 gramos y una desviación estándar 4.5 gramos. Para controlar el proceso cada hora se pesan 64 frascos, si el peso neto medio está entre 498.5 y 501.5 gramos se continúa con el proceso, caso contrario se detiene el proceso para reajustar la máquina. ¿Cuál es la probabilidad de realizar un reajuste en la máquina? UTP Sede Arequipa 7 Guia 02