INFERENCIA ESTADÍSTICA. CONTRASTE DE HIPÓTESIS 1. El peso medio de una muestra aleatoria de 100 naranjas de una determinada variedad es de 272 g. Se sabe que la desviación típica poblacional es de 20 g. ¿A un nivel de significación de 0,05 hay suficiente evidencia para refutar la afirmación de que el peso medio de la población es de 275 g? Solución: Puede plantearse como un contraste de hipótesis sobre la media. Hipótesis nula, H0: µ = 275 Hipótesis alternativa, H1: µ ≠ 275 Si se admite la hipótesis nula, las medias muestrales siguen una distribución: 20 N 275, = N (275, 2) 100 Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando: σ σ x ∉ µ − Z α/2 ,µ + Z α/2 n n siendo x la media muestral, σ la desviación típica, n el tamaño de la muestra y Zα/2 el valor correspondiente en la tabla normal para un nivel de confianza de 1 − α (nivel de significación α). En nuestro caso se tiene: µ = 275, n = 100 y, para un nivel de significación del 0,05 (95 % de confianza), Zα/2 = 1,96. Luego: σ σ 20 20 ,µ + Z α/2 , 275 + 1,96 µ − Z α/2 = 275 − 1,96 = (271,08; 278,92) n n 100 100 Como x = 272 ∈ (268,08; 275,92), no puede rechazarse la hipótesis nula. Por tanto, podemos admitir que el peso medio es de 275 g. 2. Un estudio realizado en el ámbito de la Unión Europea concluye que la edad de los propietarios de un automóvil "Mercedes" en el momento de su adquisición tiene un comportamiento Normal con media 38 años y varianza 16. Un concesionario de dicha marca, instalado recientemente en España, ha vendido sólo 150 vehículos y ha comprobado que la edad media de sus clientes es de 38,3 años. Aceptando para los clientes españoles la varianza obtenida para los clientes europeos, ¿se puede aceptar que la edad media al adquirir un vehículo de esa marca es la misma en España que en Europa, para un nivel de significación del 5 %? Solución: Hay que hacer un contraste de hipótesis (bilateral) para la media. Hipótesis nula, H0: µ = 38 Hipótesis alternativa, H1: µ ≠ 38 Si se admite la hipótesis nula, las medias muestrales siguen una distribución: 4 N 38, = N (38; 0,33) 150 Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando: σ σ x ∉ µ − Z α/2 ,µ + Z α/2 n n siendo n el tamaño muestral, x la media de la muestra, σ la desviación típica y Zα/2 el valor correspondiente en la tabla normal para una confianza de 1 − α. Si se rechaza H0 hay que admitir que la media ha cambiado. En este caso: Dpto. de Matemáticas 1/9 IES “Ramón Olleros” µ = 38 σ=4 n = 150 y Zα/2 = 1,96 Por tanto, la región de aceptación es: σ σ 4 4 ,µ + Z α/2 ,38 + 1,96 µ − Z α/2 = 38 − 1,96 = (37,36; 38,64) n n 150 150 Como 38,3 ∈ (37,36; 38,64) no puede rechazarse H0; en consecuencia se puede aceptar que la edad media al adquirir un vehículo de esa marca es la misma en España que en Europa, para un nivel de significación del 5 %. 3. En una determinada población juvenil el peso, en kilos sigue una distribución normal con una desviación típica de 10 kg. Se extrae una muestra aleatoria de 25 jóvenes cuya media muestral es de 48 kg. Para un nivel de significación del 5 %, ¿podemos aceptar la hipótesis de que la media poblacional es de 50 kg? Solución: Aplicaremos un contrate de hipótesis bilateral: Hipótesis nula, H0: µ = 50 Hipótesis alternativa, H1: µ ≠ 50 Si se admite la hipótesis nula, las medias muestrales siguen una distribución: 10 N 50, = N (50, 2) 25 Se rechaza la hipótesis nula si: σ σ x ∉ µ − Z α/2 ,µ + Z α/2 n n siendo σ la desviación típica poblacional y Zα/2 el valor correspondiente en la tabla normal para una significación α. En nuestro caso x = 48, µ = 50, σ = 10, n = 25 y, para un nivel de significación del 5 %, Zα/2 =1,96, luego: σ σ 10 10 ,µ + Z α/2 ,50 + 1,96 µ − Z α/2 = 50 − 1,96 = (46,08; 53,92) n n 25 25 Como x = 48 ∈ (46,08; 53,92), no se puede rechazar la hipótesis nula, esto es, podemos aceptar que la media poblacional es de 50 kg. 4. Se quiere estimar, en una determinada población, la media de la paga mensual que se da a los chicos de 14 años. a) Si la varianza de la paga en la población es de 1000 ptas2. ¿Cuál es la varianza de la media muestral cuando el tamaño de la muestra es de 100? b) Si en las condiciones del apartado anterior, la media muestral es de 4008 ptas, ¿se aceptaría, con un nivel de significación de 0,05, la hipótesis de que la paga media es de 4000 ptas? Solución: a) La distribución de la media muestral de tamaño n obtenidas en una población de media µ y σ desviación típica σ, N (µ,σ), se distribuye según una normal N µ, . n En nuestro caso, si σ2 = 1000 , se tendrá: σ 1000 = = 10 ⇒ la varianza de la media muestral = 10 n 100 Dpto. de Matemáticas 2/9 IES “Ramón Olleros” b) Se trata de un contrate de hipótesis. Hipótesis nula, H0: µ = 4000 Hipótesis alternativa, H1: µ ≠ 4000 Si se admite la hipótesis nula, las medias muestrales siguen una distribución: 1000 N 4000, = N (4000; 3,16) 100 Se admite la hipótesis nula si x = 4008 pertenece al intervalo: σ σ ,µ + Z α/2 µ − Z α/2 n n siendo σ la desviación típica poblacional y Zα/2 el valor correspondiente en la tabla normal para una significación α. En nuestro caso: µ = 4000, σ = 1000 , n =100 y, para el 0,05 de significación Zα/2 =1,96, luego: 1000 1000 σ σ Z Z µ − ,µ + 4000 − 1,96 , 4000 + 1,96 = = (3993,8; 4006,2) α/2 α/2 n n 100 100 Como 4008 cae fuera de ese intervalo no se acepta que ese valor sea la media poblacional. Esto es, no se acepta que la paga media sea 4000 ptas. 5. Hace 10 años, el consumo medio mensual de electricidad por vivienda en Canarias era de 320 Kw. En el año 2005 se ha tomado una muestra aleatoria de 25 viviendas y se ha obtenido un consumo medio mensual de 350 Kw con una desviación típica de 80 Kw. a) Con un nivel de significación del 10 % ¿se acepta que el consumo medio sigue siendo 320 Kw frente a que ha aumentado? b) Para estimar el consumo medio con un error menor de 6 Kw y con un nivel de confianza del 90% ¿que número de viviendas es necesario considerar? Solución: a) Se trata de un contraste de hipótesis unilateral (cola izquierda): Hipótesis nula, H0: µ ≤ 320 Hipótesis alternativa, H1: µ > 320 80 Las medias muestrales muestras siguen una distribución N 320, = N (320, 16) 25 Se rechaza H0, con un nivel de significación α, si: σ σ x > µ + Zα x ∉ −∞, µ + Z α o n n Esto equivale a admitir que la media no ha aumentado. En este caso: µ = 320; σ = 80; n = 25; Zα = 1,28. Luego: σ 80 µ + Zα = 320 + 1,28 · = 320 + 20,28 = 340,28 n 25 Como x = 350 > 340,28, hay que rechazar la hipótesis nula. Por tanto, debe aceptarse que el consumo medio ha aumentado. σ σ2 ⇒ n = (Zα/2)2 2 E n En nuestro caso, para una confianza del 90 %, α = 0,10, Zα/2 = 1,645, σ = 80 y E < 6 se tendrá: b) El error admitido E, viene dado por E = Zα/2 Dpto. de Matemáticas 3/9 IES “Ramón Olleros” n = (1,645)2 802 = 481,07 62 Esto es, n > 481. 6. Se cree que el comportamiento de ciertos microorganismos marinos se ha visto afectado por un vertido de residuos, reduciéndose en particular el tiempo de vida de dichos microorganismos. Antes del vertido ese tiempo seguía una Normal de media 45 días y desviación típica 4 días. Unas semanas después del vertido se contabilizó el tiempo de vida de una muestra de 50 microorganismos, obteniéndose una media de 43 días de vida. Suponiendo que el tiempo de vida sigue siendo aproximadamente Normal y que la desviación típica se ha mantenido: a) Plantea un test para contrastar la hipótesis de que el vertido de residuos no les ha afectado frente a que ha influido en la forma en que se cree. Si se concluye que sí afectó y esta conclusión fuera falsa, ¿cómo se llama el error cometido? b) Explica claramente a qué conclusión se llega en el test planteado en el apartado anterior para un nivel de significación del 3 %. Solución: Se trata de un contraste de hipótesis sobre la media. a) El contraste es unilateral, de una cola. Hipótesis nula, H0: µ ≥ 45 (la media sigue igual o incluso subió) Hipótesis alternativa, H1: µ < 45 (la media bajó) Si se concluye que la media ha bajado (aceptándose H1) y sin embargo esta conclusión fuera falsa, se dice que se comete un error de tipo I. 4 b) Las medias muestrales muestras siguen una distribución N 45, = N (45; 0,57) 50 Se admite que la media poblacional ha disminuido, para un nivel de significación α, cuando: σ σ x < µ – Zα o x ∉ µ − Zα ,+ ∞ n n siendo µ y σ los parámetros poblacionales (media y desviación típica poblacional), x la media muestral y Zα el valor correspondiente, para una distribución normal, con una confianza de 1 − α. En nuestro caso, para α = 3 % , el 97 % de confianza Zα = 1,82. Luego: σ 4 µ – Zα = 45 – 1,82 · = 43,97 n 50 Como x = 43 < 43,97 se admite que la media de vida de dichos microorganismos ha disminuido. 7. Una marca de nueces afirma que, como máximo, el 6 % de las nueces están vacías. Se eligieron 300 nueces al azar y se detectaron 21 vacías. a) Con un nivel de significación del 1 %, ¿se puede aceptar la afirmación de la marca? b) Si se mantiene el porcentaje muestral de nueces que están vacías y 1 − α = 0,95, ¿qué tamaño muestral se necesitaría para estimar la proporción de nueces vacías con un error menor del 1 %? Solución: 21 = 0,07 La proporción de la muestra es lp = 300 Dpto. de Matemáticas 4/9 IES “Ramón Olleros” a) Se trata de un contraste de hipótesis (que supondremos bilateral, al no decirse nada en concreto). Hipótesis nula, H0: p = 0,06 Hipótesis alternativa, H1: p ≠ 0,06 (la proporción de nueces vacías no es la indicada) Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando: pq pq lp ∉ p − Z , p + Z α/2 α/2 n n siendo p la proporción de la población, q = 1 − p, Zα el valor correspondiente en la tabla normal para una confianza de 1 − α (significación α) y n el tamaño muestral. En nuestro caso se tiene: α = 0,01 Zα/2 = 3,27 n = 300 p = 0,06 y q = 0,94 Luego: 0, 06·0,94 0, 06·0,94 ;0, 06 + 3, 27· 0, 06 − 3, 27· = (0,015; 0,105) 300 300 l Como p ∈ (0,015; 0,105), no puede rechazarse la hipótesis nula. Por tanto, debe aceptarse la afirmación de la marca. b) Para la misma proporción lp = 0,07 y, para un nivel de confianza del 95 %, Zα/2 = 1,96, si se desea que el error Z α/2 lpq < 0,01, se tendrá: n 0, 07·0,93 < 0,01 ⇒ n El tamaño muestral mínimo debe ser n = 2501. 1,96· n> 1,962 ·0, 07·0,93 = 2500,9 0, 012 8. Un 10 % de quienes utilizan cierto analgésico sufren pequeñas molestias gástricas. Un nuevo producto tiene un mayor poder analgésico, pero sin embargo parece que es más fácil que ocasione esos pequeños efectos secundarios. De hecho, 21 personas afirmaron haberlos sufrido, de una muestra de 140 que habían utilizado el nuevo medicamento. a) Plantea un test para contrastar la hipótesis de que con el nuevo medicamento se corre el mismo riesgo de padecer efectos secundarios que con el otro, frente a que, como parece, el riesgo es mayor. Explica qué tipo de errores se pueden cometer al obtener las conclusiones y cómo se llaman. b) Explica claramente a qué conclusión se llega en el test planteado en el apartado anterior para un nivel de significación del 2 %. Solución: a) Se trata de un contraste de hipótesis sobre la proporción. Con el analgésico anterior: p = 0,10 Con el analgésico nuevo: p nuevo = 21/140 = 0,15 El contraste es unilateral, de una cola. Hipótesis nula, H0: p ≤ 0,10 (la proporción sigue igual o incluso bajó) Hipótesis alternativa, H1: p > 0,10 (la proporción subió) Si se admite la hipótesis alternativa, que la proporción de molestias subió, siendo falsa se comete un error de Tipo I. (esto es, se rechaza H0 siendo verdadera) El error de Tipo II consiste en no admitir la hipótesis alternativa siendo verdadera (esto es, no rechazar H0 siendo falsa) Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para una significación α, cuando: p0 q0 p0 q0 ⇔ p nuevo – p > Zα p nuevo > p + Zα n n Dpto. de Matemáticas 5/9 IES “Ramón Olleros” siendo p la proporción poblacional, n el tamaño muestral, p nuevo la proporción muestral y Zα el valor correspondiente en la tabla normal para una confianza de 1 −α. En nuestro caso, para el 98 % de confianza, Zα = 2,06. Luego: pq 0,1·0,9 = 2,06 · ≈ 0,052 Zα n 140 Como p nuevo – p = 0,15 − 0,10 = 0,05 < 0,052, no hay evidencia estadística suficiente para rechazar la hipótesis nula. 9. Una fábrica de muebles se encargaba también del transporte y montaje de los pedidos a sus clientes. Sin embargo, recibía aproximadamente un 16 % de reclamaciones por dicho servicio. En los últimos meses, ha contratado una empresa especializada. De 250 servicios realizados por la empresa contratada, 30 han tenido reclamación. a) Plantea un test para contrastar la hipótesis de que con la empresa contratada la situación sigue igual, frente a que, como parece, ha mejorado. ¿A qué conclusión se llega para un nivel de significación del 5 %? b) Calcula un intervalo de confianza del 95 % para la proporción de servicios reclamados con la empresa contratada. Solución: La proporción inicial es p = 0,16. La proporción de la muestra es lp = 30/250 = 0,12 a) Se trata de un contraste de hipótesis unilateral (de la cola derecha) Hipótesis nula: H0: p ≥ 0,16 Hipótesis alternativa: H1: p < 0,16 Se rechaza H0, con un nivel de significación α, si: lp < p – Zα pq , o bien, si lp ∉ p − Z pq , + ∞ α n n Esto equivale a admitir que la proporción ha disminuido. En este caso, el área α se toma íntegra en la cola izquierda de la campana. Para n = 250, lp = 0,12 y α = 0,05 (Z0,05 = 1,64), se tiene que: p – Zα pq 0,16·0,84 = 0,16 – 1,64 = 0,16 – 0,023 = 0,137 n 250 Como lp = 0,12 < 0,137 hay que rechazar H0: hay evidencias estadísticas de que la situación ha mejorado (la proporción ha disminuido). b) El intervalo de confianza de la proporción, con un nivel de confianza de 1 − α, es: lpq lp q lp − Z α / 2 , lp + Z α / 2 n n l l siendo p la proporción de la muestra y q = 1 − p , n el tamaño muestral y Zα/2 el valor correspondiente en la tabla normal para una significación α. En nuestro caso: lpq lp q 0,12·0,88 0,12·0,88 lp − Z α / 2 = 0,12 − 1,96 , 0,12 1,96 , lp + Z α / 2 + = (0,10; 0,14) n n 250 250 Dpto. de Matemáticas 6/9 IES “Ramón Olleros” 10. El consumo de carne pollo parece haberse disparado desde que hace unos meses cundió la alarma sobre otros tipos de carne. En cierta carnicería, las ventas diarias de carne de pollo seguían hasta entonces una Normal de media 19 kilos y desviación típica 3 kilos. En una muestra de 35 días posteriores a la citada alarma, se obtuvo una media de 21 kilos de carne de pollo vendidos al día. Suponiendo que las ventas siguen siendo una Normal con la misma desviación típica. a) Plantear un test para contrastar que la venta de pollo no ha aumentado, frente a que sí lo ha hecho, como parecen indicar los datos. ¿A qué conclusión se llega a un nivel de significación del 5%? b) Calcula un intervalo de confianza del 95 % para la venta diaria media de carne de pollo después de la alarma? Solución: a) Se trata de un contraste de hipótesis sobre la media. En concreto, un contraste unilateral (cola derecha), que se formula así: Hipótesis nula, H0: µ ≤ 19 Hipótesis alternativa, H1: µ > 19 Se rechaza H0, con un nivel de significación α, si: σ σ o bien x > µ + Zα x ∉ −∞,µ + Z α n n siendo x la nueva media, que en este caso vale 21, σ la desviación típica y Zα el valor correspondiente al nivel de significación α. (Si se rechaza H0 debe admitirse H1). En nuestro caso, para α = 0,05, Zα = 1,64. Luego: σ 3 = 19 + 1,64 · µ + Zα = 19,83 n 35 Como x = 21 > 19, se rechaza la hipótesis nula, y por tanto se admite que la media ha aumentado. b) El intervalo de confianza de la media poblacional, para las muestras de tamaño muestral n, de media x y desviación típica σ es: σ σ , x + Zα / 2 x − Zα / 2 n n siendo Zα/2 el valor correspondiente en la tabla normal para una confianza de 1 − α. Para x = 21, σ = 3, n = 35 y, para el 95 % de confianza, Zα/2 = 1,96, se tiene: σ σ 3 3 , 21 + 1,96 , x + Zα / 2 = (20,01; 21,99) x − Zα / 2 = 21 − 1,96 35 35 n n 11. Hace diez años la proporción poblacional de personas que leían el periódico LA CIUDAD era del 35 %. Para comprobar si dicha proporción se mantiene tomamos una muestra de 225 personas de las cuales sólo 65 leen LA CIUDAD. a) Si α = 0,05, ¿podemos aceptar que la proporción de personas que leen dicho periódico es mayor o igual al 35% frente a que ha disminuido? b) ¿Se concluiría lo mismo si el nivel de significación es del 1 %? Solución: a) Se trata de realizar un contraste de hipótesis unilateral. Se realiza como sigue: Hipótesis nula, H0: p ≥ 0,35 Hipótesis alternativa, H1: p < 0,35 Se rechaza H0, con un nivel de significación α, si: Dpto. de Matemáticas 7/9 IES “Ramón Olleros” lp < p − Z α pq n o bien ⇔ lp ∉ p − Z α pq , + ∞ n siendo lp la proporción de la media muestral y Zα el valor correspondiente en la tabla normal para una significación α. Esto equivale a admitir que la proporción ha disminuido. En este caso: lp = 65/225 = 0,2889 p = 0,35 Zα = 1,645 y n = 225 Por tanto: pq 0,35·0, 65 = 0,35 – 1,645 · = 0,2977 p − Zα 225 n Como, lp = 0,2889 < 0,2977 hay que rechazar H0 con ese nivel de significación. Luego la proporción de lectores de dicho periódico ha disminuido. b) Para α = 0,01, Zα = 2,33. Por tanto: pq 0,35·0, 65 = 0,35 + 2,33 · = 0,0320 p − Zα 225 n Como, lp = 0,2889 > 0,0320 no se puede rechazar H0 para este nivel de significación. Esto es, no se puede admitir que la proporción de lectores ha disminuido. Nota: Al aumentar la significación disminuye nuestra confianza en el resultado; por eso, lo que se admite con una confianza del 95 % puede rechazarse si exigimos una confianza del 99 %. 12. Hace 10 años, se hizo un amplio estudio y se concluyó que, como máximo, el 40 % de los estudiantes universitarios eran fumadores. Para ver si actualmente se mantienen las mismas conclusiones, se tomó una muestra de 78 estudiantes entre los que 38 eran fumadores. a) Con un nivel de significación del 10 %, ¿se acepta que el porcentaje de fumadores entre los universitarios es menor o igual que el 40 %? b) Se amplió la encuesta hasta 120 personas, y se obtuvo que 54 eran fumadores. Con un nivel de significación del 5 %, ¿se tomaría la misma decisión que en el apartado anterior? Solución: La proporción de la muestra es: lp = 38 = 0,487 78 a) Se trata de un contraste unilateral. Hipótesis nula: H0: p ≤ 0,40 Hipótesis alternativa: H1: p > 0,40 (la proporción de fumaderos aumentó) Se admite la hipótesis alternativa (y se rechaza la hipótesis nula), para un nivel de significación α, cuando: lp > p + Z pq lp ∉ −∞, p + Z pq o bien α α n n siendo p la proporción de la población, q = 1 − p, Zα el valor correspondiente en la tabla normal para una confianza de 1 − α (significación α) y n el tamaño muestral. En nuestro caso se tiene: α = 0,10 Zα = 1,28 n = 78 p = 0,40 y q = 0,60 Luego: Dpto. de Matemáticas 8/9 IES “Ramón Olleros” p + Zα pq = 0,40 + 1,28 · n 0, 40·0, 60 ≈ 0,471 78 Como lp = 0,487 > 0,471, se rechaza la hipótesis nula; esto es, el porcentaje de fumadores ha aumentado, esto es, es mayor del 40 %. 54 b) Para n = 120, lp = = 0,45 y para un nivel de confianza del 95 %, Zα = 1,645, se tiene que: 120 pq 0, 40·0, 60 p + Zα = 0,40 + 1,645 · ≈ 0,474 120 n En este caso, lp = 0,45 < 0,474, por tanto, en este caso, no puede rechazarse la hipótesis nula, esto es, no se acepta que el porcentaje de fumadores ha aumentado. Dpto. de Matemáticas 9/9 IES “Ramón Olleros”