Se recibe un lote de medio de cultivo, del que se afirma que cada envase tiene un peso medio de 1000g. Se toma una muestra aleatoria de 5 envases y se obtiene un peso medio de 995g con una cuasivarianza s2 = 19.6. Al nivel de confianza del 95%, ¿hay motivos para didar de lo que dice el fabricante? Hay dos opciones razonables para establecer las hipótesis nula y alternativa 1. H0 : µ0 = 1000 frente a H1 : µ0 6= 1000. Este es el planteamiento que harı́a, por ejemplo, el fabricante, al que le preocupa asegurarse que los envases pesen 1000g: si hubiera realmente menos estarı́a engañando y si hubiera de más estarı́a perdiendo dinero. 2. H0 : µ0 ≥ 1000 frente a H1 : µ0 < 1000. Este es el planteamiento que harı́a el comprador; la muestra parece indicar que el peso medio podrı́a estar por debajo de los 1000g, y quiere asegurarse de si eso es ası́ (y, en caso de tener que rechazar el envı́o, quiere tener razones fundadas, por eso elige ası́ la hipótesis alternativa). En rigor, las hipótesis del punto 1 son las que más se ajustan al enunciado, aunque las del punto 2 también son plausibles. En clase se resolvió el apartado 1. Vamos a por el 2, que atacaremos de dos formas distintas: calcularla región de rechazo, y calcular el p-valor. Como las muestras son pequeñas y queremos hacer inferencia sobre la media, necesitamos hacer una suposición adicional, y es que los pesos de los envases se distribuyen de cuardo con una normal. En ambos casos usaremos que, si la hipótesis nula fuera cierta y consideramos todas las posibles muestras de tamaño 5, entonces, el estadı́stico basado en las medias muestrañes de tamaño 5 X̄ − µ0 √ s/ n tendrı́a una distribución t de Student con 5 − 1 grados de libertad. 1. Región de rechazo. De entre todas las posibles medias muestrales, vamos a calcular el valor umbral que separa el 5% de las que más contradicen H0 , es decir, el 5% de las más pequeños que 1000. Es decir, buscamos la el valor X̄∗ de la media muestral tal que la probabilidad de que media X̄ de otra muestra sea aún menor sea 0.05: es decir P (X̄ < X̄∗ ) = 0.05 Para hacer ese cálculo necesitamos tipificar y utilizar la t de Student, de modo que el cálculo que queremos hacer es buscar t∗ tal que P (t < t∗ ) = 0.05 > (umbral.tipificado = qt(0.05, df = 4)) [1] -2.131847 1 Es decir, las muestras cuya media, una vez tipificada, es menor que −2.132 están entre el 5% más contradictorio con la hipótesis de que la media poblacional es mayor o igual que 1000. Si la media de la muestra que hemos recogido se encuentra dentro de ese 5%, rechazamos H0 . Podemos elegir entre (a) Tipificar la media observada > (media.tipificada = (995-1000)/(sqrt(19.6)/sqrt(5))) [1] -2.525381 Como la tipificación de la media es menor que −2.132, Ãğ rechazamos H0 . (b) Destipificar el valor umbral calculado > (media.destipificada = 1000+umbral.tipificado * sqrt(19.6)/sqrt(5) ) [1] 995.7792 observa que se suma ‘umbral.tipificado porque ya es negativo. Como la media observada es menor que el valor umbral calculado, se rechaza H0 . 2. Cálculo del p-valor. El valor muestral obervado es menor que la media estipulada en H0 en 5 gramos. Vamos a calcular la probabilidad de que al extraer al azar otra muestra de 5 envases su peso medio X̄ sea menor que 1000 en al menos 5 gramos: P (X̄ < 995) la única forma que hay de calcular esa probabilidad es estandarizar para usar la t de Student 955 − 1000 √ P (X̄ < 995) = P t < √ 19.6/ 5 es decir, > (pvalor = pt((995-1000)/(sqrt(19.6)/sqrt(5)), df =4 )) [1] 0.03249164 Como el nivel de significación es α = 0.05 podemos rechazar H0 , aunque si el nivel de significación hubiera sido de α = 0.01 no habrı́amos rechazado H0 . 2