ESTADÍSTICA REPASO PRIMER CUATRIMESTRE – TEST DE HIPÓTESIS EJERCICIO 1 El número de libro juveniles prestados en 15 días elegidos al azar en los meses de verano (V) e invierno (I) ha sido: V 54 61 44 50 50 54 59 54 22 48 45 30 38 36 35 I 61 46 50 17 45 31 20 54 37 38 30 42 58 44 58 Utilizando Statgraphics: 1.- Comprueba que, a partir de los coeficientes de asimetría y curtosis, puede aceptarse que en Verano e Invierno (separadamente) la distribución es normal. Descripción / Datos numéricos / Análisis unidimensional Entrada de datos = V Resumen Estadístico para V Frecuencia = 15 Media = 45,3333 Mediana = 48,0 Moda = 54,0 Varianza = 124,095 Desviación típica = 11,1398 Mínimo = 22,0 Máximo = 61,0 Rango = 39,0 Primer cuartil = 36,0 Segundo cuartil = 54,0 Asimetría tipi. = -0,947273 Curtosis típificada = -0,234526 Coef. de variación = 24,5731% El StatAdvisor -------------Esta tabla muestra el resumen estadístico para V. Incluye las medidas de tendencia central, medidas de variabilidad, y medidas de forma. De particular interés están los coeficientes de asimetría y curtosis estandarizados que pueden utilizarse para determinar si la muestra procede de una distribución normal. Los valores de estos estadísticos fuera del rango de -2 a +2 indican alejamiento significante de normalidad que tendería a invalidar cualquier test estadístico con respecto a la desviación normal. En este caso, el valor del coeficiente de asimetría estandarizado está dentro del rango esperado para los datos de una distribución normal. El valor del coeficiente de curtosis estandarizado está dentro del rango esperado para los datos de una distribución normal. Como ambos valores (asimetría y curtosis) se encuentran dentro del rango esperado [-2,2], puede aceptarse que el préstamo en verano sigue una distribución normal. Entrada de datos = I Resumen Estadístico para I Frecuencia = 15 Media = 42,0667 Mediana = 44,0 Moda = 58,0 Varianza = 180,352 Desviación típica = 13,4295 Mínimo = 17,0 Máximo = 61,0 Rango = 44,0 Primer cuartil = 31,0 Segundo cuartil = 54,0 Asimetría tipi. = -0,679855 Curtosis típificada = -0,439777 Coef. de variación = 31,9244% El StatAdvisor -------------Esta tabla muestra el resumen estadístico para I. Incluye las medidas de tendencia central, medidas de variabilidad, y medidas de forma. De particular interés están los coeficientes de asimetría y curtosis estandarizados que pueden utilizarse para determinar si la muestra procede de una distribución normal. Los valores de estos estadísticos fuera del rango de -2 a +2 indican alejamiento significante de normalidad que tendería a invalidar cualquier test estadístico con respecto a la desviación normal. En este caso, el valor del coeficiente de asimetría estandarizado está dentro del rango esperado para los datos de una distribución normal. El valor del coeficiente de curtosis estandarizado está dentro del rango esperado para los datos de una distribución normal. Como ambos valores (asimetría y curtosis) se encuentran dentro del rango esperado [-2,2], puede aceptarse que el préstamo en invierno también sigue una distribución normal. 2.- Construye histogramas correspondientes tanto a los datos correspondientes al verano, como al invierno. ¿Avalan estos gráficos una distribución normal para el préstamo, en cada época? Descripción / Datos numéricos / Análisis unidimensional Entrada de datos = V Opciones gráficas / Histograma Histograma frecuencia 5 4 3 2 1 0 20 30 40 50 60 70 V Entrada de datos = I Histograma frecuencia 6 5 4 3 2 1 0 0 20 40 60 80 I Ambos histogramas confirman que el préstamo tanto en invierno como en verano sigue una distribución normal. 3.- Indica la media y la desviación típica correspondientes tanto al verano, como al invierno. Descripción / Datos numéricos / Análisis unidimensional Entrada de datos = V Resumen Estadístico para V Frecuencia = 15 Media = 45,3333 Mediana = 48,0 Moda = 54,0 Varianza = 124,095 Desviación típica = 11,1398 Mínimo = 22,0 Máximo = 61,0 Rango = 39,0 Primer cuartil = 36,0 Segundo cuartil = 54,0 Asimetría tipi. = -0,947273 Curtosis típificada = -0,234526 Coef. de variación = 24,5731% Entrada de datos = I Resumen Estadístico para I Frecuencia = 15 Media = 42,0667 Mediana = 44,0 Moda = 58,0 Varianza = 180,352 Desviación típica = 13,4295 Mínimo = 17,0 Máximo = 61,0 Rango = 44,0 Primer cuartil = 31,0 Segundo cuartil = 54,0 Asimetría tipi. = -0,679855 Curtosis típificada = -0,439777 Coef. de variación = 31,9244% 4.- ¿En que tanto por ciento de días, en verano, se espera superar los 50 préstamos? ¿Y en invierno? ¿Cuál es la probabilidad, tanto en verano como en invierno, de que un día cualquiera se presten menos de 25 libros? ¿En qué porcentaje de días se da un préstamo de entre 30 y 50 libros? Verano Descripción / Distribuciones / Distribuciones de probabilidad / Normal Botón derecho / Opciones de análisis Media V = 45,3333 Desviación típica V = 11,1398 Distribución acumulativa / Opciones de ventana P (X>50) Valores para la variable = 50 Distribución Acumulativa -----------------------Distribución: Normal Variable 50 Area de cola inferior (<) Dist. 1 Dist. 2 0,662365 Dist. 3 Dist. 4 Dist. 5 Variable 50 Densidad de Probabilidad Dist. 1 Dist. 2 0,0328038 Dist. 3 Dist. 4 Dist. 5 Variable 50 Area de cola Superior (>) Dist. 1 Dist. 2 0,337635 Dist. 3 Dist. 4 Dist. 5 Por tanto, en verano se esperan superar los 50 préstamos un 33’76 % de los días P (X<25) Valores para la variable = 25 Distribución Acumulativa -----------------------Distribución: Normal Variable 25 Area de cola inferior (<) Dist. 1 Dist. 2 0,0339789 Dist. 3 Dist. 4 Dist. 5 Variable 25 Densidad de Probabilidad Dist. 1 Dist. 2 0,00676973 Dist. 3 Dist. 4 Dist. 5 Variable 25 Area de cola Superior (>) Dist. 1 Dist. 2 0,966021 Dist. 3 Dist. 4 Dist. 5 Por tanto, en verano la probabilidad de prestar menos de 25 libros un día cualquiera es de 3,39 % P(30<X<50) = P(X<50)-P(X<30) Valores para las variables = 30 y 50 Distribución Acumulativa -----------------------Distribución: Normal Variable 50 30 Area de cola inferior (<) Dist. 1 Dist. 2 0,662365 0,084342 Variable 50 30 Densidad de Probabilidad Dist. 1 Dist. 2 0,0328038 0,0138876 Variable 50 30 Area de cola Superior (>) Dist. 1 Dist. 2 0,337635 0,915658 Dist. 3 Dist. 4 Dist. 5 Dist. 3 Dist. 4 Dist. 5 Dist. 3 Dist. 4 Dist. 5 P(30<X>50) = P(X<50)-P(X<30) = 0,662365- 0,084342 = 0,578023 Por tanto, en verano la probabilidad de prestar entre 30 y 50 libros es de 57,80 % Invierno Descripción / Distribuciones / Distribuciones de probabilidad / Normal Botón derecho / Opciones de análisis Media I = 42,0667 Desviación típica I = 13,4295 Distribución acumulativa / Opciones de ventana P (X>50) Valores para la variable = 50 Distribución Acumulativa -----------------------Distribución: Normal Variable 50 Area de cola inferior (<) Dist. 1 Dist. 2 0,722653 Dist. 3 Dist. 4 Dist. 5 Variable 50 Densidad de Probabilidad Dist. 1 Dist. 2 0,0249501 Dist. 3 Dist. 4 Dist. 5 Variable 50 Area de cola Superior (>) Dist. 1 Dist. 2 0,277347 Dist. 3 Dist. 4 Dist. 5 Por tanto, en invierno se esperan superar los 50 préstamos un 27,73 % de los días P (X<25) Valores para la variable = 25 Distribución Acumulativa -----------------------Distribución: Normal Variable 25 Area de cola inferior (<) Dist. 1 Dist. 2 0,101893 Dist. 3 Dist. 4 Dist. 5 Variable 25 Densidad de Probabilidad Dist. 1 Dist. 2 0,013248 Dist. 3 Dist. 4 Dist. 5 Variable 25 Area de cola Superior (>) Dist. 1 Dist. 2 0,898107 Dist. 3 Dist. 4 Dist. 5 Por tanto, en invierno la probabilidad de prestar menos de 25 libros un día cualquiera es de 10,18 % P(30<X<50) = P(X<50)-P(X<30) Valores para las variables = 30 y 50 Distribución Acumulativa -----------------------Distribución: Normal Variable 30 50 Area de cola inferior (<) Dist. 1 Dist. 2 0,184453 0,722653 Variable 30 50 Densidad de Probabilidad Dist. 1 Dist. 2 0,0198398 0,0249501 Dist. 3 Dist. 4 Dist. 5 Dist. 3 Dist. 4 Dist. 5 Variable 30 50 Area de cola Superior (>) Dist. 1 Dist. 2 0,815547 0,277347 Dist. 3 Dist. 4 Dist. 5 P(30<X<50) = P(X<50)-P(X<30) = 0,722653 – 0,184453 = 0,5382 Por tanto, en invierno la probabilidad de prestar entre 30 y 50 libros es de 53,82 % 5.- ¿Qué número de préstamos se rebasa sólo en un 5% de los días? ¿Por debajo de qué número de préstamos se localiza el 10% de los días con menor cantidad de préstamos? (Indica la respuesta tanto para verano como para invierno) Verano Descripción / Distribuciones / Distribuciones de probabilidad / Normal Botón derecho / Opciones de análisis Media V = 45,3333 Desviación típica V = 11,1398 Opciones tabulares / CDF inverso P(X > k) = 0,05 Botón derecho / Opciones de ventana P(X < k) = 1 – P(X > k) = 1 – 0,05 = 0,95 CDF = 0,95 Inversa CDF ----------Distribución: Normal CDF 0,95 0,1 0,5 0,9 0,99 Dist. 1 63,6567 31,057 45,3333 59,6096 71,2484 Dist. 2 Dist. 3 Dist. 4 Dist. 5 Por tanto, en verano, sólo en un 5% de los días, el número de préstamos es mayor de 63. CDF = 10% = 0,1 Inversa CDF ----------Distribución: Normal CDF 0,95 0,1 0,5 0,9 0,99 Dist. 1 63,6567 31,057 45,3333 59,6096 71,2484 Dist. 2 Dist. 3 Dist. 4 Dist. 5 Por tanto, en verano, el 10 % de los días, el número de préstamos es menor de 31. Invierno Descripción / Distribuciones / Distribuciones de probabilidad / Normal Botón derecho / Opciones de análisis Media I = 42,0667 Desviación típica I = 13,4295 Opciones tabulares / CDF inverso P(X > k) = 0,05 Botón derecho / Opciones de ventana P(X < k) = 1 – P(X > k) = 1 – 0,05 = 0,95 CDF = 0,95 Inversa CDF ----------Distribución: Normal CDF 0,95 0,1 0,5 0,9 0,99 Dist. 1 64,1563 24,8561 42,0667 59,2773 73,3084 Dist. 2 Dist. 3 Dist. 4 Dist. 5 Por tanto, en invierno, sólo en un 5% de los días, el número de préstamos es mayor de 64. CDF = 10% = 0,1 Inversa CDF ----------Distribución: Normal CDF 0,95 0,1 0,5 0,9 0,99 Dist. 1 64,1563 24,8561 42,0667 59,2773 73,3084 Dist. 2 Dist. 3 Dist. 4 Dist. 5 Por tanto, en invierno, el 10 % de los días, el número de préstamos es menor de 24. 6.- ¿Avalan los datos anteriores la hipótesis de que la media de libros prestados en verano es de 50? ¿Y de 40? Respóndase utilizando niveles de significación del 5% y el 1% en cada caso. Idem para los libros prestados en invierno. Verano Descripción / Datos numéricos / Análisis unidimensional Entrada de datos = V Opciones tabulares / Contraste de hipótesis Botón derecho / Opciones de ventana Media = 50 Hipótesis alternativa = No igual contraste t ----------- Hipótesis nula: media = 50,0 Alternativa: no igual Estadístico t = -1,62246 P-valor = 0,127 No se rechaza la hipótesis nula para alpha = 0,05. Como p-valor = 0,127 no es menor que 0’05, aceptamos con un nivel de significación del 5% que la media de libros prestados en verano sea de 50. Además, 0’127 tampoco es menor que 0’01, luego también aceptamos la hipótesis nula al 1% de significación. Botón derecho / Opciones de ventana Media = 40 Hipótesis alternativa = No igual contraste t ----------Hipótesis nula: media = 40,0 Alternativa: no igual Estadístico t = 1,85424 P-valor = 0,0848888 No se rechaza la hipótesis nula para alpha = 0,05. Como p-valor = 0,0848 no es menor que 0’05, aceptamos con un nivel de significación del 5% que la media de libros prestados en verano sea de 50. Además, 0’0848 tampoco es menor que 0’01, luego también aceptamos la hipótesis nula al 1% de significación. Invierno Descripción / Datos numéricos / Análisis unidimensional Entrada de datos = I Opciones tabulares / Contraste de hipótesis Botón derecho / Opciones de ventana Media = 50 Hipótesis alternativa = No igual contraste t ----------Hipótesis nula: media = 50,0 Alternativa: no igual Estadístico t = -2,28792 P-valor = 0,0382153 Se rechaza la hipótesis nula para alpha = 0,05. Como p-valor=0’038 es menor que 0’05, al 5% de significación rechazamos la hipótesis nula; por lo tanto, no podríamos admitir que la media de libros prestados fuera de 50. Sin embargo, como p-valor=0’038 NO es menor que 0’01, al 1% de significación aceptaríamos la hipótesis nula. Botón derecho / Opciones de ventana Media = 40 Hipótesis alternativa = No igual contraste t ----------Hipótesis nula: media = 40,0 Alternativa: no igual Estadístico t = 0,596012 P-valor = 0,56068 No se rechaza la hipótesis nula para alpha = 0,05. Como p-valor=0’56068 no es menor que 0’05, al 5% de significación aceptamos la hipótesis nula; por lo tanto, podríamos admitir que la media de libros prestados fuera de 40. Igualmente aceptamos la hipótesis nula al 1% de significación. 7.- ¿Puede considerarse, en cualquier caso, que la media de libros prestados en verano está por encima de 38? ¿Y de 45? (Respóndase utilizando niveles de significación del 5%) Idem para invierno. Verano Descripción / Datos numéricos / Análisis unidimensional Entrada de datos = V Opciones tabulares / Contraste de hipótesis Botón derecho / Opciones de ventana Media = 38 Alpha = 5% Hipótesis alternativa = Mayor que contraste t ----------Hipótesis nula: media = 38,0 Alternativa: mayor que Estadístico t = 2,54959 P-valor = 0,011568 Se rechaza la hipótesis nula para alpha = 0,05. Por tanto, con un nivel de significación del 5%, rechazamos la hipótesis nula y aceptamos la hipótesis alternativa, es decir, que la media de los libros prestados en verano está por encima de 38. Botón derecho / Opciones de ventana Media = 45 Alpha = 5% Hipótesis alternativa = Mayor que contraste t ----------Hipótesis nula: media = 45,0 Alternativa: mayor que Estadístico t = 0,11589 P-valor = 0,454693 No se rechaza la hipótesis nula para alpha = 0,05. Por tanto, con un nivel de significación del 5%, aceptamos la hipótesis nula, es decir, que la media de los libros prestados en verano es de 45. Invierno Descripción / Datos numéricos / Análisis unidimensional Entrada de datos = I Opciones tabulares / Contraste de hipótesis Botón derecho / Opciones de ventana Media = 38 Alpha = 5% Hipótesis alternativa = Mayor que contraste t ----------Hipótesis nula: media = 38,0 Alternativa: mayor que Estadístico t = 1,1728 P-valor = 0,130223 No se rechaza la hipótesis nula para alpha = 0,05. Por tanto, con un nivel de significación del 5%, aceptamos la hipótesis nula, es decir, que la media de los libros prestados en invierno es de 38. Botón derecho / Opciones de ventana Media = 45 Alpha = 5% Hipótesis alternativa = Mayor que contraste t ----------Hipótesis nula: media = 45,0 Alternativa: mayor que Estadístico t = -0,845953 P-valor = 0,794097 No se rechaza la hipótesis nula para alpha = 0,05. Por tanto, con un nivel de significación del 5%, aceptamos la hipótesis nula, es decir, que la media de los libros prestados en invierno es de 45.