Muestreo. Inferencia Estadística. Test de hipótesis. Tipos de errores 1 INFERENCIA ESTADÍSTICA. TEST DE HIPÓTESIS. TIPOS DE ERRORES 001.– PAU – SELECTIVIDAD – Universidad de Oviedo – Junio 1996 La empresa de transportes urgentes “El Rápido” asegura que entrega el 80% de sus envíos antes de las 12 de la mañana. Para contrastar la calidad de este servicio, la asociación de consumidores selecciona aleatoriamente 100 envíos en diversos días. (a) Establecer la hipótesis nula y la alternativa. (b) Describir en este caso en qué consistirían los errores tipo I y tipo II. ¿Cómo se denomina la probabilidad de confundirnos de modo que la asociación acuse injustamente a la empresa de no cumplir sus compromisos publicitarios? (c) A partir de los datos de la muestra, el informe encargado por la asociación afirma que el valor obtenido es significativo. ¿Cómo debe ser interpretado el resultado? RESOLUCIÓN apartado (a) Suponemos que la empresa, cuando menciona que entrega el 80% de los envíos, nos está diciendo que entrega al menos el 80% de los envíos. Planteamos las hipótesis: H0: Hipótesis nula. Hl: Hipótesis alternativa, complementa la hipótesis nula. H0 : p ≥ 80 → El porcentaje de entregas SÍ es de, al menos, el 80%. H1 : p < 80→ El porcentaje de entregas NO es de, al menos, el 80%. Siendo p la proporción de entregas de sus envíos antes de las 12:00 de la mañana. Las hipótesis así definidas suponen plantear una prueba de... Contraste de hipótesis unilateral. RESOLUCIÓN apartado (b) Error tipo I: Es la probabilidad de rechazar Ho siendo cierta. P(I) = P[Rechazar H0 / cierta H0 ] = α P(I) = P[No rechazar H1 / cierta H0 ] = α En nuestro caso, se trata de rechazar la publicidad realizada por la empresa, siendo cierta. Error tipo II: Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa. P(II) = P[Rechazar H1 / cierta H1 ] P(II) = P[No rechazar H0 / cierta H1 ] En nuestro caso no rechazar la publicidad de la empresa cuando en realidad no es cierta. Después de que la asociación de consumidores realice un estudio, si acusa injustamente a la empresa de no cumplir sus compromisos publicitarios (se rechaza H0) y realmente SÍ hacen la entrega en los tiempos asegurados (es cierto H0) estaríamos cometiendo un error de tipo I. RESOLUCIÓN apartado (c) Si el valor obtenido en la prueba es significativo quiere decir que el valor obtenido del estadístico cae dentro de la región de rechazo para un cierto valor de significación α, por lo que nos llevaría a rechazar la hipótesis nula, es decir, se cree que el porcentaje de entregas NO es de, al menos, el 80%, aunque sería interesante conocer (y exigir) el nivel de significación con el que se está trabajando en la prueba. Abel Martín 2 Del aula a la PAU 002.– PAU – Universidad de Oviedo – SEPTIEMBRE 1996 La empresa empaquetadora de mariscos “El centollu” afirma que el peso medio de sus productos supera los 400 gramos. Un restaurante consumidor habitual desea contrastar esta Información. (a) Enunciar la hipótesis nula y alternativa. (b) Describir los errores tipo I y II en este caso. (c) Sobre una muestra de 10 envases se ha observado un peso medio de 300 gramos. ¿Es posible con esta información rechazar el supuesto de la empresa “El centollu”? ¿Sería necesaria alguna información adicional para resolver el contraste? RESOLUCIÓN apartado (a) Planteamos las hipótesis: H0: Hipótesis nula. H1: Hipótesis alternativa, complementa la hipótesis nula. H0 : µ0 ≥ 400 → El peso medio del marisco empaquetado SÍ supera los 400 gramos. H1 : µ0 < 400 → El peso medio del marisco empaquetado NO supera los 400 gramos. Siendo µ el peso medio de los productos de la empresa empaquetadora de mariscos “El centollu”. Las hipótesis así definidas suponen plantear una prueba de... Contraste de hipótesis unilateral. RESOLUCIÓN apartado (b) Error tipo I: Es la probabilidad de rechazar Ho siendo cierta. P(I) = P[Rechazar H0 / cierta H0 ] = α P(I) = P[No rechazar H1 / cierta H0 ] = α Se rechaza la afirmación de la empresa de que el peso medio del marisco supera los 400 gramos (rechaza H0) siendo cierto (es cierto H0). Error tipo II: Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa. P(II) = P[Rechazar H1 / cierta H1 ] P(II) = P[No rechazar H0 / cierta H1 ] Podríamos decirlo de varias formas: (a) El error de tipo II consistiría en rechazar que no han superado los 400 gramos (rechazar H1 ), cuando en realidad no los superan (es cierta H1). (b) Considerar la veracidad de los datos proporcionados por la empresa, cuando en realidad son falsos. RESOLUCIÓN apartado (c) Los datos proporcionados por el problema son, considerando la distribución normal: Población → N(400, S) Muestra → N(300, S) ; n = 10 La distribución que sigue la media muestral es la normal de parámetros: Ŝ ℜ → N µ, n Y el valor del estadístico del contraste lo obtenemos tipificando la variable: www.aulamatematica.com Muestreo. Inferencia Estadística. Test de hipótesis. Tipos de errores Z= x-µ Ŝ 3 → N(0, 1) n Para resolver el contraste es necesario conocer el valor de la varianza muestral o bien el de la varianza poblacional, así como haber prefijado el nivel de significación. 003.– PAU – Universidad de Oviedo – – JUNIO 1998 En los últimos tiempos las ventas medias en un comercio rondaban las 120 000 PTAS diarias. Sin embargo, hace unos meses se abrió una superficie comercial cerca del mismo. El establecimiento defiende que las ventas medias se mantienen o incluso han aumentado, pero que no han disminuido. Para contrastar estadísticamente este supuesto se ha seleccionado una muestra de las ventas diarias realizadas después de la apertura de la superficie comercial. (a) Establecer las hipótesis nula y alternativa. (b) ¿Qué nombre recibe la probabilidad de que el establecimiento concluya erróneamente que las ventas medias han disminuido? Explica cómo se denomina y en qué consiste el otro error posible. (c) El establecimiento ha encargado el estudio a un especialista, y en su informe afirma, textualmente, que “el valor obtenido al realizar el contraste es significativo”, pero el establecimiento no entiende el significado de la frase. ¿Significa que el establecimiento debe concluir que sus ventas medias disminuyeron, o es lo contrario? RESOLUCIÓN apartado (a) Planteamos las hipótesis: H0: Hipótesis nula. H1: Hipótesis alternativa, complementa la hipótesis nula. H0 : µ0 ≥ 120 000 → La media de las ventas se mantienen o incluso han aumentado. H1 : µ0 < 120 000 → La media de las ventas del comercio SÍ ha disminuido. Siendo µ las ventas medias de dicho comercio, expresadas en pesetas. Las hipótesis así definidas suponen plantear una prueba de... Contraste de hipótesis unilateral. RESOLUCIÓN apartado (b) Error tipo I: Es la probabilidad de rechazar Ho siendo cierta. P(I) = P[Rechazar H0 / cierta H0 ] Se rechaza la afirmación de que la media de las ventas se mantienen o incluso han aumentado (rechaza H0) siendo cierto (es cierta H0). Estamos pues en un caso de ERROR DE TIPO I Error tipo II: Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa. P(II) = P[Rechazar H1 / cierta H1 ] El error de tipo II consistiría en rechazar que las ventas en el comercio han disminuido (rechaza H1) cuando en realidad sí han disminuido (cierta H1). RESOLUCIÓN apartado (c) Un resultado significativo quiere decir que el valor obtenido del estadístico cae dentro de la región de rechazo para un cierto valor de significación α, por lo que nos llevaría a rechazar la hipótesis nula, es decir, que concluiríamos que las ventas medias SÍ han disminuido, aunque se debería exigir al especialista el nivel de significación con el que se está trabajando en la prueba. Criterios de corrección y calificación especificados en la prueba oficial: (a) 0.75 puntos. (b) Cada tipo de error: 0.5 puntos (c) 0,75 puntos. Abel Martín 4 Del aula a la PAU 004.– PAU – Universidad de Oviedo – – JUNIO 1999 La Concejalía de Juventud de un Ayuntamiento maneja el dato de que la edad a la que los hijos se independizan de sus padres es una variable Normal con media 29 años y desviación típica 3 años. Aunque la desviación típica no plantea dudas, sí se sospecha que la media ha descendido, sobre todo por la política de ayuda al empleo que ha llevado a cabo el Ayuntamiento. Así, de un estudio reciente sobre 100 jóvenes que se acaban de independizar, se ha obtenido una media de 28.1 años de edad. (a) Con un nivel de significación del 1% ¿puede defenderse que la edad media no ha disminuido, frente a que sí lo ha hecho como parecen indicar los datos? Plantear el contraste o test de hipótesis y resolverlo. (b) Explicar, en el contexto del problema, en qué consisten cada uno de los errores del tipo I y II. (Algunos valores de la función de distribución de la Normal de media 0 y desviación típica 1: F (100) = 1; F(3) = 0.999; F(2.33) = 0.99; F(0.01) = 0.504 RESOLUCIÓN apartado (a) Los datos proporcionados por el problema son: Población → N(29, 3) Muestra → N(28.1, S) ; n = 100 1º PASO Planteamos las hipótesis: H0: Hipótesis nula. H1: Hipótesis alternativa, complementa la hipótesis nula. H0 : µ0 ≥ 29 → La edad media de los hijos independizados NO ha disminuido. H1 : µ0 < 29 → La edad media de los hijos independizados SÍ ha disminuido. Siendo µ la edad media a la que los hijos se independizan de sus padres. 2º PASO El nivel de significación que nos determina el enunciado es del 1% → α = 0.01 El nivel de confianza es del 99% → 1 - α = 0.99 3º PASO Las hipótesis así definidas suponen plantear una prueba de... Contraste de hipótesis unilateral Para α = 0.01 (1 - α = 0.99), según vemos en el enunciado [F(zα) = 0.99], le corresponde un crítico de zα = 2.33 La hipótesis alternativa nos indica la dirección del contraste, es decir, la región de rechazo de la hipótesis nula: La región de rechazo será (- ∞, - 2.33) 4º PASO Recordemos que los datos proporcionados por el problema son: www.aulamatematica.com Muestreo. Inferencia Estadística. Test de hipótesis. Tipos de errores 5 Población → N(29, 3) ; Muestra → N(28.1, S) ; n = 100 La distribución que sigue la media muestral es la normal de parámetros: σ ℜ → N µ, n 3 N 29, 100 N(29, 0.3) 5º PASO Como no se trata de una N(0, 1), el valor del estadístico del contraste lo obtenemos tipificando la variable... x-µ Z= → N(0, 1) σ n Z= 28.1 - 29 =-3 0.3 6º PASO Nuestro estadístico Z = - 3) cae dentro de la región de rechazo, por lo que rechazamos la hipótesis nula, y al nivel del 1% podremos defender que la política de ayuda al empleo que ha llevado a cabo el Ayuntamiento ha tenido su efecto y la edad media a la que los hijos se independizan de sus padres SÍ ha disminuido. RESOLUCIÓN apartado (b) Explicar, en el contexto del problema, en qué consisten cada uno de los errores del tipo I y II Error tipo I: Es la probabilidad de rechazar Ho siendo cierta. P(I) = P[Rechazar H0 / cierta H0 ] Después de la política llevada a cabo por el Ayuntamiento, se rechaza que la media de edad de independencia de los hijos no ha disminuido (se rechaza H0), siendo realmente cierto (es cierto H0). Error tipo II: Es la probabilidad de rechazar H1 siendo cierta o también no rechazar H0 cuando es falsa. P(II) = P[Rechazar H1 / cierta H1 ] Después de la política llevada a cabo por el Ayuntamiento, se rechaza que la media de edad de emancipación de los hijos ha disminuido (se rechaza H1) y realmente SÍ ha disminuido (es cierto H1). Criterios de corrección y calificación especificados en la prueba oficial: (a) Plantear el contraste, 0.5 puntos. Resolverlo, 1 punto Abel Martín (b) 0.5 puntos cada error.