Métodos Estadı́sticos de la Ingenierı́a Práctica 6: Intervalos de Confianza y Contrastes de Hipótesis Área de Estadı́stica e Investigación Operativa Mariano Amo Salas y Licesio J. Rodrı́guez-Aragón Abril 2010 Contenidos Práctica 6 . . . . . . . . . . . . . . Intervalo de Confianza . . . . . . . . . . . . . . Intervalo de Confianza para p . . . . . . . . . El valor z ⋆ . . . . . . . . . . . . . . . . . . . . . . Construcción de un Intervalo de Confianza Contraste de Hipótesis . . . . . . . . . . . . . . Contraste Bilateral. . . . . . . . . . . . . . . . . Contraste Unilateral . . . . . . . . . . . . . . . . Intervalo de confianza para µ. . . . . . . . . . Contraste de Hipótesis . . . . . . . . . . . . . . Contraste Bilateral. . . . . . . . . . . . . . . . . Contraste Unilateral . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 3 4 5 6 7 8 9 10 11 12 13 14 Contenidos Práctica 6 Intervalos de Confianza para p. Contrastes de Hipótesis para p. – Contraste Bilateral. – Contraste Unilateral. Intervalos de Confianza para µ. Contrastes de Hipótesis para µ. – Contraste Bilateral. – Contraste Unilateral. Ejercicios. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 2 / 14 Intervalo de Confianza Siempre que tomamos una medida o hacemos un muestreo (observar una muestra de una población) obtenemos una medida diferente de la cualidad a observar. Los errores de medición y el azar en la selección de la muestra hacen que nuestra variable de interés se comporte como una variable aleatoria. Muchas veces resulta necesario indicar no sólo un valor de referencia, sino un intervalo de valores. Cuando observamos una V.A. discreta (binaria) se suele considerar la proporción, p, de individuos que tienen una determinada caracterı́stica. Cuando observamos una V.A. continua la media, µ, suele proporcionar una medida de tendencia central. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 3 / 14 2 Intervalo de Confianza para p Diremos que la proporción p es la proporción de individuos a favor o en contra de algo, o la proporción de piezas con una determinada caracterı́stica, por ejemplo defectuosas. Esta proporción p suele ser desconocida y conocer su valor implicarı́a preguntar o muestrear toda la población. Normalmente se toma una muestra de tamaño n y se obtiene p̂ que es el valor que toma la proporción en la muestra de tamaño n. Sabemos que p̂ sigue una distribución Binomial, que se puede aproximar por una distribución normal, con n suficientemente grande y verificándose n > 20 y np(1 − p) > 35. p p̂ ≡ N (p, p(1 − p)/n) Podemos entonces estandarizar p̂ y considerar la V.A. Z: p̂ − p Z=q p(1−p) n ≡ N (0, 1). Cada vez que tomemos una muestra de tamaño n de la población, obtendremos un valor diferente de p̂ y de Z. Buscamos entonces un intervalo, que con un grado de confianza dado γ = (1 − α), en el que esté el valor de p̂ o Z. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 4 / 14 3 El valor z ⋆ En definitiva buscamos valores z1 y z2 tales que, P (z1 ≤ Z ≤ z2 ) = 1 − α. La distribución normal es simétrica con lo que tendremos que −z1 = z2 = z ⋆ , p̂ − p P (−z ⋆ ≤ q p(1−p) n ≤ z ⋆ ) = 1 − α. Pero la desviación tı́pica p de p̂ incluye el valor p desconocido, para resolver esto aproximamos la desviación tı́pica por p̂(1 − p̂)/(n − 1), con lo que p̂ − p P (−z ⋆ ≤ q p̂(1−p̂) n−1 ≤ z ⋆ ) = 1 − α. El intervalo de confianza vendrá entonces dado por, p p (p̂ − z ⋆ p̂(1 − p̂)/(n − 1), p̂ + z ⋆ p̂(1 − p̂)/(n − 1)), que contendrá el valor de p con una confianza de 1 − α medida en términos de probabilidad. α = P (Z ≤ −z ⋆ ) 2 En R y para una confianza 1 − α del 95%: ó 1− α = P (Z ≤ z ⋆ ) 2 >alfa<-0.05 >z1<-qnorm(alfa/2) >z2<-qnorm(1-alfa/2) Comprobándose que −z1 = z2 = z ⋆ : >zestrella<--z1 Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 5 / 14 4 Construcción de un Intervalo de Confianza Supongamos ahora que del total de piezas recibidas en una fábrica hemos sometido a control de calidad a 1000 de ellas. De estas 1000 piezas muestreadas 120 han resultado defectuosas, podrı́amos estableces un intervalo de confianza al 95% para la proporción de piezas defectuosas: >n<-1000 >prop<-120/n >alfa<-0.05 >zestrella<--qnorm(alfa/2) >c(prop-zestrella*(sqrt(prop*(1-prop)/(n-1))), + prop+zestrella*(sqrt(prop*(1-prop)/(n-1)))) R también genera los intervalos de confianza con la instrucción: >prop.test(x=120,n=1000,conf.level=0.95) Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 6 / 14 Contraste de Hipótesis La instrucción prop.test no sólo nos facilita la construcción de intervalos de confianza sino que nos permite realizar contrastes de hipótesis. Si p0 es un valor dado, podemos considerar el siguiente contraste de hipótesis: H 0 : p = p0 H1 : p 6= p0 Tomando una muestra de tamaño n, obteniendo p̂ y usando el estadı́stico, Z=p p̂ − p0 ≡ N (0, 1) condicionado a H0 . p0 (1 − p0 )/n El contraste da como resultado un p−valor, que es la probabilidad de obtener un valor tan extremo como el estadı́stico Z obtenido, condicionado a la hipótesis nula H0 . p − valor = P (|p̂ − p0 | ≥ |valor observado − p0 ||H0 ) Cuanto menor es el p−valor, menos probable es que se cumpla la hipótesis nula H0 . En ese caso decimos que el valor de p indica diferencias significativas entre p y p0 . Normalmente rechazaremos la hipótesis nula H0 para valores, p ≤ 0.05 Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 7 / 14 5 Contraste Bilateral Un proveedor nos proporciona un lote de piezas asegurándonos que la proporción de piezas defectuosas es del 2%. Hemos muestreado 500 piezas y hemos comprobado que 17 de ellas resultan defectuosas. H0 : p = 0.02 H1 : p 6= 0.02 En nuestro muestreo obtenemos p̂ = 14/500 y el contraste: >prop.test(x=17,n=500,p=0.02,alt="two.sided") 0.1 0.2 0.3 0.4 Resultando el contraste claramente significativo con lo que rechazaremos la hipótesis nula. 0.025 0.025 0.0 Z −2 0 2 4 0.1 0.2 0.3 0.4 −4 0.0189 0.0 0.0189 −4 −2 0 Métodos Estadı́sticos de la Ingenierı́a 2 4 Práctica 6 – 8 / 14 6 Contraste Unilateral Si el proveedor nos asegurase que el porcentaje de piezas defectuosas es menor o igual al 2%: H0 : p ≤ 0.02 H1 : p > 0.02 >prop.test(x=17,n=500,p=0.02,alt="greater") 0.1 0.2 0.3 0.4 Nuevamente el resultado del contraste es significativo, luego no nos queda más remedio que rechazar la hipótesis nula. 0.05 0.0 Z −2 0 2 4 0.1 0.2 0.3 0.4 −4 0.0 0.0189 −4 −2 0 2 4 Para considerar la H1 : p < 0.02 usarı́amos la opción alt="less". Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 9 / 14 7 Intervalo de confianza para µ De forma equivalente a como hemos hecho con las proporciones, podemos construir intervalos de confianza para la media, µ: T = X̄ − µ √ ≡ tn−1 Sc / n y el intervalo para un grado de confianza de γ = 1 − α serı́a: Sc Sc (X̄ − tn−1, 1+γ √ , X̄ + tn−1, 1+γ √ ) 2 2 n n Consideremos las mediciones del grosor del recubrimiento aislante de 10 equipos: >aislante<-c(10.3,10.1,9.8,9.9,10.2, + 10.1,9.7,9.9,9.7,10.2) Entonces la instrucción, >t.test(aislante, conf.level=0.95) nos proporcionará el intervalo de confianza al 95% del grosor del recubrimiento. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 10 / 14 Contraste de Hipótesis La instrucción t.test no sólo nos facilita la construcción de intervalos de confianza sino que nos permite realizar contrastes de hipótesis. Si µ0 es un valor dado, podemos considerar el siguiente contraste: H 0 : µ = µ0 H1 : µ 6= µ0 Tomando una muestra de tamaño n, obteniendo X̄ y usando el estadı́stico, T = X̄ − µ √ ≡ tn−1 condicionado a H0 Sc / n El contraste nos devolverá un p−valor, que es la probabilidad de obtener un valor tan extremo como el estadı́stico T obtenido, condicionado a la hipótesis nula H0 . Cuanto menor es el p−valor, menos probable es que se cumpla la hipótesis nula H0 . En ese caso decimos que el valor de p indica diferencias significativo entre µ y µ0 . Normalmente rechazaremos la hipótesis nula H0 para valores, p ≤ 0.05 Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 11 / 14 8 Contraste Bilateral Considerando que la protección de aislante está especificada a 10, ¿Podemos asegurar que esta hipótesis se cumple? H0 : µ = 10 H1 : µ 6= 10 >t.test(aislante,mu=10,alt="two.sided") 0.1 0.2 0.3 0.4 Resultando en este caso el contraste claramente no significativo por lo que podremos aceptar la hipótesis nula. 0.0 0.025 0.025 T −2 −1 0 1 2 3 2 3 0.1 0.2 0.3 0.4 −3 0.44 0.0 0.44 −3 −2 −1 0 Métodos Estadı́sticos de la Ingenierı́a 1 Práctica 6 – 12 / 14 9 Contraste Unilateral Ahora bien, el exceso de aislante no nos preocupa, lo que verdaderamente nos interesa es que el grosor de aislante no sea inferior a 10. H0 : µ ≥ 10 H1 : µ < 10 >t.test(aislante,mu=10,alt="less") 0.1 0.2 0.3 0.4 Nuevamente el resultado del contraste es no significativo, luego podremos aceptar la hipótesis nula. 0.0 0.05 T −2 −1 0 1 2 3 0 1 2 3 0.1 0.2 0.3 0.4 −3 0.0 0.44 −3 −2 −1 Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 13 / 14 10 Ejercicios Ejercicio 6.1: El equipo directivo de una empresa automovilı́stica ha encargado un sondeo que mida el grado de satisfacción de los clientes que adquirieron hace más de un año un determinado modelo. Obtener intervalos de confianza y realizar contrastes de hipótesis de la medida obtenida. Ejercicio 6.2: En un proceso de depuración y control de aguas residuales, se mide el contenido de biomasa de en miligramos por litro de agua. Se ha tomado una muestra de cada uno de los 10 tanques de depuración. Obtener intervalos de confianza y realizar contrastes de hipótesis de la medida obtenida. Métodos Estadı́sticos de la Ingenierı́a Práctica 6 – 14 / 14 11