Estadı́stica Tema 4: Estadı́stica Inferencial Unidad 1: Intervalos de Confianza y Contrastes de Hipótesis Área de Estadı́stica e Investigación Operativa Licesio J. Rodrı́guez-Aragón Diciembre 2010 Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 Estimación por Intervalos 3 Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 Estimación de Proporciones Puntual vs. Intervalo . . . . . . . Estimación de una Proporción Ejemplo 1 . . . . . . . . . . . . . . . Ejemplo 2 . . . . . . . . . . . . . . . Ejercicio 1 . . . . . . . . . . . . . . . Intervalos para Medias Intervalo para µ cuando Ejemplo 3 . . . . . . . . . . Ejemplo 4 . . . . . . . . . . Ejercicio 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 . 6 . 7 . 8 10 12 σ es Desconocida ............. ............. ............. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 14 15 18 19 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Contrastes de Hipótesis 20 Contrastes de Hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 Pruebas relacionadas con la Media de una Población Prueba para µ = µ0 cuando σ es Desconocida . . . . . . . . Ejemplo 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . p−valor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ejercicio 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Prueba para µ ≤ µ0 cuando σ es Desconocida . . . . . . . . Ejemplo 6 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Ejercicio 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pruebas relacionadas Ejemplo 7 . . . . . . . . Ejemplo 8 . . . . . . . . Ejercicio 5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 24 25 26 27 28 29 31 con Proporciones 32 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 1 Contenidos Estimación por Intervalos. Estimación de Proporciones. Estimación de Medias. Pruebas relacionadas con la Media de una Población. Pruebas para Proporciones. Aún el estimador centrado más eficiente es improbable que estime con exactitud el valor del parámetro de la población, de ahı́ nace la necesidad de obtener un intervalo dentro del cual se espera hallar el valor del parámetro. Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 2 / 37 3 / 37 Estimación por Intervalos Intervalos de Confianza Una estimación por intervalos, de un parámetro θ, es un intervalo de la forma θ̂I < θ < θ̂S tal que se verifique, P(θ̂I < θ < θ̂S ) = γ con γ suficientemente próximo a 1. Los valores θ̂I y θ̂S se denominan Lı́mites de Confianza. Mientras que γ es el Coeficiente de Confianza. En ocasiones, en lugar de fijar γ se fija su valor complementario, α = 1 − γ, que normalmente será un valor pequeño. Este α, es el Coeficiente de Significación, y representa la probabilidad de fallar en la estimación. Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 4 / 37 2 5 / 37 Estimación de Proporciones Puntual vs. Intervalo La estimación de la probabilidad real, p, de éxito/fracaso o bien aceptación/rechazo de una población es inabordable. Hemos de conformarnos con una estimación de esa probabilidad p̂. Para ello observamos una muestra de tamaño n y cuantificamos X, casos favorables, y estimamos p mediante p̂ = X/n. Más que una estimación puntal del parámetro p, nos puede interesar un intervalo de la forma p̂I < p < p̂S tal que se verifique, P(p̂I < p < p̂S ) = γ con γ suficientemente próximo a 1. Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 6 / 37 Estimación de una Proporción Muestreamos una población binomial B(n, p), de la que desconocemos p, tomando una observación X ≡ B(n, p) y buscamos estimar un intervalo de confianza para p ∈ (0, 1). Sabemos que E(X) = np, con lo que tomaremos como estimador p̂ = X/n. Para n suficientemente grande p̂ ≡ N (µ = p, σ 2 = pq/n), luego P(qnorm( 1−γ 1+γ ,p,sqrt(pq/n)) < p < qnorm( ,p,sqrt(pq/n)) < γ 2 2 Los valores p y q en los lı́mites de confianza del intervalo son desconocidos, los estimamos por p̂ y q̂ = 1 − p̂. Con lo que el intervalo para un valor γ de confianza vendrá dado por: 1−γ 1+γ I = qnorm( ,p̂,sqrt(p̂q̂/n)), qnorm( ,p̂,sqrt(p̂q̂/n)) 2 2 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 7 / 37 3 Ejemplo 1 Una empresa desea saber con un 95% de confianza el porcentaje de equipos defectuosos que produce. Para ello toma una muestra al azar de 250 = n equipos y comprueba que 7 = X de ellos resultan ser defectuosos. > > > > > + n<-250; x<-7; p<-x/n; q<-1-p; c(qnorm(0.025,mean=p,sd=sqrt(p*q/n)), qnorm(0.975,mean=p,sd=sqrt(p*q/n))) [1] 0.007550145 0.048449855 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 8 / 37 Ejemplo 1 > prop.test(x = 7, n = 250, conf.level = 0.95) 1-sample proportions test with continuity correction data: 7 out of 250, null probability 0.5 X-squared = 220.9, df = 1, p-value < 2.2e-16 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.01232396 0.05927047 sample estimates: p 0.028 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 9 / 37 4 Ejemplo 2 Mediante una encuesta efectuada a 1000 clientes se ha estimado que 823 están satisfechos o muy satisfechos del trato recibido. Establecer un intervalo de confianza al 95% del porcentaje de clientes satisfechos: > > > > > + n<-1000; x<-823; p<-x/n; q<-1-p; c(qnorm(0.025,mean=p,sd=sqrt(p*q/n)), qnorm(0.975,mean=p,sd=sqrt(p*q/n))) [1] 0.7993444 0.8466556 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 10 / 37 Ejemplo 2 > prop.test(x = 823, n = 1000, conf.level = 0.95) 1-sample proportions test with continuity correction data: 823 out of 1000, null probability 0.5 X-squared = 416.025, df = 1, p-value < 2.2e-16 alternative hypothesis: true p is not equal to 0.5 95 percent confidence interval: 0.7975972 0.8458786 sample estimates: p 0.823 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 11 / 37 5 Ejercicio 1 Si la proporcion p permanece constante: ¿Influye en el intervalo de confianza el tamaño de la muestra? > prop.test(x=10,n=100,conf.level=0.95)$conf.int [1] 0.0516301 0.1803577 attr(,"conf.level") [1] 0.95 > prop.test(x=100,n=1000,conf.level=0.95)$conf.int [1] 0.08245237 0.12069092 attr(,"conf.level") [1] 0.95 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 12 / 37 6 13 / 37 Intervalos para Medias Intervalo para µ cuando σ es Desconocida Sea X1 , X2 , . . . , Xn una m.a.s. procedente de una N (µ, σ), con µ y σ desconocidas. Queremos estimar µ con un nivel de confianza γ. Estimaremos la media poblacional µ a partir de la media muestral µ̂ = X y la varianza poblacional σ 2 a partir de la cuasivarianza muestral σ̂ 2 = Sc2 . Buscamos µ̂I = a y µ̂S = b, extremos del intervalo de confianza, tales que: P(a ≤ X ≤ b) = γ = 1 − α √ √ √ P(a ≤ X ≤ b) = P((a − µ)/(Sc / n)/ ≤ (X − µ)/(Sc / n) ≤ (b − µ)/(Sc / n)) √ √ P(a ≤ X ≤ b) = P((a − µ)/(Sc / n)/ ≤ T ≤ (b − µ)/(Sc / n)) = γ Con T ≡ tn−1 . entonces: √ √ (a − µ)/(Sc / n) = tn−1, 1−γ ⇒ a = µ + (Sc / n)tn−1, 1−γ 2 2 √ √ (b − µ)/(Sc / n) = tn−1, 1+γ ⇒ b = µ + (Sc / n)tn−1, 1+γ 2 0.2 Densidad 0.3 0.4 2 0.1 γ 0.0 t(n − 1, (1 − γ) 2) −3 −2 t(n − 1, (1 + γ) 2) −1 0 1 2 3 T Teniendo en cuenta que para la tn−1 , tn−1, 1+γ = −tn−1, 1−γ . 2 2 √ √ P(a ≤ X ≤ b) = P(µ − (Sc / n)tn−1, 1+γ ≤ X ≤ µ + (Sc / n)tn−1, 1+γ ) = 2 2 √ √ = P(X − (Sc / n)tn−1, 1+γ ≤ µ ≤ X + (Sc / n)tn−1, 1+γ ) = γ 2 2 Luego tenemos que el intervalo de confianza para el nivel γ será, √ √ I = [X − (Sc / n)tn−1, 1+γ , X + (Sc / n)tn−1, 1+γ ] 2 Recordemos que tn−1, 1+γ son los cuantiles 2 1+γ 2 2 de una distribución tn−1 : qt( 1+γ 2 ,df=n-1) Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 14 / 37 7 Ejemplo 3 Crear un intervalo de confianza al 95% para la cantidad de información descargada que figura en el fichero Webs.Rdata. > > > > > > load("Webs.Rdata") attach(Webs) xb<-mean(Informacion); Sc<-sd(Informacion); n<-length(Informacion); xb [1] 1.343283 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 15 / 37 Ejemplo 3 √ √ I = [X − (Sc / n)tn−1, 1+γ , X + (Sc / n)tn−1, 1+γ ] 2 2 > c(xb+(Sc/sqrt(n))*qt(0.025,df=n-1), + xb+(Sc/sqrt(n))*qt(0.975,df=n-1)) [1] 1.234069 1.452498 > xb-(Sc/sqrt(n))*qt(0.975,df=n-1) [1] 1.234069 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 16 / 37 8 Ejemplo 3 √ √ I = [X − (Sc / n)tn−1, 1+γ , X + (Sc / n)tn−1, 1+γ ] 2 2 > t.test(Informacion,conf.level=0.95) One Sample t-test data: Informacion t = 24.5073, df = 74, p-value < 2.2e-16 alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 1.234069 1.452498 sample estimates: mean of x 1.343283 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 17 / 37 Ejemplo 4 Crear intervalos de confianza para la información media descargada para cada Portal. > t.test(Informacion[Portal=="Compras"], + conf.level=0.95)$conf.int [1] 1.134820 1.566096 attr(,"conf.level") [1] 0.95 > t.test(Informacion[Portal=="Compras"], + conf.level=0.95)$estimate mean of x 1.350458 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 18 / 37 9 Ejercicio 2 Qué ocurre al aumentar o disminuir el nivel de confianza, γ. > t.test(Informacion,conf.level=0.99)$conf.int [1] 1.198366 1.488200 attr(,"conf.level") [1] 0.99 > t.test(Informacion,conf.level=0.95)$conf.int [1] 1.234069 1.452498 attr(,"conf.level") [1] 0.95 > t.test(Informacion,conf.level=0.80)$conf.int [1] 1.272407 1.414160 attr(,"conf.level") [1] 0.8 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 19 / 37 10 20 / 37 Contrastes de Hipótesis Contrastes de Hipótesis Los contrastes de hipótesis permitirán decidirnos entre dos hipótesis formuladas previamente con un determinado nivel de error. Los contrastes de hipótesis se basan en la información proporcionada por una muestra. La terminologı́a estadı́stica habla de Aceptar o Rechazar una hipótesis: Rechazar, significa que la hipótesis es falsa. Aceptar, solamente implica que no se tiene suficiente información para rechazarla. En el contraste, se plantea dos Hipótesis excluyentes y complementarias: Hipótesis Nula, H0 : Suele ser la más concreta, la que deberı́a ser cierta por defecto. Hipótesis Alternativa, H1 : Complementaria a la Nula. El planteamiento de H0 permite elaborar un modelo probabilı́stico a partir del cual podemos llegar a la decisión final. γ 0.2 Densidad 0.3 0.4 El Contraste de Hipótesis conlleva establecer dos zonas disjuntas y complementarias, Zona de Rechazo de H0 (Región Crı́tica) y la Zona de Aceptación de H0 . 1−α α 2 0.1 α 2 0.0 Z((1 − γ) 2) −3 −2 Z((1 + γ) 2) −1 0 1 2 3 Z Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 21 / 37 11 Contrastes de Hipótesis La decisión de aceptar o rechazar H0 se basa en probabilidades, no en certezas, al tomar la decisión podemos cometer dos tipo de errores. Error Tipo I: Rechazar la Hipótesis Nula, H0 siendo verdadera. Error Tipo II: Aceptar la Hipótesis Nula, H0 siendo falsa. Aceptar H0 Rechazar H0 H0 Verdadera Decisión Correcta 1−α Error Tipo I α H0 Falsa Error Tipo II β Decisión Correcta 1−β Las probabilidades de los Errores de tipo I y II son probabilidades condicionadas: Nivel de Significación, α: α = P(Error I) = P(Rechazar H0 |H0 Verdadera) Nivel de Confianza, 1 − α = γ: γ = 1 − P(Error I) = P(Aceptar H0 |H0 Verdadera) Error Tipo II, β: β = P(Error II) = P(Aceptar H0 |H0 Falsa) Potencia del Contraste, 1 − β 1 − β = P(Rechazar H0 |H0 Falsa) Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 22 / 37 12 Pruebas relacionadas con la Media de una Población 23 / 37 Prueba para µ = µ0 cuando σ es Desconocida Consideremos el problema de probar la hipótesis de que la media de una población, con varianza σ 2 desconocida, sea igual a un valor concreto µ0 , en contra de una hipótesis alternativa bilateral de que la media sea diferente. H 0 : µ = µ0 H1 : µ 6= µ0 Sea X1 , X2 , . . . , Xn una m.a.s., el estadı́stico apropiado para este caso está basado en la media muestral X. Para un nivel de Significación α = 1 − γ se establecen valores crı́ticos a y b, tales que el intervalo a < X < b defina la Región de Aceptación y la Región Crı́tica. Definamos, √ T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 . Los valores crı́ticos se obtienen, γ 0.2 Densidad 0.3 0.4 √ a = µ0 + (Sc / n)tn−1, α2 √ b = µ0 + (Sc / n)tn−1,1− α2 α 2 t(α 2) 0.0 0.1 1−α α 2 −3 −2 t(1 − α 2) −1 0 1 2 3 T Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. √ Si X cae en la Región de Aceptación, a < X < b, entonces, el estadı́stico T = (X − µ0 )/(Sc / n) caerá en la Región de Aceptación, |T | < tn−1,1− α2 , y se aceptará H0 . En caso contrario, Región de Rechazo, |T | ≥ tn−1,1− α2 , se rechazará H0 . Recordemos que tn−1, 1+γ = tn−1,1− α2 son los cuantiles de una distribución tn−1 : 2 α qt( 1+γ 2 ,df=n-1) = qt(1 − 2 ,df=n-1) Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 24 / 37 13 Ejemplo 5 El desarrollador del sito web afirma que por termino medio, cada conexión se descarga 1.4Mb de información. Las conexiones que difieran de ese valor han de ser analizadas. > t.test(Informacion,mu=1.4, + alt="two.sided",conf.level=0.95) One Sample t-test data: Informacion t = -1.0348, df = 74, p-value = 0.3042 alternative hypothesis: true mean is not equal to 1.4 95 percent confidence interval: 1.234069 1.452498 sample estimates: mean of x 1.343283 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 25 / 37 p−valor Una herramienta muy útil en los contrastes de hipótesis es el p−valor. Se define como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. > pt(-1.0348,df=74)+(1-pt(1.0348,df=74)) [1] 0.3041322 Si el p−valor < α = 1 − γ, Region de Rechazo. Si el p−valor > α = 1 − γ, Region de Aceptación. Para un nivel de confianza γ = 0.95 la significación α = 0.05. Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 26 / 37 14 Ejercicio 3 ¿Y si se afirmase que cada conexión se descarga 1.5Mb de información? > t.test(Informacion,mu=1.5, + alt="two.sided",conf.level=0.95) One Sample t-test data: Informacion t = -2.8592, df = 74, p-value = 0.005515 alternative hypothesis: true mean is not equal to 1.5 95 percent confidence interval: 1.234069 1.452498 sample estimates: mean of x 1.343283 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 27 / 37 15 Prueba para µ ≤ µ0 cuando σ es Desconocida En este caso consideremos la hipótesis de que la media de una población, con varianza σ 2 desconocida, sea menor o igual a un valor concreto µ0 , en contra de una hipótesis alternativa unilateral de que la media sea mayor. H 0 : µ ≤ µ0 H 1 : µ > µ0 Para un nivel de Significación α = 1 − γ se establecen un valor crı́tico a, tal que el intervalo X < a defina la Región de Aceptación y la Región Crı́tica. Definamos, √ T = (X − µ0 )/(Sc / n) ≡ tn−1 bajo H0 . El valor crı́tico se obtiene, γ 0.2 Densidad 0.3 0.4 √ √ (a − µ0 )/(Sc / n) = tn−1,1−α = tn−1,γ ⇒ a = µ0 + (Sc / n)tn−1,1−α 1−α 0.1 α 0.0 t(1 − α) −3 −2 −1 0 1 2 3 T Ası́ pues, de la población, se elige una muestra de tamaño n y se calcula la media de la muestra X. √ Si X cae en la Región de Aceptación, X < a, entonces, el estadı́stico T = (X − µ0 )/(Sc / n) caerá en la Región de Aceptación, T < tn−1,1−α , y se aceptará H0 ; en caso contrario, Región de Rechazo, T ≥ tn−1,1−α , se rechazará H0 . Recordemos que tn−1,γ = tn−1,1−α son los cuantiles de una distribución tn−1 : qt(γ,df=n-1) = qt(1 − α,df=n-1). Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 28 / 37 16 Ejemplo 6 El desarrollador afirma que cada conexión se ha de descargar, como mucho, 1.4Mb de información. H0 : µ ≤ 1.4 H1 : µ > 1.4 Si el p−valor < α = 1 − γ, Region de Rechazo. Si el p−valor > α = 1 − γ, Region de Aceptación. Para un nivel de confianza γ = 0.95 la significación α = 0.05. Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 29 / 37 Ejemplo 6 > t.test(Informacion,mu=1.4, + alt="greater",conf.level=0.95) One Sample t-test data: Informacion t = -1.0348, df = 74, p-value = 0.848 alternative hypothesis: true mean is greater than 1.4 95 percent confidence interval: 1.251983 Inf sample estimates: mean of x 1.343283 > 1-pt(-1.0348,df=74) [1] 0.8479339 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 30 / 37 17 Ejercicio 4 Y si el desarrollador afirmase que el lı́mite medio de descarga no deberı́a superar 1.2Mb. > t.test(Informacion,mu=1.2, + alt="greater",conf.level=0.95) One Sample t-test data: Informacion t = 2.6141, df = 74, p-value = 0.005417 alternative hypothesis: true mean is greater than 1.2 95 percent confidence interval: 1.251983 Inf sample estimates: mean of x 1.343283 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 31 / 37 Pruebas relacionadas con Proporciones 32 / 37 Ejemplo 7 Una fabricante de antivirus nos asegura que su producto detecta el nuevo y peligroso Virus “VELO” por lo menos en un 90% de las ocasiones. Hemos infectado 15 ordenadores y hemos comprobado que el antivirus ha dado positivo en 12. ¿Hay evidencias significativas para desconfiar del fabricante? H0 : p ≥ .9 H1 : p < .9 Si el p−valor < α = 1 − γ, Region de Rechazo. Si el p−valor > α = 1 − γ, Region de Aceptación. Para un nivel de confianza γ = 0.95 la significación α = 0.05. Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 33 / 37 18 Ejemplo 7 > prop.test(x=12,n=15,p=0.9, + alt="less",conf.level=0.95) 1-sample proportions test with continuity correction data: 12 out of 15, null probability 0.9 X-squared = 0.7407, df = 1, p-value = 0.1947 alternative hypothesis: true p is less than 0.9 95 percent confidence interval: 0.0000000 0.9367275 sample estimates: p 0.8 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 34 / 37 Ejemplo 8 Nuestra compañı́a telefónica propone visitar los hogares de núcleos rurales de Ciudad Real para proporcionar y vender acceso a internet mediante 3G. Se cree que este mercado es muy atractivo ya que, al parecer, sólo en el 25% de los hogares hay conexión a internet. Antes de lanzar el proyecto comercial se ha efectuado un estudio piloto. Se han visitado un total de 50 hogares y ha resultado que 18 de ellos ya poseı́an conexión a internet. A vista de estos resultados, se puede continuar suponiendo ciertas las hipótesis de partida. H0 : p ≤ 0.25 H1 : p > 0.25 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 35 / 37 19 Ejemplo 8 > prop.test(x=18,n=50,p=0.25, + alt="greater",conf.level=0.95) 1-sample proportions test with continuity correction data: 18 out of 50, null probability 0.25 X-squared = 2.6667, df = 1, p-value = 0.05124 alternative hypothesis: true p is greater than 0.25 95 percent confidence interval: 0.2493598 1.0000000 sample estimates: p 0.36 Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 36 / 37 Ejercicio 5 Por propia experiencia, sabemos que nuestro filtro anti spam detecta el 80% de mensajes basura que llegan a nuestra cuenta. El proveedor nos asegura que su tecnologı́a es similar a la que hay en el mercado. Hemos abierto una cuenta en Google y hemos reenviado 1564 mensajes de spam que estaban en nuestra papelera. De ellos sólo han burlado el filtro 186. ¿Existen evidencias significativas para desconfiar de nuestro proveedor actual? H0 : p = 0.8 H1 : p 6= 0.8 > prop.test(x=1378,n=1564,p=0.8, + alt="two.sided",conf.level=0.95) Licesio J. Rodrı́guez-Aragón Tema 4, Unidad 1 – 37 / 37 20