Grado en Ingenierı́a Informática Probabilidad y Estadı́stica 2012-2013 Hoja 4 Estimación de parámetros. Puntual e intervalos de confianza. 1. Dada una muestra aleatoria de tamaño n de una variable X, calcular el estimador de máxima verosimilitud y el del método de los momentos, en los siguientes casos: i) ii) iii) iv) v) vi) X X X X X X ∼ Bernoulli de parámetro p. ∼ Poisson (λ). ∼ Exponencial (λ), con λ > 0 (es decir, fλ (x) = λe−λx , para x > 0). ∼ N (µ, σ) (σ conocido). ∼ N (µ, σ) (µ conocido). ∼ N (µ, σ). 2. Un árbitro lanza su moneda favorita al principio de cada partido. Si durante un año 26 veces le ha salido cara y 17 veces le ha salido cruz, ¿cuál es la estimación de máxima verosimilitud de la probabilidad de cara en esa moneda? 3. El tiempo (en minutos) de un cierto proceso sigue una distribución exponencial. Hallar el estimador de máxima verosimilitud del parámetro de la distribución a partir de la siguiente muestra de tiempos de tamaño 10: 5.3 8.5 6.6 10.9 8.3 14.8 5.4 2.7 6.3 4.4 4. Se han realizado medidas repetidas e independientes entre sı́ del pH de una cierta solución, obteniéndose los siguientes resultados: 5.12 5.20 5.15 5.17 5.16 5.19 5.15 Suponiendo que estas medidas siguen una distribución N (µ; σ), obtener los estimadores de máxima verosimilitud de µ, σ 2 y σ. 5. El coseno X del ángulo con que emite electrones un proceso radiactivo es una variable aleatoria con función de densidad ⎧ ⎨ 1 + θx , si − 1 ≤ x ≤ 1; fθ (x) = 2 ⎩0, en caso contrario. donde θ ∈ [−1, 1]. Se dispone de una muestra aleatoria x1 , x2 , . . . , xn . Calcula un estimador de θ por el método de los momentos. 6. La distancia X entre un árbol cualquiera y el árbol más próximo a él en un bosque sigue una distribución de Rayleigh con función de densidad 2 2θxe−θx , si x ≥ 0; fθ (x) = 0, si x < 0. para un cierto parámetro θ > 0. Se dispone de una muestra aleatoria x1 , x2 , . . . , xn . i) Obtener el estimador de máxima verosimilitud de θ . ii) Obtener el estimador de θ por el método de los momentos. √ +∞ π √ −y Nota: . y e dy = 2 0 7. Para estudiar la proporción p de caballos afectados por la peste equina se les va a someter a una prueba. Se sabe que la prueba resulta positiva si el animal está enfermo. Además, si el animal está sano, hay una probabilidad de 4% de que la prueba resulte positiva. 1 i) Obtener la relación entre la probabilidad p de que un caballo esté enfermo y la probabilidad q de que la prueba resulte positiva. ii) Si se ha realizado la prueba a 500 caballos y resultó positiva en 95 casos, ¿cuál es el estimador de máxima verosimilitud de q? A partir del resultado del apartado i), calcular una estimación de p. 8. En una piscifactorı́a hay una proporción desconocida de peces de una especie A. Para obtener información sobre esa proporción vamos a ir sacando peces al azar. i) Si la proporción de peces de la especie A es p, ¿cuál es la probabilidad de que el primer pez de la especie A sea el décimo que extraemos? ii) Tres personas realizan, independientemente unas de otras, el proceso de sacar peces al azar hasta encontrarse con el primero de tipo A y esto ocurre, respectivamente, en las extracciones 10, 15, 18. Obtener el estimador de máxima verosimilitud de p, a partir de esta muestra de tamaño 3. 9. Un comprador solicita un lote de 10 telas asfálticas cuyo contenido de asfalteno sigue una distribución N (35; 2). ¿Cuál es la probabilidad de que el contenido medio de asfalteno del lote sea inferior a 37? 10. El error (en mg) que se comete al pesar un objeto en una cierta balanza puede considerarse como una variable aleatoria N (0; 150). Se pide: i) Probabilidad de que el error cometido (en valor absoluto) en una pesada sea inferior a 200 mg. ii) Número mı́nimo de pesadas para que, con una probabilidad del 90%, el error medio cometido (en valor absoluto) sea inferior a 50 mg. 11. Se sabe que el peso de los recién nacidos sigue una distribución normal. Si en una muestra aleatoria de 100 de ellos se obtiene una media muestral de 3 kg y una cuasi-desviación tı́pica de 0,5 kg, calcular un intervalo de confianza para la media poblacional a un nivel de confianza del 95%. 12. Observamos el peso en gramos de una muestra de 10 aspirinas, obteniendo: 1.19 1.23 1.18 1.21 1.27 1.17 1.15 1.14 1.19 1.20 Suponiendo normalidad hallar un intervalo al 80% para la varianza. 13. Para un grupo de 41 alumnos de un instituto, se observaron las calificaciones obtenidas en las PAU y se obtuvo una cuasi-varianza muestral de 5,75. Para otro grupo de 25 estudiantes procedentes de otro instituto, se constató que la cuasi-varianza era 5,35. Suponiendo que la distribución de la nota de las PAU para cada uno de los centros es normal, hallar el intervalo de confianza para el cociente de las varianzas al nivel de confianza del 90%. 14. Tenemos las siguientes muestras de la cantidad de una cierta substancia en dos hortalizas: Tomate : 777 790 759 790 770 758 764 Pepino : 782 773 778 765 789 797 782 i) Hallar un intervalo de confianza para la diferencia de medias, suponiendo que las varianzas en las dos poblaciones de hortalizas son iguales. ii) Determinar si la hipótesis de igualdad de varianzas es razonable. iii) Hallar un intervalo de confianza para la diferencia de medias, si las varianzas en las dos poblaciones de tomates y pepinos son posiblemente distintas. Comparar el intervalo con el obtenido en i). 2 15. Se determina la cantidad de nitrógeno en 8 muestras diferentes de harina. La digestión de cada una de las muestras se realiza con dos métodos diferentes obteniéndose Muestra de harina Método 1 Método 2 1 2’0 1’8 2 1’4 1’5 3 2’3 2’5 4 1’2 1’0 5 2’1 2’0 6 1’5 1’3 7 2’4 2’3 8 2’0 2’1 Hallar un intervalo para la diferencia de medias, especificando las hipótesis utilizadas para obtenerlo. 16. Se quiere estudiar la proporción p de declaraciones de la renta que presentan algún defecto. En una muestra preliminar pequeña (muestra piloto) de tamaño 50 se han observado 22 declaraciones defectuosas. ¿Cuál es el tamaño muestral necesario para estimar p cometiendo un error máximo del 0,01 con una probabilidad de 99%? 17. Una profesora imparte la misma asignatura en dos grupos distintos del mismo grado. Tiene la impresión de que el grupo del turno de mañana tiene mejor nivel que el de la tarde. En el examen final de 50 presentados del grupo de mañana 46 sacaron más de un 5 sobre 10, mientras que en el grupo de tarde de 35 presentados 20 sacaron más de 5. ¿Hay evidencia estadı́stica que sustente la opinión de la profesora? 18. Antes de encargar un gran lote de pilas alcalinas a una nueva fábrica, se desea tener una estimación de la proporción de pilas defectuosas que podemos esperar. Se prueban 300 pilas, y encontramos 42 defectuosas. i) Plantear el modelo adecuado y estimar la proporción de pilas defectuosas, con un nivel de confianza del 90%. ii) Si deseamos obtener una estimación (con el mismo nivel de confianza) cuyo error sea inferior a 0,01, ¿cuántas pilas tendrı́amos que probar? 19. Una lı́nea de producción de una fábrica es sometida a inspección. Se controlan 50 unidades elegidas al azar y se observa que 8 de ellas no cumplen las especificaciones de calidad deseadas. i) Hallar un intervalo de confianza al nivel 90% para estimar la proporción de unidades defectuosas que salen de dicha lı́nea de producción. ii) Si se desea estimar la proporción de unidades defectuosas (al mismo nivel de confianza) con un error inferior a 0,04, ¿cuántas unidades habrı́a que examinar? 3