Probabilidad y Estadı́stica Segundo del grado en Telecomunicaciones, UAM, 2013-2014 Breve solucionario del examen parcial, 18-12-2013 1. (2 puntos) Contesta razonadamente a las siguientes preguntas: a) Se lanza un dado 600 veces y se anotan los resultados obtenidos. Describe el procedimiento que seguirı́as para contrastar, a la vista de esos resultados, si el dado es regular. Solución. Se fija un nivel de significación α, digamos el 5 % y se contrasta, mediante un text χ2 , si el dado sigue el modelo (dado regular). Para ello se consideran k = 6 clases, los valores 1, 2, . . . , 6, se cuentan cuántas observaciones hay en cada una de ellas (los valores O1 , . . . , O6 ) y se comparan con los valores esperados, que como el dado es regular, son constantes en cada clase: ei = 600 · 1/6 = 100 para i = 1, . . . , 6. Se calcula el estadı́stico B = 6i=1 (Oi − ei )2 /ei y se comprueba si ese número está por encima o por debajo del percentil χ26−1,α . En el primer caso, se rechaza la hipótesis. b) En un contraste de hipótesis, ¿qué significa el nivel de significación α? Solución. La (máxima) probabilidad de rechazar la hipótesis nula cuando ésta es cierta. c) Tenemos una muestra de una variable X que sigue una N (μ, σ), con σ conocida. Estamos contrastando la hipótesis H0 : μ = 2. Al nivel de significación α = 5 %, se rechaza la hipótesis. ¿Cómo será el p-valor, mayor o menor que 5 %? Solución. El p-valor asociado a una muestra es el mı́nimo α para el que se rechazarı́a la hipótesis nula. Como en este caso con α = 5 % se rechaza, el p-valor debe ser ≤ 5 %. d) Con N muestras de una variable X que sigue una N (μ, σ), con σ conocida, el intervalo de confianza al 95 % para la media tiene tamaño 0.1. Querrı́amos reducir en un factor 10 el tamaño de este intervalo de confianza. ¿Cómo de grande deberı́a ser la nueva muestra? √ Solución. El enunciado nos dice que z2.5 % σ/ N = 0.1. Como σ es fija, reducir un factor 10 el error (pasando a 0.01) significa que la muestra debe ser de tamaño 100N (o mayor). 2. (2 puntos) Se analiza el peso en dos grupos, el primero formado por 400 personas, y el segundo por 600. Se cuentan cuántos de cada grupo tienen peso menor de 60 kg, cuántos lo tienen entre 60 y 80, y cuántos superan los 80 kg, obteniéndose los siguientes resultados: < 60 60 − 80 > 80 grupo 1 30 200 170 grupo 2 70 300 230 ¿Se puede concluir, con un nivel de significación del 5 %, que los dos grupos presentan caracterı́sticas similares en cuanto al peso? Solución. Hacemos un text χ2 de homogeneidad. Éstas son las tablas de datos observados, esperados, y diferencias relativas: observados 30 70 200 300 170 230 400 600 100 500 400 1000 10 % 50 % 40 % esperados 40 60 200 300 160 240 (O − e)2 /e 100/40 100/60 0 0 100/160 100/240 Los esperados se calculan con los porcentajes (10 %, 50 % y 40 %) de los tamaños muestrales, 400 y 600. Ası́ que basta sumar 100 100 100 5 5 5 5 60 + 40 + 15 + 10 135 100 + + + = + + + = = = 5.208. 40 60 160 240 2 3 8 12 24 24 El ejercicio termina comparando este número con el percentil χ22;5 % = 5.99, lo que determina la aceptación de la hipótesis de homogeneidad. El número de grados de libertad es (3 − 1) · (2 − 1) = 2. 3. (2 puntos) El tiempo (en √ segundos) que la máquina M1 tarda en producir una pieza sigue una N (μ1 , σ1 ), donde σ1 = 3/ 2, mientras que el tiempo para la máquina M2 es una N (μ2 , σ2 ), donde σ2 = 4. Queremos contrastar, al nivel de significación del 5 %, si las dos máquinas son igual de rápidas. Para ello, se fabrican 50 piezas con M1, obteniéndose que el tiempo medio de fabricación es de 54 segundos. Al fabricar 100 piezas con M2 se mide un tiempo medio de fabricación de 55.5 segundos. ¿Qué se puede concluir? Solución. La cuestión sugiere plantear, como hipótesis nula, H0 : μ1 = μ2 . La diferencia de medias muestrales es |x̄1 − x̄2 | = 1.5 segundos. Por otro lado, 16 + 100 = 1.960 25/100 = 1.960/2 = 0.98 . z2.5 % σ12 /n1 + σ22 /n2 = 1.960 9/2 50 Ası́ que rechazamos la hipótesis nula. 1 4. (2 puntos) Se quiere estudiar la proporción p de declaraciones de la renta que presentan algún defecto. ¿Cuál es el tamaño muestral necesario para estimar p cometiendo un error máximo del 1 % con una probabilidad de 95 %? Soluci ón. Queremos hallar n (tamaño de la muestra) para que el intervalo de confianza z2.5 % x (1 − x)/n sea menor que 0.01. No podemos usar x̄ porque no tenemos muestra, justamente estamos intentando estimar su tamaño. Nos ponemos en el “peor caso”, en el que x̄ = 1/2, y el cálculo es ya directo: √ 1 1.96 · 100 1/4 ≤ =⇒ = 98, n≥ z2.5 % n 100 2 de manera que n ≥ 982 . Si n cumple esta condición, el intervalo de confianza será menor que 0.01 en el peor de los casos, y con más razón en los restantes. 5. a) (2 puntos) La variable aleatoria X tiene como función de densidad 3 x2 /θ3 si x ∈ [0, θ], fθ (x) = 0 en caso contrario. Aquı́ θ es un parámetro, θ ∈ [1, 2]. Dada una muestra x1 , . . . , xN de la variable X, obtén un estimador de θ por el método de los momentos. b) (1 punto extra) ¿Qué se obtendrı́a por máxima verosimilitud? Solución. a) Basta hallar la esperanza de X: θ θ x2 3 3 E(X) = x 3 3 dx = 3 x3 dx = θ. θ θ 0 4 0 El estimador por momentos es solución de E(X) = x̄, con x̄ la media muestral. Ası́ que θ̂ = 4 3 x̄. b) La función de verosimilitud de una muestra x1 , . . . , xN serı́a L(θ; x1 , . . . , xN ) = N j=1 3 N N x2j 3N 2 = 3N xj =⇒ ln L(θ; x1 , . . . , xN ) = N ln(3) − 3N ln(θ) + 2 ln(xj ). 3 θ θ j=1 j=1 Pero derivar esta última función con respecto a θ e igualar a 0, 3N d ln(L) = − =0 dθ θ no tiene solución (para θ ∈ [1, 2]). Ası́ que este método (de cálculo de máximos derivando) no es útil aquı́. Sin embargo, el logaritmo de la función de verosimilitud es decreciente con θ, y por tanto alcanzará su máximo en θ = 1.