Septiembre 2005

I.T. DISEÑO INDUSTRIAL. CURSO 04/05 Estadı́stica aplicada y modelización. 10 de septiembre de 2005 SOLUCIÓN MODELO A 1. Una persona se está preparando para obtener el carnet de conducir, repitiendo un test de 20 preguntas. En la siguiente tabla se describen el número de errores que corresponden a los intentos realizados. Intentos (X) 1 2 3 4 5 Errores (Y ) 11 7 4 2 1 Calcula la recta de regresión que permita estimar el número de errores que cometerá la décima vez que repita el cuestionario y analiza si dicha estimación se puede considerar fiable. Solución: Si se quieren estimar el número de errores (Y ) en función de los intentos realizados, (X) hay que calcular la recta de regresión de Y sobre X. xi yi xi · yi 1 11 11 2 7 14 3 4 12 8 4 2 5 1 5 15 25 50 x2i yi2 1 121 4 49 9 16 16 4 25 1 55 191 Utilizamos la fórmula de la recta de regresión de Y sobre X, (que resulta de resolver genéricamente el sistema de ecuaciones que proporciona el método de los mı́nimos cuadrados:) σXY recta de regresión de Y | X : y − Y = 2 (x − X) σX media de Y, Y = N X yi 25 = =5 5 N X i=1 N covarianza varianza de X, σXY = 2 σX = media de X, xi yi i=1 N N X x2i i=1 N −X Y = 2 −X = X= N X xi i=1 N = 15 =3 5 50 − 3 · 5 = −5 5 55 − 32 = 11 − 9 = 2 5 Entonces la recta de regresión queda: y−5= −5 (x − 3) ⇔ y = −2.5x + 12.5 2 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 1 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 Para estimar a través de la recta el número de errores que cometerá la décima vez que repita el cuestionario, solamente hay que sustituir x = 10 en dicha recta: y = −2.5 · 10 + 12.5 = −12.5 Que salga un número de errores negativo, no debe extrañarnos porque fijándonos en el signo de la covarianza se observa que existe una asociación negativa entre las variables, lo que significa que cuanto mayor es el número de intentos, más pequeño es el número de errores. Se puede decir entonces que tras 10 intentos, no se cometerá ningún error. Para saber la fiabilidad de esta estimación, lo que se debe analizar es la bondad o calidad del ajuste lineal. Dicho de otro modo, se ha de determinar si se puede considerar que una recta se ajusta bien a la nube de puntos que proporcionan los datos. En general, siempre que se ajusta una curva de regresión a un conjunto de datos es el coeficiente de determinación R2 el que indica la bondad de dicho ajuste. En caso de que la curva considerada sea una recta, dicho coeficiente de determinación coincide con el cuadrado del coeficiente de σXY correlación lineal ρ = . Cuanto más cerca esté ρ2 de 1, mejor es el ajuste (más fiable σx · σY la estimación) y cuanto más cerca esté de 0, peor se ajusta la recta a la nube de puntos (y menos fiable es la estimación). Como consecuencia, valores extremos de ρ es decir 1 y -1, indican un ajuste perfecto, mientras que ρ = 0 indica que una recta no es un buen modelo para la nube de puntos. Para el cálculo de ρ, solamente queda por calcular la varianza de Y , para poder aplicar la correspondiente fórmula. varianza de Y, σY2 = N X i=1 N yi2 2 −Y = 191 − 52 = 13.2 5 −5 = −0.9731 ρ= √ √ 2 13.2 es un número próximo a -1, luego se puede decir que una recta es un buen modelo para estimar la relación entre ambas variables. Como consecuencia, la estimación que se ha hecho de que tras 10 intentos, no va a tener ningún error, se puede considerar fiable. 2. Como puede observarse en la figura, el siguiente sistema está formado por dos subsistemas conectados en serie, S y T , que están formados a su vez por los dispositivos S1 , S2 , S3 y T1 , T2 , respectivamente. S2 S1 S3 T1 T2 Los cinco dispositivos fallan de manera independiente, siendo las probabilidades de fallo las Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 2 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 siguientes: S1 0.01 S2 0.02 S3 0.03 T1 0.001 T2 0.002 (a) Calcula la probabilidad de que el subsistema S funcione. (b) Calcula la probabilidad de que el subsistema T funcione. (c) Calcula la probabilidad de que el sistema completo funcione. Nota: deben utilizarse más de 3 cifras decimales en los cálculos de este problema. Solución: En primer lugar, se nombran todos los sucesos que van a intervenir en la resolución del problema: Si =“falle dispositivo i ” y Si =“ funcione dispositivo i ”, para i ∈ {1, 2, 3}. p(S1 ) = 0.01 p(S2 ) = 0.02 p(S3 ) = 0.03 p(S1 ) = 1 − 0.01 = 0.99 p(S2 ) = 1 − 0.02 = 0.98 p(S3 ) = 1 − 0.03 = 0.97 Tj =“falle dispositivo j ” y Tj =“ funcione dispositivo j ”, para j ∈ {1, 2}. p(T1 ) = 0.001 p(T2 ) = 0.002 p(T1 ) = 1 − 0.001 = 0.999 p(T2 ) = 1 − 0.002 = 0.998 (a) • Llamamos S=“funcione sistema S ”. Para que el sistema S funcione tiene que ocurrir que funcionen los dispositivos S1 y S2 o que funcione el dispositivo S3 . Entonces, el suceso S, en términos de uniones e intersecciones será (recuerde que “y”⇔ ∩ y “o”⇔ ∪): S = (S1 ∩ S2 ) ∪ S3 Ahora calculamos la probabilidad del suceso S, teniendo en cuenta que p(A∩B) = p(A)·p(B), si A y B son sucesos independientes; p(A ∪ B) = p(A) + p(B) − p(A ∩ B). p(S) = p((S1 ∩ S2 ) ∪ S3 ) = p(S1 ∩ S2 ) + p(S3 ) − p(S1 ∩ S2 ∩ S3 ) = 0.99 · 0.98 + 0.97 + 0.99 · 0.98 · 0.97 = 0.999106. • También se puede escribir S como unión de dos sucesos incompatibles (la unión es el vacı́o, es decir, no pueden ocurrir a la vez): S = (S1 ∩ S2 ∩ S3 ) ∪ S3 Dicho con palabras, para que el sistema S funcione tiene que ocurrir que funcionen S1 y S2 y S3 no funcione o que funcione S3 . p(S) = p((S1 ∩ S2 ∩ S3 ) ∪ S3 ) = 0.99 · 0.98 · 0.03 + 0.97 = 0.999106. • Otra forma de hacerlo es pensando en el suceso complementario de S, es decir, haciendo p(S) = 1− p(S). Lo contrario (suceso complementario) de S es que el sistema S no funcione, Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 3 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 para lo cual tiene que pasar que S3 no funcione y S1 o S2 no funcionen, esto es S = S3 ∩ (S1 ∪ S2 ). Entonces, p(S) = 1−p(S) = 1−p(S3 ∩(S1 ∪S2 )) = 1−p(S3 )·(p(S1 )+p(S2 )−p(S1 )·p(S2 )) = 0.999106. (b) Al estar los dispositivos conectados en paralelo, para que el sistema T funcione debe ocurrir que funcione T1 o que funcione T2 , entonces T = T1 ∪ T2 : p(T ) = p(T1 ∪ T2 ) = p(T1 ) + p(T2 ) − p(T1 ∩ T2 ) = 0.999 + 0.998 − 0.999 · 0.998 = 0.999998. En este caso, considero más sencillo, pasar al suceso complementario: para que T no funcione tiene que ocurrir que fallen T1 y T2 . p(T ) = 1 − p(T ) = 1 − p(T1 ∩ T2 ) = 1 − 0.001 · 0.002 = 0.999998. (c) Como los sistemas S y T están conectados en serie para que funcione el sistema completo deben fucionar S y T : p(S ∩ T ) = p(S) · p(T ) = 0.999106 · 0.999998 = 0.999104. 3. Se estima que el precio medio del litro de gasolina oscilará entre 0.90 C y 1.30 C en el próximo año, siguiendo una distribución uniforme. (a) Escribe explı́citamente la función de densidad y la función de distribución de la variable continua mencionada. (b) ¿Cuál es el precio esperado para el litro de gasolina en el próximo año? Razona la respuesta. (c) Calcula la probabilidad de que la gasolina valga menos de 1 C. (d) Suponiendo que el precio se mantiene por encima de 1 C, calcula la probabilidad de que valga más de 1.20 C. Solución: (a) La función de densidad asociada a una distribución uniforme continua en un intervalo [a, b] es  1  si a ≤ x ≤ b  b − a f (x) =   0 en el resto En este caso, [a, b] = [0.9, 1.3], entonces  1   si 0.9 ≤ x ≤ 1.3 0.4 f (x) =   0 en el resto Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 4 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 Para calcular la función de distribución F (x), se debe saber que F (x) = Z x f (x) para todo a x ∈ IR. Si x < 0.9, entonces F (x) = 0. Si 0.9 ≤ x ≤ 1.3, entonces Z x 1 1 x − 0.9 F (x) = dt = [t]x0.9 = 0.4 0.4 0.9 0.4 Z 1.3 Z x Z x 1 1 dt = dt + 0 dt = 1. En resumen: Para x > 1.3, F (x) = 0.9 0.4 1.3 0.9 0.4  0 si x < 0.9  (x − 0.9)/0.4 si 0.9 ≤ x ≤ 1.3 F (x) =  1 si x > 1.3 (b) El precio medio de la gasolina corresponde a la esperanza matemática de la variable X, a saber: · 2 ¸1.3 Z ∞ Z 1.3 1 x 1.32 − 0.92 E(X) = xf (x)d x = x dx = = = 1.1 C 0.4 0.8 0.9 0.8 −∞ 0.9 Z 1 0.1 1 d x = F (1) = = 0.25 (c) p(X < 1) = 0.4 0.9 0.4 (d) Ahora se quiere calcular la probabilidad de que la gasolina valga más de 1.20 C sabiendo que el precio se mantiene por encima de 1 C, por tanto es la probabilidad condicionada p(X > 1.2 | X > 1) = p({X > 1.2} ∩ {X > 1}) p(X > 1.2) 1 − F (1.2) 1 − 0.75 1 = = = = . p(X > 1) p(X > 1) 1 − F (1) 1 − 0.25 3 4. La SGAE ha publicado que Madrid, el Paı́s Vasco y Navarra son las comunidades autónomas que registraron un mayor acceso a internet durante el primer trimestre de 2005. Con un 45, 40 y 34 por ciento respectivamente, superaron a la media nacional, que fue del 33,6 por ciento. (a) Calcula la probabilidad de que en un grupo de 10 personas escogidas al azar en Madrid, 6 de ellas se hayan conectado a internet durante el primer trimestre de 2005. (b) Sabiendo que la población del Paı́s Vasco es de aproximadamente 2 millones y medio de habitantes, ¿cuál es el número medio de vascos que se han conectado a la red en el periodo del estudio? Razona la respuesta. (c) Navarra tiene aproximadamente 600000 habitantes. ¿Cuál es la probabilidad de que se hayan conectado a internet en el primer trimestre del año más de 205000 navarros ? Solución: (a) Llamamos X=“número de personas que se conectaron en Madrid a internet en un grupo de 10”. El hecho de que una persona se conecte o no a internet en Madrid en el periodo del estudio se puede ver como una prueba de Bernoulli, donde el éxito=“una persona se conecte a internet en Madrid” y el Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 5 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 fracaso=“una persona no se conecte a internet en Madrid”. Según el enunciado del problema, la probabilidad de éxito es p=0.45. Como se ha escogido un grupo de 10 personas para ver si se han conectado o no a internet, se repite n = 10 veces la prueba de Bernoulli. Cada vez que se escoja una persona en Madrid y se le pregunte si se conectó o no a internet, la respuesta es independiente de lo que dijera la persona a la que se le preguntó ya o a la que se le puede preguntar despúes. Por tanto, se trata de repeticiones independientes de dicha prueba. Se tienen, por lo tanto, todos los ingredientes necesarios para identificar la variable X como una binomial de parámetros n = 10 (número de veces que se repite el experimento) y p = 0.45, probabilidad de éxito. Lo que se pide en este apartado es p(X = 6), que se puede consultar en las tablas de la variable binomial o aplicar la fórmula: µ ¶ 10 p(X = 6) = 0.456 · (1 − 0.45)4 = 0.1596. 6 (b) Llamando Y =“número de vascos que se conectaron a internet”, siguiendo un razonamiento similar al del apartado (a), se deduce que Y ∼ B(2500000, 0.40). Lo que se pregunta en este apartado es el número medio de vascos que se conectaron a internet, por tanto es la esperanza o media de la variable anterior. Al ser una binomial, se sabe que la media es np, en este caso, 2500000 · 0.4 = 1000000. Alrededor de un millón de personas se conectaron en internet en el Paı́s Vasco en el primer trimestre del año. (c) De nuevo, se vuelve a hacer el mismo razonamiento que en los dos apartados anteriores: si T =“número de navarros que se conectaron a internet”, es claro que T ∼ B(600000, 0.34). Lo que se pide en el ejercicio es 600000 X ¶ µ 600000 p(T > 205000) = 0.34i · (1 − 0.34)600000−i i i=205001 Está claro que es imposible hacer este cálculo con una calculadora tradicional. Si nos fijamos en los parámetros de la binomial con la que estamos ahora trabajando, se tiene np = 600000· 0.34 = 204000 > 5 y p = 0.34 < 0.5, con lo cual, podemos aproximarla con una distribución p √ normal N de parámetros np = 204000 y npq = 600000 · 0.34 · (1 − 0.34) = 367. Hay que tener en cuenta que para utilizar correctamente esta aproximación de una variable discreta T (con distribución binomial) con una variable continua N (con distribución normal) es necesario hacer una corrección de continuidad. Concretamente p(T > 205000) = p(T ≥ 205001) = p(N ≥ 205001 − 0.5) = µ ¶ 205000.5 − 204000 p Z> = p(Z > 2.72) = 0.0033. 367 5. Una empresa de transporte local realizó un estudio hace cinco años sobre los miles de kilómetros que recorrı́an sus vehı́culos en un mes, del cual se dedujo que dicha variable seguı́a una distribución normal de media 3000 km y desviación tı́pica de 200 km. Para Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 6 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 analizar si ese número de kilómetros ha variado con el tiempo, se consideraron 40 vehı́culos, de los que se obtuvieron una media muestral de 3003.45 Km recorridos en un mes. Admitiendo que la distribución modelo sigue siendo normal y que la dispersión también se ha mantenido durante estos cinco años, ¿puede admitirse que la media de kilómetros recorridos también se ha mantenido, a un nivel de significación del 5%? Solución: Para trabajar más cómodamente, lo haremos con miles de kilómetros, es decir, llamamos X=“miles de km recorridos al mes”. Se admite que X sigue una distribución normal. Lo que se quiere conocer es si se puede admitir que la media de dicha distribución es 3, por tanto, se debe plantear un contraste de hipótesis sobre la media de una distribución normal. Si consultamos las tablas de contrastes de hipótesis, vemos que tenemos que distinguir entre población con varianza conocida o desconocida. Leyendo detenidamente el enunciado del problema encontramos que podemos admitir que la dispersión se ha mantenido, por lo tanto, se considera varianza poblacional conocida. Contraste bilateral para la media de una distribución normal con varianza conocida: H0 : µ = 3 Ha : µ 6= 3 ¾ σ Se rechaza H0 si |x − µ0 | > z α2 √ . n El nivel de significación es del 5%, luego se debe tomar α = 5/100 = 0.05, por tanto, z α2 = z0.025 = 1.96, según las tablas de la distribución normal. La desviación tı́pica σ es 0.2 miles de km y el tamaño muestral n = 40: | x − µ0 |=| 3.00345 − 3 |= 0.00345 0.2 σ z α2 √ = 1.96 · √ = 0.062 n 40 0.00345 < 0.062, por tanto la condición de rechazo no se cumple. Conclusión: se acepta H0 : µ = 3, por lo tanto, se acepta que la media de km recorridos sigue siendo de 3000 km al año. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 7 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 SOLUCIÓN MODELO B 1. Los fabricantes de automóviles deben controlar la cantidad de distintos contaminantes emitidos por los tubos de escape de sus modelos. Dos de los principales contaminantes son el monóxido de carbono (CO) y el monóxido de nitrógeno (NO). En la tabla siguiente, aparecen los valores correspondientes a las emisiones de 9 vehı́culos del mismo modelo. Las variables se miden en gramos por kilómetro recorrido. CO NO 2.3 5 7.5 10 15 6 8 6.3 4 1.8 1.5 1 0.7 0.6 1.3 1 1.2 1.4 (a) Razona el tipo de asociación que existe entre ambas variables, según el signo de la covarianza. Calcula el coeficiente de correlación lineal e interpreta su valor. (b) A través de la correspondiente recta de regresión, realiza una estimación de la emisión de NO generada por un automóvil cuya emisión de CO es de 4.5 gr/km. (c) Usando la otra recta de regresión, estima la emisión de CO de un automóvil que emite 0.5 gr/km de NO. Solución: (a) La siguiente tabla recoge una serie de cálculos se serán necesarios utilizar en la resolución del ejercicio xi yi x i · y i x2i yi2 2.3 1.8 4.14 5.29 3.24 5 1.5 7.5 25 2.25 7.5 1 7.5 56.25 1 7 100 0.49 10 0.7 15 0.6 9 225 0.36 6 1.3 7.8 36 1.69 8 1 8 64 1 6.3 1.2 7.56 39.69 1.44 4 1.4 5.6 16 1.96 64.1 10.5 64.1 567.23 13.43 Lo primero que se pide es la covarianza de la variable bidimendional (X, Y ), para lo cual son necesarias las medias de X e Y : 64.1 10.5 X= Y = = 7.122 = 1.166 9 9 64.1 σXY = − 7.122 · 1.166 = −1.1822 9 Que la covarianza sea negativa significa que existe una asociación negativa entre las variables: cuando los valores de X aumentan, los de Y disminuyen. σXY El coeficiente de correlación lineal coincide con ρ = . Se necesita calcular primero las σx · σY varianzas de X e Y : 13.43 567.23 2 − 7.1222 = 12.303 σY2 = − 1.1662 = 0.133 σX = 9 9 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 8 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 −1.1822 √ = −0.9241 12.303 0.133 El coeficiente de correlación lineal es un número próximo a -1, lo cual indica que una recta es un buen ajuste para estimar los valores de una variable en función de la otra. ρ= √ (b) Para hacer una estimación de la emisión de NO generada por un automóvil según su emisión de CO, se debe utilizar la recta de regresión de Y sobre X, que, en este caso, resulta ser: −1.1822 y − 1.166 = (x − 7.122) ⇔ y = −0.096x + 1.8497 12.303 Si la emisión de CO es de x=4.5 gr/km, la emisión de NO será de −0.096·4.5+1.8497 = 1.4177 gr/km. (c) La otra recta de regresión es la de X sobre Y recta de regresión de X | Y : x−X = σXY −1.1822 (y − 1.166) (y − Y ) ⇔ x − 7.122 = 2 σY 0.133 Para estimar el nivel de CO que corresponde a un nivel de y = 0.5gr/km de NO, se sustituye en la recta anterior 1.1822 x = 7.122 − (0.5 − 1.166) = 13.032. 0.133 2. En un sistema de alarma, la probabilidad de que se produzca un peligro es 0.1. Si éste se produce, la probabilidad de que la alarma funcione es 0.95. La probabilidad de que funcione la alarma sin haber habido peligro es 0.03. Calcula: (a) Probabilidad de que la alarma funcione. (b) Probabilidad de que habiendo funcionado la alarma, no haya habido peligro. (c) Probabilidad de que haya un peligro y la alarma no funcione. (d) Probabilidad de que no habiendo funcionado la alarma, haya un peligro. Solución: Como en todos los ejercicios de cálculo de probabilidades, lo primero es nombrar los sucesos cuyas probabilidades son conocidas por el enunciado: Siendo P =“haya peligro” y F =“funcione la alarma” p(P ) = 0.1 p(F | P ) = 0.95 p(F | P ) = 0.03. (a) Para calcular p(F ) hay que aplicar el teorema de la probabilidad total: p(F ) = p(F ∩ P ) + p(F ∩ P ) = p(F | P ) · p(P ) + p(F | P ) · p(P ) = 0.95 · 0.1 + 0.03 · (1 − 0.1) = 0.122. (b) Hay que calcular la probabilidad de que no haya peligro sabiendo que ha funcionado la alarma 0.03 · 0.9 p(F | P ) · p(P ) = = 0.2213 p(P | F ) = p(F ) 0.122 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 9 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 (c) En este apartado se pide la probabilidad de una intersección de sucesos: haya un peligro y la alarma no funcione p(P ∩ F ) = p(F | P ) · p(P ) = (1 − 0.95) · 0.1 = 0.005 (d) Se trata, de nuevo, de una probabilidad condicionada p(P | F ) = p(F | P ) · p(P ) 0.005 = 0.00569. = 1 − 0.122 p(F ) 3. Se dispone de un dado trucado de forma que la cara del 1 se sustituye por un 6. Calcula la función de distribución F (x) y la esperanza (media) de la variable aleatoria X=“puntuación obtenida al lanzar el dado”. Se considera la variable aleatoria Y =“máximo de las puntuaciones obtenidas en 2 tiradas” (no se suman las puntuaciones). Calcula su función de probabilidad y la probabilidad de obtener más de 4 puntos. Solución: Dada X=“puntuación obtenida al lanzar el dado trucado”, los valores que toma X son {2, 3, 4, 5, 6} con probabilidades asociadas 1 p(X = 2) = ; 6 1 p(X = 3) = ; 6 1 p(X = 5) = ; 6 p(X = 4) = p(X = 6) = 1 6 2 6 La función de distribución está definida por F (x) = p(X ≤ x) para todo x ∈ IR. Lo vamos haciendo por tramos: Si x < 2, F (x) = 0 si 2 ≤ x < 3, F (x) = p(X = 2) = 1/6; si 3 ≤ x < 4, F (x) = p(X = 2) + p(X = 3) = 1/6 + 1/6 = 2/6; si 4 ≤ x < 5, F (x) = p(X = 2) + p(X = 3) + p(X = 4) = 1/6 + 1/6 + 1/6 = 3/6; si 5 ≤ x < 6, F (x) = 1/6 + 1/6 + 1/6 + 1/6 = 4/6; si x ≥ 6, F (x) = 1/6 + 1/6 + 1/6 + 1/6 + 2/6 = 1  0 si x < 2     1/6 si 2 ≤ x < 3    2/6 si 3 ≤ x < 4 La función de distribución es F (x) = 3/6 si 4 ≤ x < 5     4/6 si 5 ≤ x < 6    1 si x ≥ 6 La media de X es, por definición E(X) = 6 X k=2 E(X) = 2 · k · p(X = k): 1 1 1 2 26 1 +3· +4· +5· +6 = = 4.333 6 6 6 6 6 6 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 10 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 La segunda variable aleatoria discreta que se define en el problema es Y =“máximo de las puntuaciones obtenidas en 2 tiradas”. Esto quiere decir que si al lanzar el dado 2 veces sale, por ejemplo un 4 y un 5, me quedo con el máximo de 4 y 5, es decir, 5. Los valores que toma la variable son Y ∈ {2, 3, 4, 5, 6} y para calcular las probabilidades asociadas a dichos valores interpretamos cuál es el suceso que ocurre cuando Y toma sus distintos valores: Y = 2 cuando sale (2,2); 1 1 1 P (Y = 2) = · = . 6 6 36 Y = 3 cuando salen (2,3), (3,2) ó (3,3); 1 1 1 1 1 1 3 p(Y = 3) = · + · + · = . 6 6 6 6 6 6 36 Y = 4 cuando salen (2,4), (4,2), (3,4), (4,3) ó (4,4); 5 1 1 1 1 1 1 1 1 1 1 p(Y = 4) = · + · + · + · + · = . 6 6 6 6 6 6 6 6 6 6 36 Y = 5 cuando salen (2,5), (5,2), (3,5), (5,3), (4,5), (5,4) ó (5,5); 1 1 7 p(Y = 5) = 7 · · = . 6 6 36 Y = 6 cuando salen (2,6), (6,2), (3,6), (6,3), (4,6), (6,4), (5,6), (6,5) ó (6,6); 20 1 2 2 2 p(Y = 6) = 8 · · + · = . 6 6 6 6 36 Por último, la probabilidad de obtener más de 4 puntos es p(Y > 4) = p(Y = 5) + p(Y = 6) = 7 20 27 + = = 0.75. 36 36 36 4. En una fábrica que envasa agua mineral, se ha establecido que el volumen envasado en cada botella por la máquina automática sigue una distribucián normal de media 150 cl y desviación tı́pica 2 cl. (a) Calcula la probabilidad de que una botella de agua contenga exactamente 150 cl. (b) Calcula la probabilidad de que el volumen envasado se sitúe entre 148 y 152 cl. (c) Los responsables de calidad de la empresa saben que el 0.2% de las botellas envasadas no pueden venderse porque contienen una cantidad de agua insuficiente. ¿Cuántos centilitros debe contener como mı́nimo una botella para que se comercialice? (d) Calcula la probabilidad de que en un lote de 5 botellas, 2 de ellas contengan más de 150 cl. Solución: Sea X=“volumen, en cl, de agua envasada por la máquina”. Según el enunciado se sabe que X ∼ N (150, 2). (a) p(X = 150) = 0, por ser X una variable aleatoria continua. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 11 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 (b) Para calcular p(148 < X < 152), vamos a reducir el problema a una normal de parámetros 0 y 1. Para ello, hay que tipificar la variable X, esto es restarle su media y dividirla por la desviación tı́pica: si X ∼ N (150, 2) entonces la nueva variable X − 150 ∼ N (0, 1) = Z. 2 µ ¶ 148 − 150 152 − 150 p(148 < X < 152) = p <Z< = p(−1 < Z < 1) 2 2 Esta probabilidad coincide con el área sombreada en la siguiente figura -1 1 Para calcular la probabilidad pedida podemos utilizar el suceso complementario de {−1 < Z < 1} que será {Z < −1} ∪ {Z > 1} (ver figura siguiente) -1 1 Por la simetrı́a de la distribución normal, se sabe que p(Z < −1) = p(Z > 1), entonces p(148 < X < 152) = p(−1 < Z < 1) = 1 − (p(Z < −1) + p(Z > 1)) = 1 − 2 p(Z > 1) = 1 − 2 · 0.1587 = 0.6826. (c) Llamamos a a la cantidad mı́nima que debe contener una botella para que se comercialice. Como el 0.2% contiene menos de dicha cantidad lo que se sabe es que p(X < a) = 0.2/100 = 0.002. Tipificando la variable X, nos queda µ ¶ a − 150 0.002 = p Z < 2 Como b = (a − 150)/2 es un valor que deja a su izquierda un área menor que 0.5, debe tratarse de un número negativo, con lo que 0.002 = p(Z < b) = p(Z > −b) es decir − b = z0.002 150 − a = z0.002 . El valor de z0.002 se busca usando las tablas de la normal por tanto, 2 tipificada: buscamos el número 0.002 en el interior de la tabla y se anota a qué fila y columna corresponde. La fila del valor 2.8 y la columna del 0.08. Entonces, z0.002 = 2.88. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 12 I.T. DISEÑO INDUSTRIAL. CURSO 04/05 Para calcular el valor de a sólo hay que resolver la ecuación a = 150 − 2 · 2.88 = 144.24. 150 − a = 2.88, de donde 2 Para que una botella se comercialice tiene que contener como mı́nimo 144.24 cl. 5. Para investigar si la proporción de matrimonios civiles es la misma en dos Comunidades Autónomas, se tomaron al azar 100 matrimonios en cada una de ellas. En la primera población, 62 de los matrimonios eran civiles, mientras que en la segunda, lo eran 49. A nivel α = 0.05, ¿puede aceptarse que no influye significativamente la Comunidad Autónoma en la que se celebre el matrimonio para elegirlo civil? Solución: Para ver si la proporción de matrimonios civiles es la misma en dos Comunidades distintas, se toman muestras en cada una de ellas, cuyos tamaños muestrales son n1 = 100 y n2 = 100. El problema intenta verificar una hipótesis acerca de la proporción de personas de ambos lugares a las que les ocurre algo (éxito), luego se trata de un contraste de hipótesis sobre la diferencia de parámetros de dos distribuciones binomiales. Concretamente, se quiere saber si dicha diferencia de proporciones es significativa o no, es decir, si en ambas poblaciones el número de personas que eligen matrimonio civil es la misma o no. Por tanto, se trata de un contraste bilateral: Contraste bilateral para la diferencia de parámetros (p1 −p2 ) de dos distribuciones binomiales B(1, p1 ) y B(1, p2 ). H0 : p1 = p2 Ha : p1 6= p2 ¾ Se rechaza H0 si |p̂1 − p̂2 | > z α2 s p (1 − p) µ ¶ 1 1 + . n1 n2 n1 p̂1 + n2 p̂2 n1 + n2 Los valores de p̂1 y p̂2 corresponden a la proporciones de individuos que eligieron matrimonio civil de las muestras elegidas en las poblaciones 1 y 2, respectivamente. siendo p= p̂1 = 62 = 0.62; 100 p̂2 = 62 + 49 49 = 0.49 por tanto p = = 0.555 100 200 Como α = 0.05, entonces z α2 = z0.025 = 1.96. Comprobemos ahora si se cumple la condición de rechazo o no: |p̂1 − p̂2 | =| 0.62 − 0.49 |= 0.13 s s µ µ ¶ ¶ 1 1 1 1 z α2 p (1 − p) + = 1.96 · 0.555 · (1 − 0.555) + = 0.1377 n1 n2 100 100 Como 0.13 < 0.1377, no se cumple la condición de rechazo. Ésto quiere decir que se acepta H0 , por tanto la proporción en ambas poblaciones se consideran iguales. Conclusión: sı́ puede aceptarse que no influye significativamente la Comunidad Autónoma en la que se celebre el matrimonio para elegirlo civil. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 13

Septiembre 2005

Documentos relacionados

Productos

Apoyo

Septiembre 2005

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib