I.T. DISEÑO INDUSTRIAL. CURSO 03/04 Estadı́stica aplicada y modelización. 15 de septiembre de 2004 SOLUCIÓN MODELO A 1. La siguiente tabla muestra el número de averı́as al año, X, de 50 máquinas y la temperatura de funcionamiento de las mismas, Y, en el momento de la averı́a. X\Y 2 3 4 5 30 40 50 1 2 2 5 5 10 2 3 10 0 4 6 (a) Calcula las distribuciones marginales de frecuencias de las variables aleatorias X e Y , indicando frecuencias absolutas y relativas de ambas variables. xi 2 3 4 5 ni. fi. Ni. xi ni. x2i ni. 5 1/10 5 10 20 20 2/5 25 60 180 15 3/10 40 60 240 10 1/5 50 50 250 50 1 180 690 yj n.j f.j N.j yj n.j yj2 n.j 30 8 4/25 8 240 7200 40 14 7/25 22 560 22400 50 28 14/25 50 1400 70000 50 1 2200 99600 (b) Calcula mediana y moda de ambas variables, el número medio de averı́as al año y la temperatura media de funcionamiento durante las averı́as. Para la variable X: Mediana: como N/2 = 25 = N2. , entonces la mediana será el punto medio de la modalidad 3+4 correspondiente y la siguiente; en este caso, Me = = 3.5. 2 Moda: es el valor de mayor frecuencia, por tanto Mo = 3 180 Media: X = = 3.6. 50 Para la variable Y : Mediana: como N/2 = 25 ∈ (22, 50), entonces la mediana es la modalidad correspondiente al mayor de los extremos del intervalo anterior; Me=50. Moda: es el valor de mayor frecuencia, por tanto Mo=50. 2200 Media: Y = = 44. 50 (c) Calcula el coeficiente de variación de ambas variables. 690 2 = Varianza de X: σX − (3.6)2 = 0.84. 50 Coeficiente de variación de X: √ √ σ2 0.84 = 0.2545 CV(X) = = 3.6 X 99600 − 442 = 56. Varianza de Y : σY2 = 50 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 1 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 Coeficiente de variación de Y : √ 56 CV(Y ) = = 0.17. 44 (d) Calcula la recta de regresión de Y sobre X y, a través del coeficiente de correlación lineal, analiza la bondad de dicho ajuste. Dado que ya se han calculado la media de X e Y y también la varianza de X, para calcular la recta de regresión es más cómodo emplear la fórmula de la misma, en lugar del sistema de ecuaciones. Sólo falta calcular la covarianza. σXY = 60 + 160 + 200 + 450 + 600 + 1500 + 240 + 480 + 2000 + 800 + 1500 −3.6·44 = 1.4. 50 La recta de regresión de Y sobre X queda y − 44 = 1.4 (x − 3.6) ⇔ y = 1.66x + 38. 0.84 Coeficiente de correlación lineal: ρ= √ 1.4 √ = 0.2041. 0.84 56 Como es un número próximo a cero, se deduce que el ajuste lineal no es bueno para este conjunto de datos. 2. Dos profesoras comparten un despacho con un solo teléfono. Han comprobado que el 45% de las llamadas recibidas son para la profesora A y el resto para la profesora B. Dos de cada cinco llamadas que recibe la profesora A son externas y las otras tres son llamadas realizadas desde la misma Universidad. La profesora B recibe cuatro de cada seis llamadas desde la Universidad y el resto externas. (a) Calcula la probabilidad de que se reciba en el despacho una llamada externa. Llamamos E al suceso E = ”se reciba una llamada externa en el despacho”. Como dicha llamada puede ir dirigida a la profesora A o a la profesora B, hay que aplicar el teorema de la probabilidad total. Si se denominan LA y LB a los sucesos LA = ”la profesora A reciba una llamada”; LB =”la profesora B reciba una llamada”; entonces P (E) = P (E | LA ) · P (LA ) + P (E | LB ) · P (LB ) = 2 2 · 0.45 + · 0.55 = 0.3633. 5 6 (b) Sabiendo que se ha recibido una llamada realizada desde la Universidad en el despacho, ¿qué probabilidad hay de que fuera dirigida a la profesora A? Las llamadas que se reciben en el despacho se están haciendo desde la Universidad o son externas, por tanto podemos llamar E c al suceso ”se reciba una llamada hecha desde la Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 2 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 Universidad”. La probabilidad pedida en este apartado es la probabilidad condicionada, P (LA | E c ), para la que hay que usar la fórmula de Bayes 3 · 0.45 P (E | LA ) · P (LA ) P (LA E ) c 5 = = = 0.424. P (LA | E ) = P (E c ) P (E c ) 1 − 0.3633 T c c 3. Un jugador lanza 2 veces una moneda perfecta. Describe la distribución de probabilidad de la variable aleatoria X que mide el número de caras que obtiene. Otro jugador lanza la moneda 3 veces. (a) ¿Cuál es la probabilidad de que ambos jugadores obtengan el mismo número de caras? (b) ¿Y de que el segundo jugador saque más caras que el primero? Para la primera parte del problema, se llama X=”número de caras en 2 lanzamientos” que es una variable discreta que sigue una distribución binomial: el experimento de Bernoulli es el lanzamiento de la moneda; se está considerando éxito=”salir cara”, con lo cual, la probabilidad de éxito es p = 1 ; 2 el experimento se repite n = 2 veces. Para dar la distribución de probabilidad, se ha de decir, en primer lugar, los valores que toma la variable, en este caso X ∈ {0, 1, 2} y las probabilidades de que X tome dichos valores: à ! µ ¶0 µ ¶2 P (X = 0) = 2 0 1 2 1 2 = 2 1 1 2 1 2 1 1 =2 = 4 2 2 2 1 2 1 2 = à ! µ ¶1 µ ¶1 P (X = 1) = à ! µ ¶2 µ ¶0 P (X = 2) = 1 4 1 4 Para la segunda parte: Llamamos Y =”número de caras en 3 lanzamientos”. Como en el caso anterior, esta variable también sigue una distribución binomial, aunque de parámetros n = 3 y p = 1/2. Para que ambos jugadores obtengan el mismo número de caras, lo que debe ocurrir es que o ambos no obtengan ninguna cara, es decir, X = 0 e Y = 0, o que ambos obtengan 1 cara, X = 1 e Y = 1 o que ambos obtengan 2 caras, X = 2 e Y = 2. Si se denota por A al suceso A=”ambos jugadores obtengan el mismo número de caras ” se verifica A = ({X = 0} ∩ {Y = 0}) ∪ ({X = 1} ∩ {Y = 1}) ∪ ({X = 2} ∩ {Y = 2}) Como las variables X e Y toman valores de forma independiente, P ({X = i} ∩ {Y = i}) = P (X = i) · P (Y = i) para i ∈ {0, 1, 2} y como los distintos resultados al lanzar una Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 3 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 moneda son incompatibles, la probabilidad de esta unión de sucesos es solamente la suma de las probabilidades. Se puede usar la tabla de la distribución binomial: P (A) = P (X = 0) · P (Y = 0) + P (X = 1) · P (Y = 1) + P (X = 2) · P (Y = 2) = 0.25 · 0.125 + 0.5 · 0.375 + 0.25 · 0.375 = 0.3125 El suceso B=”el segundo jugador saque más caras que el primero” se puede expresar B = ({X = 0} ∩ {Y > 0}) ∪ ({X = 1} ∩ {Y > 1}) ∪ ({X = 2} ∩ {Y > 2}) siendo la probabilidad P (B) = P (X = 0) · (P (Y = 1) + P (Y = 2) + P (Y = 3))+ P (X = 1) · (P (Y = 2) + P (Y = 3)) + P (X = 2) · P (Y = 3) = 0.25(0.375 + 0.375 + 0.125) + 0.5(0.375 + 0.125) + 0.25 · 0.125 = 0.5 4. La velocidad a la que circulan los vehı́culos por una autovı́a sigue una distribución normal de parámetros 100 y 40. (a) ¿Cuál es la probabilidad de que un vehı́culo circule a 120 km/h.? Al tratarse X=”velocidad a la que circulan los vehı́culos por la autovı́a” de una variable aleatoria continua, la probabilidad de que dicha variable tome un valor concreto es siempre 0. P (X = 120) = 0. (b) Calcula la probabilidad de que un vehı́culo circule entre 90 y 120 km/h. µ ¶ 90 − 100 120 − 100 <Z< = 40 40 P (−0.25 < Z < 0.5) = 1 − (P (Z > 0.5) + P (Z < −0.25)) = P (90 < X < 120) = P 1 − (P (Z > 0.5) + P (Z > 1)) = 1 − 0.3085 − 0.4013 = 0.2902 (c) Se ha estimado que el 11.9% de los vehı́culos circulan a una velocidad demasiado alta, que pone en peligro la seguridad de los demás conductores. ¿A partir de qué velocidad se está considerando que un vehı́culo representa una amenaza para los demás? Si se representa por a al valor buscado, lo que se sabe sobre él es que µ a − 100 0.119 = P (X > a) = P Z > 40 ¶ a − 100 por tanto, = z0.119 . El valor de z0.119 se deduce usando las tablas de la normal 40 tipificada: buscamos el número 0.119 en el interior de la tabla y se anota a qué fila y columna corresponde. La fila del valor 1.1 y la columna del 0.08. Entonces, z0.119 = 1.18. a − 100 = 1.18, de donde Para calcular el valor de a sólo hay que resolver la ecuación 40 a = 100 + 40 · 1.18 = 147.2. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 4 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 Los vehı́culos que circulan a velocidad superior a los 147.2 km/h se considera que representan una amenaza para los demás conductores. (d) De una muestra de 6 vehı́culos elegidos al azar entre aquellos que circulaban por la autovı́a, calcula la probabilidad de que sólo dos de ellos circularan a más de 120 Km/h, mientras que los otros cuatro lo hicieran por debajo de esta velocidad. Obsérvese que esta cuestión puede verse como la repetición de una prueba de Bernoulli, lo cual hace pensar en la distribución binomial. Prueba de Bernoulli: un vehı́culo circula a 120 km/h o no. Número de pruebas : 6, que es el número de vehı́culos cuya velocidad se observa. Si se considera como éxito ”un vehı́culo circule a más de 120 km/h”, la probabilidad de éxito será µ ¶ 120 − 100 p = P (X > 120) = P Z > = P (Z > 0.5) = 0.3085 40 Si llamamos Y = ”número de vehı́culos que circulan a más de 120 km/h de una muestra de 6 vehı́culos”, la probabilidad que se pide es P (Y = 2). Como no se encuentra el valor de p = 0.3085, en las tablas de la binomial, se usa la fórmula correspondiente: à ! P (Y = 2) = 6 6! 0.30852 (1 − 0.3085)4 = 0.0951 · 0.2281 = 0.326. 2! · 4! 2 5. Cada año se lleva a cabo en la Reserva Natural de la laguna de Fuente Piedra (Málaga) una campaña de anillamiento de flamencos que permite conocer aspectos tan importantes para la conservación de la especie como su supervivencia y mortalidad, movimientos, migraciones, causas de mortandad, uso de hábitats, reproducción, intercambio entre poblaciones, etc. El número de pollos a anillar depende de las tasas de nacimiento registradas en los años anteriores. Se ha estimado que el número de nacimientos por año sigue una distribución de Poisson y la media de nacimientos durante los últimos 30 años es 14023.75 pollos al año. (a) Estima un intervalo de confianza al 90% para la media de nacimientos que se registran en la laguna por año. Si se consulta la correspondiente tabla de intervalos de confianza, se observa que el intervalo para la media de una distribución de Poisson es x − zα/2 s s x x , x + zα/2 n n donde x representa la media muestral, en este caso x = 14023.75 α es el nivel de significación, α = 1 − 0.9 = 0.1 y n el tamaño muestral, n = 30. Se tienen que usar las tablas de la normal para calcular zα/2 = z0.05 . Buscamos 0.05 en el interior de la tabla. Al no encontrar este número, se han de considerar dos valores entre los cuales 0.05 esté comprendido. Éstos son 0.0505 y 0.0495, que corresponden a las abcisas 1.64 y 1.65, respectivamente. Hay que hacer una interpolación lineal con ambos valores, Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 5 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 aunque en este caso es sencillo pues 0.05 es el punto medio de 0.0495 y 0.0505, luego z0.05 será el punto medio entre z0.0495 y z0.0505 , es decir z0.05 = 1.645. Ahora sólo queda sustituir cada uno de los valores x − zα/2 s s s s x x 14023.75 14023.75 , x + zα/2 = 14023.75 − 1.645 , 14023.75 + 1.645 = n n 30 30 [14023.75 − 35.5661, 14023.75 + 35.5661] = [13988.184, 14059.316] (b) ¿Puede admitirse que el número medio de nacimientos es de 14000 pollos al año, a un nivel de significación α = 0.1? Hay que realizar un contraste de hipótesis estadı́sticas sobre la media de una distribución de Poisson. Como la pregunta no hace referencia a si el número de nacimientos está por encima o por debajo de los 14000 ejemplares, sino solamente importa si se puede considerar igual o no, habrá que plantear un contraste bilateral: H0 : λ = 14000 Ha : λ 6= 14000 Si observamos la tabla de contrastes de hipótesis, s se rechaza H0 : λ = 14000 si | x − λ0 |> zα/2 λ0 n Se sustituye cada elemento de la fórmula por su valor (obsérvese que λ0 representa el valor con el que se está comparando la media, por tanto, λ0 = 14000): s | x − λ0 |=| 14023.75 − 14000 |= 23.75 < 35.536 = zα/2 λ0 n por tanto, como no se cumple la condición de rechazo, se acepta H0 . Entonces, sı́ puede admitirse que el número de nacimientos será de 14000 pollos al año, con el nivel de significación considerado. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 6 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 SOLUCIÓN MODELO B 1. Se quiere analizar la relación calcio - creatinina en la orina con objeto de diagnosticar la presencia de cierto tipo de cálculos renales. Para ello se realiza una simulación en el laboratorio en la que se toman cinco muestras con distintas cantidades de Ca y se registran los niveles de creatinina a fin de determinar el tipo de asociación entre ambas variables. Calcio (X, mg/l) Creatinina (Y, mg/l) 1.5 2 2.5 3 3.5 0.5 1/3 0.5 0.3 0.2 (a) Ajusta una recta de regresión Y | X. Se puede emplear la correspondiente fórmula: recta de regresión de Y | X : y−Y = σXY (x − X) 2 σX para lo cual, hay que calcular los diversos elementos de la misma. Disponemos en forma de tabla los cálculos necesarios para que quede más claro: xi yi xi · yi x2i 3/2 1/2 3/4 9/4 2 1/3 2/3 4 5/2 1/2 5/4 25/4 3 3/10 9/10 9 7/2 1/5 7/10 49/4 25/2 11/6 64/15 135/4 Entonces, N X media de X, X= 25/2 5 = = 2.5 5 2 yi 11/6 11 = = 0.366 N 5 30 PN xi yi 64/15 5 · 11 = i=1 −X ·Y = − = 0.85333 − 0.91666 = −0.06333 N 5 2 · 30 media de Y, σXY = N N X covarianza xi i=1 Y = N X varianza de X, 2 σX = x2i i=1 N i=1 2 −X = = 135/4 − 2.52 = 6.75 − 6.25 = 0.5 5 Tras sustituir se obtiene: y − 0.366 = −0.06333 (x − 2.5) ⇔ y = −0.1266x + 0.6825 0.5 También se pueden deducir los dos coeficientes de la ecuación de la recta de regresión, cuya expresión genérica se tomará y = a + bx, por medio del sistema de ecuaciones que resulta de aplicar el método de los mı́nimos cuadrados: Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 7 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 N X yi = aN + b i=1 N X N X i=1 i=1 xi y i = a N X xi i=1 N X xi + b x2i i=1 Ya se han calculado antes todos los términos del sistema, que queda 11 25 = 5a + b 6 2 64 25 135 = a+ b 15 2 4 y las soluciones son a = 0.683, b = −0.1266. 1 a + bx Haciendo un sencillo cambio de variable, se puede reducir al caso lineal: 1 1 si y = , entonces = a + bx, que se puede ver como la ecuación de una recta si se a + bx y 1 llama y 0 = . Por tanto, se ha de ajustar una recta de regresión de Y 0 sobre X. Se puede y utilizar el sistema de ecuaciones correspondiente o la fórmula de la recta. En cualquiera de ambos casos, se tienen que realizar los cálculos necesarios con la nueva variable Y 0 . (b) Ajusta una hipérbola de la forma y = yi0 = 1 yi xi · yi0 2 3 3 6 2 5 10/3 10 5 35/2 46/3 = 15.333 83/2 = 41.5 El sistema de ecuaciones serı́a N X yi0 i=1 N X = xi yi0 = a i=1 aN + b N X i=1 N X xi i=1 N X xi + b x2i i=1 15.333 = 41.5 = 25 5a + b 2 25 135 a+ b 2 4 cuyas soluciones son a = −0.1 y b = 1.27. Si se prefiere aplicar la fórmula, se determinan los valores de Y0 = 15.333 41.5 = 3.066 y σXY 0 = − 2.5 · 3.066 = 0.635 5 5 y sustituı́mos y0 − Y 0 = σXY 0 0.635 (x − X) ⇔ y − 3.0666 = (x − 2.5) ⇔ y 0 = 1.27x − 0.1 2 σX 0.5 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 8 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 Por tanto, la ecuación de la hipérbola será y= 1 1.27x − 0.1 (c) Realiza una estimación del nivel de creatinina para un contenido de calcio de 2.8 mg/l con ambas curvas de regresión. Solamente hay que sustituir el valor x = 2.8 en ambas curvas: En la recta de regresión: y = −0.1266 · 2.8 + 0.6825 = 0.328. 1 En la hipérbola: y = = 0.289. 1.27 · 2.8 − 0.1 2. Un sistema está formado por dos componentes C1 y C2 conectados en paralelo y otro componente C3 conectado en serie a los dos anteriores, tal como muestra la figura C1 C3 C2 Cada componente funciona de forma independiente a los demás siendo las probabilidades de fallo 0.1, 0.15 y 0.01, para los componentes C1 , C2 y C3 , respectivamente. Calcula la probabilidad de que (a) fallen los tres componentes Si se denota por Ci = ”falle la componente” i, el suceso A=”fallen los tres componentes” se puede expresar como A = C1 ∩ C2 ∩ C3 por tanto P (A) = P (C1 ) · P (C2 ) · P (C3 ) = 0.1 · 0.15 · 0.01 = 0.00015. (b) falle alguno de los componentes El suceso B =”falle alguno de los componentes” se puede expresar como B = C1 ∪ C2 ∪ C3 puesto que ”fallar alguno” significa que falle el primero o el segundo o el tercer componente. Como C1 , C2 y C3 no son sucesos incompatibles, es decir, sı́ pueden ocurrir a la vez, puesto que pueden fallar C1 y C2 al mismo tiempo o C1 y C3 o . . .. Esto implica que para calcular la probabilidad asociada al suceso B, habrı́a que tener en cuenta todas las intersecciones, esto es P (B) = P (C1 ) + P (C2 ) + P (C3 ) − P (C1 ∩ C2 ) − P (C1 ∩ C3 ) − P (C2 ∩ C3 ) + P (C1 ∩ C2 ∩ C3 ) Por eso es más sencillo usar el suceso complementario de B, B c = ”no falle ningún componente” = C1c ∩ C2c ∩ C3c Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 9 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 Entonces P (B) = 1−P (B c ) = 1−((1−P (C1 ))·(1−P (C2 ))·(1−P (C3 ))) = 1−(0.9·0.85·0.99) = 0.24265 (c) el sistema funcione, es decir, funcione al menos uno de los componentes C1 , C2 y funcione el componente C3 . Para que el sistema funcione tiene que funcionar C3 forzosamente y funcionar C1 o C2 , por consiguiente, S =”el sistema funcione” se puede expresar S = C3c ∩ (C1c ∪ C2c ) luego P (S) = P (C3c ) · P (C1c ∪ C2c ) = P (C3c ) · (P (C1c ) + P (C2c ) − P (C1c ∩ C2c )) = 0.99 · (0.9 + 0.85 − 0.9 · 0.85) = 0.99 · 0.985 = 0.97515 (d) el componente C3 falle, sabiendo que el sistema está funcionando P (C3 ∩ S) Se trata de la probabilidad condicionada P (C3 | S) = , pero como C3 ∩ S = ∅, es P (S) decir, si C3 falla, es imposible que funcione el sistema, P (C3 ∩ S) = 0 y, como consecuencia, P (C3 | S) = P (C3 ∩ S) = 0. P (S) (e) el componente C3 falle, sabiendo que el sistema falla. Ésta es otra probabilidad condicionada: P (C3 | S c ) = P (C3 ∩ S c ) P (S c ) El suceso intersección C3 ∩ S c serı́a que C3 falle y el sistema falle, pero como un fallo en el componente C3 implica que el sistema falle, C3 ∩ S c = C3 . Entonces, la probabilidad pedida P (C3 | S c ) = P (C3 ∩ S c ) P (C3 ) 0.01 = = = 0.4024. c P (S ) 1 − P (S) 1 − 0.97515 3. El tiempo de vida, medido en años, de cierto dispositivo eléctrico sigue una variable aleatoria de densidad ( k + x2 si 0 ≤ x ≤ 1 f (x) = 0 en el resto (a) Calcula el valor de la constante k. Para que f (x) sea función de densidad se deben cumplir dos condiciones: 1. f (x) ≥ 0 para todo x, lo cual implica que k debe ser un número real positivo, y 2. Z ∞ −∞ f (x)dx = 1 lo cual va a permitir obtener el valor concreto de k: 1= Z ∞ −∞ f (x)dx = Z 0 −∞ f (x)dx + Z 1 0 f (x)dx + Z ∞ 1 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada f (x)dx = 0 + Z 1 0 f (x)dx + 0 = 10 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 Z 1³ 0 1 = 3 (b) ¿Cuánto se estima por tanto k = 1 − k+x 2 ´ " x3 dx = kx + 3 #1 =k+ 0 1 3 2 . 3 que puede durar como mucho un dispositivo? Como la función de densidad de la variable X=”años que puede durar el dispositivo eléctrico” toma valores no nulos solamente en el intervalo [0, 1], ésto quiere decir que el tiempo de vida está comprendido entre 0 y 1 año. Por lo tanto, se estima que un dispositivo puede durar como mucho un año. (c) Calcula la probabilidad de que un dispositivo dure menos de seis meses. En primer lugar, como la variable mide el tiempo de vida en años y la pregunta se hace por 1 meses, hay que tener en cuenta que seis meses es de año. Se pide entonces 2 ¶ µ P X< 0+ Z 1/2 Z 0 Z 1/2 1 = f (x)dx = f (x)dx + f (x)dx = 2 −∞ −∞ 0 Z 1/2 µ 2 0 3 ¶ +x 2 " 2 x3 dx = x + 3 3 #1/2 = 0 2 1 1 1 3 · + · 3 = . 3 2 3 2 8 (d) ¿Cuál es el tiempo de vida medio de un dispositivo? Lo que se ha de calcular es la esperanza matemática de la variable X E(X) = Z ∞ −∞ xf (x)d x = Z 1µ 2 0 3 ¶ x+x 3 " 2 x2 x4 dx = + 3 2 4 #1 = 0 21 1 7 + = . 32 4 12 Expresado en meses, se puede decir que el tiempo de vida medio de un dispositivo es 7 meses. (e) Sabiendo que un dispositivo lleva funcionando tres meses, calcula la probabilidad de que dure menos de cuatro meses. Teniendo en cuenta que 3 meses representa 3/12 de un año y 4 meses, 4/12 de un año, lo que se pide es la probabilidad condicionada ¾ µ½ µ P X< ¶ P 4 3 X> = 12 12 ½ 3 4 T X> X< 12 ¶ 12 µ 3 P X> 12 ¾¶ µ 1 1 <X< P 4µ ¶3 = 1 P X> 4 ¶ Calculamos los valores de numerador y denominador: µ P ¶ µ ¶ " Z 1/3 1 2 x3 1 2 <X< = + x2 d x = x + 4 3 3 3 3 1/4 #1/3 = 1/4 Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 21 1 1 21 1 1 + − − = 0.0626. 3 3 3 33 3 4 3 43 11 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 4. El propietario de un olivar estima que el número de olivos que posee por cada 100 m2 sigue una distribución de Poisson de parámetro 2. (a) ¿Cuántos olivos tiene por término medio cada parcela de 100 m2 ? Lo que se está pidiendo es la esperanza de la variable X=”número de olivos en cada 100 m2 ”. Como X sigue una distribución de Poisson, la media es precisamente el parámetro de dicha Poisson, esto es λ = 2. (b) Calcula la probabilidad de que en una parcela de 100 m2 haya más de 3 olivos plantados. Se utilizan las tablas de la Poisson: P (X > 3) = 1 − P (X ≤ 3) = 1 − (P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3)) = 1 − 0.1353 − 0.2707 − 0.2707 − 0.1804 = 0.1429. (c) Calcula la probabilidad de que en una parcela de 100 m2 haya uno o dos olivos. P (X = 1) + P (X = 2) = 0.2707 + 0.2707 = 0.5414. (d) Si una extensión de 1000 m2 está separada en parcelas de 100 m2 , calcula la probabilidad de que en la mitad de las parcelas haya exactamente 2 olivos plantados en cada una. Una extensión de 1000 m2 contiene 10 parcelas de 100 m2 , por lo tanto, lo que se está pidiendo es la probabilidad de que entre 10 parcelas de 100 m2 , 5 tengan dos olivos plantados y las otras 5 no tengan 2 olivos plantados. Estamos ante la repetición 10 veces de la prueba de Bernoulli: ”en una parcela de 100 m2 hay 2 olivos plantados o no”. Si se considera como éxito el suceso ”en una parcela de 100 m2 hay 2 olivos plantados”, la probabilidad de éxito p = P (X = 2) = 0.2707 La variable Y =”número de parcelas con 2 olivos plantados de 10 parcelas observadas” sigue, entonces una distribución binomial de parámetros n = 10 y p = 0.2707. La probabilidad que se pide en este apartado es ! à 10 0.27075 · (1 − 0.2707)5 = 0.0755. P (Y = 5) = 5 5. Para analizar la variabilidad de la temperatura en las cimas de las Sierras Tejeda y Almijara (Málaga), se seleccionan al azar 20 dı́as y se registra una cuasidesviación muestral de 5 grados centı́grados. Suponiendo que la temperatura se distribuye normalmente, (a) estima un intervalo de confianza al 95% para la varianza poblacional; Si se consulta la correspondiente tabla de intervalos de confianza, el intervalo que se pide en el problema viene dado por (n − 1)S 2 (n − 1)S 2 , 2 I= 2 χ α , n−1 χ1− α , n−1 2 2 donde Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 12 I.T. DISEÑO INDUSTRIAL. CURSO 03/04 n representa el tamaño muestral, n = 20, S 2 es la cuasivarianza muestral, S 2 = 52 = 25 α, nivel de significación, α = 1 − 0.95 = 0.05 y χ2γ, n es el número real que verifica P (χ2n > χ2γ, n ) = γ Para obtener los valores de χ2α , n−1 = χ20.025,19 y χ21− α , n−1 = χ20.975,19 se usan las tablas de la Ji 2 2 cuadrado. Sólo hay que buscar n = 19 en la primera columna y 0.025 y 0.975 en la primera fila; ası́: χ20.025,19 = 32.852 y χ20.975,19 = 8.907. El intervalo de confianza para la varianza de la variable que mide la temperatura en las cimas de las Sierras a un nivel de confianza del 95% es · ¸ 19 · 25 19 · 25 , = [14.45, 53.32] 32.852 8.907 (b) ¿Se puede considerar que la desviación tı́pica es significativamente mayor que 4, tomando α = 0.01? En este apartado hay que plantear un contraste de hipótesis acerca de la desviación tı́pica de una distribución normal. Si consultamos las tablas de los contrastes de hipótesis más usuales, se observa que no hay un modelo especı́fico para hipótesis sobre la desviación tı́pica, aunque sı́ sobre la varianza. Cualquier afirmación que se realice sobre la desviación tı́pica se puede hacer en términos de la varianza (que es el cuadrado de la desviación tı́pica). Como la pregunta del problema es si se puede considerar la desviación tı́pica poblacional mayor que 4, se debe tomar el contraste cuya hipótesis alternativa plantee esta cuestión: H0 : σ 2 = 42 = 16 Ha : σ 2 > 16 Mirando en las tablas de los contrastes de hipótesis, encontramos que la condición de rechazo es (n − 1)S 2 se rechaza H0 si > χ2α,n−1 σ02 donde σ02 denota el número real concreto con el que se está comparando la varianza, es decir, σ02 = 16. 19 · 25 (n − 1)S 2 = 29.68 < 36.191 = χ20.01,19 = 2 σ0 16 Como no se cumple la condición de rechazo, se debe aceptar la hipótesis nula H0 . Los datos proporcionados por la muestra no dan motivos para pensar que la desviación tı́pica de la temperatura sea mayor que 4, por tanto, se considera que la desviación tı́pica es igual (o, en todo caso, menor que 4) pero no mayor que 4. Inmaculada de las Peñas Cabrera. Dpto de Matemática Aplicada 13