Universidad Autónoma de Madrid Probabilidad y Estadı́stica Propuesta de Problemas 4 (Soluciones) 1. a) La estrategia consiste en elegir el número de dados que vamos a lanzar. Llamemos en a la estrategia de lanzar n dados. Debemos calcular la esperanza de la variable ganancia para cada estrategia y ver para cual es máxima. e1 : La variable ganancia tiene como función de masa p(−1.25) = 3/6 = 1/2, p(1) = 3/6 = 1/2. Por tanto µ = −1.25 ∗ 1 1 + 1 ∗ = −0.25/2 = −0.125. 2 2 e2 : En este caso, p(−1.25) = (1/2)2 , p(1) = 2 ∗ (1/2)2 , p(0) = 1/4. Luego µ = −1.25 ∗ 1 2 0.75 +1∗ = = 0.1875. 4 4 4 e3 : p(−1.25) = (1/2)3 , p(1) = 3 ∗ (1/2)3 , luego µ = −1.25 ∗ 3 1.75 1 +1∗ = = 0.21875. 8 8 8 e4 : p(−1.25) = (1/2)4 , p(1) = 4 ∗ (1/2)4 , luego 4 2.75 1 +1∗ = ≈ 0.17. 16 16 16 en : p(−1.25) = (1/2)n , p(1) = n ∗ (1/2)n , luego µ = −1.25 ∗ 1 n n − 1.25 +1∗ n = . n 2 2 2n Parece que la esperanza máxima ocurre par e3 y luego va decreciendo. Para comprobar que efectivamente decrece, deberı́amos ver que µ = −1.25 ∗ (n + 1) − 1.25 n − 1.25 < . 2n+1 2n Si simplificamos esa desigualdad, vemos que equivale a n > 2.25, luego efectivamente es cierto que la esperanza va bajando a partir de n = 3, y por tanto la estrategia óptima es e3 . b) Por las propiedades de la esperanza µY = 100 ∗ 1.75/8 = 21.875. Además, como la varianza de la ganancia en una partida es 1 4 3 + (0 − µ)2 ∗ + (1 − µ)2 ∗ ≈ 0.5225, 8 8 8 √ tenemos que Var(Y ) = 100 ∗ 0.5225 ≈ 52.25, luego σY = 52.25 ≈ 7.23. Ası́, la estimación para el resultado de Y es (−1.25 − µ)2 ∗ 21.875 ± 7.23. 1 de 5 Universidad Autónoma de Madrid Probabilidad y Estadı́stica c) Como ya sabemos la media µY y la DT σY de Y , aproximamos las probabilidades que nos piden usando un variable normal N con media µY y DT σY . Yo lo he hecho con R para terminar antes. Queda x -10 -5 0 5 10 15 20 25 30 35 40 45 P(x < N ≤ x + 5) 9.52/100000 1.14/1000 8.54/1000 4.04 % 12.06 % 22.69 % 26.96 % 20.23 % 9.58 % 2.86 % 5.39/1000 6.39/10000 d ) En general, los resultados de las simulaciones se parecen mucho a los obtenidos con la aproximación; esto tiene sentido ya que Y es una suma de muchas variables independientes (100 variables). Sin embargo, la aproximación no es buena en los intervalos de los extremos; esto también tiene sentido, ya que sabemos que las simulaciones aproximan muy mal la probabilidad real si esta es pequeña. También podrı́a ser porque la aproximación normal funciona peor en los extremos, en términos relativos. 2. a) Como en el√apartado 1.b), tenemos que µY = 7 ∗ 0.21875 ≈ 1.53 y σY2 = 7 ∗ 0.5225, luego σY = 7 ∗ 0.5225 ≈ 1.53. Por tanto, la aproximación para Y es 1.53 ± 1.91. b) Hacemos como en el apartado 1.c), pero usando la media y DT del apartado 2.a). Ası́, obtenemos la siguiente tabla: 2 de 5 Universidad Autónoma de Madrid Probabilidad y Estadı́stica x -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 P(x < N ≤ x + 1) 3.70/100000 2.78/10000 1.59/1000 7.00/1000 2.35 % 6.04 % 11.88 % 17.89 % 20.62 % 18.19 % 12.29 % 6.35 % 2.51 7.61/1000 c) Sabemos que la variable ganancia en una partida corresponde a sacar un boleto al azar de la caja -1.25 1 1 1 0 0 0 0 . Por tanto, la variable Y corresponde a la suma de 7 boletos sacados con reposición de dicha caja. Como debemos hacer bastantes cálculos, vamos a elegir un lenguaje sencillo de expresión: vamos a clasificar los sucesos por el número de boletos de cada clase que aparecen. Por ejemplo, 24 serı́a el suceso de que aparezcan en las 7 sacadas 2-1.25, 4 1 y el resto boletos con 0 (pudiendo aparecer en cualquier orden). Ası́, el suceso 24 darı́a Y = 2 ∗ (−1.25) + 4 ∗ 1 + (7 − 2 − 4) ∗ 0 = 1.5. Por otra parte, teniendo en cuenta las reordenaciones, P(24) = 7! 1 3 4 ( )2 ( )4 ( )7−2−4 ≈ 1.62 %. 2!4!(7 − 4 − 2)! 8 8 8 De la misma forma, podemos hacer el cálculo para cualquier suceso ab con 0 ≤ a + b ≤ 7. Ası́, conseguimos la siguiente tabla (con dos decimales de aproximación). Yo he realizado los cálculos con R para ahorrar tiempo (y vosotros también podrı́ais haberlo hecho). 3 de 5 Universidad Autónoma de Madrid Probabilidad y Estadı́stica ab 70 60 61 50 51 52 40 41 42 43 30 31 32 33 34 20 21 22 Y -8.75 -7.50 -6.50 -6.25 -5.25 -4.25 -5.00 -4.00 -3.00 -2.00 -3.75 -2.75 -1.75 -0.75 0.25 -2.50 -1.50 -0.50 P 4.77/107 1.34/105 1.00/105 1.60/104 2.40/104 9.01/105 1.07/1000 2.40/1000 1.80/1000 4.51/104 4.27/1000 1.28 % 1.44 % 7.21/1000 1.35/104 1.03 % 3.85 % 5.77 % ab 23 24 25 10 11 12 13 14 15 16 00 01 02 03 04 05 06 07 Y 0.50 1.50 2.50 -1.25 -0.25 0.75 1.75 2.75 3.75 4.75 0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00 P 4.33 % 1.62 % 2.43/1000 1.37 % 6.15 % 11.54 % 11.54 % 6.49 % 1.95 % 2.43/1000 7.81/1000 4.10 % 9.22 % 11.54 % 8.65 % 3.89 % 9.73/1000 1.04/1000 Como no aparece ninguna Y repetida, esta tabla nos da directamente la función de masa de Y (aunque desordenada). Por ejemplo p(1.50) ≈ 1.62 %. d ) Simplemente tenemos que sumar las probabilidades correspondientes a cada intervalo. Por ejemplo P(0 < Y ≤ 1) = p(0.25) + p(0.50) + p(0.75) + p(1.00) ≈ 20.10 %. Por otra parte, como por el apartado 2.b) sabemos que la aproximación normal es P(0 < N ≤ 1) ≈ 17.89 %, tenemos que el error relativo cometido al usar dicha aproximación es 20.10 % − 17.89 % ≈ 10.97 %. 20.10 % Repitiendo estos pasos con cada intervalo, podemos construir la siguiente tabla: 4 de 5 Universidad Autónoma de Madrid Probabilidad y Estadı́stica x -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 P(x < Y ≤ x + 1) 1.70/10000 1.31/1000 2.49/1000 6.07/1000 2.35 % 6.65 % 13.42 % 20.10 % 22.39 % 18.27 % 10.60 % 4.14 % 9.73/1000 1.04/1000 P(x < N ≤ x + 1) 3.70/100000 2.78/10000 1.59/1000 7.00/1000 2.35 % 6.04 % 11.88 % 17.89 % 20.62 % 18.19 % 12.29 % 6.35 % 2.51 % 7.61/1000 Error Relativo 78.28 % 78.79 % 36.10 % 15.16 % 8.96/10000 9.22 % 11.46 % 10.97 % 7.88 % 4.00/1000 15.94 % % 53.54 % 158.14 % 629.33 % Vemos que la aproximación normal en este caso no es buena; esto era de esperar porque Y es una suma de pocas variables (sólo 7). Vemos que las zonas donde la aproximación es peor son los intervalos de los extremos (donde la probabilidad real es más pequeña), y mejor en los intervalos centrales. 5 de 5