ESTADÍSTICA Y SUS APLICACIONES EN CIENCIAS SOCIALES Práctico 2 – Solución. Curso 2016 Ejercicio 1 Suponemos que hay independencia en la concurrencia o no entre las personas. Dado este supuesto y las características del experimento (pueden separarse las opciones entre éxitos y fracasos), la situación de cada persona convocada es asimilable a un experimento tipo Bernoulli. Tenemos 12 repeticiones independientes de este experimento, por lo que podemos definir la variable aleatoria: X= “número de personas que concurre a la entrevista de entre las 12 contactadas”. La variable X sigue una distribución Binomial con parámetros n=12 y p=0,85, o sea que: X~B(n = 12 , p = 0.85) Se puede responder las preguntas del ejercicio utilizando la función de cuantía de la distribución Binomial. 𝑝(𝑘) = 𝐶𝑘𝑛 . 𝑝𝑘 . (1 − 𝑝)𝑛−𝑘 12 a) 𝑃(𝑋 = 12) = 𝑝𝑋 (12) = 𝐶12 . (0.85)12 . (1 − 0.85)12−12 = 0.1422 b) 𝑃(𝑋 = 0) = 𝑝𝑋 (0) = 𝐶012 . (0.85)0 . (1 − 0.85)12−0 = 0.0000000000129 Esta es una probabilidad muy pero muy baja. Una probabilidad alta implicaría que se debe cambiar el método para convocar a las entrevistas. c) E(X) = n.p dado que X sigue una distribución Binomial. En este caso E(X)= 12 × 0,85 = 10,2 La esperanza o media de una variable aleatoria puede no ser un número perteneciente al recorrido de la variable. En este caso es una fracción: el número de personas que se espera que concurran es un poco mayor a 10 pero no llega a 11. Ejercicio 2 a) Definimos las variables aleatorias X = cantidad de titulares que concurren; Y = cantidad de suplentes que concurren. Ambas variables siguen una distribución binomial. La probabilidad de que cada titular concurra es de 0,9 pero la de que cada suplente concurra es de 0,8. Observar que las variables son independientes, ya que se supone que el hecho de que concurra un titular no influye en la probabilidad de que un suplente concurra (y viceversa). b) la probabilidad de que la mesa se forme con los tres suplentes implica que ninguno de los titulares concurra y sí los tres suplentes, o sea: P(X=0) · P(Y=3) = 0.13· 0.83 = 0,001 · 0,512= 0,000512 c) Para que haya necesidad de llamar a uno de los suplentes alcanza con que falte un titular, por lo tanto es igual a: P(X = 2) = 3 · 0.92· 0.11 = 3 · 0,081 = 0,243 Se multiplica por 3, dado que se pueden dar 3 situaciones distintas (combinaciones): falta el presidente, falta el secretario o falta el vocal. Observar que la letra solicita la probabilidad de llamar un suplente y no la probabilidad de que la mesa se conforme con un suplente. En este segundo caso, sería necesario también incorporar la probabilidad de que al menos un suplente asista. d) La mesa no puede conformarse únicamente en el caso de que no concurra nadie. Según la Corte Electoral, alcanza con que concurra una sola persona de las citadas (un titular o un suplente) para que la mesa se conforme (el asistente deberá invitar a otros ciudadanos a formar parte de la mesa hasta que la corte designe otros integrantes). Por tanto, viene dada por la probabilidad de que no concurra ninguno de los citados, o sea: P(X = 0) · P(Y = 0) = 0.13· 0.23 = 0,001 · 0,008 = 0,000008. Ejercicio 3 Suponemos también que hay independencia en la decisión de confirmar o no entre las personas (no consideramos que viajen juntos familiares o amigos). En consecuencia, se puede asumir que se cumplen los supuestos de una sucesión de pruebas de Bernoulli (éxito= concurre). La distribución del número de éxitos obtenidos con la repetición de este experimento (cada potencial pasajero es un experimento diferente) n veces puede aproximarse a través de una distribución Binomial. Definimos entonces la variable aleatoria relevante: Y= “número de personas que confirman sus vuelos entre los 30 que reservaron” Y~B(n = 30 , p = 0.8) 30 a) 𝑃(𝑌 = 30) = 𝑝𝑌 (30) = 𝐶30 . (0.8)30 . (1 − 0.8)30−30 = 0.001237 En aproximadamente el 1 por mil (1/000) de los casos puede ocurrir que los 30 que reservan confirmen sus vuelos. b) 𝑃(𝑌 > 25) = 𝑝𝑌 (30) + 𝑝𝑌 (29) + 𝑝𝑌 (28) + 𝑝𝑌 (27) + 𝑝𝑌 (26) = = 0.001237 + 0.0093 + 0.0337 + 0.0785 + 0.1325 = 0.2552 La estrategia de la empresa es relativamente arriesgada ya que con una probabilidad 0,25 habrá problemas en el aeropuerto antes de cada vuelo. Ejercicio 4 El tipo de situación se ajusta al tipo de experimentos modelizados a través de la distribución de Poisson. Definimos la variable aleatoria F como: F= “cantidad de reclamantes que llegan a la oficina en un minuto” F seguirá una distribución de Poisson con parámetro 𝜆 = 3 (promedio de reclamantes que llegan por minuto): 𝐹~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 3). (𝜆 se define en relación al intervalo en que está definida la variable aleatoria relevante. Si la variable definida hubiera sido H= “cantidad de reclamantes que llegan a la oficina en una hora”, entonces el 𝜆 relevante sería 𝜆𝐻 = 3 ∗ 60.) Podemos usar la función de cuantía de F para responder las preguntas. La cuantía de una distribución de Poisson es: 𝑒 −𝜆 𝜆𝑘 𝑝(𝑘) = 𝑘! a) 𝑃(𝐹 = 0) = 𝑝𝐹 (𝑘) = 𝑒 −3 30 0! = 0.0498 b) Esta pregunta tiene un marco temporal diferente de la anterior. Definimos entonces J = “cantidad de reclamantes que llegan a la oficina en dos minutos”, sabemos que 𝐽~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 6) dado que en dos minutos el promedio de gente que llega a la oficina es de seis personas. Por lo tanto tenemos que: 𝑃(𝐽 = 4) = 𝑝𝐽 (4) = 𝑒 −6 64 4! = 0.1338 c) Usamos la variable aleatoria F definida antes. Definiendo una F1 como la F para el primer minuto y otra F2 como la F para el segundo minuto, podemos plantear que la respuesta a la pregunta viene dada por: 𝑃(𝐹1 = 2)⋂𝑃(𝐹2 = 2) Si suponemos independencia de F1 y F2, entonces: 𝑃(𝐹1 = 2)⋂𝑃(𝐹2 = 2) = 𝑝𝐹1 (2) ∗ 𝑝𝐹2 (2) 2 𝑒 −3 32 𝑒 −3 32 𝑒 −3 32 𝑃(𝐹1 = 2)⋂𝑃(𝐹2 = 2) = ∗ =[ ] = 0.0502 2! 2! 2! d) Si en un minuto se esperan 3 llegadas, en media hora, o sea 30 minutos se deberán esperar 90 llegadas(3*30=90). Formalmente podríamos definir: M= “cantidad de reclamantes que llegan a la oficina en treinta minutos” y establecer que 𝑀~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(𝜆 = 90). Entonces E(M)=𝑚𝑀 = 𝜆𝑀 = 90. Ejercicio 5 Sea la variable aleatoria X = “cantidad de fallas en un rollo de 10 metros” => X ~ Poisson(2,5). a) 𝑃(𝑋 ≤ 2) = 𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2) = 0,082 + 0,205 + 0,257 = 0,544 b) E(X) = 2,5. El promedio indica de que se espera una falla cada cuatro metros de tela (en promedio). Ejercicio 6 X ~ N(140 , 102) => a) 𝑍= 𝑋−140 10 ~𝑁(0 , 1) P(X>140) = 0,5 La distribución normal es simétrica con respecto a la media, la mitad de la masa de probabilidad corresponde a los valores a cada lado de la media (140 en este caso). b) 145 − 140 150 − 140 𝑃(145 < 𝑋 < 150) = 𝑃 ( <𝑍< ) = 𝑃(0,5 < 𝑍 < 1) = 10 10 𝐹𝑧(1) − 𝐹𝑧(0,5) = (𝑡𝑎𝑏𝑙𝑎𝑠) = 0,8413 − 0,6914 = 0,1498. c) El primer quintil de las alturas (Q20) es la altura para la cual se acumula el 20% de probabilidad. El problema consiste entonces en hallar Q20 tal que P(X<Q20) = 0,2. Estandarizando tenemos: 𝑃(𝑍 < 𝛾) = 0,2 , dónde 𝛾 = 𝑄20 −140 10 . Para encontrar γ se busca en la tabla de la normal estándar el valor que acumule 0,2. Se obtiene γ = -0.85. Entonces, tenemos: 𝑆í 𝛾 = −0,84 => 𝑄20 −140 10 = −0,84 => 𝑄20 = 131,6. d) Se estima que habrán 1000 * 0,1498 = 149,83. Aproximadamente 149 niños con la estatura solicitada. Ejercicio 7 La variable aleatoria de interés y su recorrido son: X = “cantidad de personas de la muestra que mira TV y escucha radio”. Rec (X) = (0, 1, 2, 3, 4) X se distribuye Hipergeométrica, dado que se realizan 4 pruebas de Bernoulli sin reposición (en ningún caso un encuestador entrevista dos veces la misma persona). La probabilidad de éxito corresponde a la porbailidad encontrar alguien que a la vez vea TV y escuche radio. P(TV∩R)= P(TV/R)·P(R) =0,25·0,8=0,2 X ~ Hipergeométrica (N, n, p) => X ~ Hipergeométrica (25; 4; 0,2) Recordar que p = A/N, por lo que tenemos que A = p.N = (0,2) * 25 = 5 La función de cuantía de una Hipergeométrica viene dada por: 𝑁−𝐴 𝐶𝑘𝐴 ∗ 𝐶𝑛−𝑘 𝑝(𝑘) = 𝐶𝑛𝑁 𝑃(𝑋 > 1) = 1 − 𝑃(𝑋 ≤ 1) = 1 − [P(X = 0) + P(X = 1)] = 𝐶05, 𝐶420 𝐶15, 𝐶320 = 1 − [ 25 + ] = 0,1664 𝐶4 𝐶425 Ejercicio 8 X = “Cantidad de países con reservas de petróleo” Rec (X) = {0, 1, 2, 3} X ~ Hipergeométrica (20; 3; 0,25) => A = N.p = 20*(0,25) = 5 a) 𝑃(𝑋 = 1) = b) 𝑃(𝑋 = 2) = 𝐶15 𝐶215 𝐶320 𝐶25 𝐶115 c) 𝐸(𝑋) = 𝑝𝑛 = 𝐶320 𝐴∗𝑛 𝑁 = 0,46 = 0,13 = 0,75 Se espera que en promedio 0.75 países (no alcanza a un país) de los tres países seleccionados tenga reservas de petróleo. Ejercicio 9 Lo que debemos hacer es calcular la probabilidad de que ante la ausencia de discriminación, a lo sumo una de las mujeres fuera ascendida en su cargo. X = “Cantidad de mujeres ascendidas en los tres ascensos” Rec (X) = {0, 1, 2, 3} X ~ Hipergeométrica (9; 3; 4/9=0,4444) => A = N.p = 9*(0,4444) = 4 La probabilidad de que no más de una mujer fuera ascendida es P(X=0) + P(X=1). 𝐶14 𝐶25 𝑃(𝑋 = 1) = 9 = 0,4762 𝐶3 𝐶04 𝐶35 𝑃(𝑋 = 0) = 9 = 0,1190 𝐶3 Por tanto: 𝑃(𝑋 ≤ 1) = 0,4762 + 0,1190 = 0,5952 Por tanto, si no se tiene en cuenta el género (sin discriminación), había casi un 60% de probabilidad de que no más que una mujer fuera elegida. Ejercicio 10 a) X = “Cantidad de estudiantes que consultan en 20 minutos”. λ = 5,2 => 𝑃(𝑋 = 4) = X ~ Poisson (5,2) 𝑒 −5,2 5,24 = 0,1681 4! b) 𝐏(𝐗 > 𝟒) = 𝟏 − 𝐏(𝐗 ≤ 𝟒) = = 𝟏 − [𝐏(𝐗 = 𝟎) + 𝐏(𝐗 = 𝟏) + 𝐏(𝐗 = 𝟐) + 𝐏(𝐗 = 𝟑) + 𝐏(𝐗 = 𝟒)] = 𝟏 − [𝟎, 𝟎𝟎𝟓𝟓 + 𝟎, 𝟎𝟐𝟖𝟕 + 𝟎, 𝟎𝟕𝟒𝟔 + 𝟎, 𝟏𝟐𝟗𝟑 + 𝟎, 𝟏𝟔𝟖𝟏] = 𝟎, 𝟓𝟗𝟑𝟖 c) Y = “Cantidad de estudiantes que consultan en 30 minutos” Observar que λ = 5,2 para cada período de 20 minutos. Como ahora tenemos un período de 30 minutos, debemos determinar qué porcentaje es 30 minutos en 20 minutos, o sea 30/20 = 1,5. Entonces, para obtener un parámetro λ por cada período de 30 minutos hacemos (5,2)*1,5 = 7,8. Y ~ Poisson(7,8) Como nos solicita la probabilidad de que lleguen 7 estudiantes por cada período de 30 minutos, tenemos: 𝑷(𝑿 = 𝟕) = 𝒆−𝟕,𝟖 𝟕, 𝟖𝟕 = 𝟎, 𝟏𝟒𝟐𝟖 𝟕! Ejercicio 11 a. Utilizamos el modelo binomial, en que cada auto puede verse como una prueba de Bernoulli, con p = 0.1. Al considerar el lote una muestra aleatoria las pruebas son independientes. X ~ B(n=10; p=0.1). i. P (al menos uno defectuoso) = 1 − P (ninguno defectuoso) = 1 − P(X=0) = 1 − C100 (0.1)0(0.9)10 = 1− 0.349 = 0.65 ii. P (más de 3 defectuosos) = 1 − P (3 o menos defectuosos) = 1 − P(X=0) − P(X=1) − P(X=2) − P(X=3) = 1 − C100 (0.1)0(0.9)10 − C101(0.1)1(0.9)9 − C102(0.1)2(0.9)8 − C103 (0.1)3(0.9)7 = 1 − 0.349 − 0.387 − 0.194 − 0.057 = 0.013 b. Aplicamos el modelo hipergeométrico, ya que extraemos sin reponer de un lote que tiene una proporción dada de autos defectuosos. 𝐶22 𝐶28 𝑃(𝑋 = 2) = 10 = 0,133 𝐶4 Ejercicio 12 a. Poisson puede verse como la distribución en el límite de una variable binomial, cuando n es muy grande y a la vez p es muy pequeño. Un supermercado puede contener un número alto de clientes que podrían pasar por la caja en un minuto dado, pero sólo una pequeña proporción de ellos lo hace. Si nuestro experimento aleatorio consistiera en observar a los n clientes del supermercado y verificar si pasan o no por la caja en un minuto dado, con dos resultados posibles, éxito si pasan y fracaso si no pasan, éste estaría correctamente descrito por una variable Binomial. En las condiciones planteadas, la variable Poisson sería una adecuada aproximación. b. 𝑃(𝑋 = 𝑥) = 𝑒 −𝜆 𝜆𝑥 𝑥! donde λ = E(X). Para determinar λ tomamos el minuto como intervalo de interés, y por lo tanto obtenemos λ ≈ 300/120 = 2.5 clientes por minuto. i. PX (0) = e-2.5 = 0.082 𝑃(𝑋 = 0) = 𝑒 −2.5 2.50 = 𝑒 −2.5 = 0.082 0! ii. P(X ≥ 5) = 1 − [P(X=0) + P(X=1) + P(X=2) + P(X=3) + P(X=4)] Obtenemos P(X=x) = 0.205, 0.256, 0.214, 0.134 para x = 1, 2, 3, 4 respectivamente. De modo que P (X ≥ 5) = 1 − 0.891 = 0.109 Ejercicio 13 Dado que X ~ N(2, 25), sabemos que P(a < X ≤ b) = P [(a−2)/5 < Z ≤ (b−2)/5], donde Z ~ N(0,1). Utilizamos entonces en todos los casos las tablas de la N(0,1), donde Φ(z) denotan los valores de probabilidad acumulados hasta ese punto por la función de distribución de la variable Z. a. P(−1 < X ≤ 1) = P (X ≤ 1 ) − P (X ≤ −1) = Φ [(1 − 2)/5] − Φ [(−1 − 2)/5] b. P ( X < −2) = P (X≤ −2) = Φ [(−2 −2)/5] =1 − Φ (4/5) c. P ( −5.3 ≤ X≤ 4.7 ) = P ( −5.3 < X ≤ 4.7 ) = P (X ≤ 4.7 ) − P (X ≤ −5.3 ) Φ [(4.7 − 2)/5] − Φ [(−5.3 − 2)/5] = Φ [(4.7 − 2)/5] − {1 − Φ [7.3/5]} d. P({X < −7.5} ∪ {X > 2.5}) = P(X < −7.5) + P(X > 2.5) = P(X ≤ −7.5) + P(X > 2.5) = P(X≤ −7.5) + [1 − P(X ≤ 2.5)] = Φ [(−7.5 − 2)/5] + [1− Φ [(2.5 − 2)/5]] = 1− Φ [(9.5)/5] + [1− Φ [(2.5 − 2)/5]] e. P (X ≥ 6) = P (X > 6) = 1 − P (X ≤ 6) = 1 − Φ [(6 − 2)/5] Ejercicio 14 Sabemos que X~U[-3, 9], entonces tenemos: 𝐸(𝑋) = (𝑎 + 𝑏) (−3 + 9) = =3 2 2 (𝑏 − 𝑎)2 (9 + 3)2 144 𝑉(𝑋) = = = = 12 12 12 12 b) Para hallar la P(X<0) deberíamos integrar la función de densidad. Como sabemos que en la distribución uniforme todos los resultados dentro del intervalo [a,b] son equiprobables con una probabilidad de 1/(b-a), podemos calcular el área del rectángulo como base por altura. En este caso: 1 (𝑏 − 𝑎) 1 3 𝑃(𝑋 < 0) = (0 + 3) ∗ = = 0.25 (9 + 3) 12 𝑃(𝑋 < 𝑥) = (𝑥 − 𝑎) ∗ Ejercicio 15 a) X Normal (μX, 22) tal que P(X>28)=0.03. Definiendo Z como Z = 28−μX P(Z< 2 X−μX 2 , tenemos que P(Z> 28−μX 2 )=0.03, o lo que es lo mismo )=0.97. En la tabla Normal Φ(1.88) acumula 0.97 de probabilidad. Por lo tanto: 28−μX 1.88= 2 de donde se deduce que μX=24.24 b) Se debe hallar Q95 tal que se cumpla: P(X<Q95)=0.95. Análogamente al punto a): Q95 −μX P(Z< 2 Q95 −24.24 2 )=0.95, entonces como Φ(1.65) = 0.95, se debe encontrar Q 95 tal que =1.65. Así se obtiene Q95=27.54.