VARIABLES ALEATORIAS Métodos Estadísticos Aplicados a las Auditorías Sociolaborales Francisco Álvarez González francisco.alvarez@uca.es VARIABLES ALEATORIAS UNIDIMENSIONALES Variable aleatoria, asociada a una experiencia aleatoria, es la ley que hace corresponder a cada suceso aleatorio un valor numérico. Así, por ejemplo, la expresión "lanzamos tres monedas observando el número de caras que se obtienen" está definiendo la variable aleatoria que permite asociar al suceso Cara-Cruz-Cara el valor 2 (dos caras). Como en el caso de las variables estadísticas, las variables aleatorias pueden ser discretas o continuas. Nos centraremos en el estudio de las primeras. FUNCIÓN DE DENSIDAD O LEY DE PROBABILIDAD Es el conjunto de los valores de la variable aleatoria X y sus probabilidades respectivas f(x) = Pr(X=x). Para el caso discreto se suele adoptar la forma de representación siguiente : X x1 x2 x3 f(X) p1 p2 p3 .... .... xi .... xn pi .... pn n Ante la equivalencia entre frecuencias relativas y probabilidades, se verifica que : ∑p i =1 i=1 FUNCIÓN DE DISTRIBUCIÓN Del mismo modo que se definían las frecuencias acumuladas, denominamos función de distribución a : F(x) = Pr(X≤x) MOMENTOS. ESPERANZA MATEMÁTICA, VARIANZA, ASIMETRÍA Y CURTOSIS n Momento ordinario de orden k : α k = ∑ p i . x ik i =1 n μ k = ∑ p i . ( x i − E ( X) ) Momento central de orden k : k i =1 En particular : Esperanza matemática : Es el momento ordinario de orden 1 (α1) , equivalente a la media aritmética. n E ( X) = α 1 = ∑ p i . x i i =1 Varianza : Es el momento central de 2º orden. n n V( X) = μ 2 = ∑ p i . ( x i − E ( X)) = ∑ p i . x 2i − E ( X) 2 = α 2 − α 12 2 i =1 i =1 Desviación típica : Es la raíz cuadrada de la varianza. D ( X) = V( X ) Coeficiente de asimetría : (similar a lo estudiado en el análisis descriptivo de una variable) A ( X) = μ3 [ D( X)] 3 Coeficiente de curtosis : (similar a lo estudiado en el análisis descriptivo de una variable) K( X) = μ4 [ D( X)] 4 −3 Expresión de algunos momentos centrales en función de momentos ordinarios : μ1 = 0 μ2 = α 2 − μ 3 = α 3 − 3. α1 . α 2 + 2. α13 α12 μ 4 = α 4 − 4. α1 . α 3 + 6. α12 . α 2 − 3. α14 Variables aleatorias (F. Álvarez) - 1 OTRAS MEDIDAS DE CENTRALIZACIÓN Moda : es el valor de la variable aleatoria que posee probabilidad máxima. Mediana : es el valor Md de la variable aleatoria para el cuál : F(Md) ≥ 0'5 y 1 - F(Md) < 0'5 (siendo F la función de distribución) PROPIEDADES • • • E(X + Y) = E(X) + E(Y) E(α.X) = α.E(X) , para cualquier número α. Si las dos variables son independientes , se verifica que : • E(X . Y) = E(X) . E(Y) • V(X + Y) = V(X) + V(Y) TEOREMA DE TCHEBYCHEV Establece la probabilidad máxima de que la variable aleatoria tome valores en los alrededores de la esperanza matemática (media de la distribución). Teorema : Para toda variable aleatoria X para la que existe su esperanza y su varianza, se verifica que, para cualquier valor numérico positivo k : Pr( X − E ( X ) < k ) < 1 − V( X) k2 Gráficamente : La probabilidad de que cualquier valor de la variable X pertenezca al intervalo sombreado es inferior a : 1− 2 - Variables aleatorias (F. Álvarez) V( X) k2 EJERCICIOS RESUELTOS 1 Lanzadas cuatro monedas, consideremos el número de cruces obtenidas. Calcular, de la variable aleatoria así definida : a) Ley de probabilidad b) Función de distribución c) Esperanza matemática y varianza d) Mediana y moda de la distribución e) Determine la probabilidad de obtener más de 1 y menos de 3 caras. Compruebe el teorema de Tchebychev. CCCC CCC+ CC++ C+++ ++++ CC+C C+C+ +C++ C+CC C++C ++C+ +CCC +CC+ +++C +C+C Se obtienen 0 cruces Se obtienen 3 caras y 1 cruz Se obtienen 2 caras y 2 cruces Se obtienen 1 cara y 3 cruces Se obtienen 4 cruces ++CC Ley de probabilidad o función de densidad : X f(x)=Pr(X=x) 0 1/16 1 4/16 2 6/16 3 4/16 4 1/16 0 1/16 1/16 1 4/16 5/16 2 6/16 11/16 3 4/16 15/16 4 1/16 16/16 = 1 Función de distribución : X f(x)=Pr(X=x) F(x)=Pr(X≤x) ⎧0 ⎪1 ⎪ 16 ⎪5 ⎪ F ( x) = ⎨ 16 11 ⎪ 16 ⎪15 ⎪ 16 ⎪⎩1 Más correctamente se expresará : para x < 0 para0 ≤ x < 1 para1 ≤ x < 2 para 2 ≤ x < 3 para3 ≤ x < 4 para x ≥ 4 Gráficamente : Función de distribución Ley de probabilidad Para el cálculo de la esperanza matemática y la varianza de una variable aleatoria discreta, se aconseja construir la siguiente tabla auxiliar : α1 α2 De aquí : X P P.X P.X2 E(X) = α1 = 2 0 1/16 0 0 1 4/16 4/16 4/16 2 6/16 12/16 24/16 3 4/16 12/16 36/16 4 1/16 4/16 16/16 Totales 1 32/16 = 2 80/16 = 5 V(X) = α2 - α12 = 5 - 4 = 1 Variables aleatorias (F. Álvarez) - 3 Definida la desviación típica como la raíz cuadrada de la varianza : D(X) = 1 Observando la ley de probabilidad o función de densidad, deducimos que : Moda = 2 (al tener X=2 la mayor probabilidad (6/16) ) Observando la función de distribución, deducimos que : Mediana = 2 (al ser X=2 el valor para el que F(X) (=11/16) primero iguala o supera a 0'5) Comprobemos el teorema de Tchebychev para el caso reseñado : • • Pr (1 < X < 3) = Pr(X=2) = 6/16 = 0'375 Siendo E(X) = 2 , la esperanza se encuentra en el centro del intervalo definido (1 , 3), luego su amplitud es k=2. Recordando que V(X) =1, tenemos : Pr ( X − E ( X ) < 2) < 1 − • 1 = 0'75 22 La probabilidad calculada es en efecto inferior a 0'75. 2 En la extracción simultánea de tres bolas de una urna que contiene 6 bolas blancas y cuatro negras, observamos el número de bolas blancas extraídas. De la variable aleatoria así definida, calcular : a) ley de probabilidad b) función de distribución c) esperanza matemática , varianza y desviación típica. d) mediana y moda de la distribución. ⎛ 4⎞ ⎜⎜ ⎟⎟ 3 4 Pr(0blancas y3ne gras ) = ⎝ ⎠ = = 0'033 ⎛10 ⎞ 120 ⎜⎜ ⎟⎟ ⎝3⎠ ⎛6⎞ ⎛ 4⎞ ⎜⎜ ⎟⎟.⎜⎜ ⎟⎟ 1 2 6.6 Pr(1blanca y 2ne gras ) = ⎝ ⎠ ⎝ ⎠ = = 0'3 120 ⎛10 ⎞ ⎜⎜ ⎟⎟ ⎝3⎠ ⎛ 6⎞ ⎛ 4⎞ ⎜⎜ ⎟⎟.⎜⎜ ⎟⎟ 2 1 15.4 Pr(2blancas y1ne gra ) = ⎝ ⎠ ⎝ ⎠ = = 0'5 120 ⎛10 ⎞ ⎜⎜ ⎟⎟ ⎝3⎠ ⎛ 6⎞ ⎜⎜ ⎟⎟ 3 20 Pr(3blancas y0ne gras ) = ⎝ ⎠ = = 0'167 ⎛10 ⎞ 120 ⎜⎜ ⎟⎟ ⎝3⎠ Una vez calculadas las probabilidades de las distintas situaciones posibles, obtenemos : Ley de probabilidad o función de densidad : X Prob. 0 0'033 1 0'3 F(x) = 0 0'033 0'333 0'833 1 Función de distribución : 2 0'5 3 0'167 x<0 0≤x<1 1≤x<2 2≤x<3 x≥3 Esperanza matemática , varianza y desviación típica : X Prob. = P P.X P.X2 E( X) = 1'8 0 0'033 0 0 1 0'3 0'3 0'3 2 0'5 1 2 V( X) = 3' 8 - 1' 8 2 = 0'56 3 0'167 0'5 1'5 D( X) = Totales 1'8 3'8 0' 56 = 0'748 Mediana y Moda : Observando la función de distribución, deducimos que : Mediana = 2 (al ser X=2 el valor para el que F(X) (= 0'8333) primero iguala o supera a 0'5) Observando la ley de probabilidad o función de densidad, deducimos que : Moda = 2 (al tener X=2 la mayor probabilidad (0'5) ) 4 - Variables aleatorias (F. Álvarez) 3 Complete la ley de probabilidad siguiente, sabiendo que su esperanza matemática es igual a 1'8 : X Prob. 0 0'2 1 a n De una parte, sabiendo que se verifica que ∑p i 2 b 3 0'3 = 1 , resulta : 0'2 + a + b + 0' 3 = 1 ⇒ a + b = 0'5 i=1 Conocida la esperanza matemática : E ( X ) = n ∑ p .x i i = 0 . 0' 2 + 1. a + 2. b + 3. 0' 3 = 1' 8 ⇒ a + 2.b = 0'9 i=1 Resolviendo el sistema obtenemos los valores de a y b : a + b = 0'5 a = 0'5 - b a + 2.b = 0'9 0'5 - b + 2.b = 0'9 ⇒ b = 0'4 ⇒ a = 0'1 4 Calcular la esperanza matemática, varianza, asimetría y curtosis de la variable aleatoria que tiene como función de distribución : F(x) = 0 0'2 0'55 0'85 1 x<2 2≤x<4 4≤x<6 6≤x<8 x≥8 La ley de probabilidad o función de densidad será : x p 2 0'2 4 0'35 6 0'3 8 0'15 p.x p.x2 p.x3 p.x4 0'4 0'8 1'6 3'2 1'4 5'6 22'4 89'6 1'8 10'8 64'8 388'8 1'2 9'6 76'8 614'4 Cálculo de momentos : α1 α2 α3 α4 α1 = 4'8 (Σ) α2 = 26'8 (Σ) α3 = 165'6 (Σ) α4 = 1096 (Σ) Luego : • esperanza matemática : n E( X) = ∑ p i . x i = α1 = 4'8 i =1 • varianza : V( X) = μ 2 = α 2 − α12 = 26'8 − 4'8 2 = 3'76 • ( D( X) = 3'76 = 19391 ' ) coeficiente de asimetría : μ 3 = α 3 − 3. α1 .α 2 + 2.α13 = 165'6 − 3.4'8.26'8 + 2.4'8 3 = 0'8640 μ3 0'8640 A ( X) = ' 3 = 3 = 01185 ' ( D( x)) 19391 • coeficiente de curtosis : μ4 = α4 − 4. α1. α3 + 6. α12 . α2 − 3. α14 = 1096 − 4.4'8165 . '6 + 6.4'82 .26'8 − 3.4'84 = 28'7872 28'7872 μ4 K( X) = 4 −3= 4 − 3 = −0'9638 19391 ' ( D( x ) ) 5 Realizada una apuesta de 100 pts., un jugador extrae una bola de una caja que contiene 2 bolas blancas, 3 rojas y 5 negras. Si la bola extraída es negra pierde lo apostado y finaliza el juego; si es roja recibe lo apostado y deja de jugar, y finalmente, si es blanca, cobra 200 pts. si al lanzar una moneda obtiene cruz y 400 pts. si sale cara. Si el jugador participa en 12 ocasiones en dicho juego, ¿ qué beneficio o pérdida tendrá ?. Las situaciones posibles son : Variables aleatorias (F. Álvarez) - 5 Beneficio -100 pts. 100 - 100 = 0 pts. 200 - 100 = 100 pts. 400 - 100 = 300 pts. Extrae bola negra Extrae bola roja Extrae bola blanca y cruz Extrae bola blanca y cara Probabilidad (5/10) 0'5 (3/10) 0'3 (2/10).(1/2) 0'1 (2/10).(1/2) 0'1 La esperanza matemática de la variable aleatoria "beneficio en el juego" , nos indica lo que cabe esperar que ocurra en cada jugada. Una cantidad negativa se interpreta como la pérdida media que el jugador tendrá en cada jugada. Si la esperanza es positiva indicará que el jugador, promediando jugadas, ganará dicha cantidad. En ambos casos se dice que el juego no es equitativo o que es injusto. Cuando la esperanza matemática del beneficio en un juego es igual a cero, diremos que dicho juego es equitativo o justo. En nuestro caso : E(X) = -100.0'5 + 0.0'3 + 100.0'1 + 300.0'1 = -10 pts. Realizadas 12 jugadas, lo más probable (lo esperado) es que haya perdido 120 pts. [12 . (-10) ] . 6 Lanzando dos dados y sumando los puntos obtenidos, los premios que ofrece el juego son los siguientes : - Devolución de lo apostado : si la suma es inferior a 4 o superior a 10. - Doble de lo apostado : si se obtiene 5 o 9. - Cuatro veces lo apostado : si la suma de puntos es 7 Analice si el juego es equitativo o no. Análisis de las situaciones posibles : 1-1 1-2 1-3 1-4 1-5 1-6 2 3 4 5 6 7 2-1 2-2 2-3 2-4 2-5 2-6 3 4 5 6 7 8 3-1 3-2 3-3 3-4 3-5 3-6 4 5 6 7 8 9 4-1 4-2 4-3 4-4 4-5 4-6 5 6 7 8 9 10 5-1 5-2 5-3 5-4 5-5 5-6 6 7 8 9 10 11 6-1 6-2 6-3 6-4 6-5 6-6 7 8 9 10 11 12 Al apostar x pts., los beneficios o pérdidas son : Situaciones Devolución de lo apostado Doble de lo apostado Cuatro veces lo apostado Pérdida de lo apostado 2, 3, 11, 12 5,9 7 4, 6, 8, 10 Nº de veces 6 8 6 16 36 Beneficio 0 x 3x -x Probabilidad 6/36 8/36 6/36 16/36 Determinemos su esperanza matemática : E( X) = 0. 6 8 6 16 8x +18x - 16x 10 + x. + 3x . − x. = = .x 36 36 36 36 36 36 Siendo la esperanza matemática positiva, el juego siempre dará beneficio al jugador . No es equitativo, siendo desfavorable para la banca. Parece claro que el dueño del local de juego no tiene vista comercial o no sabe estadística. 6 - Variables aleatorias (F. Álvarez) EJERCICIOS PROPUESTOS 1 Determine la función de distribución, esperanza matemática, varianza y desviación típica de las variables aleatorias definidas por las siguientes funciones de densidad : a) x f(x) 1 0'1 2 0'25 b) x f(x) -2 0'05 0 A 3 0'05 4 0'3 2 0'15 4 A 5 0'3 6 0'2 8 2.A 2 Determine la ley de probabilidad, esperanza matemática, mediana, moda, varianza, desviación típica, asimetría y curtosis de la variable aleatoria que tiene como función de distribución : F(x) = 0 0'15 0'35 0'35 0'7 1 si si si si si si x<1 1≤x<2 2≤x<3 3≤x<4 4≤x<5 x≥5 3 Determine la ley de probabilidad, función de distribución, esperanza matemática, varianza y desviación típica de la variable aleatoria definida por el número de bolas blancas resultantes de la extracción de dos bolas de una urna, que contiene 3 bolas blancas y dos negras, y una bola de otra urna, que posee 5 bolas de cada color. 4 La participación en un juego nos lleva a lanzar una moneda y un dado. Si sale cara al lanzar la moneda perdemos lo apostado. Si sale cruz, recibimos el doble de la apuesta si el número del dado es múltiplo de 3, tres veces la apuesta si sale 5 y, lo apostado, en el resto de los casos. Si un jugador participa 20 veces en el juego, apostando 1000 pts. en cada ocasión, ¿ qué beneficio obtendrá con mayor probabilidad ?. Variables aleatorias (F. Álvarez) - 7 SOLUCIONES DE LOS EJERCICIOS PROPUESTOS 1 a) F(x) = b) F(x) = 0 0'1 0'35 0'4 0'7 1 si si si si si si x<1 1≤x<2 2≤x<3 3≤x<4 4≤x<5 x≥5 0 0'05 0'2 0'35 0'5 0'7 1 si si si si si si si x < -2 -2 ≤ x < 0 0≤x<2 2≤x<4 4≤x<6 6≤x<8 x≥8 E(X) = 3'45 V(X) = 1'9475 D(X) = 1'3955 E(X) = 4'4 V(X) = 10'24 D(X) = 3'2 2 x f(x) 1 0'15 2 0'2 3 0 4 0'35 5 0'3 E(X) = 3'45 V(X) = 2'1475 D(X) = 1'4654 Moda = Mediana = 4 Asimetría = A(X) = -0'5212 Curtosis = K(X) = -1'254 3 Urna 1ª 0 blancas 0 blancas 1 blanca 1 blanca 1 blancas 1 blancas F(x) = Urna 2ª 0 blancas 1 blanca 0 blancas 1 blanca 0 blancas 1 blanca 0 0'05 0'4 0'85 1 Prob. 0'1.0'5 = 0'05 0'1.0'5 = 0'05 0'6.0'5 = 0'30 0'6.0'5 = 0'30 0'3.0'5 = 0'15 0'3.0'5 = 0'15 si si si si si Total 0 blancas 1 blanca 1 blanca 2 blancas 2 blancas 3 blancas x<0 0≤x<1 1≤x<2 2≤x<3 x≥3 x f(x) 0 0'05 E(X) = 1'7 V(X) = 0'61 D(X) = 1'7 4 Beneficio : X P = Probabilidad E(X) = -167 -1000 0'5 En 20 jugadas perderá 3340 pts. 8 - Variables aleatorias (F. Álvarez) 0 0'25 1000 0'167 2000 0'083 1 0'35 2 0'45 3 0'15