Tema 4: Variables Aleatorias

Anuncio
VARIABLES ALEATORIAS
Métodos Estadísticos Aplicados a las Auditorías Sociolaborales
Francisco Álvarez González
francisco.alvarez@uca.es
VARIABLES ALEATORIAS UNIDIMENSIONALES
Variable aleatoria, asociada a una experiencia aleatoria, es la ley que hace corresponder a cada suceso
aleatorio un valor numérico.
Así, por ejemplo, la expresión "lanzamos tres monedas observando el número de caras que se obtienen"
está definiendo la variable aleatoria que permite asociar al suceso Cara-Cruz-Cara el valor 2 (dos caras).
Como en el caso de las variables estadísticas, las variables aleatorias pueden ser discretas o continuas. Nos
centraremos en el estudio de las primeras.
FUNCIÓN DE DENSIDAD O LEY DE PROBABILIDAD
Es el conjunto de los valores de la variable aleatoria X y sus probabilidades respectivas f(x) = Pr(X=x).
Para el caso discreto se suele adoptar la forma de representación siguiente :
X
x1
x2
x3
f(X)
p1
p2
p3
....
....
xi
....
xn
pi
....
pn
n
Ante la equivalencia entre frecuencias relativas y probabilidades, se verifica que :
∑p
i
=1
i=1
FUNCIÓN DE DISTRIBUCIÓN
Del mismo modo que se definían las frecuencias acumuladas, denominamos función de distribución a :
F(x) = Pr(X≤x)
MOMENTOS. ESPERANZA MATEMÁTICA, VARIANZA, ASIMETRÍA Y CURTOSIS
n
Momento ordinario de orden k :
α k = ∑ p i . x ik
i =1
n
μ k = ∑ p i . ( x i − E ( X) )
Momento central de orden k :
k
i =1
En particular :
Esperanza matemática : Es el momento ordinario de orden 1 (α1) , equivalente a la media aritmética.
n
E ( X) = α 1 = ∑ p i . x i
i =1
Varianza : Es el momento central de 2º orden.
n
n
V( X) = μ 2 = ∑ p i . ( x i − E ( X)) = ∑ p i . x 2i − E ( X) 2 = α 2 − α 12
2
i =1
i =1
Desviación típica : Es la raíz cuadrada de la varianza.
D ( X) = V( X )
Coeficiente de asimetría : (similar a lo estudiado en el análisis descriptivo de una variable)
A ( X) =
μ3
[ D( X)] 3
Coeficiente de curtosis : (similar a lo estudiado en el análisis descriptivo de una variable)
K( X) =
μ4
[ D( X)] 4
−3
Expresión de algunos momentos centrales en función de momentos ordinarios :
μ1 = 0
μ2 = α 2 −
μ 3 = α 3 − 3. α1 . α 2 + 2. α13
α12
μ 4 = α 4 − 4. α1 . α 3 + 6. α12 . α 2 − 3. α14
Variables aleatorias (F. Álvarez) - 1
OTRAS MEDIDAS DE CENTRALIZACIÓN
Moda : es el valor de la variable aleatoria que posee probabilidad máxima.
Mediana : es el valor Md de la variable aleatoria para el cuál :
F(Md) ≥ 0'5 y 1 - F(Md) < 0'5 (siendo F la función de distribución)
PROPIEDADES
•
•
•
E(X + Y) = E(X) + E(Y)
E(α.X) = α.E(X) , para cualquier número α.
Si las dos variables son independientes , se verifica que :
• E(X . Y) = E(X) . E(Y)
• V(X + Y) = V(X) + V(Y)
TEOREMA DE TCHEBYCHEV
Establece la probabilidad máxima de que la variable aleatoria tome valores en los alrededores de la esperanza
matemática (media de la distribución).
Teorema :
Para toda variable aleatoria X para la que existe su esperanza y su varianza, se verifica que, para
cualquier valor numérico positivo k :
Pr( X − E ( X ) < k ) < 1 −
V( X)
k2
Gráficamente :
La probabilidad de que cualquier valor de la
variable X pertenezca al intervalo sombreado
es inferior a :
1−
2 - Variables aleatorias (F. Álvarez)
V( X)
k2
EJERCICIOS RESUELTOS
1
Lanzadas cuatro monedas, consideremos el número de cruces obtenidas. Calcular, de la variable
aleatoria así definida :
a)
Ley de probabilidad
b)
Función de distribución
c)
Esperanza matemática y varianza
d)
Mediana y moda de la distribución
e)
Determine la probabilidad de obtener más de 1 y menos de 3 caras. Compruebe el teorema de
Tchebychev.
CCCC
CCC+
CC++
C+++
++++
CC+C
C+C+
+C++
C+CC
C++C
++C+
+CCC
+CC+
+++C
+C+C
Se obtienen 0 cruces
Se obtienen 3 caras y 1 cruz
Se obtienen 2 caras y 2 cruces
Se obtienen 1 cara y 3 cruces
Se obtienen 4 cruces
++CC
Ley de probabilidad o función de densidad :
X
f(x)=Pr(X=x)
0
1/16
1
4/16
2
6/16
3
4/16
4
1/16
0
1/16
1/16
1
4/16
5/16
2
6/16
11/16
3
4/16
15/16
4
1/16
16/16 = 1
Función de distribución :
X
f(x)=Pr(X=x)
F(x)=Pr(X≤x)
⎧0
⎪1
⎪ 16
⎪5
⎪
F ( x) = ⎨ 16
11
⎪ 16
⎪15
⎪ 16
⎪⎩1
Más correctamente se expresará :
para x < 0
para0 ≤ x < 1
para1 ≤ x < 2
para 2 ≤ x < 3
para3 ≤ x < 4
para x ≥ 4
Gráficamente :
Función de distribución
Ley de probabilidad
Para el cálculo de la esperanza matemática y la varianza de una variable aleatoria discreta, se aconseja construir la
siguiente tabla auxiliar :
α1
α2
De aquí :
X
P
P.X
P.X2
E(X) = α1 = 2
0
1/16
0
0
1
4/16
4/16
4/16
2
6/16
12/16
24/16
3
4/16
12/16
36/16
4
1/16
4/16
16/16
Totales
1
32/16 = 2
80/16 = 5
V(X) = α2 - α12 = 5 - 4 = 1
Variables aleatorias (F. Álvarez) - 3
Definida la desviación típica como la raíz cuadrada de la varianza :
D(X) = 1
Observando la ley de probabilidad o función de densidad, deducimos que :
Moda = 2 (al tener X=2 la mayor probabilidad (6/16) )
Observando la función de distribución, deducimos que :
Mediana = 2 (al ser X=2 el valor para el que F(X) (=11/16) primero iguala o supera a 0'5)
Comprobemos el teorema de Tchebychev para el caso reseñado :
•
•
Pr (1 < X < 3) = Pr(X=2) = 6/16 = 0'375
Siendo E(X) = 2 , la esperanza se encuentra en el centro del intervalo definido (1 , 3), luego su amplitud es k=2.
Recordando que V(X) =1, tenemos :
Pr ( X − E ( X ) < 2) < 1 −
•
1
= 0'75
22
La probabilidad calculada es en efecto inferior a 0'75.
2
En la extracción simultánea de tres bolas de una urna que contiene 6 bolas
blancas y cuatro negras, observamos el número de bolas blancas extraídas.
De la variable aleatoria así definida, calcular :
a)
ley de probabilidad
b)
función de distribución
c)
esperanza matemática , varianza y desviación típica.
d)
mediana y moda de la distribución.
⎛ 4⎞
⎜⎜ ⎟⎟
3
4
Pr(0blancas y3ne gras ) = ⎝ ⎠ =
= 0'033
⎛10 ⎞ 120
⎜⎜ ⎟⎟
⎝3⎠
⎛6⎞ ⎛ 4⎞
⎜⎜ ⎟⎟.⎜⎜ ⎟⎟
1 2
6.6
Pr(1blanca y 2ne gras ) = ⎝ ⎠ ⎝ ⎠ =
= 0'3
120
⎛10 ⎞
⎜⎜ ⎟⎟
⎝3⎠
⎛ 6⎞ ⎛ 4⎞
⎜⎜ ⎟⎟.⎜⎜ ⎟⎟
2 1
15.4
Pr(2blancas y1ne gra ) = ⎝ ⎠ ⎝ ⎠ =
= 0'5
120
⎛10 ⎞
⎜⎜ ⎟⎟
⎝3⎠
⎛ 6⎞
⎜⎜ ⎟⎟
3
20
Pr(3blancas y0ne gras ) = ⎝ ⎠ =
= 0'167
⎛10 ⎞ 120
⎜⎜ ⎟⎟
⎝3⎠
Una vez calculadas las probabilidades de las distintas situaciones posibles, obtenemos :
Ley de probabilidad o función de densidad :
X
Prob.
0
0'033
1
0'3
F(x) =
0
0'033
0'333
0'833
1
Función de distribución :
2
0'5
3
0'167
x<0
0≤x<1
1≤x<2
2≤x<3
x≥3
Esperanza matemática , varianza y desviación típica :
X
Prob. = P
P.X
P.X2
E( X) = 1'8
0
0'033
0
0
1
0'3
0'3
0'3
2
0'5
1
2
V( X) = 3' 8 - 1' 8 2 = 0'56
3
0'167
0'5
1'5
D( X) =
Totales
1'8
3'8
0' 56 = 0'748
Mediana y Moda :
Observando la función de distribución, deducimos que :
Mediana = 2 (al ser X=2 el valor para el que F(X) (= 0'8333) primero iguala o supera a 0'5)
Observando la ley de probabilidad o función de densidad, deducimos que :
Moda = 2 (al tener X=2 la mayor probabilidad (0'5) )
4 - Variables aleatorias (F. Álvarez)
3
Complete la ley de probabilidad siguiente, sabiendo que su esperanza matemática es igual a 1'8 :
X
Prob.
0
0'2
1
a
n
De una parte, sabiendo que se verifica que
∑p
i
2
b
3
0'3
= 1 , resulta : 0'2 + a + b + 0' 3 = 1 ⇒ a + b = 0'5
i=1
Conocida la esperanza matemática : E ( X ) =
n
∑ p .x
i
i
= 0 . 0' 2 + 1. a + 2. b + 3. 0' 3 = 1' 8 ⇒ a + 2.b = 0'9
i=1
Resolviendo el sistema obtenemos los valores de a y b :
a + b = 0'5
a = 0'5 - b
a + 2.b = 0'9
0'5 - b + 2.b = 0'9 ⇒ b = 0'4 ⇒ a = 0'1
4
Calcular la esperanza matemática, varianza, asimetría y curtosis de la variable aleatoria que tiene como
función de distribución :
F(x) =
0
0'2
0'55
0'85
1
x<2
2≤x<4
4≤x<6
6≤x<8
x≥8
La ley de probabilidad o función de densidad será :
x
p
2
0'2
4
0'35
6
0'3
8
0'15
p.x
p.x2
p.x3
p.x4
0'4
0'8
1'6
3'2
1'4
5'6
22'4
89'6
1'8
10'8
64'8
388'8
1'2
9'6
76'8
614'4
Cálculo de momentos :
α1
α2
α3
α4
α1 = 4'8 (Σ)
α2 = 26'8 (Σ)
α3 = 165'6 (Σ)
α4 = 1096 (Σ)
Luego :
•
esperanza matemática :
n
E( X) = ∑ p i . x i = α1 = 4'8
i =1
•
varianza :
V( X) = μ 2 = α 2 − α12 = 26'8 − 4'8 2 = 3'76
•
( D( X) =
3'76 = 19391
'
)
coeficiente de asimetría :
μ 3 = α 3 − 3. α1 .α 2 + 2.α13 = 165'6 − 3.4'8.26'8 + 2.4'8 3 = 0'8640
μ3
0'8640
A ( X) =
'
3 =
3 = 01185
'
( D( x)) 19391
•
coeficiente de curtosis :
μ4 = α4 − 4. α1. α3 + 6. α12 . α2 − 3. α14 = 1096 − 4.4'8165
. '6 + 6.4'82 .26'8 − 3.4'84 = 28'7872
28'7872
μ4
K( X) =
4 −3=
4 − 3 = −0'9638
19391
'
( D( x ) )
5
Realizada una apuesta de 100 pts., un jugador extrae una bola de una caja que contiene 2 bolas
blancas, 3 rojas y 5 negras. Si la bola extraída es negra pierde lo apostado y finaliza el juego; si es roja
recibe lo apostado y deja de jugar, y finalmente, si es blanca, cobra 200 pts. si al lanzar una moneda
obtiene cruz y 400 pts. si sale cara.
Si el jugador participa en 12 ocasiones en dicho juego, ¿ qué beneficio o pérdida tendrá ?.
Las situaciones posibles son :
Variables aleatorias (F. Álvarez) - 5
Beneficio
-100 pts.
100 - 100 =
0 pts.
200 - 100 =
100 pts.
400 - 100 =
300 pts.
Extrae bola negra
Extrae bola roja
Extrae bola blanca y cruz
Extrae bola blanca y cara
Probabilidad
(5/10)
0'5
(3/10)
0'3
(2/10).(1/2)
0'1
(2/10).(1/2)
0'1
La esperanza matemática de la variable aleatoria "beneficio en el juego" , nos indica lo que cabe esperar que
ocurra en cada jugada.
Una cantidad negativa se interpreta como la pérdida media que el jugador tendrá en cada jugada. Si la
esperanza es positiva indicará que el jugador, promediando jugadas, ganará dicha cantidad. En ambos casos
se dice que el juego no es equitativo o que es injusto.
Cuando la esperanza matemática del beneficio en un juego es igual a cero, diremos que dicho juego es
equitativo o justo.
En nuestro caso :
E(X) = -100.0'5 + 0.0'3 + 100.0'1 + 300.0'1 = -10 pts.
Realizadas 12 jugadas, lo más probable (lo esperado) es que haya perdido 120 pts. [12 . (-10) ] .
6
Lanzando dos dados y sumando los puntos obtenidos, los premios que ofrece el juego son los
siguientes :
- Devolución de lo apostado :
si la suma es inferior a 4 o superior a 10.
- Doble de lo apostado :
si se obtiene 5 o 9.
- Cuatro veces lo apostado :
si la suma de puntos es 7
Analice si el juego es equitativo o no.
Análisis de las situaciones posibles :
1-1
1-2
1-3
1-4
1-5
1-6
2
3
4
5
6
7
2-1
2-2
2-3
2-4
2-5
2-6
3
4
5
6
7
8
3-1
3-2
3-3
3-4
3-5
3-6
4
5
6
7
8
9
4-1
4-2
4-3
4-4
4-5
4-6
5
6
7
8
9
10
5-1
5-2
5-3
5-4
5-5
5-6
6
7
8
9
10
11
6-1
6-2
6-3
6-4
6-5
6-6
7
8
9
10
11
12
Al apostar x pts., los beneficios o pérdidas son :
Situaciones
Devolución de lo apostado
Doble de lo apostado
Cuatro veces lo apostado
Pérdida de lo apostado
2, 3, 11, 12
5,9
7
4, 6, 8, 10
Nº de veces
6
8
6
16
36
Beneficio
0
x
3x
-x
Probabilidad
6/36
8/36
6/36
16/36
Determinemos su esperanza matemática :
E( X) = 0.
6
8
6
16 8x +18x - 16x 10
+ x.
+ 3x .
− x.
=
=
.x
36
36
36
36
36
36
Siendo la esperanza matemática positiva, el juego siempre dará beneficio al jugador . No es equitativo, siendo
desfavorable para la banca.
Parece claro que el dueño del local de juego no tiene vista comercial o no sabe estadística.
6 - Variables aleatorias (F. Álvarez)
EJERCICIOS PROPUESTOS
1
Determine la función de distribución, esperanza matemática, varianza y desviación típica de las variables
aleatorias definidas por las siguientes funciones de densidad :
a)
x
f(x)
1
0'1
2
0'25
b)
x
f(x)
-2
0'05
0
A
3
0'05
4
0'3
2
0'15
4
A
5
0'3
6
0'2
8
2.A
2
Determine la ley de probabilidad, esperanza matemática, mediana, moda, varianza, desviación típica, asimetría
y curtosis de la variable aleatoria que tiene como función de distribución :
F(x) =
0
0'15
0'35
0'35
0'7
1
si
si
si
si
si
si
x<1
1≤x<2
2≤x<3
3≤x<4
4≤x<5
x≥5
3
Determine la ley de probabilidad, función de distribución, esperanza matemática, varianza y desviación típica de
la variable aleatoria definida por el número de bolas blancas resultantes de la extracción de dos bolas de una
urna, que contiene 3 bolas blancas y dos negras, y una bola de otra urna, que posee 5 bolas de cada color.
4
La participación en un juego nos lleva a lanzar una moneda y un dado. Si sale cara al lanzar la moneda
perdemos lo apostado. Si sale cruz, recibimos el doble de la apuesta si el número del dado es múltiplo de 3,
tres veces la apuesta si sale 5 y, lo apostado, en el resto de los casos.
Si un jugador participa 20 veces en el juego, apostando 1000 pts. en cada ocasión, ¿ qué beneficio obtendrá
con mayor probabilidad ?.
Variables aleatorias (F. Álvarez) - 7
SOLUCIONES DE LOS EJERCICIOS PROPUESTOS
1
a)
F(x) =
b)
F(x) =
0
0'1
0'35
0'4
0'7
1
si
si
si
si
si
si
x<1
1≤x<2
2≤x<3
3≤x<4
4≤x<5
x≥5
0
0'05
0'2
0'35
0'5
0'7
1
si
si
si
si
si
si
si
x < -2
-2 ≤ x < 0
0≤x<2
2≤x<4
4≤x<6
6≤x<8
x≥8
E(X) = 3'45
V(X) = 1'9475
D(X) = 1'3955
E(X) = 4'4
V(X) = 10'24
D(X) = 3'2
2
x
f(x)
1
0'15
2
0'2
3
0
4
0'35
5
0'3
E(X) = 3'45
V(X) = 2'1475
D(X) = 1'4654
Moda = Mediana = 4
Asimetría = A(X) = -0'5212
Curtosis = K(X) = -1'254
3
Urna 1ª
0 blancas
0 blancas
1 blanca
1 blanca
1 blancas
1 blancas
F(x) =
Urna 2ª
0 blancas
1 blanca
0 blancas
1 blanca
0 blancas
1 blanca
0
0'05
0'4
0'85
1
Prob.
0'1.0'5 = 0'05
0'1.0'5 = 0'05
0'6.0'5 = 0'30
0'6.0'5 = 0'30
0'3.0'5 = 0'15
0'3.0'5 = 0'15
si
si
si
si
si
Total
0 blancas
1 blanca
1 blanca
2 blancas
2 blancas
3 blancas
x<0
0≤x<1
1≤x<2
2≤x<3
x≥3
x
f(x)
0
0'05
E(X) = 1'7
V(X) = 0'61
D(X) = 1'7
4
Beneficio : X
P = Probabilidad
E(X) = -167
-1000
0'5
En 20 jugadas perderá 3340 pts.
8 - Variables aleatorias (F. Álvarez)
0
0'25
1000
0'167
2000
0'083
1
0'35
2
0'45
3
0'15
Descargar