Tema 4: Variables aleatorias

Anuncio
46
Estadı́stica
Tema 4: Variables aleatorias
El concepto de variable aleatoria surge de la necesidad de hacer más manejables matemáticamente los
resultados de los experimentos aleatorios, que en muchos casos son cualitativos, y que siguen patrones muy
similares aunque la naturaleza del experimento no lo sea.
Por ejemplo, un experimento consistente en observar el resultado de tirar una moneda, si ésta está
trucada y la probabilidad de cara es 0.9 y la de cruz es 0.1, es similar al experimento observar una pieza
fabricada en un proceso que produce un 90% de piezas buenas y un 10% de piezas con defecto, pues en ambos
casos, los posibles resultados del experimento son dos y la asignación de probabilidades a los resultados es
igual. Sin embargo, ambos experimentos son de naturaleza totalmente diferente.
3.1 Variable aleatoria y ley de probabilidad asociada a la variable.
Definición 1 Dado un espacio muestral Ω asociado a un experimento aleatorio, llamaremos variable
aleatoria (v.a.) definida sobre Ω a una aplicación X de Ω en IR.
Por ejemplo, en los dos experimentos de la introducción, podrı́a definirse la aplicación X que asigna al
resultado “cara” el valor 1 y al resultado “cruz” el valor 0. Igualmente, en el caso de la pieza, podrı́a
definirse una variable asignando al resultado “buena” el valor 1 y al resultado “defectuosa” el valor 0.
Definición 2 Dada una variable aleatoria X definida sobre el conjunto de sucesos de un experimento
aleatorio, llamaremos soporte de X, que se denota por SX , al conjunto de posibles valores (números
reales) de la variable aleatoria.
Observación 1 El soporte de una variable aleatoria puede ser discreto o consistir en un intervalo de
IR. En los dos ejemplos anteriores, SX = {0, 1}.
El soporte de la variable aleatoria se puede considerar como un nuevo espacio muestral, sobre el que
se puede definir una probabilidad relacionada con la probabilidad definida sobre el espacio muestral
original Ω, de la siguiente forma:
dado A ⊂ IR, p(A) = p({ω ∈ Ω/X(ω) ∈ A})
De esta forma se define una aplicación con llegada en el intervalo [0,1], sobre los subconjuntos del
soporte que son imagen de un suceso de Ω y se puede demostrar que esta aplicación es una probabilidad.
Esta probabilidad se denomina probabilidad asociada a la v.a. X, ley de probabilidad de la v. a. X o
distribución de la v.a. X.
En el ejemplo:
p(1) = p(cara) = 0.9, p(0) = p(cruz) = 0.1
e igualmente:
p(1) = p(buena) = 0.9, p(0) = p(def ectuosa) = 0.1
Es decir, las probabilidades definidas sobre SX = {0, 1} son iguales, aún cuando los experimentos sean
diferentes. Una vez que se conoce el soporte de una variable aleatoria y su distribución, se puede
“olvidar” el experimento original. Cada variable aleatoria distinta (es decir, con soporte o distribución
distinta) constituye un modelo probabilı́stico. En el resto del tema y en los siguientes nos centraremos
en el estudio de estos modelos.
47
Estadı́stica
3.2 Variables aleatorias discretas.
Una variable aleatoria es discreta si su soporte es discreto, es decir, si consiste en un número finito o
numerable de resultados: SX = {x1 , x2 , . . . xn , . . .}.
Definición 3 La ley de probabilidad o distribución de una variable aleatoria discreta X queda determinada
por los valores p(xi ) = p(X = xi ), i = 1, 2, . . ..
Se puede extender la definición de p a cualquier número real, definiéndola como cero para todos los
x 6= xi , i = 1, 2, . . .. A esta función definida en IR se la denomina función de probabilidad o de masa
de la variable aleatoria.
Ejemplo:
El ejemplo más sencillo de variable discreta es la variable discreta uniforme, cuyo soporte es SX =
{x1 , x2 , . . . , xn } con probabilidades: p(xi ) = n1 .
Otra forma de definir la distribución de una v.a. discreta es mediante la función de distribución:
Definición 4 Llamaremos función de distribución de la variable aleatoria X a la función: F : IR 7−→
[0, 1] definida por:
F (x) = p(X ≤ x).
Propiedades 1
Propiedades de la función de distribución.
(a) lim F (x) = 1 y lim F (x) = 0.
x7→∞
x7→−∞
La primera igualdad se debe a que {X ≤ ∞} es todo el espacio muestral y la segunda a
que {X ≤ −∞} es su complementario.
(b) Si SX = {x1 , x2 , . . . xn , . . .} y los valores están ordenados de menor a mayor,
F (x) =
k
P
p(xi ), si x ∈ [xk , xk+1 ).
i=1
(c) F es creciente: si x ≤ y, F (x) ≤ F (y).
(d) F es continua a la derecha:
lim F (x + h) = F (x).
h7→0+
(e) p(xi ) = F (xi ) − F (xi−1 ).
(f ) Como consecuencia de todas las propiedades anteriores, la gráfica de F es discontinua con saltos
finitos en los puntos de probabilidad no nula, y creciente.
3.3 Variables aleatorias continuas.
De forma intuitiva, una variable aleatoria continua es aquella que toma valores en un intervalo de IR.
Posteriormente daremos una definición más rigurosa.
Vamos a introducir este concepto y el de distribución de una variable continua de forma intuitiva,
partiendo de un ejemplo.
Consideremos la medida del diámetro interior de un rodamiento de determinadas caracterı́sticas.
Esta medida puede considerarse una variable aleatoria pues las medidas de los distintos rodamientos
tomarán valores aleatorios dentro de un intervalo de IR más o menos amplio. Si tomamos 100 de estos
48
Estadı́stica
rodamientos, anotamos sus medidas y construimos el histograma correspondiente, después de haber
agrupado en clases, cada rectángulo del histograma tendrá área proporcional a la frecuencia relativa
de la clase correspondiente, y esta frecuencia se puede escribir como: fi = Fi+1 − Fi , donde fi es la
frecuencia relativa de la clase [xi , xi+1 ) y Fi+1 es la correspondiente frecuencia relativa acumulada.
Vamos a suponer que la razón de proporcionalidad es 1 y por tanto, que:
(xi+1 − xi )hi = Fi+1 − Fi
dónde hi es la altura del rectángulo. Podemos observar en ese histograma que el área total es 1 y que
la probabilidad de que una de las 100 piezas escogida al azar tenga su medida en el intervalo [xi , xi+1 )
es el área del histograma correspondiente a este intervalo
Si ahora medimos 1000 piezas y agrupamos en clases (igualmente espaciadas), obtendremos un nuevo
histograma; si tomamos 100000 piezas y agrupamos en clases, ..., los sucesivos histogramas van
a ir aproximándose a una curva (Ley de Regularidad Estadı́stica). ¿Cuál va a ser la altura f(x)
correspondiente a cada x del soporte de esta variable, en esa curva?.
En el histograma inicial, la altura de un punto x que estuviese en el intervalo [xi , xi+1 ) era:
hi =
Fi+1 − Fi
xi+1 − xi
e igualmente en los sucesivos histogramas, de forma que f(x) será el lı́mite de estas alturas cuando el
número de piezas observadas y el número de clases tiendan a infinito (y por tanto la amplitud de las
clases tienda a cero).
A esta curva lı́mite la vamos a llamar función de densidad. Su nombre proviene de la similitud entre el
concepto de probabilidad, las frecuencias relativas y la interpretación de éstas como masas. Cuando se
consideran variables aleatorias continuas, el soporte de la variable se puede interpretar como una varilla
delgada de masa unidad y densidad no constante, dada por la función de densidad de probabilidad
f(x).
Igual que en el caso de la varilla (en el que cada punto de la misma tiene masa cero) la probabilidad de
cada punto es cero, sin embargo, la probabilidad de un intervalo contenido en el soporte (equivalente
a la masa de un trozo de varilla) puede ser no nula.
Definición 5 Diremos que una variable aleatoria X es continua si existe una función
f : IR 7−→ IR, integrable, tal que:
(a) f (x) ≥ 0 para todo x ∈ IR.
(b)
R∞
−∞ f (x)dx
(c) p(X ≤ x) =
= 1.
Rx
−∞ f (t)dt.
A dicha función se la denomina función de densidad de la variable aleatoria X.
Observación 2 A partir de lo desarrollado en la introducción de este punto, se deduce que f (x)
describe el comportamiento “a largo plazo” ( es decir, cuando el número de observaciones tiende a
infinito) de la variable.
49
Estadı́stica
Ejemplo:
De nuevo, el ejemplo más sencillo de v. a. continua es la v.a. continua uniforme, que se define como
aquella que tiene densidad constante en un intervalo acotado de IR. Ası́, la v.a. continua uniforme en
[a, b] será la que tiene por soporte SX = [a, b] y densidad:
(
f (x) =
(¿Por qué
1
b−a
a≤x≤b
en otro caso
0
1
b−a ?)
Igual que ocurre con las v.a. discretas, la distribución de una v.a. continua se puede definir también
a partir de la función de distribución de la variable, que se define de igual forma:
Definición 6 Llamaremos función de distribución de la variable aleatoria X a la función: F : IR 7−→
[0, 1] definida por:
F (x) = p(X ≤ x).
Teniendo en cuenta la definición de función de densidad, se cumplen las siguientes propiedades:
Propiedades 2 (a) lim F (x) = 1 y lim F (x) = 0.
x7→∞
x7→−∞
(b) F es creciente: si x ≤ y, F (x) ≤ F (y).
(c) F (x) =
Rx
−∞ f (t)dt.
(d) F(x) es continua en IR.
(e) F(x) es derivable y F 0 (x) = f (x), para cada x ∈ R en el que la función de densidad es continua.
(f ) La probabilidad de un punto es nula.
(g) p([a, b]) = p((a, b]) = p([a, b)) = p((a, b)) = F (b) − F (a) =
Rb
a
f (t)dt.
Ejemplo:
La función de distribución de la v.a. continua uniforme será:
F (x) =


 0
si x ≤ a
a≤x≤b
si x ≥ b
x−a
b−a

 1
3.4 Medidas caracterı́sticas de una v.a.
Las medidas caracterı́sticas asociadas a una v.a. reciben el mismo nombre que en el caso de variables
estadı́sticas y se interpretan de idéntica forma. En este caso, para distinguir unas y otras, se representan
con letras griegas.
Vamos a definir a continuación las principales. Podrá observarse que en el caso discreto, las definiciones
son totalmente análogas a las dadas para v. estadı́sticas, si en éstas se cambia frecuencia relativa por
probabilidad.
Medida
Media o Esperanza
Varianza
Desviación tı́pica
v.a.discretas
µ ó E(X)
xi p(xi )
v.a. continuas
−∞ xf (x) dx
P
R∞
σ2
i
P
R∞
σ
i
r
P
qR
∞
(xi − µ)2 p(xi )
(xi − µ)2 p(xi )
i
−∞ (x
− µ)2 f (x) dx
−∞ (x
− µ)2 f (x) dx
50
Estadı́stica
Observación 3 La media de una variable aleatoria se interpreta como el valor esperado a largo plazo,
de la variable, de ahı́ su nombre de Esperanza.
En cuanto a las restantes medidas, se definen:
• Mediana:
- en el caso discreto se calcula de igual forma que para variables estadı́sticas.
- en el caso continuo, es el valor para el que F (x) = 21 .
• Moda:
- en el caso discreto, es el valor xi para el cuál p toma el valor más alto.
- en el caso continuo, coincide con los máximos absolutos de la función de densidad.
• Cuartiles:
- en el caso discreto se calculan de igual forma que para variables estadı́sticas.
- en el caso continuo son: Q1 el valor para el que F (x) = 14 y Q3 el valor para el que F (x) = 34 .
• Rango intercuartı́lico: en ambos casos se define como la diferencia entre los cuartiles, Q3 − Q1 .
• Coeficiente de variación: en ambos casos se define como
σ
µ.
Un resultado importante, que expresa la relación existente entre la media de una variable aleatoria
y su desviación tı́pica, es el teorema de Chebychev, cuyo enunciado es similar al visto en Estadı́stica
Descriptiva, y cuya demostración, en el caso discreto es análoga y por tanto, no la repetiremos:
Teorema 1 Teorema de Chebychev
Sea X una v.a. con media µ finita y desviación tı́pica σ finita. Entonces, si k es un número real con
1
k ≥ 1: p(µ − kσ ≤ X ≤ µ + kσ) > 1 − 2
k
3.5 Transformaciones de v.a.
Igual que cuando trabajamos con variables estadı́sticas, a veces interesa realizar un cambio de escala
o una traslación u otro tipo de transformación que simetrice la distribución o la haga más fácilmente
manejable. Las principales transformaciones son las citadas en el tema 1.
Definición 7 Dada una variable aleatoria X, con soporte SX , llamaremos transformación de la
variable a una aplicación h : SX 7−→ IR, no constante. La función Y=h(X), cuyos valores son las
imágenes de h, es una nueva variable aleatoria, cuya distribución viene dada por la de la variable X,
mediante la igualdad: p(Y ≤ y) = p(x/h(x) ≤ y). Su soporte es SY = h(SX ).
Observación 4 Si X es una v.a. discreta, con soporte {x1 , x2 , . . . , xn , . . .}, la variable Y será discreta,
con soporte SY = {h(x1 ), h(x2 ), . . .} y p(yi ) = p({xj /h(xj ) = yi }).
Si X es una v.a. continua, con función de distribución F (x), si h es continua, la v.a. Y será continua,
con función de distribución G(y) = p({x/h(x) ≤ y}).
Por tanto, se observa que en el caso discreto obtener la ley de probabilidades de la nueva variable es
sencillo. En el caso continuo, puede complicarse, dependiendo de la expresión de la función h. En
general, el cálculo de las funciones de densidad y de distribución de la v.a. Y se hace a través de la
definición de función de distribución y una vez obtenida ésta, se obtiene la de densidad derivando.
51
Estadı́stica
Medidas de la variable transformada.
Proposición 1 Sea X una v.a y h(x) una transformación. Si Y = h(X) es la variable transformada,
entonces:
µY =
µY =
σY2 =
σY2 =
P
h(xi )p(xi )
Ri∞
−∞ h(x)f (x) dx
si X es discreta
si X es continua
(h(xi ) − µY )2 p(xi )
i
R∞
2
−∞ (h(x) − µY ) f (x) dx
P
Las demás medidas se calculan según la definición.
si X es discreta
si X es continua
Descargar