Análisis de Datos I Esquema del Tema 13 Tema 13: Variables aleatorias discretas 1. DEFINICIÓN 2. FUNCIÓN DE PROBABILIDAD, f(x) 3. FUNCIÓN DE DISTRIBUCIÓN, F(x) 4. CARACTERÍSTICAS DE LAS VARIABLES DISCRETAS UNA VARIABLE: Valor Esperado de X, E(X) Varianza de X, σ2(X) DOS VARIABLES: Función de probabilidad conjunta, f (xi, yj) Covarianza y correlación de X e Y, σ (XY) y ρ (XY) 5. INDEPENDENCIA __________________ Bibliografía: Tema 10 (pág. 265-283) Carmen Ximénez 1 Análisis de Datos I Esquema del Tema 13 1. DEFINICIÓN “Una variable aleatoria es una función que asocia un número real y sólo uno, a cada suceso elemental del espacio muestral (E ) de un experimento aleatorio”. Se representan mediante letras mayúsculas y pueden tomar N posibles valores: X = { x1, x 2, ... , xi , ... , xn } Ejemplo: Experimento aleatorio: “Lanzar una moneda al aire dos veces” Sucesos elementales: E = {CC, CX, XC, XX}. Donde: C (Cara) y X (Cruz) Se define el suceso X: Nº de caras Asignación de números reales: (CC, 2); (CX, 1); (XC, 1); (XX, 0) La variable X viene definida por los valores: 0, 1, 2 Por tanto, X = {0, 1, 2} Las variables aleatorias discretas “Se definen sobre espacios muestrales finitos o infinitos y numerables” 2. FUNCIÓN DE PROBABILIDAD, f (x) Probabilidad de que la variable X tome un valor concreto: f (xi) = P (X = xi) Donde: Σ f (xi) = 1. Gráficamente se representa mediante barras. Con los datos del ejemplo anterior: .60 X f (xi) 0 0,25 1 0,50 f (x) .50 2 0,25 .40 .30 .20 0 1 2 X 3. FUNCIÓN DE DISTRIBUCIÓN, F (x) Probabilidad de que la variable X tome un valor u otro inferior: F (xi) = P (X ≤ xi) Donde: F(xmín) = f (x1) F(xmáx) = 1 Gráficamente resulta ‘la función escalera’. Continuando con el ejemplo anterior: 1.20 1.00 X F (xi) 0 0,25 1 0,75 2 1,00 F (x) .80 .60 .40 .20 0.00 0 1 2 X Carmen Ximénez 2 Análisis de Datos I Esquema del Tema 13 4. CARACTERÍSTICAS DE LAS VARIABLES DISCRETAS UNA VARIABLE: Valor esperado: E (X) = μ = Σ [xi · f (xi) ] Varianza: σ2 (X) = [Σ xi2 · f (xi)] – [E(X)]2 Propiedades: E (a) = a; σ2 (a) = 0 (donde a es una constante) Si Y = X + a ........ E(Y) = E(X) + a .................. σ2(Y) = σ2(X) Si Y = a · X .......... E(Y) = a · E(X) .................. σ2(Y) = a2 · σ2(X) DOS VARIABLES: Cuando trabajamos con dos variables discretas, X e Y, se puede definir la probabilidad de que ambas tomen ciertos valores (xi e yj) simultáneamente. A esto se le denomina: Función de probabilidad conjunta, f (xi, yj) = P[(X = xi) ∩ P(Y = yj)] Y X x1 x2 .. . xn y1 f (x1, y1) f (x2, y1) .. . f (xn, y1) f (y1) y2 f (x1, y2) f (x2, y2) .. . f (xn, y2) f (y2) … … … .. . … … ym f (x1, ym) f (x2, ym) .. . f (xn, ym) f (ym) f (x1) f (x2) .. . f (xn) 1,00 Los índices que reflejan la relación lineal entre las variables X e Y son los siguientes: La Covarianza, σ ( XY ) = E( XY ) - E( X ) ⋅ E(Y ) Donde, E(XY) = ∑∑ xi ⋅ y j ⋅ f ( xi , y j ) i La Correlación, ρ ( XY ) = j σ ( XY ) σ ( X ) ⋅ σ (Y ) Propiedades: Si T = X + Y ......... E(T) = E(X) + E(Y) .......... σ2(T) = σ2(X) + σ2(Y) + 2 σ (XY) Si T = X - Y .......... E(T) = E(X) - E(Y) ........... σ2(T) = σ2(X) +σ2(Y) - 2 σ (XY) Si T = X + Y + Z ... E(T) = E(X) + E(Y) + E(Z) σ2(T) = σ2(X) + σ2(Y) + σ2(Z) + 2 · [σ(XY) + σ(XZ) + σ(YZ)] 5. INDEPENDENCIA Dos variables aleatorias X e Y son independientes si para todo par de valores (xi, yj) se cumple que: f (xi, yj) = f (xi) · f (yj) Si X e Y son independientes: f (xi / yj) = f (xi) σ (XY) =ρ(XY) = 0 Nota: Aunque dos sucesos (p.e. x1, y3) sean independientes, para que las variables X e Y lo sean tienen que serlo todos los restantes sucesos. Carmen Ximénez 3 Análisis de Datos I Esquema del Tema 13 EJEMPLO (resuelto) La variable aleatoria X tiene la siguiente distribución: 0 0,15 X f (xi) 1 0,40 2 0,30 3 0,15 1. Obtenga la función de distribución para la variable X 2. Represente gráficamente la función de probabilidad y la función de distribución de la variable X 3. ¿Cuál es la probabilidad de obtener valores superiores a 1? ¿y menores que 3? ¿y entre 1 y 3 (ambos inclusive)? 4. Obtenga el valor esperado y la varianza de la variable X 5. Obtenga el valor esperado y la varianza de las variables U = X + 2 y W = 3 X 6. La variable X se mide por segunda vez y se obtiene la variable Y: 0 1 2 3 Y f (yi) 0,35 0,25 0,30 0,10 a) Obtenga la distribución conjunta de X e Y si se asume que son independientes b) Calcule el valor esperado y la varianza para las variables R = X + Y y S = 2X - Y si X e Y son independientes SOLUCIÓN 1. 0 0,15 X F (xi) 1 0,55 2 0,85 3 1,00 F (x) f (x) 2. 0 1 2 3 0 X 3. E (X) = 1,45 1 2 3 X σ (X) = 0,85 2 4. P (X > 1) = P (X ≥ 2) = 1 – F(1) = 0,45 (o también f (2) + f (3) = 0,45) P (X < 3) = P (X ≤ 2) = F(2) = 0,85 (o también f (0) + f (1) + f (2) = 0,85) (o también f (1) + f (2) + f (3) = 0,85) P (1 ≤ X ≤ 3) = F(3)- F(0) = 0,85 5. E (U) = 3,45 σ2 (U) = 0,85; E (W) = 4,35 σ2 (W) = 7,65 X 6. a) Y 0 1 2 3 b) E (R) = 2,60 Carmen Ximénez 0 0,052 0,038 0,045 0,015 0,15 1 0,14 0,10 0,12 0,04 0,40 σ2 (R) = 1,87; 2 0,105 0,075 0,090 0,030 0,30 E (S) = 1,75 3 0,052 0,037 0,045 0,015 0,15 0,35 0,25 0,30 0,10 1,00 σ2 (S) = 4,607 4