DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA DISTRIBUCIÓN DE VARIABLES ALEATORIAS LA FUNCIÓN DE DISTRIBUCION 01. Función de Distribución Definición 1 Sea el espacio probabilístico (U , Φ, p ) donde es U el espacio muestral o conjunto de los sucesos elementales, Φ es la sigma-álgebra asociada y p la medida de probabilidad sobre la sigma-álgebra Φ . Si es X variable aleatoria en dicho espacio probabilístico, se define la Función de Distribución de X como la aplicación F : R → R dada por ∀x ∈ R, F ( x) = p[X ≤ x ] es, pues, la función tal que a cada x ∈ R le hace corresponder la probabilidad del suceso cuya imagen por X es el conjunto de números reales menores o iguales a x. Extendemos de forma inmediata esta definición al caso n-dimensional: Dada la variable aleatoria n-dimensional X = ( X 1 ,..., X n ) se llama Función de Distribución de X a la aplicación F : R n → R dada por ∀( x1 ,..., x n ) ∈ R n , F ( x1 ,..., x n ) = p[X 1 ≤ x1 ,..., X n ≤ x n ] es decir, se trata de la función tal que a cada n-pla de números reales ( x1 ,..., xn ) ∈ R n le hace corresponder la probabilidad del suceso cuya imagen por X = ( X 1 ,..., X n ) son los números reales menores o iguales a los xi, i=1,…,n. 02. Propiedades inmediatas de la Función de Distribución: Teorema 1 Si es F ( x ) = p X ≤ x [ ] la Función de Distribución de la variable aleatoria X, se verifica: a) ∀x, y ∈ R / x ≤ y → F ( x ) ≤ F ( y ) (F(x) es monótona creciente) b) ∀x ∈ R, 0 ≤ F ( x ) ≤ 1 lim F ( x) = 1, para x → ∞ d) lim F ( x ) = 0, para x → −∞ e) lim F ( x + 0) = F ( x ) (F(x) es continua por la derecha) f) lim F ( x − 0) = F ( x ) + p[ X = x ] (F(x) es continua por la izquierda si p[ X = x ] = 0 ) c) CASANCHI.COM, 2010 1 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA Demostración: [ ] [ ] [ ] [ ] ∀x ∈ R, [X ≤ x ]∈ Φ → p[X ≤ x ] ≤ 1 ∧ p[ X ≤ x ] ≥ 0 → 0 ≤ p[ X ≤ x ] ≤ 1 , por tanto es a) ∀x, y ∈ R / x ≤ y → X ≤ x ≤ X ≤ y → p X ≤ x ≤ p X ≤ y → F ( x ) ≤ F ( y ) b) 0 ≤ F ( x) ≤ 1, ∀x ∈ R c) Sabemos que el conjunto de los sucesos elementales se puede expresar por ∞ U = [ X ≤ 0] U [X > 0] = [X ≤ 0] U U [n − 1 < X ≤ n] → p (U ) = p[X ≤ 0] + n =1 ∞ ∞ ∞ + p U [n − 1 < X ≤ n ] = p[ X ≤ 0] + ∑ p[n − 1 < X ≤ n] → 1 = p[X ≤ 0] + ∑ p[n − 1 < X ≤ n ] n =1 n =1 n =1 [ n0 ] ∑ p[n − 1 < X ≤ n] = F (n0 ) Por tanto, ∀ε > 0 / ε < 1, ∃n0 ∈ N / 1 − ε < p X ≤ 0 + n =1 en definitiva, ∀ε > 0 / ε < 1, ∃x0 = n0 / F ( x0 ) > 1 − ε ∧ F ( x) creciente → lim F ( x) = 1, para x → ∞ d) De la expresión U = ∞ U [− (n + 1) < X ≤ −n] U [X > 0] , se tiene que n =0 ∞ n0 n =0 n =0 1 = ∑ p[− (n + 1) < X ≤ − n] + p[ X > 0] → ∀ε > 0, ∃n0 ∈ N / 1 − ε < ∑ p[− (n + 1) < X ≤ −n] + + p[ X > 0] = 1 − p[X ≤ −(n0 + 1)] = 1 − F (−(n0 + 1)) → −ε < F (−(n0 + 1)) → F (−(n0 + 1)) < ε Es decir, se tiene que ∀ε > 0, ∃x0 = n0 + 1 / F (− x0 ) < ε → lim F (− x) = 0 → lim F ( x) = 0 [ e) Sea S n = X ≤ x + 2 −n x→∞ ], se tiene que x → −∞ [ ] S0 = [X ≤ x + 1] , S1 = [ X ≤ x + 1 2] , …, S n = X ≤ x + 1 2n , … por consiguiente, la sucesión {S n }n ≥ 0 es decreciente, por lo cual, el límite viene dado por la intersección: ∞ lim [ n→∞ {Sn } = I Sn = [X ≤ x] n=0 ] [ ] F ( x + 0) = lim p X ≤ x + 2− n = p (lim X ≤ x + 2− n ) = p[ X ≤ x ] = F ( x) • [ f) Sea ahora S n = X ≤ x − 2 −n ], se tiene que [ (x→∞) ] S = [ X ≤ x − 1] , S1• = [X ≤ x − 1 2] , …, S n• = X ≤ x − 1 2n , … • 0 { } • por consiguiente, la sucesión S n n≥0 es creciente, por lo cual, el límite viene dado por la unión: lim n→∞ ∞ {S } = U S = [X < x] • n • n n=0 CASANCHI.COM, 2010 2 DISTRIBUCIÓN DE VARIABLES ALEATORIAS [ ] [ CARLOS S. CHINEA ] F ( x − 0) = lim p X ≤ x − 2 − n = p (lim X ≤ x − 2 − n ) = p[X < x ] ( x → ∞ ) O sea: F ( x − 0) = p[ X < x ] = p[ X ≤ x ] − p[X = x ] = F ( x) − p[ X = x ] [ ] si p X = x = 0 → F ( x − 0) = F ( x ) (continua por la izquierda) Teorema 2 Sean, en el espacio probabilístico (U , Φ, p ) , las variables aleatorias X i , i = 1,..., n, y F ( xi ) = p[X 1 ≤ xi ], i = 1,..., n , y consideremos asimismo la variable aleatoria n-dimensional X = ( X 1 ,..., X n ) y su Función de Distribución F ( x1 ,..., xn ) = p[ X 1 ≤ x1 ,..., X n ≤ xn ] . Representemos por (i1 ,..., ik ) una combinación de k de los n subíndices (1,…,n) y y sea X i1 ...ik = X i1 ,..., X ik la variable aleatoria k-dimensional correspondiente, siendo, sus correspondientes Funciones de Distribución ( ) [ finalmente, su Función de Distribución Fi1 ...i k ( xi1 ,..., xik ) = p X i1 ≤ xi1 ,..., X i k ≤ xik ] En estas condiciones se verifican las siguientes afirmaciones: a) ∀xi , yi ∈ R / xi ≤ yi , i = 1,..., n → F ( x1 ,..., xn ) ≤ F ( y1 ,..., yn ) (F(x1,…,xn) es monótona creciente) b) ∀( x1 ,..., xn ) ∈ R , 0 ≤ F ( x1 ,..., xn ) ≤ 1 n [ ] c) F ( x1 ,..., xn ) = p X 1 ≤ x1 ,..., X n ≤ xn es continua a la derecha de cada xi , i = 1,..., n d) lim F ( x1 ,..., xn ) = F1,...,i −1,i +1,..., n ( x1 ,..., xi −1 , xi +1 ,..., xn ), para xi → ∞ e) lim F ( x1 ,..., xn ) = 1, para xi → ∞, i = 1,2,..., n f) lim F ( x1 ,..., xn ) = F j ( x j ) para xi → ∞, i ≠ j , g) lim F ( x1 ,..., xn ) = 0 para xi → −∞, i = 1,2,..., n h) Sea la n-pla de pares de números reales cualesquiera ai ≤ bi , i = 1,..., n (pudiéndose tomar los valores ± ∞ ). Se tiene que siendo si = 0 ∨ si = 1, i = 1,..., n , y [ n ] ∑ (−1) k ∑ F (c1 ,..., cn ) para ci = si ai + (1 − si )bi es: p a1 < x1 ≤ b1 ,...,a n < xn ≤ bn = k =0 s1 + ... + s n = k Demostración: a) Es obvio, pues F ( x1 ,..., xn ) = p X 1 ≤ x1 ,..., X n ≤ xn es una probabilidad y, por [ b) ] tanto, un número real del intervalo cerrado [0,1] . Si cada xi ≤ yi , i = 1,..., n entonces [ X i ≤ xi ] ⊆ [Yi ≤ yi ], i = 1,..., n por lo que [X 1 ≤ x1 ,..., X n ≤ xn ] ⊆ [Y1 ≤ y1 ,..., Yn ≤ yn ] → p[X 1 ≤ x1 ,..., X n ≤ xn ] ≤ ≤ p[Y1 ≤ y1 ,..., Yn ≤ yn ] → F ( x1 ,..., xn ) ≤ F ( y1 ,..., yn ) c) Fijamos, por ejemplo, las variables xi, i=2,…,n haciendo xi = ci , i = 2,..., n y veamos entonces que es continua a la derecha de x1, es decir que X 1 ≤ x1 + 0, X 2 ≤ c2 ,..., X n ≤ cn = X 1 ≤ x1 , X 2 ≤ c2 ,..., X n ≤ cn , con lo cual, [ ] [ ] por repetición para cada una de las variables se verificará que CASANCHI.COM, 2010 3 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA [X 1 ≤ x1 + 0, X 2 ≤ x2 + 0,..., X n ≤ xn + 0] = [X 1 ≤ x1 , X 2 ≤ x2 ,..., X n ≤ xn ] y por consiguiente que F ( x1 + 0,..., xn + 0) = F ( x1 ,..., xn ) lo que nos indicará que la Función de Distribución es continua a la derecha de cada variable. Veamos, pues, que se cumple para la primera variable considerando la sucesión decreciente {Ar }r ≥0 = [X 1 ≤ x1 + 2− r , X 2 ≤ c2 ,..., X n ≤ cn ] Si tendemos al límite en cada variable: lim Ar = lim r→∞ [X 1 ] ≤ x + 2 − r , X 2 ≤ c2 ,..., X n ≤ cn = [ X 1 ≤ x + 0, X 2 ≤ c2 ,..., X n ≤ cn ] r →∞ o bien, por ser decreciente: ∞ lim Ar = I Ar = [X 1 ≤ x, X 2 ≤ c2 ,..., X n ≤ cn ] r→∞ r =0 [ ] [ por tanto, X 1 ≤ x1 + 0, X 2 ≤ c2 ,..., X n ≤ cn = X 1 ≤ x1 , X 2 ≤ c2 ,..., X n ≤ cn ] al repetir esto con cada una de las variables, queda probada la proposición. d) Es claro que X 1 ≤ x1 , X 2 ≤ x2 ,..., X n ≤ xn ≤ X 2 ≤ x2 ,..., X n ≤ xn , por tanto: [ ] [ ] F ( x1 , x 2 ,..., x n ) ≤ F ( x 2 ,..., x n ) . El espacio muestral U de los sucesos elementales se puede expresar, usando la variable aleatoria X1, por U = [X 1 ≤ ∞ ] , o sea, por U = [X 1 ≤ 0] U [0 < X 1 ≤ 1] U [1 < X 1 ≤ 2] U ... U [h < X 1 ≤ h + 1] U ... = ∞ = [X 1 ≤ 0] U U [h < X 1 ≤ h + 1] h =0 Como sabemos que la intersección de cualquier suceso A con U es igual a A ( A = U ∩ A ), si hacemos A = X 2 ≤ x2 ,..., X n ≤ xn tendremos: [ ] A = U ∩ A = ([X 1 ≤ 0] ∩ A) ∪ U [h < X 1 ≤ h + 1] ∩ A , por lo que al tomar h =0 ∞ probabilidades: ∞ p( A) = p(U ∩ A) = p([ X 1 ≤ 0] ∩ A) + p U [h < X 1 ≤ h + 1] ∩ A = h =0 ∞ = p([ X 1 ≤ 0] ∩ A) + ∑ p([h < X 1 ≤ h + 1] ∩ A) h =0 que podemos expresar, para cualquier número natural m, por m p( A) = p([X 1 ≤ 0] ∩ A) + ∑ p([h < X 1 ≤ h + 1] ∩ A) + p([m + 1 < X 1 ≤ m + 2] ∩ A) + h =0 + p([m + 2 < X 1 ≤ m + 3] ∩ A) + ... = F (m + 1, x 2 ,..., x n ) + ∞ ∑ p([h < X h = m +1 1 ≤ h + 1] ∩ A) O sea: F2,...,n ( x 2 ,..., x n ) = F (m + 1, x 2 ,..., x n ) + ∞ ∑ p([h < X h = m +1 1 ≤ h + 1] ∩ A) por tanto, ∀ε > 0, ∃m0 ∈ N / ∀m > m0 : CASANCHI.COM, 2010 4 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA F2,...,n ( x 2 ,..., x n ) − F (m + 1, x 2 ,..., x n ) = ∑ p([h < X h = m +1 1 ≤ h + 1] ∩ A) < ε (d.1) F ( x1 , x 2 ,..., x n ) = F2,...,n ( x 2 ,..., x n ) lim con lo cual: ∞ x1 → ∞ y lo mismo ha de ocurrir para cualquier otra de las n variables: lim F ( x1 , x 2 ,..., x n ) = F2,...,i −1,i +1,...n ( x1 ,.., xi −1, xi +1 ,..., x n ) xi → ∞ e) Veamos la siguiente suma de diferencias de funciones de distribución: n ∑ {F (x ,..., x ) − F h=2 h...n 2 n h −1...n (xh−1 ,..., xn )} = F2...n (x2 ,..., xn ) − F (x1 ,..., xn ) + F3...n (x3 ,..., xn ) − − F2...n ( x2 ,..., xn ) + F4...n ( x4 ,..., xn ) − F3...n ( x3 ,..., xn ) + ... + Fn ( xn ) − Fn −1,n ( xn −1 , xn ) = = − F (x1 ,..., xn ) + Fn ( xn ) n Es decir, F ( x1 ,..., xn ) = F n( xn ) − ∑ {Fh...n ( x2 ,..., xn ) − Fh −1...n ( xh −1 ,..., xn )} (e) h=2 ε > 0 , para xh-1 Fh...n ( x2 ,..., xn ) − Fh −1...n ( xh −1 ,..., xn ) < ε / n , por lo que al Por (d.1) del apartado anterior sabemos que dado un suficientemente grande es sumar los n-1 sumandos anteriores es: n ∑ {F (x ,..., x ) − F h...n h=2 2 h −1...n n (xh−1 ,..., xn )} < (n − 1) ε n por otra parte, del teorema 1, parte c, para la función de distribución unidimensional se tiene que el límite para x → ∞ es lim F ( x) = 1 ↔ 0 ≤ 1 − F ( x) < ε / n ,para valor suficientemente grande de x por tanto, de la expresión (e): ∞ ε h=2 n 0 ≤ 1 − F ( x1 ,..., xn ) = 1 − F n( xn ) + ∑ {Fh...n ( x2 ,..., xn ) − Fh −1...n ( xh −1 ,..., xn )} < en definitiva: 0 ≤ 1 − F ( x1 ,..., xn ) < ε → + (n − 1) ε n lim F ( x1 ,..., xn ) = 1 xi → ∞ i = 1,...n f) Supongamos, para simplificar el proceso que j=n. Del apartado anterior podemos n expresar que F n( xn ) − F ( x1 ,..., xn ) = ∑ {Fh...n (x2 ,..., xn ) − Fh −1...n ( xh −1 ,..., xn )} (f.1) h=2 ε > 0 , para xh-1 suficientemente grande es Fh...n (x2 ,..., xn ) − Fh −1...n ( xh −1 ,..., xn ) < ε / n − 1 , por lo cual al efectuar la suma (f.1), y por (d.1) sabemos que para un n-1 sumandos, queda: 0 ≤ F n( xn ) − F ( x1 ,..., xn ) < (n − 1). en definitiva: CASANCHI.COM, 2010 ε n −1 de =ε 5 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA lim F ( x1 ,..., xn ) = Fn ( xn ) xi → ∞ i≠n y al extender el resultado al resto de las variables se tiene la expresión buscada lim F ( x1 ,..., xn ) = F j ( x j ), j = 1,..., n xi → ∞ i≠ j ∞ U = [x > 0] U U [− (h + 1) < X 1 ≤ − h] y h =0 ∞ llamemos A = [x2 ,..., xn ] . Se tiene que A = U I A = U [− ( h + 1) < X 1 ≤ − h] I A + h =0 + ([X 1 > 0] I A) . Tomando probabilidades: g) Expresemos el espacio muestral U por ∞ p ( A) = ∑ ([− (h + 1) < X 1 ≤ −h] I A) + p ([X 1 > 0] I A) = p ([X 1 > 0] I A) + h =0 m −1 ∞ h =0 h=m + ∑ ([− (h + 1) < X 1 ≤ − h] I A) + ∑ ([− (h + 1) < X 1 ≤ − h] I A) = (g.1) ∞ = p ([X 1 > − m] I A) + ∑ ([− (h + 1) < X 1 ≤ − h] I A) h=m por otra parte: [X1 > −m] U [X1 ≤ −m] = U → ([X1 > −m]I A) U ([X1 ≤ −m] I A) = U I A = A [ ] [ ] al tomar probabilidades se tiene: p ( X 1 > − m I A) + p ( X 1 ≤ − m I A) = p ( A) → → p([X 1 > −m] I A) = p ( A) − p ([X 1 ≤ −m] I A) Si sustituimos en la anterior expresión (g.1): ∞ p( A) = p ( A) − p([X 1 ≤ − m] I A) + ∑ ([− (h + 1) < X 1 ≤ − h] I A) , de donde: h=m ∞ p([ X 1 ≤ − m] I A) = ∑ ([− (h + 1) < X 1 ≤ − h] I A) , o bien: h=m ∞ F (− m, x2 ,..., xn ) = ∑ ([− (h + 1) < X 1 ≤ −h] I A) h=m para un ε > 0 dado y tomando m su suficientemente grande 0 < F (− m, x2 ,..., xn ) ≤ ε de donde resulta la proposición: lim F (− m, x2 ,..., xn ) = 0 → m→∞ restantes variables: lim F ( x1 , x2 ,..., xn ) = 0 , que extendido a las x1 → −∞ lim F ( x1 ,..., xn ) = 0 para xi → −∞, i = 1,2,..., n M = [a1 < X 1 ≤ b1 ,..., an < X n ≤ bn ] y consideremos por separado los sucesos A1 = [a1 ≥ X 1 ],..., An = [a n ≥ X n ] . Llamemos: h) Llamemos CASANCHI.COM, 2010 6 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA n A = U Ak = [a1 ≥ X 1 ] U ... U [an ≥ X n ] , cumpliéndose, por las leyes de De Morgan, que k =1 A = [a1 < X 1 ] I ... I [an < X n ] = [a1 < X 1 ,..., an < X n ] Asimismo, consideremos por separado los sucesos B1 = [X 1 ≤ b1 ],..., Bn = [X n ≤ bn ] y llamemos: n B = I Bk = [ X 1 ≤ b1 ] I ... I [ X n ≤ bn ] = [X 1 ≤ b1 ,..., X n ≤ bn ] k =1 Se tiene, entonces, que podemos expresar: M = [a1 < X 1 ≤ x1 ,..., an < X n ≤ xn ] = [a1 < X 1 ,..., an < X n ] I [X 1 ≤ b1 ,..., X n ≤ bn ] = = AIB Tomando probabilidades, se tiene: n n p ( M ) = p ( A I B ) = p ( B ) − p ( A I B ) = p ( B ) − p U Ak I B = p ( B ) − p U ( Ak I B ) k =1 k =1 n Si llamamos Qk = Ak I B se tiene, finalmente, que p ( M ) = p ( B ) − p U Qk (*) k =1 Para terminar hemos de obtener una fórmula que nos permita determinar la n n sucesos, p U Qk , en función de la probabilidad de k =1 sus intersecciones. Como conocemos que p (Q1 U Q2 ) = p (Q1 ) + p (Q2 ) − p (Q1 I Q2 ) , probabilidad de la unión de intentaremos generalizar esta fórmula: p(Q1 U Q2 U Q3 ) = p((Q1 U Q2 ) U Q3 ) = p(Q1 U Q2 ) + p(Q3 ) − p((Q1 U Q2 ) I Q3 ) = = p (Q1 ) + p(Q2 ) − p(Q1 I Q2 ) + p(Q3 ) − p((Q1 U Q2 ) I Q3 ) = p(Q1 ) + p(Q2 ) + p(Q3 ) − − p(Q1 I Q2 ) − p((Q1 I Q3 ) U (Q2 I Q3 ) ) = p(Q1 ) + p(Q2 ) + p (Q3 ) − p(Q1 I Q2 ) − − p(Q1 I Q3 ) − p(Q2 I Q3 ) + p(Q1 I Q2 I Q3 ) o sea, inducimos que para n sucesos será: n n p U Qk = ∑ (−1) k −1α nk , siendo α nk = ∑ p (Qi1 I ... I Qik ) k =1 k =1 C nk que es sencillo probar mediante inducción completa, viendo que si se supone cierta para n=h: h h p U Qk = ∑ (−1) k −1α hk , siendo α hk = ∑ p(Qi1 I ... I Qik ) k =1 k =1 C hk también será cierta para n=h+1: h +1 h +1 p U Qk = ∑ (−1) k −1α ( h +1) k , siendo α ( h +1) k = ∑ p (Qi1 I ... I Qik ) k =1 k =1 Chk+1 Por otra parte, vemos que Qi1 = Ai1 I B = [ X i1 ≤ ai1 ] I [ X 1 ≤ b1 ,..., X n ≤ bn ] = = [X 1 ≤ b1 ,..., X i1 ≤ ai1 ≤ bi1 ,..., X n ≤ bn ] = [ X 1 ≤ b1 ,..., X i1 ≤ ci1 ,..., X n ≤ bn ] siendo ci1 = si1ai1 + (1 − si1 )bi1 con si1 = 1 Por consiguiente, es p (Q1 I ... I Qn ) = p[ X 1 ≤ c1 ,..., X n ≤ cn ] = F (c1 ,..., cn ) siendo c j = s j a j + (1 − s j )b j CASANCHI.COM, 2010 7 DISTRIBUCIÓN DE VARIABLES ALEATORIAS con CARLOS S. CHINEA s j = 1 si j ∈ (i1,..., ik ) o bien con s j = 0 si j ∉ (i1,..., ik ) En definitiva, es: (−1) k ∑ p (Qi1 I ... I Qik ) = (−1) k C nk y por otra parte es p ( B) = p[X 1 ≤ b1 ,..., X n ≤ bn ] = (−1) 0 ∑ F (c ,..., c ) s1 + ... + s j = k 1 n ∑ F (c ,..., c ) s1 + ... + s n = 0 1 n Finalmente, la expresión (*) queda así: n n p ( M ) = p ( B) − p U Qk = p ( B) − ∑ (−1) k −1 ∑ p(Qi1 I ... I Qik ) = k =1 k =1 C nk n = (−1)0 n ∑ F (c ,..., c ) + ∑ (−1) ∑ F (c ,..., c ) = ∑ (−1) ∑ F (c ,..., c ) s1 + ... + s j = 0 n 1 k k =1 s1 + ... + s j = k 1 n k k =0 s1 + ...+ s j = k 1 n o bien n p[a1 < X 1 ≤ b1 ,..., an < X n ≤ bn ] = ∑ (−1) k k =0 ∑ F (c ,..., c ) s1 + ... + s j = k 1 n con s j = 1 si j ∈ (i1,..., ik ) o bien con s j = 0 si j ∉ (i1,..., ik ) Definición 2 Sea la variable aleatoria unidimensional X condicionada al suceso A ( p ( A) > 0 ), es [ ] decir, X ≤ x / A . Se denomina Función de Distribución Condicionada al suceso A a la función F ( x / A) = p([ X ≤ x ]/ A) Teorema 3 Dada la variable aleatoria X y el sistema completo de sucesos {A0 , A1 ,..., An ,...}, la Función de Distribución de X se puede expresar por F ( x) = ∑ p( An ).F ( x / An ) n≥0 Demostración: Si en el espacio probabilístico (U ,Φ, p ) , {An }n ≥ 0 es un sistema completo, entonces, por definición es UA n n≥0 = U , I An = φ n≥0 Y por el Teorema de la Probabilidad Total (*): p[ X ≤ x ] = ∑ p( An ). p([ X ≤ x ]/ An ) n≥0 por tanto F ( x) = ∑ p( An ).F ( x / An ) n≥0 (*) Ver el teorema de la Probabilidad Ttotal en “De las álgebras de Sucesos a los Espacios Probabilísticos”, pag 11. CASANCHI.COM, 2010 8 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA Definición 3 Se dice que las n variables aleatorias X 1 ,..., X n son independientes si para cualquier n-pla de pares de números reales ( a1 , b1 ),..., ( an , bn ) tales que ai ≤ bi , i=1,…,n se [ ] [ ] verifica que son independientes los sucesos a1 < X 1 ≤ b1 ,..., an < X n ≤ bn , es decir, [a1 < X 1 ≤ b1 ] I ... I [an < X n ≤ bn ] = φ Teorema 4 La condición necesaria y suficiente para que las n variables aleatorias X 1 ,..., X n sean independientes es que F ( x1 ,..., xn ) = F ( x1 ).F ( x2 ).....F ( xn ) Demostración: [ ] [ ] Llamemos A1 = a1 < X 1 ≤ b1 ,..., An = an < X n ≤ bn . Sabemos que k de estos sucesos son independientes sii ( ) p Ai1 I ... I Aik = p( Ai1 )..... p( Ai1 ) Siendo (i1 ,..., ik ) una combinación cualquiera de orden k, de los n índices (o sea, un k elemento de Cn ) ⇒ (si los sucesos son independientes, entonces se verifica la relación entre las funciones de distribución): F ( x1 ,..., xn ) = p[a1 < X 1 ≤ b1 ,..., an < X ≤ bn ] = p[[a1 < X 1 ≤ b1 ] I ... I [an < X ≤ bn ]] = = p[a1 < X 1 ≤ b1 ]..... p[an < X ≤ bn ] = F1 ( x1 ).....Fn ( xn ) ⇐ (Si se verifica la relación entre las funciones de distribución, entonces los sucesos son independientes): Del teorema 3_h), podemos expresar: p ( A1 I ... I Am ) = Por tanto, es p( A1 I ... I Am ) = s1 + ...+ s m = 0 ∑ (−1) F (c ,..., c k 1 s1 + ... + s m = 0 m m ∑ (−1)k F (c1,..., cm ) = m m ∑ (−1) F (c )....F s1 + ...+ s m = 0 k 1 1 m ) (cm ) Se tendrá: p( A1 I ... I Am ) = (F1 (b1 ) − F1 (a1 ) ).....(Fm (bm ) − Fm (am ) ) = = ( p[ X 1 ≤ b1 ] − p[X 1 ≤ a1 ])....( p[X m ≤ bm ] − p[X m ≤ am ]) = = p[a1 < X 1 ≤ b1 ]..... p[am < X m ≤ bm ] = p( A1 )..... p( Am ) 03.Las distribuciones discretas Definición 4 Una variable aleatoria, X, se dice que es discreta, si su rango, RX, es un conjunto numerable. Diremos que su distribución es discreta. CASANCHI.COM, 2010 9 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA Obviamente, RX será discreto, lo que quiere decir que siempre existen bolas reducidas de cualquier elemento del mismo que son disjuntas con el conjunto: ∀x ∈ RX , ∃B' ( x; r ) I RX = φ Llamaremos Función de Distribución Discreta a la función de distribución de una variable aleatoria discreta. Teorema 5 Sea X una variable aleatoria discreta sobre el espacio probabilístico (U , Φ, p ) ) y sea F su función de distribución. Se verifica: −1 1) Si X (U ) = RX = {x1 , x2 ,...}, entonces la familia {An }n ≥ 0 , donde An = X ( xn ) es un sistema completo de sucesos de U. 2) Se verifican las siguientes implicaciones a) Si x k < X ≤ x k +1 = φ entonces F ( x k +1 ) = F ( x k ) b) [ Si [x k ] < X ≤ x k +1 ] = [X = x k +1 ]entonces F ( x k +1 ) = F ( x k ) + p[X = x k +1 ] Demostración: 1) Trivial. 2) a) [xk b) [xk < X ≤ x k +1 ] = φ → p[x k < X ≤ x k +1 ] = 0 → p[X ≤ x k +1 ] − p[X ≤ x k ] = 0 → → F ( xk +1 ) − F ( xk ) = 0 → F ( xk +1 ) = F ( xk ) < X ≤ x k +1 ] = [ X = x k +1 ] → p[x k < X ≤ x k +1 ] = p[X = x k +1 ] → p[X ≤ x k +1 ] − − p[ X ≤ x k ] = p[X = x k +1 ] → F ( x k +1 ) − F ( x k ) = p[ X = x k +1 ] → → F ( x k +1 ) = F ( x k ) + p[X = x k +1 ] , y la función de distribución resulta, por tanto, que es escalonada. Definición 5 Se llama función de densidad de una variable aleatoria discreta, X, a la función p = p[ X = x r ], si x = x r , r ∈ Z f ( x) = r 0, si x ≠ x r , ∀r ∈ Z Teorema 6 Si f(x) es la función de densidad de una variable aleatoria discreta X, entonces 1) 0 ≤ f ( x ) ≤ 1, ∀x ∈ R ∞ 2) ∑ r =1 ∞ f ( xr ) = ∑ pr = 1 3) F ( x ) = r =1 ∑p xr ≤ x r Demostración: 1) Trivial, pues se trata de una probabilidad. 2) Trivial, pues se trata de la probabilidad del espacio muestral (suceso seguro). 3) Trivial, pues F ( x ) = p X ≤ x = ... + p X = x k −1 + p X = x k + ... + p X = x = [ = ∑p xr ≤ x ] [ ] [ ] [ ] r CASANCHI.COM, 2010 10 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA Teorema 7 Dado un conjunto de n variables aleatorias discretas, X 1 ,.., X n , se cumple que la variable aleatoria X = ( X 1 ,..., X n ) es también discreta. Demostración: trivialmente, pues el producto cartesiano de n conjuntos numerables es también numerable. Definición 6 Dada la variable aleatoria discreta Xi, cuyo rango es R X i = {xi1 , xi 2 ,...} . Si llamamos p[ X i = xik ] = pik , se define la función de densidad de Xi por: p , si xi = xir , i = 1,..., n f ( x) = r1 ...rn 0, si xi ≠ xir , i = 1,..., n donde se ha llamado [ pr1 ...rn = p X 1 = x1r1 ,..., X n = xnrn cumpliéndose que F ( x1 ,..., xn ) = ∑p xiri ≤ xi ] r1 ...rn Definición 7 Las funciones pi , si x = xir , r ∈ Z , i = 1,..., n f i ( x) = r 0, si x ≠ xir , ∀r ∈ Z Se llaman funciones de densidad marginales de la variable aleatoria X = ( X 1 ,..., X n ) . Teorema 8 La condición necesaria y suficiente para que las n variables aleatorias discretas X 1 ,..., X n , de funciones de densidad respectivas f1 ( x),..., f n ( x), sean independientes es que se verifique que f ( x1 ,..., xn ) = f1 ( x1 )..... f n ( xn ) , siendo f ( x1 ,..., xn ) la función de densidad de la variable aleatoria discreta X = ( X 1 ,..., X n ) . Demostración ⇒ (Si las X 1 ,..., X n son independientes, entonces f ( x1 ,..., xn ) = f1 ( x1 )..... f n ( xn ) ) Si cada variable Xi es discreta, llamando Rxi a su rango, i=1,…,n, se tiene que ∀xi ∈ R, ∃B( xi ; ri ) / B' ( xi ; ri ) I Rxi = φ , con lo cual [xi − ri < X i ≤ xi ] = [X i = xi ] y podemos expresar: f ( x1 ,..., xn ) = p[X 1 = x1 ,..., X n = xn ] = p[[ X 1 = x1 ] I ... I [ X n = xn ]] = = p[X 1 = x1 ]..... p[ X n = xn ] = f1 ( x1 )..... f n ( xn ) ⇐ (Si es f ( x1 ,..., xn ) = f1 ( x1 )..... f n ( xn ) entonces las X 1 ,..., X n son independientes) f ( x1 ,..., xn ) = f1 ( x1 )..... f n ( xn ) → pr1 ...rn = pr1 ..... prn , y la función de distribución puede expresarse por F ( x1 ,..., xn ) = ∑p xri ≤ xi r1 ...rn = ∑ pr1 ..... prn = ∑ pr1 ..... ∑ prn = xri ≤ xi xri ≤ xi xri ≤ xi = F1 ( x1 ).....Fn ( xn ) , es decir, F ( x1 ,..., xn ) = F ( x1 ).....F ( xn ) , los que nos indica, por el teorema 4, que las variables aleatorias X 1 ,..., X n son independientes. CASANCHI.COM, 2010 11 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA También para las funciones de densidad discretas acostumbra a definirse el concepto de función condicional, utilizando para ello la fórmula de la probabilidad de un suceso condicionado a otro. Así, dadas n variables aleatorias discretas X 1 ,..., X n , se define la función de densidad condicional de las variables aleatorias X 1 ,..., X s con respecto a los valores de las variables restantes X s +1 , = cm +1 ,..., X n = cn por la probabilidad: f1...s ( x1 ,..., xs / xs +1 = cs +1 ,..., xn = cn ) = p([ X 1 = x1 ,..., X s = xs ]/[X s +1 = cs +1 ,..., X n = cn ]) 04.Las distribuciones continuas Una variable aleatoria, X, se dice que es continua, si su rango, RX, es un conjunto infinito no numerable. Diremos que su distribución es continua. La correspondiente función de distribución será continua en todo el campo real [ ] salvo en aquellos puntos en los que P X = x ≠ 0 . El conjunto R X de estos puntos [ ] ' es numerable. En definitiva, será P X = x = 0 en R X − R X , y esto quiere decir que ' P[ X = x ] = 0 no implica necesariamente que [X = x ] sea el suceso imposible. Definición 8 Se dice que la variable aleatoria X, de función de distribución absolutamente continua sii existe una función cumple: f ( x) ≥ 0 medible lebesgue que ∞ a) ∫ f ( x).dx = 1 , x b) F ( x) = ∫ f (t ).dt −∞ −∞ La función F (x) , es f (x) se denomina función de densidad de la variable aleatoria X. Se verifica, en definitiva que la función derivada de la función de distribución coincide con la función de densidad, salvo en los puntos de discontinuidad, que son un conjunto de probabilidad nula y en los cuales la función de densidad puede modificarse sin que varíe integral anterior. B F ' ( x) = f ( x) F ( B) − F ( A) = ∫ f (t ).dt A Con esto, la función de distribución, F(x), cumple, efectivamente, la condición de definición de función absolutamente continua, pues n n i =1 i =1 ∀ε > 0, ∃δ > 0 / ∑ (bi − ai ) < δ ⇒ ∑ F (bi ) − F (ai ) < ε Definición 9 Se dice que la variable aleatoria n-dimensional X = ( X 1 ,..., X n ) , de función de F ( x1 ,..., x n ) , es absolutamente continua sii existe una función f ( x1 ,..., x n ) ≥ 0 medible lebesgue que cumple: distribución CASANCHI.COM, 2010 12 DISTRIBUCIÓN DE VARIABLES ALEATORIAS a) b) ∞ ∞ −∞ −∞ CARLOS S. CHINEA ∫ ... ∫ f ( x ,..., x ).dx ...dx 1 n 1 x1 xn −∞ −∞ n = 1, F ( x1 ,..., xn ) = ∫ ... ∫ f (t1 ,..., t n ).dt1...dt n f ( x1 ,..., xn ) se denomina función de densidad de la variable aleatoria X. La función Se verifica, en definitiva que la función derivada parcial de la función de distribución coincide con la función de densidad, salvo en los puntos de discontinuidad, que son un conjunto de probabilidad nula: ∂ n F ( x1 ,..., xn ) f ( x1 ,..., xn ) = ∂x1....∂xn Teorema 9 Dada la variable aleatoria absolutamente continua, X = ( X 1 , X 2 ) , de función de densidad f ( x1 , x2 ) , se verifica que las funciones ∞ f1 ( x1 ) = ∫ ∞ f ( x1 , t 2 ).dt 2 , f 2 ( x2 ) = −∞ ∫ f (t , x ).dt 1 2 1 −∞ son las funciones de densidad marginales, absolutamente continuas, de las variables aleatorias X1 y X2. Demostración Por el teorema 1_f) se tiene que las funciones marginales son: lim F ( x1 ,..., xn ) = F j ( x j ), i ≠ j , i = 1,..., n xi → +∞ Si hacemos n=2 se tienen: F1 ( x1 ) = lim F ( x1 , x2 ), F2 ( x2 ) = lim F ( x1 , x2 ) x2 → +∞ x1 → +∞ o sea, x1 ∞ F1 ( x1 ) = lim F ( x1 , x2 ) = f (t1 , t 2 ).dt 2 .dt1 = f1 (t1 ).dt1 ⇒ ∫ ∫ ∫ − ∞ − ∞ −∞ x2 → +∞ x1 ∞ ⇒ f1 ( x1 ) = ∫ f ( x , t ).dt 1 2 2 −∞ F2 ( x2 ) = x2 ∞ x2 lim F ( x1 , x2 ) = f (t1 , t 2 ).dt1 .dt 2 = f 2 (t 2 ).dt 2 ⇒ ∫ ∫ ∫ − ∞ − ∞ −∞ x1 → +∞ ∞ ⇒ f 2 ( x2 ) = ∫ f (t , x ).dt 1 2 1 −∞ Teorema 10 Dada la variable aleatoria absolutamente continua aleatorias suficiente X = ( X 1 ,..., X n ) , las variables X 1 ,..., X n son absolutamente continuas, y la condición necesaria y para que sean independientes CASANCHI.COM, 2010 es que se verifique que 13 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA f ( x1 ,..., xn ) = f1 ( x1 )..... f n ( xn ) , siendo f ( x1 ,..., xn ) la función de densidad de la variable aleatoria X = ( X 1 ,..., X n ) , y las f i ( xi ), i = 1,..., n son las funciones de densidad de las variables aleatorias X i , i = 1,..., n . Demostración ⇒ (Si las variables aleatorias absolutamente continuas X 1 ,..., X n son f ( x1 ,..., xn ) = f1 ( x1 )..... f n ( xn ) ) Por el teorema 4, sabemos que si X 1 ,..., X n son independientes, entonces se cumple para las funciones de distribución que F ( x1 ,..., xn ) = F ( x1 ).....F ( xn ) , con lo cual, es: independientes, entonces ∂ n F ( x1 ,..., xn ) ∂ n (F1 ( x1 ),..., Fn ( xn ) ) dF1 ( x1 ) dFn ( xn ) = f ( x1 ,..., xn ) = = = f1 ( x1 )... f n ( xn ) ... ∂x1...∂xn ∂x1...∂xn dx1 dxn ⇐ f ( x1 ,..., xn ) = f1 ( x1 )..... f n ( xn ) , entonces las variables (Si se verifica que X 1 ,..., X n son independientes) aleatorias absolutamente continuas x1 xn −∞ −∞ x1 xn −∞ −∞ F ( x1 ,..., xn ) = ∫ ... ∫ f (t1 ,..., t n ).dt1...dt n = ∫ ... ∫ f (t1 )... f (t n ).dt1...dt n = = xn x1 ∫ f (t ).dt ... ∫ f (t 1 −∞ 1 n ).dt n = F1 ( x1 )...Fn ( xn ) −∞ Con lo cual, aplicando nuevamente el teorema 4, las variables X 1 ,..., X n son independientes. 05.Algunos ejemplos Veamos ejemplos de distribuciones discretas y continuas, definidas por la función de densidad: a) Un ejemplo de distribución de una variable aleatoria discreta es la Distribución Binomial: - Función de probabilidad (o de densidad de probabilidad): n pr = p[X = xr ] = p x r .q n − x r , si x = xr , xr = 0,1,..., n ∈ Z f ( x) = xr 0, si x ≠ x , ∀x ∈ Z r r Por tanto, su función de distribución es F ( x) = ∑ pr = xr ≤ x siendo x n ∑ x . p xr = 0 r xr .q n − x r (o ≤ x ≤ n) , F ( x) = 0 si x < 0 , y F ( x) = 1 si x ≥ n CASANCHI.COM, 2010 14 DISTRIBUCIÓN DE VARIABLES ALEATORIAS CARLOS S. CHINEA b) Un ejemplo de distribución de una variable aleatoria continua: Distribución Normal: Función de probabilidad (o de densidad de probabilidad): 1 x−µ σ − 1 f ( x) = e 2 σ 2π 2 Por tanto, su función de distribución es x F ( x) = ∫ −∞ x 1 t −µ σ − 1 f (t ).dt = ∫ e 2 − ∞ σ 2π 2 .dt , 06.Bibliografía Cramer, H.; “Métodos matemáticos de la Estadística”. Ediciones Aguilar. Frechet, M.; “Recherches theoriques modernes sur la theorie des probabilities”, Gauthier-Villars, 10ª edic. 1950 Gndenko, B. ; “Teoría de probabilidades ». Editorial Mir Schweizer, B;Sklar, A.; “Probabilistic metric spaces”, North Holland, N.York, 1983 Quesada P,V.; García Perez, A.; “Lecciones de Cálculo de probabilidades”, Diaz de Santos, Madrid, 1988. Martín Pliego, F.;Ruiz-Maya Pérez, L.; “Fundamentos de Probabilidad”, ThomsonParaninfo, 1998. S. Chinea, C., “Aleatoriedad y álgebras de sucesos”, (http://casanchi.com/mat/aleatoria01.pdf ) S. Chinea, C., “De las álgebras de sucesos a los espacios probabilísticos”, (http://casanchi.com/mat/sucesospro01.pdf ) S. Chinea, C., “Variables aleatorias. Una incursión en los espacios probabilizables”, (http://casanchi.com/mat/valeatoria01.pdf ) CASANCHI.COM, 2010 15