Universidad Técnica Federico Santa María Universidad Técnica Federico Santa María Departamento de Informática ILI-280 Capítulo 5: Variables Aleatorias Distribuciones Estadística Computacional I Semestre 2006 Profesor : Profesor : Héctor Allende Carlos Valle Variables Aleatorias Función que asigna a cada punto del espacio muestral un número real X :Ω → ℜ Ejemplo N°1: Ω ={falla , no falla} X({ no falla }) = 0 X({ falla }) = 1 2 1 Universidad Técnica Federico Santa María Variables Aleatorias Ω Espacio Muestral no falla A cada s ∈ Ω le corresponde exactamente un valor X(s) falla X({no falla}) = 0 X({falla}) = 1 IR Conjunto Números −∞ 0 +∞ 1 X:Ω Reales Rx ∈ IR 1(]-∞, x]) ∈ X ℑ Familia de eventos elementales 3 Variables Aleatorias si Ω X(s) = b; s ∈ Ω A sk X(s) = a RX a b • El espacio RX es el conjunto de TODOS los posible valores de X(s). • En cierto sentido podemos considerar RX como otro espacio muestral. • El espacio muestral original “induce” un espacio muestra RX asociado a la Ω Variable Aleatoria X. • Luego un evento A en S induce un evento en el espacio muestral RX. 4 2 Universidad Técnica Federico Santa María Variables Aleatorias si X(s) = b; s ∈ Ω A sk X(s) = a RX Nótese que para cada par de números reales a y b existen los siguientes conjuntos a ( ( [ [ a<x<b a<x≤b a≤x<b a≤x≤b ( x<b x≤b x>a ( x≥a -∞ -∞ b ) ] ) ] ) ] ∞ ∞ Función de Probabilidad El concepto de Probabilidad de ocurrencia de eventos en el espacio muestral Ω se puede aplicar a eventos en RX. 0 ≤ P(X(s) = x ) = f(x) ≤ 1 f(x) 1 Ω f: R [0, 1] RX 0 X(s) = x s X: Ω RX 6 3 Universidad Técnica Federico Santa María Variable Aleatoria X :Ω → ℜ X −1 (] − ∞, x]) ∈ ℑ Variable Aleatoria Discreta Sea C ∈ ℑ (con C ⊆ Ω) f:C → ℜ Soporte contable C = {ci : i ∈ I ⊆ N } i) f (ci ) ≥ 0 ii) ∑ f (c ) = 1 i i∈I Usando la transformacion X 7 Variable Aleatoria Discreta Sea X una variable aleatoria Si el número de valores de X (esto es su Recorrido). Es finito (contable) o. Es contablemente infinito (denumerable). Entonces llamamos a X una variable aleatoria discreta. Esto es, los valores de X (w) pueden ser enumerados. x1, x2, x3, …, xn, … En el caso contable la lista es finita. En el caso denumerable la lista es infinita contable 8 4 Universidad Técnica Federico Santa María Variable Aleatoria Discreta Sea C ∈ℑ , conjunto de eventos elementales de una familia de eventos del espacio muestra; C ⊆ Ω X : C →ℜ es una función definida sobre el Espacio Muestral, que mapea en el conjunto de los Números Reales los eventos elementales definidos en C = { ci: i ∈ I ⊆ N }, tal que: p(ci ) = P(ci ) ≥ 0 Sea A el evento tal los eventos elementales ci∈C pertnezcan también a A, esto es ci ∈ C ∩ A. Usando la transformación X: x(ci ) = xi P ( A) = ∑ f (c j ) = ∑ P ( X = xi ) j∈{i:ci ∈C ∩ A} i 9 Función de Probabilidad v.a discreta A cada resultado posible xi se asocia un número f ( xi ) = P( X ( s ) = xi ) llamado la probabilidad de xi Los f(xi) deben satisfacer: f(xi) 0 ≤ f ( xi ) ≤ 1 ∑ f (x ) = 1 i x i El conjunto de pares (xi, f(xi)) se le denomina Función de Probabilidad o Cuantía. x1 x2 x3 x4 x5 x6 xn P (X=5) = f(5) Función de Probabilidad de “masa” Función de Frecuencia 10 5 Universidad Técnica Federico Santa María Función de Cuantía de una v.a. discreta x (ci ) = xi P ( A) = ∑ f (c j ) = ∑ P( X = xi ) j∈{i:ci ∈C ∩ A} i Propiedades función de cuantía: P( X = xi ) ≥ 0 ∑ P( X = x ) = 1 i i Función de Distribución F ( x) = ∑ P( X = xi ) = ∑ f ( xi ) xi ≤ x xi ≤ x 11 Esperanza y Varianza de una v.a. discreta Esperanza de una v.a.d. X E [ X ] = ∑ xi P ( X = xi ) i Varianza de una v.a.d X V [ X ] = ∑ ( xi − E [ X ]) 2 P ( X = xi ) i 12 6 Universidad Técnica Federico Santa María Distribución Bernoulli Consideremos un solo experimento ε sea A un evento asociado con tal experimento. supongamos que P(A) = p; luego P(Ac) = 1- p Sea la v.a. X(A ) = 1 X(Ac) f(x) P(X = 1) = p =0 P(X = 0) = 1 – p p = 0,7 Entonces su función de cuantía es f(x) = P(X =x) = px (1 – p)1-x X = 0, 1 0<p<1 x 0 0 1 13 Distribución Bernoulli Variable aleatoria discreta Bernoulli: X :Ω →ℜ donde se tienen sólo 2 eventos posibles: P( X ( w) = 0) = 1 − p P( X ( w) = 1) = p Esperanza: Varianza: E [X] = 0 ( 1 - p ) + 1 * p = p V [X] = ( 0 - p )2( 1 - p ) + ( 1 - p )2 p =p(1-p) 14 7 Universidad Técnica Federico Santa María Distribución Binomial Supongamos que de una línea de producción se extraen n piezas con reemplazo, las cuales pueden ser defectuosas o no con una probabilidad “p”. X: N° de piezas defectuosas en las n extracciones Entonces n P( X = k ) = p k (1 − p ) n − k k k = 0,1,..., n 15 Distribución Binomial • Sean n repeticiones independientes del experimento. • Ω consiste de todos los posibles secuencias { a1, a2, a3, .., an}, donde cada ai puede ser un evento A o un evento Ac. • Existen 2n de tales secuencias. Sea la variable aleatoria X := número de veces que ocurre el evento A sus posibles valores son: 0, 1, 2, 3 , ....., n f(x) 0,300 0,200 n = 16 p = 0,2 f(x) = P(X = x) = n px (1 –p)n-x x 0,100 0,000 0 1 2 3 4 5 6 7 8 9 x x = 0, 1, 2,......,n 0<p<1 16 8 Universidad Técnica Federico Santa María Distribución Binomial Esperanza: Varianza : Notación: E [X] = np V [X] = np (1-p) X ~ Bi (n, p ) Características: Se utiliza en el muestreo de una población finita con reemplazo. También cuando la población es muy grande, con o sin reemplazo, ya que “p” se hace relativamente constante. 17 Distribución Binomial 18 9 Universidad Técnica Federico Santa María Distribución Hipergeométrica Surge en poblaciones que contienen elementos clasificables en 2 estratos (con defectos: D ; sin defectos: N - D). Consideremos un lote de tamaño N. Se extrae una muestra de tamaño n sin reemplazo. X: N° de artículos defectuosos en la muestra 19 Distribución Binomial D k P( X = k ) = N − D n − k N n k =0,1,2,.....,min{ {n,D} E[X ] = n D N V [X ] = n D( N − D)( N − n) N 2 ( N − 1) Es aplicable al muestrear lotes de tamaño pequeño en relación al tamaño de la muestra (N ≤ 10 n). 20 10 Universidad Técnica Federico Santa María Distribución de Poisson Supongamos que tenemos una muestra de tamaño grande, para lo cual la probabilidad de encontrar un artículo defectuoso es pequeño “p”, y por lo tanto “np” el número total de artículos defectuosos en la muestra. Sea λ = np. Entonces P( X = k ) = λk e − λ k! k = 0,1,2,.... 21 Distribución de Poisson 22 11 Universidad Técnica Federico Santa María Distribución de Poisson Esperanza: Varianza: E [X] = λ V [X] = λ Caso límite: X ∼ B( n , p ) k n λ λ P ( X = k ) = 1 − k n n con n −k I (k ) { } 0 ,1, 2 ,.... , n n→∞ y p≈0 P( X = k ) = λk k! e −λ I N 0 ( k ) 23 Construcción de un Modelo Probabilístico Ejemplo: Las piezas a la salida de una línea de producción se clasifican en defectuosas (D) o no defectuosas (N). Se toma tres piezas aleatoriamente y se clasifican de acuerdo a este esquema. El Ω para este experimento es: Ω = {NNN, NND, NDN, DNN, NDD, DND, DDN, DDD} La probabilidad que una pieza sea defectuosa es p y no cambia. Eso implica que si la población es finita, las observaciones se hacen con reemplazo Interesa el número de piezas D y no el orden en que salen. Se define una v.a. X igual al número de piezas defectuosas; luego, X = { 0, 1, 2, 3). Encontrar (xi, f(xi)) 24 12 Universidad Técnica Federico Santa María Creando un modelo probabilístico f(x) 3(1-p)2p 0,5 (1-p)3 0,4 3(1-p) p2 0,3 0,2 p3 0,1 x 0 0 1 2 3 Ω = {NNN, NND, NDN, DNN, NDD, DND, DDN, DDD} X(NND)= 1 X(NDN)= 1 X(DNN)= 1 3 P(N) P(N) P(D) 25 Función de distribución v.a. discreta F(x) F(x) = 0 x < x1 1 1 = Σ f( xi ) x1 ≤ x < x2 = Σ f( xi ) x2 ≤ x < x3 = Σ f( xi ) x3 ≤ x < x4 i=1 2 i=1 3 i=1 4 = Σ f( xi ) i=1 x4 ≤ x < x5 0 P(X=x5) = f(x5) Función de Probabilidad de “masa” Función de Frecuencia x x1 x2 x3 x4 x5 x6 xn 26 13 Universidad Técnica Federico Santa María Variables Aleatorias Continuas Cuando el experimento ε se realiza sobre un espacio muestral Ω que está relacionado con escalas intevalares. tales como mediciones de distancias, volúmenes, pesos, tiempos, velocidad, voltajes, intensidad, caudal, temperatura, etc. Ya que los posibles valores de X en un intervalo, a < x < b, son infinitos - no enumerables - no podemos hablar del i-ésimo valor de X = xi; En tales casos se habla de Variables Aleatorias Continuas, donde Rx es un intervalo o un conjunto de intervalos; entonces existe una función continua especial: f :ℜ → ℜ f ( x) = lim h →0 P ( x < X < x + h) >0 h 27 Variables Aleatorias Continuas Sea X una variable aleatoria continua. La función densidad de probabilidad (pdf) es una función que satisface: f(x) > 0; f(x) A: un evento a x b ∀ x ∈ Rx ∈ −∞, +∞ A: { x| a < x ≤ b) ∫ f(x) dx = 1 Rx b P(A) = P(a < x < b) = ∫ f( x ) dx a 28 14 Universidad Técnica Federico Santa María Distribuciones de Probabilidad Continuas Están definidas por una densidad de v. a. X f :ℜ → ℜ se dice densidad de probabilidad Propiedades: f(x) ≥ 0 ∞ ∫ f(x)dx = 1 -∞ 29 Propiedades y Definiciones b ∫ 1. P ( a ≤ x ≤ b) = f ( x )dx a 2. F ( x ) = P ( X ≤ x) = x ∫ f (t )dt −∞ 3. F (-∞ ∞) = 0 ; F (∞ ∞) = 1 b A = ∫ f ( x)dx f(x) 4. Fx es no decreciente 5. E [ X ] = 6. ∫ xf ( x)dx a a x b |R V [ X ] = ∫ ( x − E [X ]) 2 f ( x)dx R 30 15 Universidad Técnica Federico Santa María Función de distribución acumulada Si X es una variable aleatoria, la Función de Distribución Acumulada mide la probabilidad de un suceso en un intervalo de valores: F ( x ) = P ( X ≤ x) Si X es es una v.a. v.a. Discreta Discreta F ( x) = ∑ Si X es una v.a. Continua x f ( xi ) F ( x) = ∀i ∃xi ≤ x ∫ f (t )dt −∞ Donde la suma es tomada sobre todos los índices i que satisfacen xi ≤ x Donde la sumatoria es reemplazada por una integración para todos los valores de t ≤ x 31 Construcción de Modelos de Probabilidad Sea F : ℜ → ℜ es una función de distribución, entonces: F es no decreciente F es continua por la derecha lim f ( x ) = 0 y lim f ( x ) = 1 x → −∞ x →∞ Luego P(]] -∞ ∞ , x ]) = F(x) define una Probabilidad Además: P( ]a,b] P( [a,b] P( ]a,b[ P( [a,b[ ) = F(b) - F(a) ) = F(b) - F(a-) ) = F(b-) - F(a) ) = F(b-) - F(a-) 32 16 Universidad Técnica Federico Santa María Variables Aleatorias Continuas Sea X una variable aleatoria continua que puede tomar cualquier valor entre a ≤ x ≤ b; cuya pdf es: f (x) = 1 − b a a≤ x≤b f(x) Sea a = 3; b = 12 0,2 A: el evento { 4 < x < 7 } 0,1 Entonces: 7 x 0,0 2 3 4 5 6 7 P(A) = P(4 < x < 7) 8 9 10 11 12 a b min máx = ∫ 1 9 dx 4 1 P(A) = 3 33 Distribución Uniforme Función de densidad f ( x) = 1 b−a a< x<b Función de Distribución es 0 x − a F ( x) = b−a 1 Esperanza E[X ] = Notación: a+b 2 X ~ U ( a , b) x≤a a< x<b x≥b Varianza V [ X ] = (b − a) 2 12 34 17 Universidad Técnica Federico Santa María Distribución Uniforme 35 Distribución Normal o Gaussiana Función de densidad f ( x) = 1 2π σ e 1 x−µ 2 − 2 σ , x∈R La función de Distribución no tiene expresión analítica. (Usar tablas o calculadoras) Esperanza E [ X ] = µ Varianza V [X ] = σ 2 Notación: X ~ N ( µ , σ 2 ) 36 18 Universidad Técnica Federico Santa María Distribución Normal 37 Distribución Normal o Gaussiana Estandarización Haciendo Z= se tiene que: X − µ ∼ N( 0 , 1 ) σ 1 f z ( z) = 1 − 2 z2 e 2π ,z∈R y FZ(z) se obtiene de tablas ! 38 19 Universidad Técnica Federico Santa María Distribución Exponencial Función de densidad f X ( x) = 1 λ e − x λ x ≥ 0, λ > 0 si Función de Distribución es FX ( x) = 1 − e − x λ x≥0 E[X ] = λ Esperanza V [ X ] = λ2 Varianza Notación: X ~ exp(λ ) 39 Distribución Exponencial 40 20 Universidad Técnica Federico Santa María Distribución de Rayleigh Función de densidad f X ( x) = x − α2 e x2 2α 2 si x≥0 Función de Distribución es FX ( x) = 1 − e Esperanza Varianza Notación: E[ X ] = − x2 2α 2 x≥0 α 2π 2 π V [ X ] = ( 2 − )α 2 2 X ~ R(α ) 41 Distribución de Rayleigh 42 21 Universidad Técnica Federico Santa María Distribución de Weibull Función de densidad f X ( x) = abx b −1e − ax b x ≥ 0 , a > 0, b > 0 si Función de Distribución es FX ( x ) = 1 − e − ax b x≥0 1 E [X ] = a −1/ b Γ1 + Esperanza b 2 1 Varianza V [X ] = a −2 / b Γ1 + b − Γ 2 1 + b Notación: X ~ Weibull (a, b) 43 Distribución de Weibull 44 22 Universidad Técnica Federico Santa María Distribución tt-student Función de densidad ν + 1 Γ 1 2 1 f X ( x) = ν +1 ν νπ 2 Γ x 2 1 + 2 ν Esperanza Varianza Notación: E[X ] = 0 ν > 1 V [X ] = ν ν −2 ν >2 X ~ tν 45 Distribución tt-student 46 23 Universidad Técnica Federico Santa María Distribución Gamma Función de densidad α −1 f X ( x, α , β ) = − x β x e I R + ( x) Γ(α ) β α Función de Distribución es x FX ( x) = P( X ≤ x) = ∫ f (t ,α , β )dt −∞ ∞ Esperanza E[X ] = αβ Γ( n ) = ∫ y n −1e − y dy V [ X ] = αβ 2 0 Varianza Notación: X ~ Gamma(α , β ) = Γ(α , β ) n>0 47 Distribución Gamma X ~ Γ(α , β ) 48 24 Universidad Técnica Federico Santa María Distribución ChiChi-Cuadrado Función de densidad f X ( x,n ) = x n x −1 − 2 2 e n n Γ 2 2 2 I R +(x) Función de Distribución es x FX ( x) = P( X ≤ x) = ∫ f (t , n)dt −∞ Esperanza E [X ] = n V [ X ] = 2n Varianza Notación: X ~ χ 2 (n) = Γ(n / 2,2) 49 Distribución ChiChi-Cuadrado 50 25 Universidad Técnica Federico Santa María Distribución Beta Función de densidad f X ( x, r , s ) = Γ( r + s ) r −1 x (1 − x ) s −1 Γ( r )Γ( s ) I[ ]( x) 0 ,1 1 Función de Distribución es FX ( x ) = P( X ≤ x ) = E [X ] = r r+s β (r, s) = ∫ xr −1(1− x)s−1 dx 0 x ∫ f (u , r , s )du Γ( r + s )Γ( r + u ) E [X ] = Γ( r )Γ( r + s + u ) −∞ µ Esperanza Varianza V [X ] = Notación: X ~ Beta(r , s) = β (r , s) rs ( r + s )2 ( r + s + 1) 51 Distribución Beta 52 26