Modelos de probabilidad Modelos de probabilidad Proceso de Bernoulli Objetivos del tema: Distribución de Bernoulli Distribución Binomial Distribución Geométrica Al final del tema el alumno será capaz de: Proceso de Poisson Distribución de Poisson Distribución Exponencial Comprender las hipótesis de las distintas distribuciones presentadas Distribución Normal La Normal como aproximación de otras distribuciones Seleccionar la distribución discreta o continua correcta en aplicaciones específicas Distribuciones relacionadas con la Normal Distribución χ2 de Pearson Distribución t de Student Distribución F de Fisher Calcular probabilidades, determinar medias y varianzas para las distribuciones más comunes 1 Estadística, Profesora. María Durbán 2 Estadística, Profesora. María Durbán Modelos de probabilidad Proceso de Bernoulli Proceso de Bernoulli Distribución de Bernoulli Distribución Binomial Distribución Geométrica Cuando un experimento tiene las siguientes características: Sólo hay dos resultados posibles: Aceptable (A) Defectuoso (D) Proceso de Poisson Distribución de Poisson Distribución Exponencial La proporción de A y D es constante en la población y no se modifica cualquiera que sea la cantidad observada Distribución Normal La Normal como aproximación de otras distribuciones Pr( D) = p Pr( A) = q = 1 − p Distribuciones relacionadas con la Normal Distribución χ2 de Pearson Distribución t de Student Distribución F de Fisher Las observaciones son independientes Estadística, Profesora. María Durbán 3 Estadística, Profesora. María Durbán 4 Proceso de Bernoulli Proceso de Bernoulli Cuando un experimento tiene las siguientes características: Ejemplos Sólo hay dos resultados posibles: Aceptable (A) Defectuoso (D) Observar el resultado al lanzar una moneda La proporción de A y D es constante en la población y no se modifica cualquiera que sea la cantidad observada Si una pieza es defectuosa o no en un proceso de fabricación Observar el sexo de un recién nacido Pr( D) = p Pr( A) = q = 1 − p Si se transmite correctamente un bit a través de un canal digital Las observaciones son independientes 5 Estadística, Profesora. María Durbán 6 Estadística, Profesora. María Durbán Proceso de Bernoulli Proceso de Bernoulli Distribución de Bernoulli Distribución Binomial 0 si el suceso no ocurre A → q = 1 − p = Pr( X = 0) X = si el suceso ocurre A → p = Pr( X = 1) 1 Si se repite un número fijo de veces, n, un experimento de Bernoulli con parámetro p, el número de éxitos sigue una distribución Binomial de parámetros (n,p). X = Número de veces que ocurre un suceso en las n pruebas La función de probabilidad es: p ( x) = p x (1 − p )1− x X ~ B ( n, p ) x = 0,1 X toma valores 0,1,2,…,n µ = E [ X ] = 0 × (1 − p ) + 1× p = p σ = Var [ X ] = (0 − p) 2 (1 − p) + (1 − p) 2 p = p(1 − p) Estadística, Profesora. María Durbán 7 Estadística, Profesora. María Durbán 8 Proceso de Bernoulli Proceso de Bernoulli n=5 La función de probabilidad es: n P( X = r ) = p r (1 − p) n − r , r = 0,1,K , n r n=25 E [ X ] = np p=0.75 p=0.5 p=0.2 Var [ X ] = np (1 − p ) 9 Estadística, Profesora. María Durbán 10 Estadística, Profesora. María Durbán Proceso de Bernoulli Proceso de Bernoulli Ejemplo Ejemplo Un aparato electrónico contiene 40 circuitos integrados. La probabilidad de que un circuito sea defectuoso es 0.01 y los circuitos son independientes. El producto funciona sólo si no hay ningún circuito defectuoso. Un aparato electrónico contiene 40 circuitos integrados. La probabilidad de que un circuito sea defectuoso es 0.01 y los circuitos son independientes. El producto funciona sólo si no hay ningún circuito defectuoso. ¿Cuál es la probabilidad de que el aparato funcione? ¿Cuál es la probabilidad de que el aparato funcione? X = Número de circuitos defectuosos en los 40 de un aparato X = Número de circuitos defectuosos en los 40 de un aparato Pr( X = 0) Experimento: Observar si un circuito es defectuoso o no. Se repite 40 veces Son independientes La probabilidad de ser defectuoso es constante, 0.01 Estadística, Profesora. María Durbán 11 Estadística, Profesora. María Durbán 12 Proceso de Bernoulli Proceso de Bernoulli Ejemplo Distribución Geométrica Cuando un experimento tiene las siguientes características: Un aparato electrónico contiene 40 circuitos integrados. La probabilidad de que un circuito sea defectuoso es 0.01 y los circuitos son independientes. El producto funciona sólo si no hay ningún circuito defectuoso. Sólo hay dos resultados posibles La probabilidad de éxito se mantiene constante ¿Cuál es la probabilidad de que el aparato funcione? Las observaciones son independientes X = Número de circuitos defectuosos en los 40 de un aparato Se repite el experimento hasta que ocurre el primer éxito X ~ B(40, 0.01) X = Número de veces que hay que repetir el experimento hasta conseguir el primer éxito 40 Pr( X = 0) = 0.010 (1 − 0.01) 40 = 0.669 0 X ~ Ge( p ) 13 Estadística, Profesora. María Durbán Proceso de Bernoulli Proceso de Bernoulli Distribución Geométrica Distribución Geométrica X i i = 1,.....n son Bernoulli X1 ↓ 1 0 X2 ↓ 0 1 X3 ↓ 0 0 X4 L ↓ 0 L ⇒ 0 L ⇒ 0 0 0 0 1 0 0 1 L ⇒ L ⇒ X i i = 1,.....n son Bernoulli X ↓ X = 1 Pr( X = 1) = p X = 2 Pr( X = 2) = qp X1 ↓ 1 0 X2 ↓ 0 1 X3 ↓ 0 0 X4 L ↓ 0 L ⇒ 0 L ⇒ X = 3 Pr( X = 3) = qqp X = 4 Pr( X = 4) = qqqp 0 0 0 0 1 0 0 1 L ⇒ L ⇒ X ↓ X = 1 Pr( X = 1) = p X = 2 Pr( X = 2) = qp X = 3 Pr( X = 3) = qqp X = 4 Pr( X = 4) = qqqp E [ X ] = 1/ p La función de probabilidad es: P( X = r ) = (1 − p ) r −1 p, r = 1, 2, K Estadística, Profesora. María Durbán 14 Estadística, Profesora. María Durbán Var [ X ] = (1 − p ) / p 2 15 Estadística, Profesora. María Durbán 16 Proceso de Bernoulli Proceso de Bernoulli Distribución Geométrica Ejemplo p ( x ) = Pr ( X = x ) = (1 − p) x −1 p La probabilidad de que un bit transmitido a través de un canal de transmisión digital sea recibido como un error es 0.1. Si las transmisiones son independientes, ¿Cuál es el número medio de transmisiones que hemos de observar hasta que ocurre el primer error? X = Número de transmisiones que hay que observar hasta encontrar el primer error E [ X ] = 1/ p = 1/ 0.1 = 10 17 Estadística, Profesora. María Durbán Modelos de probabilidad Proceso de Poisson Proceso de Bernoulli Cuando un experimento tiene las siguientes características: Distribución de Bernoulli Distribución Binomial Distribución Geométrica Se observa la ocurrencia de sucesos en un intervalo Proceso de Poisson La probabilidad de que ocurra un suceso en un intervalo Distribución de Poisson Distribución Exponencial Es la misma para los intervalos del mismo tamaño Es proporcional a la longitud del intervalo Distribución Normal La Normal como aproximación de otras distribuciones Los sucesos ocurren de forma independiente. El número de sucesos que ocurren en un intervalo es independiente del número de sucesos que ocurren en otro intervalo Distribuciones relacionadas con la Normal Distribución χ2 de Pearson Distribución t de Student Distribución F de Fisher Estadística, Profesora. María Durbán 18 Estadística, Profesora. María Durbán 19 Estadística, Profesora. María Durbán 20 Proceso de Poisson Proceso de Poisson Distribución de Poisson Distribución de Poisson La función de probabilidad es: X = Número de sucesos en un intervalo de longitud fija La distribución de Poisson se puede obtener como límite de una Binomial cuando n → ∞ y p → 0 λ = np → P( X = r ) = ∞ Número medio de sucesos en ese intervalo e− λ λ r , r = 0,1, K r! E[X ] = λ → E[X ] = ∑r Var [ X ] = λ 0 ∞ e−λ λ r λ r −1 = λ e−λ ∑ =λ r! 1 ( r − 1)! X ~ P(λ1 ) Y ~ P(λ2 ) independientes X + Y ~ P(λ1 + λ2 ) 21 Estadística, Profesora. María Durbán 22 Estadística, Profesora. María Durbán Proceso de Poisson Proceso de Poisson Distribución de Poisson Ejemplos Número de defectos en un milímetro de cable. Número de llamadas de teléfono que se reciben en una centralita en una hora. Número de erratas por página en un documento Estadística, Profesora. María Durbán 23 Estadística, Profesora. María Durbán 24 Proceso de Poisson Proceso de Poisson Ejemplo Ejemplo El proceso de llegadas de clientes a un puesto de servicio se produce de manera estable e independiente. Por término medio llega un cliente cada minuto. El proceso de llegadas de clientes a un puesto de servicio se produce de manera estable e independiente. Por término medio llega un cliente cada minuto. ¿Cuál es la probabilidad de que no lleguen clientes en 3 minutos? Mantener el citado puesto de servicio abierto 8 horas al día cuesta 6000 euros diarios. ¿Cuál debe ser el precio mínimo que se cobre a cada cliente para que sea rentable? X = Número de clientes por minuto → X ~ P (λ = 1) Y = Número de clientes en 8 horas → Y ~ P (λ = 60 × 8 = 480) Y = Número de clientes en 3 minutos → Y ~ P (λ = 3) Beneficio = Tarifa x Y -6000 Pr(Y = 0) = −3 0 e 3 = e−3 0! Beneficio Esperado = Tarifa × E [Y ] − 6000 > 0 = Tarifa × 480 − 6000 > 0 25 Estadística, Profesora. María Durbán Proceso de Poisson Distribución de exponencial Distribución de exponencial X = Numero de sucesos en la unidad de tiempo X ~ P (λ ) Tiempo entre llamadas telefónicas Tiempo entre llegadas a un puesto de servicio Tiempo de vida de un componente eléctrico T = Tiempo hasta que ocurre el primer suceso M Podemos calcular su función de distribución: P (T > t0 ) = P(cero sucesos en (0,t 0 )) Cuando el número de sucesos sigue una distribución de Poisson, el tiempo entre sucesos sigue una distribución exponencial Estadística, Profesora. María Durbán 26 Estadística, Profesora. María Durbán Proceso de Poisson La distribución exponencial se puede utilizar para modelizar Tarifa > 12.5 X= Número de sucesos en una unidad de tiempo X ~ P (λ ) Y = Número de sucesos en (0,t0) Y ~ P (λt0 ) 27 P (T > t0 ) = Pr(Y = 0) = e − λt0 F (t0 ) = P (T ≤ t0 ) = 1 − e − λt0 Estadística, Profesora. María Durbán Estadística, Prof. Bernardo D'Auria 28 Proceso de Poisson Proceso de Poisson f ( x ) = λ e−λ x Distribución de exponencial X = Numero de sucesos en la unidad de tiempo X ~ P (λ ) T = Tiempo entre dos sucesos consecutivos f ( x) = 2e −2 x dF (t ) = λ e − λt , t ≥ 0 dt f (t ) = E [ X ] = 1/ λ f ( x) = 0.5e −0.5 x f ( x ) = 0.1e −0.1x Si hay λ sucesos por término medio en un intervalo de tiempo Var [ X ] = 1/ λ 2 El tiempo medio entre dos sucesos es 1/λ 29 Estadística, Profesora. María Durbán 30 Estadística, Profesora. María Durbán Proceso de Poisson Proceso de Poisson Ejemplo Propiedad El proceso de llegadas de clientes a un puesto de servicio se produce de manera estable e independiente. Por término medio llega un cliente cada minuto. Pr(T > t1 +t 2 | T > t1 ) = Pr( T > t 2 ) ¿Cuál es la probabilidad de que pasen más de 3 minutos entre la llegada de dos clientes? X = Número de clientes por minuto → X ~ P (λ = 1) T = Tiempo entre dos clientes Pr(T > t1 +t 2 I T > t1 ) Pr( T > t1 +t 2 ) e − λ (t1 +t 2 ) = − λ t1 = e − λt2 = e Pr( T > t1 ) Pr( T > t1 ) → T ~ Exp (λ = 1) Pr(T > 3) = 1 − Pr(T ≤ 3) = 1 − F (3) = 1 − (1 − e −1×3 )=e −3 Pr(Y > 7 | Y > 4) = Pr(Y > 3) = 1 − F (3) = e−3 = Pr(No haya clientes en 3 minutos) Estadística, Profesora. María Durbán Si no ha habido clientes en 4 minutos, ¿cuál es la probabilidad de que no haya clientes en los próximos 3 minutos? 31 Estadística, Profesora. María Durbán 32 Modelos de probabilidad Distribución Normal Proceso de Bernoulli Distribución de Bernoulli Distribución Binomial Distribución Geométrica La distribución Normal describe gran cantidad de procesos aleatorios Proceso de Poisson Distribución de Poisson Distribución Exponencial Errores de medida Ruido en una señal digital Corriente eléctrica en un trozo de cable … Distribución Normal La Normal como aproximación de otras distribuciones Distribuciones relacionadas con la Normal Distribución χ2 de Pearson Distribución t de Student Distribución F de Fisher En muchas situaciones otras distribuciones se pueden aproximar a una Normal Es la base para la inferencia estadística 33 Estadística, Profesora. María Durbán 34 Estadística, Profesora. María Durbán Distribución Normal Distribución Normal Tiene forma de campana y es simétrica respecto de la media Está caracterizada por dos parámetros: La media, µ, y la desviación típica, σ. N ( µ , σ ) f ( x) Toma valores en toda la recta real La media, mediana y moda coinciden Su función de densidad es: 1 f ( x) = e 2π σ E[ X ] = µ − ( x − µ )2 2σ 2 −∞ < x < ∞ µ Var[ X ] = σ 2 0.5 Estadística, Profesora. María Durbán 35 Estadística, Profesora. María Durbán 0.5 36 Distribución Normal Distribución Normal El efecto de µ y σ ¿Cómo afecta la deviación típica la forma de f(x)? La probabilidad es el área bajo la curva Es un factor de escala σ= 2 Pr(c ≤ X ≤ d) σ =3 σ =4 f(x) No es posible calcular la probabilidad de un intervalo simplemente usando la integral de la función de densidad ¿Cómo afecta el valor esperado a la posición de f(x)? µ = 10 µ = 11 µ = 12 Es un factor de traslación c 37 Estadística, Profesora. María Durbán X → Z = X −µ 38 Distribución Normal Densidad de (X-µ)/σ σ x Estadística, Profesora. María Durbán Distribución Normal Todas las distribuciones normales se pueden transformar en N(0,1) d X ~ N (3, 2) Densidad de X-µ Densidad de X 3 6 Pr( X ≤ 6) Z ~ N (0,1) Mismoº área σ 1 µ Estadística, Profesora. María Durbán 0 39 1.5 6−3 0 Pr Z ≤ Pr( 1.5) = Z ≤ 2 Estadística, Profesora. María Durbán Estadística, Prof. Bernardo D'Auria 40 Distribución Normal Distribución Normal Ejemplo La función de distribución de la Normal estándar tiene una notación propia: El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas F ( x) = Pr( X ≤ x) = φ ( x) ¿Cuál es la probabilidad de que el semiconductor falle antes de 6000 horas? Q( x) = Pr( X > x) = 1 − φ ( x) ¿Qué tiempo de vida en horas es excedido por el 95.05% de los semiconductores? Pr( X < 6000) Q(− x) = 1 − Q( x) Existen ciertas cotas para la función Q que se utilizan para calcular cotas en error de probabilidad de varios sistemas de comunicaciones 1 − x2 Pr( X > a ) = 0.9505 2 Q( x) ≤ e 2 x≥0 2 Q( x) < x − 1 e 2 x≥0 2π x Estadística, Profesora. María Durbán 41 42 Estadística, Profesora. María Durbán Distribución Normal Distribución Normal Ejemplo Ejemplo El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas ¿Cuál es la probabilidad de que el semiconductor falle antes de 6000 horas? ¿Cuál es la probabilidad de que el semiconductor falle antes de 6000 horas? 6000 − 7000 Pr( X < 6000) = Pr Z < = Pr( Z < −1.66) 600 6000 − 7000 Pr( X < 6000) = Pr Z < = Pr( Z < −1.66) 600 -1.66 Estadística, Profesora. María Durbán 1.66 43 Estadística, Profesora. María Durbán 44 Distribución Normal Distribución Normal Ejemplo Ejemplo ¿Cuál es la probabilidad de que el semiconductor falle antes de 6000 horas? El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas ¿Cuál es la probabilidad de que el semiconductor falle antes de 6000 horas? 6000 − 7000 Pr( X < 6000) = Pr Z < = Pr( Z < −1.66) 600 = 1 − Pr( Z ≤ 1.66) = 1 − Pr( Z < 1.66) = 1 − 0.9515 = 0.0485 1.66 45 Estadística, Profesora. María Durbán Estadística, Prof. Bernardo D'Auria Estadística, Profesora. María Durbán Distribución Normal 46 Distribución Normal Ejemplo Ejemplo El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas ¿Qué tiempo de vida en horas es excedido por el 95.05% de los semiconductores? ¿Qué tiempo de vida en horas es excedido por el 95.05% de los semiconductores? a − 7000 Pr( X > a ) = 0.9505 → Pr Z > = 0.9505 600 a − 7000 Pr( X > a ) = 0.9505 → Pr Z > = 0.9505 600 -b 0.9505 0.9505 a Estadística, Profesora. María Durbán Valor negativo -b 47 Estadística, Profesora. María Durbán 48 Distribución Normal Distribución Normal Ejemplo Ejemplo ¿Qué tiempo de vida en horas es excedido por el 95.05% de los semiconductores? El tiempo de vida de un semiconductor sigue una distribución Normal con media 7000 horas y desviación típica 600 horas ¿Qué tiempo de vida en horas es excedido por el 95.05% de los semiconductores? −(a − 7000) Pr( X > a ) = 0.9505 → Pr Z < = 0.9505 600 −(a − 7000) Pr( X > a) = Pr Z < = 0.9505 600 −(a − 7000) = 1.65 600 ⇓ a = 6010 b 0.9505 El 95.05% de los semiconductores duran más de 6010 horas b 49 Estadística, Profesora. María Durbán Estadística, Profesora. María Durbán Distribución Normal Estadística, Prof. Bernardo D'Auria 50 Distribución Normal Más ejemplos de cálculo de probabilidades Pr ( Z <-0.6) = Pr ( Z >0.6 ) = 1 - Pr (Z < 0.6 ) = 1 – 0.7257 = 0.2743 Pr( -0.6 < Z < 1.83 )= Pr( Z < 1.83 ) - Pr( Z ≤ -0.6 ) Pr( Z < 1.83 ) = 0.9664 = 0.7257 - 0.0336 = 0.6921 -0.6 Estadística, Profesora. María Durbán La Normal es importante, no sólo porque muchas variables comunes sigan esa distribución, sino porque aunque una v.a. no posea distribución normal, ciertos estadísticos/estimadores calculados sobre muestras elegidas al azar sí poseen una distribución Normal. 1.83 51 Estadística, Profesora. María Durbán 52 Distribución Normal Distribución Normal Muestra Ilustración 1ª 50 60 Elegimos aleatoriamente grupos de 10 observaciones. Para cada grupo de 10 obtenemos entonces una nueva medida: la media muestral. Las medias de cada muestra están más o menos cerca de la media de la variable original. 0 El histograma no se parece a una distribución normal con la misma media y desviación típica 10 20 La muestra tiene media 59.9 y desviación típica 4.57 2ª 3ª 59 63 59 60 60 69 66 58 60 54 53 65 51 51 69 54 59 54 51 53 59 63 62 65 66 57 56 70 69 55 30 40 Sea X una variable Uniforme en el intervalo [50,70]. Tenemos una muestra de tamaño 2000. 50 55 xx 60 65 70 x 53 Estadística, Profesora. María Durbán 59.4 Estadística, Profesora. María Durbán Distribución Normal 58.5 61.1 54 Distribución Normal Supongamos que tenemos n variables aleatorias Xi La distribución de las medias muestrales tiene distribución aproximadamente normal. Las observaciones de la nueva variable están menos dispersas. La desviación típica es menor, en este caso 1.92 distribución cualquiera 30 Teorema Central del Límite a La media de esta nueva variable es muy parecida a la de la variable original. independientes con medias (µι) y desviaciones típicas (σi) y 40 20 Cuando n crece, 10 Y = X1 + X 2 + K + X n 0 55.220755 57.099264 58.977773 62.734792 64.613301 xxx 60.856282 56.160009 58.038518 59.917028 61.795537 63.674046 la distribución de Y − ∑ µi ≈ N (0,1) ∑ σ i2 aa$x Estadística, Profesora. María Durbán 55 Estadística, Profesora. María Durbán Y~N (∑ µ , i ∑σ 2 i ) 56 Modelos de probabilidad Distribución Normal 4.5 Proceso de Bernoulli Distribución de Bernoulli Distribución Binomial Distribución Geométrica Supongamos que tenemos n variables aleatorias Xi independientes con medias (µι) y desviaciones típicas (σi) y 4.6 Proceso de Poisson Distribución de Poisson Distribución Exponencial distribución cualquiera Teorema Central del Límite 4.8 Distribución Normal 4.9 La Normal como aproximación de otras distribuciones 4.10 Distribuciones relacionadas con la Normal Distribución χ2 de Pearson Distribución t de Student Distribución F de Fisher Sea lo que sea lo que midamos, cuando se promedie sobre una muestra grande, nos va a aparecer de manera natural la distribución Normal 57 Estadística, Profesora. María Durbán La Normal como aproximación de otras distribuciones 58 Estadística, Profesora. María Durbán La Normal como aproximación de otras distribuciones Binomial-Normal Binomial-Normal La variable Binomial es suma de variables de Bernoulli, que toman el valor 0 ó 1. E [ Xi ] = p Y = X 1 + X 2 +K X n ( n = 50 p = 0.3 0.08 npq = 10.5 Var[ X i ] = p (1 − p ) T.C.L. Y ≈ N np, np (1 − p ) 0.12 ) 0.04 ( n > 30 N 15, 10.5 npq > 5 ) 0.00 5.000 7.625 10.250 12.875 15.500 18.125 20.750 23.375 26.000 x Estadística, Profesora. María Durbán 59 Estadística, Profesora. María Durbán 60 La Normal como aproximación de otras distribuciones La Normal como aproximación de otras distribuciones Factor de corrección Ejemplo Un fabricante de semiconductores admite que produce un 2% de chips defectuosos. Los chips se empaquetan en lotes de 2000 chips para su venta. Un comprador rechazará un lote si contiene 25 o más chips defectuosos La distribución Normal es continua pero la Binomial es discreta. Para mejorar la aproximación introducimos un factor de corrección que consiste en añadir o substraer 0.5 al valor al que le queremos calcular la probabilidad. ¿Cuál es la probabilidad de rechazar un lote? x + 0.5 − np Pr( X ≤ x) = Pr( X ≤ x + 0.5) ≅ Pr Z ≤ np (1 − p ) x − 0.5 − np Pr( x ≤ X ) = Pr( x − 0.5 ≤ X ) ≅ Pr ≤Z np (1 − p ) n > 30 np = 40 np (1 − p) = 39.2 61 Estadística, Profesora. María Durbán Pr ( X ≥ 25 ) X ~ B(2000, 0.02) La Normal como aproximación de otras distribuciones X ≈ N (40, 6.26) ↓ 25 − 0.5 − 40 Pr Z ≥ = 6.26 Pr (Z ≥ −2.47 ) = Pr (Z ≤ 2.47 ) = 0.9932 Estadística, Profesora. María Durbán 62 La Normal como aproximación de otras distribuciones Poisson-Normal Poisson-Normal La distribución de Poisson surge como límite de la Binomial cuando el número de experimentos tiende a infinito. Aproximamos a una Normal cuando λ grande (λ > 5) X ~ P (λ ) ( X ≈ N λ, λ Estadística, Profesora. María Durbán ) 63 Estadística, Profesora. María Durbán 64 Modelos de probabilidad La Normal como aproximación de otras distribuciones Proceso de Bernoulli Ejemplo Distribución de Bernoulli Distribución Binomial Distribución Geométrica El número de defectos en la superficie de un material por metro cuadrado sigue una distribución de Poisson con media 100. Proceso de Poisson Si se analiza un metro cuadrado de dicho material, ¿Cuál es la probabilidad de encontrar 95 defectos o más? Distribución de Poisson Distribución Exponencial Distribución Normal La Normal como aproximación de otras distribuciones Pr ( X ≥ 95 ) Distribuciones relacionadas con la Normal Distribución χ2 de Pearson Distribución t de Student Distribución F de Fisher ↓ 95 − 100 − 0.5 Pr Z ≥ = Pr (Z ≥ −0.55 ) = 10 Pr (Z ≤ 0.55 ) = 0.7088 65 Estadística, Profesora. María Durbán Distribuciones relacionadas con la Normal 66 Estadística, Profesora. María Durbán Distribuciones relacionadas con la Normal χ g2 χ g2 Tiene un sólo parámetro denominado grados de libertad. La función de densidad es asimétrica. Sólo toma valores positivos. La función de densidad es asimétrica positiva. Sólo toma valores positivos. La función de densidad se hace más simétrica cuando aumenta el número de grados de libertad. La función de densidad se hace más simétrica cuando aumenta el número de grados de libertad. g X −µ 2 Y = ∑ i =1 i ~ χg σ 2 E [Y ] = g 0.4 0.3 Var [Y ] = 2 g 0.0 0.1 independientes σ 2 grados de libertad 3 grados de libertad 4 grados de libertad 5 grados de libertad f(x) X i ~ N (µ ,σ ) Xi − µ 2 ~ χ1 σ 2 ~ N (0,1) 0.2 Xi − µ 0.5 Tiene un sólo parámetro denominado grados de libertad. 0 Estadística, Profesora. María Durbán 67 Estadística, Profesora. María Durbán 5 10 15 x 20 25 68 Distribuciones relacionadas con la Normal Distribuciones relacionadas con la Normal t de Student t de Student Tiene un sólo parámetro denominado grados de libertad. La función de densidad es simétrica positiva respecto al 0. Toma valores en toda la recta real. La función de densidad se aproxima a una N(0,1) cuando aumenta el número de grados de libertad. 0.4 Tiene un sólo parámetro denominado grados de libertad. La función de densidad es simétrica respecto al 0. Toma valores en toda la recta real. La función de densidad se aproxima a una N(0,1) cuando aumenta el número de grados de libertad. 5 grados de libertad 20 grados de libertad 100 grados de libertad Z ~ N (0,1) Y ~ χ g2 f(x) Z Y/g 0.0 0.1 tg = 0.2 0.3 Se obtiene como el cociente entre dos variables: 69 Estadística, Profesora. María Durbán Distribuciones relacionadas con la Normal F de Fisher Tiene un dos parámetros denominados grados de libertad. La función de densidad es asimétrica. Sólo toma valores positivos. Se obtiene como el cociente entre dos variables: Fg1 , g2 = Estadística, Profesora. María Durbán X / g1 Y / g2 X ~ χ g21 Y ~ χ g22 71 Estadística, Profesora. María Durbán -10 -5 0 x 5 70