05 – Funciones de densidad de probabilidad Diego Andrés Alvarez Marín Profesor Asistente Universidad Nacional de Colombia Sede Manizales 1 Contenido ● FDP uniforme FDP lognormal ● FDP beta FDP gamma ● FDP exponencial FDP Weibull ● FDP normal FDP Rayleigh FDP Maxwell 2 Sobre la selección de las FMPs/FDPs La elección de una FMP/FDP para representar un fenómeno de interés práctico debe estar motivada tanto por la compresión de la naturaleza del fenómeno en sí, como por la posible verificación de la FMP/FDP seleccionada a través de la evidencia empírica. 3 FDP Uniforme ~U(a,b) La variable aleatoria toma valores sobre un intervalo de manera que la medida de probabilidad se encuentra uniformemente distribuída sobre ese intervalo. Esto es, la probabilidad que la variable aleatoria tome un valor en cada subintervalo de igual longitud es la misma. 4 FDP Uniforme ~U(a,b) Momentos de la FDP: Ejemplo: redondeo del peso de una persona: 67 kg significa un peso entre 66.5 kg y 67.5 kg El error de redondeo se encuentra distribuído uniformemente en el rango [-0.5kg, 0.5 kg] 5 FDP Uniforme ~U(a,b) 6 Principio de indiferencia de Laplace http://en.wikipedia.org/wiki/Principle_of_indifference El principio de indiferencia (también llamado el principio de razón insuficiente) es una regla para asignar probabilidades epistémicas. Suponga por ejemplo que existen n>1 eventos mutuamente exclusivos y exhaustivos. El principio establece que si no se puede distingir estos n eventos, entonces a cada evento se le debe asignar una probabilidad igual a 1/n. Ejemplo: La dirección según la cual las ondas producidas por un terremoto pueden aproximarse a una estructura pueden considerarse en ausencia de información en contra, que se distribuye uniformemente en el intervalo [0○, 360○). 7 FDP Uniforme con MATLAB ● y = unifpdf(x,a,b); = fX(x;a,b) ● p = unifcdf(x,a,b); = FX(x;a,b) ● x = unifinv(p,a,b); (-1) ● [m,v] = unifstat(a,b) ; = media y varianza = FX (p;a,b) 8 Ejemplo FDP Uniforme 9 FDP Beta ~ B(α,β) La FDP Beta se utiliza para representar variables físicas cuyos valores se encuentran restringidos a un intervalo de longitud finita ej: distribución de artículos defectuosos sobre un intervalo de tiempo. Como es una FDP muy flexible, generalmente se utiliza para la descripción empírica de datos 10 FDP Beta ~B(α,β) 11 12 13 La FDA Beta ~B(α,β) 14 La FDP Beta de cuatro parámetros ~B(α,β,a,b) 15 FDP Beta con MATLAB ● y = betapdf(x,α,β); = fX(x;α,β) ● p = betacdf(x,α,β); = FX(x;α,β) ● x = betainv(p,α,β); (-1) = FX (p;α,β) ● [m,v] = betastat(α,β); = media y varianza 16 FDP Beta de 4 parámetros con MATLAB ● y = betapdf((x-a)/(b-a),α,β)/(b-a); = fX(x;α,β) ● p = betacdf((x-a)/(b-a),α,β); ● x = a+betainv(p,α,β)*(b-a); = FX(x;α,β) (-1) = FX (p;α,β,a,b) 17 FDP Beta con EXCEL ● ● p = DISTR.BETA(x;α;β;a;b) x = DISTR.BETA.INV(p;α;β;a;b) = FX(x;α,β,a,b) (-1) = FX (p;α,β,a,b) 18 Ejemplo: FDP beta Para planear las direcciones de las pistas de los aeropuertos, se debe estudiar las dispersiones de contaminantes de aire procedentes de los alrededores. Aquí la dirección predominante y la variación de estas son críticas. En el siguiente programa simulamos tales direcciones del viento. ¿Qué opina usted del modelo de la FDP beta para representar las direcciones del viento? 19 Ejemplo FDP Beta Resultado de la ejecución: 20 Observe que en este caso la FDP beta no es satisfactoria ya que existe una discontinuidad en la representación del viento que viene del este. 21 FDP exponencial Con la FDP exponencial se modela el lapso de tiempo entre dos eventos consecutivos de Poisson que ocurren de manera independiente y a una frecuencia constante. Ejemplo: intervalo de tiempo entre los arribos de vehículos a un punto En forma más general se usa para modelar tiempos entre los arribos en líneas de espera en un proceso de Poisson homogéneo. 22 FDP exponencial La FDP exponencial se puede entender como la contraparte continua de la FMP geométrica, la cual describe el número de ensayos de Bernoulli requeridos para que un proceso discreto cambie de estado. La FMP exponencial describe el tiempo para que un proceso continuo cambie de estado. 23 Ejemplos FDP exponencial ● Distancia entre grietas ● Distancia entre animalitos pisados en una carretera. ● Distancia entre las mutaciones en una cadena de ADN ● Vida útil de equipamiento electrónico ● ● ● ● ● Tiempo hasta qie una partícula radioactiva decae o el tiempo entre los ruidos de un contador geiger Dinero que las personas tienen en sus bolsillos Cantidad de tiempo (empezando ahora) hasta que el siguiente terremoto ocurra Tiempo que se debe esperar (desde ahora) antes de la siguiente llamada telefónica (entre las 2:30 y las 3:00 pm) Duración de una conversación telefónica 24 FDP exponencial ~ Exp(λ) ● La FDP es: ● La FDA es: 25 Parametrización alternativa de la FDP exponencial ● La FDP es: ● La FDA es: Es decir 26 Interpretación del parámetro λ ● θ=1/λ → Tiempo medio de falla (mean time to failure - MTTF): es el periodo o lapso promedio entre dos eventos independientes de Poisson. Ejemplo: tiempo promedio entre fallas/arribos: 5 segundos/vehículo. ● λ=1/θ → es la frecuencia de falla o promedio de sucesos por unidad de tiempo Ejemplo: frecuencia de fallas/arribos: 0.2 vehículos/segundo. 27 Interpretación del parámetro λ ● In real-world scenarios, the assumption of a constant rate (or probability per unit time) is rarely satisfied. For example, the rate of incoming phone calls differs according to the time of day. But if we focus on a time interval during which the rate is roughly constant, such as from 2 to 4 p.m. during work days, the exponential distribution can be used as a good approximate model for the time until the next phone call arrives 28 FDP exponencial ~ Exp(λ) 29 Algunas fórmulas FDP exponencial ● Función cuartil: ● Media: Si usted recibe en promedio dos llamadas telefónicas por hora, se espera que usted tenga que esperar media hora por cada llamada ● Varianza: 30 FDP exponencial con MATLAB ● y = exppdf(x,1/λ); = fX(x;λ) ● p = expcdf(x,1/λ); = FX(x;λ) (-1) ● x = expinv(p,1/λ); = FX (p;λ) ● [m,v] = expstat(1/λ) ; = media y varianza 31 FDP exponencial con EXCEL ● y = DISTR.EXP(x;λ;FALSO) = fX(x;λ) ● p = DISTR.EXP(x;λ;VERDADERO) = FX(x;λ) ● x = DISTR.GAMMA.INV(p;1;1/λ) (-1) = FX (p;λ) 32 Ejemplo 1: FDP exponencial Se sabe que la cantidad de tiempo que un empleado postal gasta con su cliente sigue una FDP exponencial, con un tiempo promedio de 4 minutos por cliente Cual es la probabilidad que un empleado postal emplee entre 4 y 5 minutos con un cliente seleccionado al azar? 33 Ejemplo 1: FDP exponencial Cual es la probabilidad que un empleado postal emplee entre 4 y 5 minutos con un cliente seleccionado al azar? 34 Ejemplo 1: FDP exponencial El 75% de los clientes son atendidos en cuanto tiempo? 35 Ejemplo 2: FDP exponencial En promedio, un circuito de un computador dura 10 años. El tiempo que los componentes electrónicos duran siguen una distribución exponencial. ¿Cuál es la probabilidad que ese tipo de circuitos duren más de 7 años? 36 Ejemplo 2: FDP exponencial En promedio, un circuito de un computador dura 10 años. ¿Cuánto es el tiempo de duración de 80% de los circuitos? 37 Ejemplo 2: FDP exponencial ¿Cuál es la probabilidad que una parte de computador dure entre 9 y 11 años? 38 Ejemplo 3: FDP exponencial Suponga que la longitud de una llamada telefónica se modela como una variable aleatoria que sigue una distribución exponencial. Suponga que el tiempo promedio de una llamada telefónica es 6 minutos. Si una persona llega al teléfono público justo antes que usted, más o menos cuánto tiempo le tocará esperar? ¿Cuál es la probabilidad que le toque esperar más de seis minutos? 39 Deducción de la FDP exponencial 40 Notas FDP exponencial Debido a la propiedad de estacionaridad y de independencia del suceso de Poisson, la PDF exponencial denota la probabilidad que no ocurra ningún suceso en un intervalo cualquiera de longitud t, comience o no en el tiempo 0. En resumen, los tiempos de interarribos de un proceso de Poisson son independientes y se distribuyen exponencialmente. 41 Propiedad de la falta de memoria Cuando una variable aleatoria es exponencial, entonces la FDP obedece: 42 Propiedad de la falta de memoria 43 Ejemplo 44 FDP normal o gausiana X~N(μ,σ) ● ● Es la más importante y la más abusada de las FDPs Las FDPs de muchas estadísticas muestrales tienden hacia la FDP normal conforme crece el tamaño de la muestra. 45 FDP normal o gausiana X~N(μ,σ) La FDP normal fue descubierta por Abraham de Moivre en 1733 tomando un límite de la FMP binomial, sin embargo comúnmente se conoce como FDP gausiana ya que Karl Friedrich Gauss la citó en un artículo en 1809. Abraham de Moivre (1667 – 1754), matemático francés descubridor de la distribución normal 46 FDP normal o gausiana X~N(μ,σ) ● La FDP: ● La FDA: debe integrarse numéricamente, ya que no tiene solución analítica 47 FDP normal o gausiana X~N(μ,σ) ● Media: ● Varianza: 48 49 Ejemplos de aplicación ● La resistencia a la compresión del concreto ● Coeficiente de inteligencia ~N(μ=100,σ=15) 50 Propiedades de la FDP gausiana ● ● fX(x) es simétrica alrededor de x=μ, la cual es al mismo tiempo la media, mediana y moda de la distribución, de hecho: Los puntos de inflección de fX(x) ocurren en x=μ+σ y x=μ-σ 51 Dominio de la FDP normal ● ● Teóricamente el dominio de la FDP normal fX(x) es (-∞,∞). En la práctica puede ser útil suponer que cierta variable, tal como la carga, el peso o el tiempo se limitan físicamente a valores no negativos. Por lo tanto, es importante observar las colas para entender mejor como manejar el dominio teórico (-∞,∞). 52 La FDA normal estándar Cambio de variables: donde, FDP normal estándar: observe que es equivalente a FX(x;0,1) 53 Transformación a la FDA normal estándar es una variable aleatoria normalmente distribuída ~N(μ=0,σ=1) por lo tanto, 54 Formulación alternativa de la FDA normal estándar La FDA normal estándar se puede escribir como: donde la función erf está dada por: NOTA: esta función ya está programada en MATLAB (erf)y en MS EXCEL (=ERF) 55 Probabilidades bajo la FDP normal 56 FDP normal con MS EXCEL ● p = DISTR.NORMAL(x;μ;σ;FALSO) = fX(x;μ;σ) ● p = DISTR.NORMAL(x;μ;σ;VERDADERO) = FX(x;μ;σ) (-1) ● x = DISTR.NORMAL.INV(p;μ;σ) = FX (x;μ;σ) ● p = DISTR.NORMAL.ESTAND(z) = FX(p;0,1) ● z = DISTR.NORMAL.ESTAND.INV(p) = FX(-1)(p;0,1) ● z = NORMALIZACION(x;μ;σ) 57 FDP normal con MATLAB ● y = normpdf(x,μ,σ); = fX(x;μ,σ) ● p = normcdf(x,μ,σ); = FX(x;μ,σ) ● x = norminv(p,μ,σ); (-1) = FX (p;μ,σ) ● [m,v] = normstat(μ,σ); = media y varianza 58 Dibujando la FDP normal con MATLAB dentro de los límites especificados ● p = normspec(specs,mu,sigma) 59 Ejemplo: FDP normal Una fábrica de tornillos debe producir un tornillo con especificación del diámetro igual a 2cm±0.1cm. Si el diámetro de los tornillos se distribuyen según ~N(2.02cm, 0.06cm), ¿cuál es la probabilidad de que un tornillo en la etapa de control de calidad sea desechado? 60 Dibujo de probabilidad normal en MATLAB con normplot http://en.wikipedia.org/wiki/Normal_probability_plot Este es un test visual de normalidad. 61 Ejemplo 1: FDP normal La resistencia de un cilindro de concreto se distribuye según una FDP normal con media 220 2 2 kgf/cm y una desviación estándar de 20 kgf/cm . Encuentre: ● La probabilidad que f'c sea menor que 200kgf/cm2 62 63 Ejemplo 1: FDP normal La resistencia de un cilindro de concreto se distribuye según una FDP normal con media 220 2 2 kgf/cm y una desviación estándar de 20 kgf/cm . Encuentre: ● La probabilidad que f'c sea a lo más 250kgf/cm2 64 Ejemplo 1: FDP normal La probabilidad que f'c esté entre 210 y 240kgf/cm 2: 65 Ejemplo 2: FDP normal ● ● La demanda mensual de un producto sigue una FDP N(μ=200 unidades,σ=40 unidades). ¿Qué tan grande debe ser el inventario disponible a principios de un mes de modo que la probabilidad de existencia de un producto sea de al menos 95%? 66 Ejemplo 2: FDP normal 67 Teorema del límite central 68 Convergencia en distribución 69 Teorema del límite central ● ● Este teorema será válido incluso si los sumandos de Xi no son i.i.d., aunque algunas restricciones con respecto a los grados de dependencia y la tasa de crecimiento de los momentos deben ser aún impuestas. Por ejemplo, puede que las variables aleatorias Xi no sean idénticamente distribuídas, siempre y cuando cada variable individual tenga poco efecto sobre la suma. 70 Teorema del límite central ● Puesto que la variable aleatoria en muchos fenómenos se origina a partir de variaciones aditivas, no es sorprendente que los histogramas que aproximan la FDP normal se observen frecuentemente en la naturaleza y que esta FDP se adopte a menudo como modelo en la práctica. 71 Ejemplo del teorema del límite central 72 Ejemplos: el teorema del límite central en la vida práctica ● ● ● La prueba del ICFES (como suma de puntos). Las cargas muertas y vivas de una estructura (se consideran como la suma de muchas fuerzas relativamente pequeñas, suponiendo que ninguna de ellas domina al total). La longitud total es la suma de las diferentes partes individuales: la longitud total de una distancia, el tiempo total gastado repitiendo varias operaciones idénticas en un programa de construcción suponiendo que los tiempos son independientes. 73 La combinación lineal de variables aleatorias normales también es normal Ejemplo: 74 Deducción de la FDP normal 75