2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 TEMA 9: DISTRIBUCIONES CONTINUAS 1. DISTRIBUCIÓN UNIFORME CONTINUA Esta es la más sencilla de las distribuciones continuas. Surge al considerar una variable aleatoria que toma valores equiprobables en un intervalo finito y su nombre se debe al hecho de que la densidad de la probabilidad de esta variable aleatoria es uniforme en todo su intervalo de definición. Sea un experimento aleatorio cuya variable aleatoria asociada toma valores en un intervalo finito, de manera que puede tomar cualquier valor de ese intervalo, entonces si la probabilidad de que la variable aleatoria tome un valor en cada subintervalo de la misma longitud es la misma, diremos que la variable aleatoria está distribuida uniformemente en ese intervalo. Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una distribución uniforme en el intervalo real [a,b], con -∞<a<b<+∞ ,si su función de densidad es: 1 , a xb f ( x) b a en el resto 0, Abreviadamente lo indicamos por XU(a,b) en donde a y b son los parámetros. Características: 1. Función de distribución de una U(a,b) es: xa 0, x xa P( X x) f ( x)dx , a xb a b a xb 1, ba 2. Media μ= (es el centro del intervalo de definición y en consecuencia coincide 2 con la mediana). 3. Varianza b a VAR(X)= 2 12 Ejemplo: Sea X una variable aleatoria que se distribuye de forma uniforme en el intervalo [3,9] . Hallar: función de densidad, función de distribución, Esperanza y varianza. Solución: f(x)= 1/6 0 3 x 9 resto 0 x<3 F(x)= (x-3)/6 3 x 9 1 x>9 E[X]=6 y VAR[X]=3 1 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 2. DISTRIBUCIÓN NORMAL La distribución normal o distribución de Gauss es sin duda la más importante y la de más aplicación de todas las distribuciones continuas. Esta distribución es bastante adecuada para describir la distribución de muchos conjuntos de datos que ocurren en la naturaleza, la industria y la navegación. Así pues para los siguientes conjuntos de datos, se puede considerar adecuada la distribución normal: - Datos meteorológicos correspondientes a temperaturas, lluvias, etc. - Las clasificaciones correspondientes a pruebas de aptitud. - Las alturas de individuos de una edad y sexo dado. - Las medidas físicas de productos manufacturados. - La vida media de un tipo de lámparas con un voltaje dado, etc. Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una distribución normal de parámetros μ y σ si su función de densidad es: ( x )2 1 2 f ( x) e 2 , -∞< x<+∞ 2 donde μ , σ y tales que -∞<μ<+∞ y σ>0. (π=3,14159... , e=2,71828 ) Abreviadamente la indicaremos por XN(μ,σ) Veamos ahora la representación gráfica de la función de densidad f(x) de la N( μ,σ). Para ello veremos que se cumplen las siguientes propiedades: 1. f(x) es continua en toda la recta real. 2. f(x) es simétrica respecto de x = μ es decir es simétrica respecto del parámetro μ. 3. f(x) tiene como asíntota horizontal el eje de abscisas. 4. f(x) es estrictamente creciente cuando x<μ, y estrictamente decreciente cuando x>μ. 5. f(x) presenta un máximo cuando x=μ, ese máximo vale f(μ)= 1 2 El gráfico nos muestra la representación gráfica de la función de densidad, f(x), de una distribución normal de parámetros μ y σ: Se observa que tiene forma de campana, de aquí que frecuentemente se le llame campana de Gauss. También se pone de manifiesto que el parámetro μ corresponde al 2 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 máximo y al centro de la distribución y el parámetro σ nos da idea del grado de apertura o aplastamiento de la curva f(x). Relación entre la N(μ,σ) y la N(0,1) ( x )2 1 2 e 2 Veamos pues que la expresión f ( x) nos da la función de densidad 2 de una familia de distribuciones normales para los diferentes valores de los parámetros μ y σ. Dentro de esta familia de distribuciones normales hay una muy importante, que corresponde a los valores de los parámetros μ=0 y σ=1, es decir la distribución N(0, 1) y recibe el nombre de distribución tipificada o estándar, cuya correspondiente función de densidad se obtiene haciendo μ=0 y σ=1 en la expresión 1 f ( x) e 2 ( x )2 2 2 : 1 2x f ( x) e , x 2 2 Proposición: Si X es una variable aleatoria con distribución N(μ,σ), entonces la variable aleatoria tipificada Z=(X-μ)/σ sigue una distribución N(0,1). Características: 1. Función de distribución correspondiente a una variable aleatoria X distribuida según una N(μ,σ) será: 1 F(x)=P(X ≤x) 2 ( x )2 x e 2 2 dx , -∞<x<+<∞ 2. Media: E [X]=μ El parámetro μ es la media de la distribución. Sabemos que la función de densidad f(x) de una N(μ,σ) es simétrica respecto de su media μ, es decir P[X≤μ ]= P [X≥μ] = 0,5 lo cual nos permite decir que el parámetro μ es la mediana de la distribución. La función de densidad f(x) presentaba un máximo para x= μ ,lo cual nos indica que el parámetro μ es la moda de la distribución. En consecuencia diremos que en una distribución N( μ,σ), la media, la mediana y la moda coinciden con el parámetro μ. 3. Varianza. VAR[X] = σ² Luego el parámetro σ que utilizamos en la N( μ,σ) es la desviación típica de la distribución, y en el caso de la N(0,1) la desviación típica es la unidad. Utilización de las tablas: En la tabla de tablas estadísticas aparece tabulada la función de distribución de una N(0,1). Como la función de densidad de la distribución normal es completamente simétrica, en este caso respecto al parámetro de media μ=0, se da una sola tabla de valores de Z, incluyendo solamente los valores positivos de Z. 3 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 Para indicar el uso de la tabla consideramos las siguientes reglas básicas: 1. P(X≤-a)=1-P(X≤a) 2. P(X>a)=1-P(X≤a) 3. P(a≤X≤b)=P(X≤b)-P(X≤a) 4. P(-a≤X≤a)=2P(X≤a)-1 5. P(-a≤X≤b)=P(X≤b)+P(X≤a)-1 6. P(-a≤X≤-b)=P(X≤a)-P(X≤b) Propiedades 1. Propiedad reproductiva. La suma de n variables aleatorias independientes, X1 , X 2 ,..., X n y distribuidas según una N i , i , i = 1, 2, ..., n, sigue una distribución N ( μ1 +....+ n , 12 ... n2 ) 2. Si X1 , X 2 ,..., X n son n variables aleatorias independientes e idénticamente distribuidas, según una N(μ,σ), entonces la variable aleatoria suma de las n variables Y= X1 X 2 ... X n sigue una distribución N( nμ, n ) 3. Si X1 , X 2 ,..., X n son n variables aleatorias independientes e idénticamente distribuidas, según una N(μ,σ), entonces la variable aleatoria media aritmética de estas n variables X X 1 X 2 ... X n sigue una distribución N(μ ,σ/ n ). n Relación entre las distribuciones Binomial, Poisson y Normal : Una variable aleatoria X con distribución B(n,p) se puede aproximar a una distribución N(μ,σ), siendo μ=np y σ= npq cuando n sea suficientemente grande, es decir cuando np > 5 y p ≤1/2. Sabemos que la media de la distribución de Poisson coincide con el parámetro λ, y cuando este parámetro es demasiado grande, puede utilizarse la distribución normal para aproximar la distribución de Poisson. En la práctica la aproximación es aceptable si λ≥10, aunque algunos autores aceptan la aproximación cuando λ > 5. El procedimiento práctico es análogo al caso de la binomial, así pues si tenemos una variable aleatoria X que se distribuye según una distribución de Poisson de parámetro λ, P(λ), siendo λ≥10, podemos aproximar esta distribución de Poisson por una distribución normal N(λ,σ), en donde la media λ es μ= E[X] = λ y la desviación típica σ, es σ= Ejemplo: Sea XN(200, 20). Determinar las siguientes probabilidades: a) P(185<X<210) b) P(215<X<250) c)P(X>240) Solución: a) 0,4649 b)0,2204 c)0,0228 d) 0,8643 d) P(X>178) 4 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 3. DISTRIBUCIÓN GAMMA Previamente vamos a definir la función gamma como una función del análisis matemático y que después utilizaremos en varios modelos o distribuciones probabilísticas de tipo continuo. Así pues, definimos la función gamma de p , Γ(p) como: Γ(p)= x p1 e x dx, p>0 0 Integrando por partes se tendrá: Γ(p)=(p-1)! Dos casos particulares son: Γ(1)=1 , Γ(1/2)= (para p no entero pero si positivo) Una vez que hemos definido esta función gamma, la vamos a aplicar para definir la distribución de probabilidad gamma, pues son muchas las aplicaciones de esta distribución a experimentos o fenómenos aleatorios que tienen asociadas variables aleatorias que siempre son no negativas y cuyas distribuciones son sesgadas a la derecha, es decir, el área bajo la función de densidad disminuye a medida que nos alejamos del origen. Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una distribución gamma de parámetros p y a, siendo p,a y p>0 y a>0, XΓ(p,a), si su función de densidad es : a p p 1 ax x e ,x0 f ( x) ( p ) 0 ,x0 Esta distribución se aplica para representar las siguientes distribuciones: - Intervalos de tiempo entre dos fallos de un motor. - Intervalos de tiempo entre dos llegadas de automóviles a una gasolinera. - Tiempos de vida de sistemas electrónicos, etc. Características: 1. Función de distribución a p x p 1 ax x e dx, x 0 F ( x) P( X x) ( p) 0 0, x0 El valor de esta expresión no es fácil de obtener, aunque cuando p es entero positivo , la integral se puede calcular por partes y las probabilidades se obtienen de forma aproximada. Con el fin de simplificar el cálculo de estas probabilidades Pearson tabuló la función gamma incompleta para diferentes valores del parámetro p, que viene dada por : 5 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 y 1 F ( y) y p 1e y dy, y 0 ( p ) 0 * 2. Media: E[X]=p/a 3. Varianza: Var(X)=p/a² 4. Propiedad reproductiva Si X1 , X 2 ,..., X n son n variables aleatorias independientes, distribuidas según una Γ( pi , a ), para i=1,...,n. Entonces la variable aleatoria Y= X1 X 2 ... X n sigue una distribución Γ( p1 ... pn , a). Ejemplo: Sea X una variable aleatoria con distribución gamma con p=2 y a=50. ¿Cuál es la probabilidad de que X tome un valor menor al valor de la media?. Solución: 0,594 4. DISTRIBUCIÓN EXPONENCIAL Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una distribución exponencial de parámetro a , siendo a y a >0, XExp( a ), si su función de densidad es a e ax , x>0 f(x)= , x0 0 Esta distribución es un caso particular de la distribución Γ(p, a ) para p=1, hecho que tendremos en cuenta para el estudio de sus características. Esta distribución está relacionada con la de Poisson, así pues si el número de sucesos que ocurren en un determinado intervalo sigue una distribución de Poisson, entonces la variable aleatoria que representa el tiempo entre ocurrencia de sucesos sigue una distribución exponencial. Así, por ejemplo, si el número de ventas semanales de un cierto modelo de coche sigue una distribución de Poisson, entonces el tiempo transcurrido entre las ventas seguirá una distribución exponencial. También se pueden modelizar mediante la distribución exponencial las siguientes situaciones: - la duración de la prestación de un servicio. - el tiempo entre llegadas sucesivas a una cola o punto de servicio. - el tiempo de duración de algunos equipos, etc. Características: 1. Función de distribución 1 e ax , x>0 f ( x) P( X x) , x0 0 6 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 2. Media : E[X]=1/a 3.Varianza : Var(X)=1/a² Ejemplo: El tiempo transcurrido entre la llegada de dos clientes consecutivos al departamento de ventas de un concesionario de una determinada marca de automóviles, es de 20 minutos. Calcular la probabilidad de que el tiempo transcurrido entre la llegada de dos clientes consecutivos no supere la media hora. Solución: E[X]=1/a=20 luego a= 0,05. P(X 30 )=0,7769. 5. DISTRIBUCIÓN BETA Previamente vamos a definir la función beta de p y q, β(p,q) como : 1 p, q x p1 1 x q 1 dx, p 0, q 0 0 Se verifica también : β(p,q)=(Γ(p)Γ(q))/Γ(p+q) Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una distribución beta de parámetros p y q, siendo p,q y p>0 y q>0, Xβ(p,q), si su función de densidad es: 1 x p 1 (1 x)q 1 , 0<x<1 f ( x) ( p, q) 0 , en el resto O bien q 1 ( p q) p 1 x 1 x , 0<x<1 f ( x ) ( p ) ( q ) 0 , en el resto Observemos que esta función de densidad está definida en el intervalo (0,1), lo cual nos indica que esta familia de distribuciones beta es muy útil para representar modelos probabilísticos que representan proporciones, tales como: - La fracción de tiempo que un equipo está en reparación. - La proporción de piezas defectuosas de un lote. - La proporción del gasto de una familia en alimentación con respecto a los ingresos totales. - La participación de la producción de una empresa con respecto al total de lo producido en ese sector, etc. Características 1. Función de distribución La expresión de la función de distribución es: 7 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 0 x 1 q 1 F ( x) x p 1 1 x dx 0 ( p, q ) 1, ,x0 , 0<x<1 , x 1 2. Media: E[X]=p/(p+q) 3. Varianza: Var(X)=(pq)/(p+q+1)(p+q)²) Ejemplo: Una comunidad de vecinos dispone de un depósito que contiene una cantidad fija de combustible para la calefacción central y que es rellenado cada mes. La experiencia acumulada durante muchos meses permite representar la proporción de reserva utilizada cada mes mediante un modelo de distribución Beta con parámetros p=4 y q=2. Calcule la probabilidad de que un mes determinado se utilice más del 75% de la reserva de combustible. Solución: Su función de densidad será: f(x) = 20x3(1-x) si 0<x<1 y f(x)=0 en otro caso. Luego P(x>0,75)= f ( x)dx =0,3672 0 , 75 8 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 EJERCICIOS TEMA 9 1. De la parada del autobús que recorre la línea Algeciras-San Roque sale un autobús cada 15 minutos. Un viajero llega de improviso en cualquier momento. Obtener: a) La función de distribución de la v.a. tiempo de espera hasta que salga el próximo autobús. b) Probabilidad de que el viajero espere menos de 5 minutos. c) La media y la varianza de la v.a. tiempo de espera. d) Probabilidad de que el viajero espere exactamente 10 minutos. 2. El tiempo que tarda un alumno para ir de su domicilio a la facultad varía entre 30 y 40 minutos. Diariamente debe llegar a clase a las 9 horas. Deseamos saber: a) El tiempo medio que tarda en ir a clase y la varianza. b) A qué hora debe salir de su casa para tener una probabilidad de 0’8 de no llegar tarde a clase. 3. Sea una v.a. X distribuida según una normal con media μ=50 y desviación típica =8. Obtener: a) Probabilidad de que X tome valores entre 38 y 58. b) Probabilidad de que X tome un valor mayor que 66. 4. Supongamos que la demanda semanal de un artículo sigue una distribución normal de media μ =100 y desviación típica =20. ¿Qué existencias deben tener al principio de la semana para poder satisfacer la demanda con una probabilidad de 0’95? 5. Una determinada compañía dedicada a la exportación de frutas y hortalizas ha observado que el peso de los melones que cultiva para ser exportados sigue una distribución normal con media μ =1’7 kgs. y desviación típica =100 grs. Se desea conocer: a) La proporción de melones que pesan menos de 2 kgs. b) Sabiendo que son rechazados para la exportación aquellos melones cuyo peso difiere en más de 300 grs. del peso medio, determinar la proporción de melones que se rechazan. 6. El “tiempo de duración en horas” X de una pieza de un cierto equipo se distribuye según una distribución gamma de parámetros p=3 y a=0’2. Determinar: a) Probabilidad de que el equipo funcione más de 10 horas. b) Probabilidad de que el equipo funcione entre 10 y 15 horas. 9 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 7. En un parking público se ha observado que los coches llegan aleatoria e independientemente a razón de 360 coches por hora: a) Utilizando la distribución exponencial encontrar la probabilidad de que el próximo coche no llegará en los próximos 30 segundos. b) Utilizando la distribución de Poisson obtener la misma probabilidad anterior. 8. Si consideramos una v.a. X que representa la proporción de personas que consumen una determinada marca de aceite de oliva y que sigue una distribución beta de parámetros p=1 y q=1, determinar la probabilidad de que dicha proporción esté comprendida entre el 10% y el 50%. 9. El depósito central de agua potable de un determinado municipio se llena una vez por semana, los domingos. Observando el consumo de agua de años anteriores se llegó a la conclusión de que la proporción de agua del depósito que se distribuye durante la semana se podía representar por una distribución beta de parámetros p=3 y q=2. Determinar la probabilidad de que se distribuya al menos el 80% de agua del depósito central durante una semana. 10. Un transportista tiene una avería en su camión de forma aleatoria y uniforme a lo largo del trayecto de 100 kms. desde el origen al destino. Calcular: a) Probabilidad de que el lugar donde se avería diste más de 2 veces del origen que del destino. b) Distancia media desde el destino al punto en que se produce la avería. 11. El sistema de control de calidad de una planta industrial consta de 3 subsistemas que deben funcionar simultáneamente para efectuar el control completo. Si los tiempos de funcionamiento, de los 3 subsistemas, son independientes y se distribuyen (en horas) respectivamente N(45,5), N(47,3) y N(50,6), se pide calcular la probabilidad de que el sistema funcione las 40 horas laborables de una semana, si al comienzo de la semana se renuevan los subsistemas. 12. Un sistema electrónico está compuesto por dos circuitos cuyos tiempos de vida son independientes y se distribuyen (6,2) y (8,4) respectivamente, en miles de horas. El sistema funciona mientras funcione alguno de los dos circuitos. Se pide: a) Probabilidad de que el sistema funcione más de 4.000 horas. b) Vida esperada de cada circuito 13. Sea X la v.a. “tiempo de duración hasta su adquisición de cierto producto en el escaparate de un comercio”, y se distribuye Exp(0,2) en días. Obtener: a) Tiempo esperado del producto en el escaparate. b) Desviación típica del tiempo de exposición. 10 2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9 14. Un supermercado está interesado en controlar la calidad de los servicios que presta a sus clientes y comprueba que el tiempo que una cajera emplea en atender a un cliente sigue una distribución Gamma con media de 6 minutos y varianza 12 minutos2. a) Calcule la probabilidad de que una persona sea atendida durante más de 10 minutos en una caja. b) Si dos amigos, que han comprado de forma independiente, se dirigen juntos a la caja para pagar sus respectivas compras, ¿cuál es la probabilidad de que el tiempo total que la cajera emplea en atender a los dos sea inferior a 6 minutos? 11