TEMA 9: Distribuciones continuas

Anuncio
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
TEMA 9: DISTRIBUCIONES CONTINUAS
1. DISTRIBUCIÓN UNIFORME CONTINUA
Esta es la más sencilla de las distribuciones continuas. Surge al considerar una variable
aleatoria que toma valores equiprobables en un intervalo finito y su nombre se debe al
hecho de que la densidad de la probabilidad de esta variable aleatoria es uniforme en
todo su intervalo de definición.
Sea un experimento aleatorio cuya variable aleatoria asociada toma valores en un
intervalo finito, de manera que puede tomar cualquier valor de ese intervalo, entonces si
la probabilidad de que la variable aleatoria tome un valor en cada subintervalo de la
misma longitud es la misma, diremos que la variable aleatoria está distribuida
uniformemente en ese intervalo.
Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una
distribución uniforme en el intervalo real [a,b], con -∞<a<b<+∞ ,si su función de
densidad es:
 1
, a xb

f ( x)   b  a

en el resto
0,
Abreviadamente lo indicamos por XU(a,b) en donde a y b son los parámetros.
Características:
1. Función de distribución de una U(a,b) es:
xa
0,
x
xa

P( X  x)   f ( x)dx  
, a xb
a
b  a
xb

1,
ba
2. Media μ=
(es el centro del intervalo de definición y en consecuencia coincide
2
con la mediana).
3. Varianza
b  a 
VAR(X)=
2
12
Ejemplo: Sea X una variable aleatoria que se distribuye de forma uniforme en el
intervalo [3,9] . Hallar: función de densidad, función de distribución, Esperanza y
varianza.
Solución:
f(x)=
1/6
0
3 x  9
resto
0
x<3
F(x)= (x-3)/6 3  x  9
1
x>9
E[X]=6 y VAR[X]=3
1
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
2. DISTRIBUCIÓN NORMAL
La distribución normal o distribución de Gauss es sin duda la más importante y la de
más aplicación de todas las distribuciones continuas. Esta distribución es bastante
adecuada para describir la distribución de muchos conjuntos de datos que ocurren en la
naturaleza, la industria y la navegación. Así pues para los siguientes conjuntos de datos,
se puede considerar adecuada la distribución normal:
- Datos meteorológicos correspondientes a temperaturas, lluvias, etc.
- Las clasificaciones correspondientes a pruebas de aptitud.
- Las alturas de individuos de una edad y sexo dado.
- Las medidas físicas de productos manufacturados.
- La vida media de un tipo de lámparas con un voltaje dado, etc.
Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una
distribución normal de parámetros μ y σ si su función de densidad es:
 ( x   )2
1
2
f ( x) 
e 2 ,
-∞< x<+∞
 2
donde μ , σ   y tales que -∞<μ<+∞ y σ>0. (π=3,14159... , e=2,71828 )
Abreviadamente la indicaremos por XN(μ,σ)
Veamos ahora la representación gráfica de la función de densidad f(x) de la N( μ,σ).
Para ello veremos que se cumplen las siguientes propiedades:
1. f(x) es continua en toda la recta real.
2. f(x) es simétrica respecto de x = μ es decir es simétrica respecto del parámetro μ.
3. f(x) tiene como asíntota horizontal el eje de abscisas.
4. f(x) es estrictamente creciente cuando x<μ, y estrictamente decreciente cuando
x>μ.
5. f(x) presenta un máximo cuando x=μ, ese máximo vale f(μ)= 1
 2
El gráfico nos muestra la representación gráfica de la función de densidad, f(x), de una
distribución normal de parámetros μ y σ:
Se observa que tiene forma de campana, de aquí que frecuentemente se le llame
campana de Gauss. También se pone de manifiesto que el parámetro μ corresponde al
2
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
máximo y al centro de la distribución y el parámetro σ nos da idea del grado de apertura
o aplastamiento de la curva f(x).
Relación entre la N(μ,σ) y la N(0,1)
 ( x   )2
1
2
e 2
Veamos pues que la expresión f ( x) 
nos da la función de densidad
 2
de una familia de distribuciones normales para los diferentes valores de los parámetros
μ y σ. Dentro de esta familia de distribuciones normales hay una muy importante, que
corresponde a los valores de los parámetros μ=0 y σ=1, es decir la distribución N(0, 1)
y recibe el nombre de distribución tipificada o estándar, cuya correspondiente función
de densidad se obtiene haciendo μ=0 y σ=1 en la expresión
1
f ( x) 
e
 2
 ( x   )2
2 2
:
1 2x
f ( x) 
e ,    x  
2
2
Proposición: Si X es una variable aleatoria con distribución N(μ,σ), entonces la variable
aleatoria tipificada Z=(X-μ)/σ sigue una distribución N(0,1).
Características:
1. Función de distribución correspondiente a una variable aleatoria X distribuida según
una N(μ,σ) será:
1
F(x)=P(X ≤x) 
 2
 ( x   )2
x

e
2 2
dx , -∞<x<+<∞

2. Media: E [X]=μ
El parámetro μ es la media de la distribución. Sabemos que la función de densidad f(x)
de una N(μ,σ) es simétrica respecto de su media μ, es decir P[X≤μ ]= P [X≥μ] = 0,5 lo
cual nos permite decir que el parámetro μ es la mediana de la distribución.
La función de densidad f(x) presentaba un máximo para x= μ ,lo cual nos indica que el
parámetro μ es la moda de la distribución.
En consecuencia diremos que en una distribución N( μ,σ), la media, la mediana y la
moda coinciden con el parámetro μ.
3. Varianza. VAR[X] = σ²
Luego el parámetro σ que utilizamos en la N( μ,σ) es la desviación típica de la
distribución, y en el caso de la N(0,1) la desviación típica es la unidad.
Utilización de las tablas:
En la tabla de tablas estadísticas aparece tabulada la función de distribución de una
N(0,1).
Como la función de densidad de la distribución normal es completamente simétrica, en
este caso respecto al parámetro de media μ=0, se da una sola tabla de valores de Z,
incluyendo solamente los valores positivos de Z.
3
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
Para indicar el uso de la tabla consideramos las siguientes reglas básicas:
1. P(X≤-a)=1-P(X≤a)
2. P(X>a)=1-P(X≤a)
3. P(a≤X≤b)=P(X≤b)-P(X≤a)
4. P(-a≤X≤a)=2P(X≤a)-1
5. P(-a≤X≤b)=P(X≤b)+P(X≤a)-1
6. P(-a≤X≤-b)=P(X≤a)-P(X≤b)
Propiedades
1. Propiedad reproductiva.
La suma de n variables aleatorias independientes, X1 , X 2 ,..., X n y distribuidas según
una N  i , i  , i = 1, 2, ..., n, sigue una distribución N ( μ1 +....+ n ,  12  ...   n2 )
2. Si X1 , X 2 ,..., X n son n variables aleatorias independientes e idénticamente
distribuidas, según una N(μ,σ), entonces la variable aleatoria suma de las n variables
Y= X1  X 2  ...  X n sigue una distribución N( nμ, n )
3. Si X1 , X 2 ,..., X n son n variables aleatorias independientes e idénticamente
distribuidas, según una N(μ,σ), entonces la variable aleatoria media aritmética de estas n
variables X  X 1  X 2  ...  X n sigue una distribución N(μ ,σ/ n ).
n
Relación entre las distribuciones Binomial, Poisson y Normal :
Una variable aleatoria X con distribución B(n,p) se puede aproximar a una distribución
N(μ,σ), siendo μ=np y σ= npq cuando n sea suficientemente grande, es decir cuando
np > 5 y p ≤1/2.
Sabemos que la media de la distribución de Poisson coincide con el parámetro λ, y
cuando este parámetro es demasiado grande, puede utilizarse la distribución normal para
aproximar la distribución de Poisson. En la práctica la aproximación es aceptable si
λ≥10, aunque algunos autores aceptan la aproximación cuando λ > 5.
El procedimiento práctico es análogo al caso de la binomial, así pues si tenemos una
variable aleatoria X que se distribuye según una distribución de Poisson de parámetro λ,
P(λ), siendo λ≥10, podemos aproximar esta distribución de Poisson por una
distribución normal N(λ,σ), en donde la media λ es μ= E[X] = λ y la desviación típica
σ, es σ= 
Ejemplo: Sea XN(200, 20). Determinar las siguientes probabilidades:
a) P(185<X<210)
b) P(215<X<250)
c)P(X>240)
Solución:
a) 0,4649 b)0,2204
c)0,0228
d) 0,8643
d) P(X>178)
4
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
3. DISTRIBUCIÓN GAMMA
Previamente vamos a definir la función gamma como una función del análisis
matemático y que después utilizaremos en varios modelos o distribuciones
probabilísticas de tipo continuo.
Así pues, definimos la función gamma de p , Γ(p) como:

Γ(p)=  x p1  e x dx, p>0
0
Integrando por partes se tendrá:
Γ(p)=(p-1)!
Dos casos particulares son: Γ(1)=1 , Γ(1/2)=  (para p no entero pero si positivo)
Una vez que hemos definido esta función gamma, la vamos a aplicar para definir la
distribución de probabilidad gamma, pues son muchas las aplicaciones de esta
distribución a experimentos o fenómenos aleatorios que tienen asociadas variables
aleatorias que siempre son no negativas y cuyas distribuciones son sesgadas a la
derecha, es decir, el área bajo la función de densidad disminuye a medida que nos
alejamos del origen.
Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una
distribución gamma de parámetros p y a, siendo p,a   y p>0 y a>0, XΓ(p,a), si su
función de densidad es :
 a p p 1  ax
x e
,x0

f ( x)   ( p )
0
,x0

Esta distribución se aplica para representar las siguientes distribuciones:
- Intervalos de tiempo entre dos fallos de un motor.
- Intervalos de tiempo entre dos llegadas de automóviles a una gasolinera.
- Tiempos de vida de sistemas electrónicos, etc.
Características:
1. Función de distribución
 a p x p 1  ax
x  e dx, x  0

F ( x)  P( X  x)   ( p) 0
0,
x0

El valor de esta expresión no es fácil de obtener, aunque cuando p es entero positivo , la
integral se puede calcular por partes y las probabilidades se obtienen de forma
aproximada. Con el fin de simplificar el cálculo de estas probabilidades Pearson tabuló
la función gamma incompleta para diferentes valores del parámetro p, que viene dada
por :
5
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
y
1
F ( y) 
y p 1e y dy, y  0

( p ) 0
*
2. Media: E[X]=p/a
3. Varianza: Var(X)=p/a²
4. Propiedad reproductiva
Si X1 , X 2 ,..., X n son n variables aleatorias independientes, distribuidas según una
Γ( pi , a ), para i=1,...,n. Entonces la variable aleatoria Y= X1  X 2  ...  X n sigue una
distribución Γ( p1  ...  pn , a).
Ejemplo: Sea X una variable aleatoria con distribución gamma con p=2 y a=50. ¿Cuál
es la probabilidad de que X tome un valor menor al valor de la media?.
Solución: 0,594
4. DISTRIBUCIÓN EXPONENCIAL
Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una
distribución exponencial de parámetro a , siendo a   y a >0, XExp( a ), si su
función de densidad es
a  e ax ,
x>0
f(x)= 
,
x0
0
Esta distribución es un caso particular de la distribución Γ(p, a ) para p=1, hecho que
tendremos en cuenta para el estudio de sus características.
Esta distribución está relacionada con la de Poisson, así pues si el número de sucesos
que ocurren en un determinado intervalo sigue una distribución de Poisson, entonces la
variable aleatoria que representa el tiempo entre ocurrencia de sucesos sigue una
distribución exponencial. Así, por ejemplo, si el número de ventas semanales de un
cierto modelo de coche sigue una distribución de Poisson, entonces el tiempo
transcurrido entre las ventas seguirá una distribución exponencial.
También se pueden modelizar mediante la distribución exponencial las siguientes
situaciones:
- la duración de la prestación de un servicio.
- el tiempo entre llegadas sucesivas a una cola o punto de servicio.
- el tiempo de duración de algunos equipos, etc.
Características:
1. Función de distribución
1  e ax , x>0
f ( x)  P( X  x)  
, x0
0
6
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
2. Media : E[X]=1/a
3.Varianza : Var(X)=1/a²
Ejemplo: El tiempo transcurrido entre la llegada de dos clientes consecutivos al
departamento de ventas de un concesionario de una determinada marca de automóviles,
es de 20 minutos. Calcular la probabilidad de que el tiempo transcurrido entre la llegada
de dos clientes consecutivos no supere la media hora.
Solución:
E[X]=1/a=20 luego a= 0,05. P(X  30 )=0,7769.
5. DISTRIBUCIÓN BETA
Previamente vamos a definir la función beta de p y q, β(p,q) como :
1
  p, q    x p1 1  x 
q 1
dx, p  0, q  0
0
Se verifica también : β(p,q)=(Γ(p)Γ(q))/Γ(p+q)
Definición: Diremos que una variable aleatoria X, de tipo continuo, sigue una
distribución beta de parámetros p y q, siendo p,q   y p>0 y q>0, Xβ(p,q), si su
función de densidad es:
 1
x p 1 (1  x)q 1 , 0<x<1

f ( x)    ( p, q)
0
, en el resto

O bien
q 1
 ( p  q) p 1
x 1  x  , 0<x<1

f ( x )    ( p ) ( q )
0
, en el resto

Observemos que esta función de densidad está definida en el intervalo (0,1), lo cual nos
indica que esta familia de distribuciones beta es muy útil para representar modelos
probabilísticos que representan proporciones, tales como:
- La fracción de tiempo que un equipo está en reparación.
- La proporción de piezas defectuosas de un lote.
- La proporción del gasto de una familia en alimentación con respecto a los ingresos
totales.
- La participación de la producción de una empresa con respecto al total de lo
producido en ese sector, etc.
Características
1. Función de distribución
La expresión de la función de distribución es:
7
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
0
x
1
q 1

F ( x)   
x p 1 1  x  dx
 0  ( p, q )
1,
,x0
, 0<x<1
, x 1
2. Media: E[X]=p/(p+q)
3. Varianza: Var(X)=(pq)/(p+q+1)(p+q)²)
Ejemplo: Una comunidad de vecinos dispone de un depósito que contiene una cantidad
fija de combustible para la calefacción central y que es rellenado cada mes. La
experiencia acumulada durante muchos meses permite representar la proporción de
reserva utilizada cada mes mediante un modelo de distribución Beta con parámetros
p=4 y q=2. Calcule la probabilidad de que un mes determinado se utilice más del 75%
de la reserva de combustible.
Solución:
Su función de densidad será: f(x) = 20x3(1-x) si 0<x<1 y f(x)=0 en otro caso.

Luego P(x>0,75)=
 f ( x)dx
=0,3672
0 , 75
8
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
EJERCICIOS TEMA 9
1. De la parada del autobús que recorre la línea Algeciras-San Roque sale un autobús
cada 15 minutos. Un viajero llega de improviso en cualquier momento. Obtener:
a) La función de distribución de la v.a. tiempo de espera hasta que salga el próximo
autobús.
b) Probabilidad de que el viajero espere menos de 5 minutos.
c) La media y la varianza de la v.a. tiempo de espera.
d) Probabilidad de que el viajero espere exactamente 10 minutos.
2. El tiempo que tarda un alumno para ir de su domicilio a la facultad varía entre 30 y
40 minutos. Diariamente debe llegar a clase a las 9 horas. Deseamos saber:
a) El tiempo medio que tarda en ir a clase y la varianza.
b) A qué hora debe salir de su casa para tener una probabilidad de 0’8 de no llegar
tarde a clase.
3. Sea una v.a. X distribuida según una normal con media μ=50 y desviación típica
=8. Obtener:
a) Probabilidad de que X tome valores entre 38 y 58.
b) Probabilidad de que X tome un valor mayor que 66.
4. Supongamos que la demanda semanal de un artículo sigue una distribución normal
de media μ =100 y desviación típica =20. ¿Qué existencias deben tener al principio
de la semana para poder satisfacer la demanda con una probabilidad de 0’95?
5. Una determinada compañía dedicada a la exportación de frutas y hortalizas ha
observado que el peso de los melones que cultiva para ser exportados sigue una
distribución normal con media μ =1’7 kgs. y desviación típica =100 grs. Se desea
conocer:
a) La proporción de melones que pesan menos de 2 kgs.
b) Sabiendo que son rechazados para la exportación aquellos melones cuyo peso
difiere en más de 300 grs. del peso medio, determinar la proporción de melones
que se rechazan.
6. El “tiempo de duración en horas” X de una pieza de un cierto equipo se distribuye
según una distribución gamma de parámetros p=3 y a=0’2. Determinar:
a) Probabilidad de que el equipo funcione más de 10 horas.
b) Probabilidad de que el equipo funcione entre 10 y 15 horas.
9
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
7. En un parking público se ha observado que los coches llegan aleatoria e
independientemente a razón de 360 coches por hora:
a) Utilizando la distribución exponencial encontrar la probabilidad de que el
próximo coche no llegará en los próximos 30 segundos.
b) Utilizando la distribución de Poisson obtener la misma probabilidad anterior.
8. Si consideramos una v.a. X que representa la proporción de personas que consumen
una determinada marca de aceite de oliva y que sigue una distribución beta de
parámetros p=1 y q=1, determinar la probabilidad de que dicha proporción esté
comprendida entre el 10% y el 50%.
9. El depósito central de agua potable de un determinado municipio se llena una vez
por semana, los domingos. Observando el consumo de agua de años anteriores se
llegó a la conclusión de que la proporción de agua del depósito que se distribuye
durante la semana se podía representar por una distribución beta de parámetros p=3
y q=2. Determinar la probabilidad de que se distribuya al menos el 80% de agua del
depósito central durante una semana.
10. Un transportista tiene una avería en su camión de forma aleatoria y uniforme a lo
largo del trayecto de 100 kms. desde el origen al destino. Calcular:
a) Probabilidad de que el lugar donde se avería diste más de 2 veces del origen que
del destino.
b) Distancia media desde el destino al punto en que se produce la avería.
11. El sistema de control de calidad de una planta industrial consta de 3 subsistemas que
deben funcionar simultáneamente para efectuar el control completo. Si los tiempos
de funcionamiento, de los 3 subsistemas, son independientes y se distribuyen (en
horas) respectivamente N(45,5), N(47,3) y N(50,6), se pide calcular la probabilidad
de que el sistema funcione las 40 horas laborables de una semana, si al comienzo de
la semana se renuevan los subsistemas.
12. Un sistema electrónico está compuesto por dos circuitos cuyos tiempos de vida son
independientes y se distribuyen (6,2) y (8,4) respectivamente, en miles de horas.
El sistema funciona mientras funcione alguno de los dos circuitos. Se pide:
a) Probabilidad de que el sistema funcione más de 4.000 horas.
b) Vida esperada de cada circuito
13. Sea X la v.a. “tiempo de duración hasta su adquisición de cierto producto en el
escaparate de un comercio”, y se distribuye Exp(0,2) en días. Obtener:
a) Tiempo esperado del producto en el escaparate.
b) Desviación típica del tiempo de exposición.
10
2º CC. EE. ESTADÍSTICA EMPRESARIAL. TEMA 9
14. Un supermercado está interesado en controlar la calidad de los servicios que presta a
sus clientes y comprueba que el tiempo que una cajera emplea en atender a un
cliente sigue una distribución Gamma con media de 6 minutos y varianza 12
minutos2.
a) Calcule la probabilidad de que una persona sea atendida durante más de 10
minutos en una caja.
b) Si dos amigos, que han comprado de forma independiente, se dirigen juntos a la
caja para pagar sus respectivas compras, ¿cuál es la probabilidad de que el
tiempo total que la cajera emplea en atender a los dos sea inferior a 6 minutos?
11
Documentos relacionados
Descargar