DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES ALEATORIAS DISCRETAS

Anuncio
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLES
ALEATORIAS DISCRETAS
ESPACIO MUESTRAL. El conjunto de todos los resultados posibles de un experimento estadístico
denotado por “S” o “ Ω ”
VARIABLE. Se denomina variable a la entidad que puede tomar un valor cualesquiera durante la
duración de un proceso dado. Si la variable toma un solo valor durante el proceso se llama constante.
VARIABLE ALEATORIA: Es una función que asocia un número real a cada elemento del espacio
muestral. Es decir son aquellas que pueden diferir de una respuesta a otra.
Una variable aleatoria se puede clasificar en:
Variable aleatoria discreta.
Variable aleatoria continua.
Variable aleatoria discreta. Una variable discreta proporciona datos que son llamados datos
cuantitativos discretos y son respuestas numéricas que resultan de un proceso de conteo.
La cantidad de alumnos regulares en un grupo escolar.
El número de águilas en cinco lanzamientos de una moneda.
Número de circuitos en una computadora.
El número de vehículos vendidos en un día, en un lote de autos
Variable aleatoria continua. Es aquella que se encuentra dentro de un intervalo comprendido entre dos
valores cualesquiera; ésta puede asumir infinito número de valores y éstos se pueden medir.
La estatura de un alumno de un grupo escolar.
El peso en gramos de una moneda.
La edad de un hijo de familia.
Las dimensiones de un vehículo.
DEPARTAMENTO DE CIENCIAS BÁSICAS
1
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
DISTRIBUCIONES
Distribución de probabilidad. Es una distribución teórica de frecuencias que describe cómo se
espera que varíen los resultados de un experimento. Existen diferentes tipos de modelos que
permiten describir el comportamiento de fenómenos estadísticos que permiten hacer inferencias y
tomar decisiones en condiciones de incertidumbre.
P(x)
Se pueden clasificar en:
Discretas
x1
Distribuciones
x2
xn
x
P(x)
Continuas
x1
xn
x
Distribuciones discretas. Son aquellas donde las variables asumen un número limitado de valores,
por ejemplo el número de años de estudio.
Discretas
Binomial
Hipergeométrica
Multinomial
Poisson
Distribuciones continuas. Son aquellas donde las variables en estudio pueden asumir cualquier
valor dentro de determinados límites; por ejemplo, la estatura de un estudiante.
Uniforme
Continuas
Exponencial
Normal
DEPARTAMENTO DE CIENCIAS BÁSICAS
2
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
Una distribución de frecuencias es un listado de las frecuencias observadas de todos los resultados
de un experimento que, en realidad se han presentado cuando se lleva a cabo un experimento; en
cambio, una distribución de probabilidad es un listado de las probabilidades de todos los resultados
posibles que podrían presentarse si se efectuara el experimento.
Las probabilidades que se asocian a cada uno de los valores que toma la variable aleatoria x constituyen
lo que se conoce como DISTRIBUCIÓN DE PROBABILIDAD, la cual puede ser representada
mediante una función matemática, una gráfica o una tabla de valores. La diferencia consiste en que la
función matemática se transforma en una función probabilística.
E1
S
E0
X
x0
x1
P(X) p(x0) p(x1)
...
...
...
En
xn
p(xn)
Dados los eventos E1, E2, ..., En ⊂ S, se dice que x es una variable aleatoria, si a cada valor de xi que
asume cada Ei, se le asocia su probabilidad de ocurrencia y cumple con las siguientes condiciones:
a)
La probabilidad para todo valor que asuma la variable aleatoria xi, será mayor o igual a cero
pero menor que uno.
0 ≤ P(xi) ≤ 1 ∀ xi
b)
La suma de todas las probabilidades asociadas a todos los valores que toma la variable x, es
igual a la unidad.
n
∑ P(x i ) = 1
1
∝
∫ P(x i )dx
=1
−∝
Encuentre la distribución de probabilidad de lanzar dos monedas y la variable aleatoria número de
águilas.
S
X
{Lanzar dos monedas}
Número de águilas
E0
Caen x = 0 águilas
E1
Caen x = 1 águilas
E2
Caen x = 2 águilas
1
4
1
P(E1) =
2
1
P(E2) =
4
P(E0) =
DEPARTAMENTO DE CIENCIAS BÁSICAS
3
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
P(X)
Estadística
1
2
1
4
X
0
1
2
Existen ciertas características que diferencian a las distribuciones de probabilidad, llamadas
momentos de la distribución que son: la media aritmética o esperanza matemática y la desviación
estándar.
FUNCIONES DE PROBABILIDAD DISCRETAS
La distribución de probabilidad para una variable aleatoria discreta puede ser:
1.2.3.-
Una relación teórica de resultados y probabilidades que se puede obtener de un modelo
matemático y que representa algún fenómeno de interés.
Una relación empírica de resultados y sus frecuencias relativas observadas.
Una relación subjetiva de resultados relacionados con sus probabilidades subjetivas o artificiales
que representan el grado de convicción del encargado en tomar decisiones sobre la probabilidad
de posibles resultados.
Sabemos que una variable aleatoria discreta o discontinua es aquella en la que existe una distancia
bien definida entre dos de los valores consecutivos que asume; y dichos valores son numerables.
Existen varios modelos matemáticos que representan diversos fenómenos discretos de la vida real.
Las más útiles son:
1.La distribución uniforme discreta.
1.La distribución de probabilidad Binomial o de Bernoulli.
2.La distribución de probabilidad Hipergeométrica.
3.La distribución de probabilidad de Poisson.
UNIFORME DISCRETA
Si la variable aleatoria X asume valores de X1, X2, ..., Xk con iguales probabilidades, entonces la
distribución uniforme es:
f (x, k ) =
DEPARTAMENTO DE CIENCIAS BÁSICAS
4
1
k
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
P(x)
x1
x2
xk
k
∑ xi
µ=
i =1
k
k
∑ (x i
− µ )2
σ 2 = i =1
k
La distribucióin de probabilidad del lanzamiento de un dado es:
S = {1, 2, 3, 4, 5, 6}
P (x = 1, 2, ..., 6) =
1
6
µ=
σ2 =
1+ 2 + 3+ 4 + 5 + 6
= 3 .5
6
(1 − 3.5) 2 + (2 − 3.5) 2 + K + (6 − 3.6) 2
6
= 2.91
LA DISTRIBUCION BINOMIAL
Esta distribución fue elaborada por Jacobo Bernoulli y es aplicable a un gran número de problemas
de carácter económico y en numerosas aplicaciones como:
- Juegos de azar.
- Control de calidad de un producto.
- En educación.
- En las finanzas.
La distribución binomial posee las siguientes propiedades esenciales:
1.2.-
3.-
El espacio muestral contiene n ensayos idénticos.
Las observaciones posibles se pueden obtener mediante dos diferentes métodos de muestreo.
Se puede considerar que cada observación se ha seleccionado de una población infinita sin
reposición o de una población finita con reposición.
Cada observación se puede clasificar en una de dos categorías conocidas como éxito E o
fracaso E', las cuales son mutuamente excluyentes es decir E ∩ E' = 0.
DEPARTAMENTO DE CIENCIAS BÁSICAS
5
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
4.5.-
Estadística
Las probabilidades de éxito p y de fracaso q = 1 - p en un ensayo se mantienen constantes,
durante los n ensayos.
El resultado de cualquier observación es independiente del resultado de cualquier otra
observación.
La probabilidad de que el evento E ocurra x veces y el evento E' ocurra (n - x) veces en n ensayos
independientes está dado por la fórmula binomial:
n
P (x, n, p) =   p x qn - x
x
donde:
p = Probabilidad característica o probabilidad de éxito.
q = Probabilidad de fracaso
x = Número de éxitos deseados
n = Número de ensayos efectuados
Si se lanza 4 veces una moneda, calcular el evento "Número de águilas que caen."
datos:
n = 4 ensayos.
1
p = probabilidad de éxito en un ensayo.
2
1 1
q = 1 - p = 1− =
2 2
x = 0, 1, 2, 3, 4
S = {lanzar 4 veces la moneda}
A = {número de águilas que caen}
0
4
1   4  1   1 
1

P (E0) = P 0,4,  =      =
2   0  2   2 
16

1
3
4
1   4  1   1 

P (E1) = P1,4,  =      =
16
2   1  2   2 

2
2
6
1   4  1   1 

P (E 2 ) = P 2,4,  =      =
16
2   2  2   2 

3
1
4
1   4  1   1 

P (E3) = P 3,4,  =      =
2   3  2   2  16

DEPARTAMENTO DE CIENCIAS BÁSICAS
6
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN
El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas:
µ = np
σ 2 = npq
σ=
npq
µ = Media
σ2 = Varianza
σ = Desviación estándar
DISTRIBUCIÓN MULTINOMIAL
Ocurre cuando en el experimento binomial cada intento tiene más de dos resultados posibles.
Las probabilidades de ocurrencia p1, p2, ..., pk en un solo ensayo, la distribución de probabilidad de las
variables aleatorias k1, k2, ..., kn que representan el número de ocurrencias de E1, E2, ..., En en n
intentos independientes es:
P(n, k 1 , k 2 , K , k n ) =
n!
k
kn
p 1 1 p k2
2 K pn
k 1!k 2! K k n!
Calcular la probabilidad de obtener dos veces el número 4, dos veces el número 5 y una vez el
número 2, en el lanzamiento de un dado 5 veces.
2
2
1
5!  1   1   1 
P(5, 2, 2, 1) =
      = 0.00385
2!2!1!  6   6   6 
LA DISTRIBUCIÓN HIPERGEOMÉTRICA
Se emplea para calcular la probabilidad de obtener determinado número de éxitos en un espacio
muestral de n ensayos; pero a diferencia de la distribución binomial es que los datos de la muestra se
extraen sin reemplazo en una población finita. Por esto es que el resultado de una observación depende
o es afectado por el resultado de cualquier otra u otras observaciones anteriores.
Es decir la distribución hipergeométrica se emplea para muestreos sin reemplazo de una población finita
cuya probabilidad de ocurrencia cambia a lo largo del ensayo.
Dado un espacio muestral S de tamaño N con los subespacios M ⊂ N y (N - M) ⊂ N entonces, la
probabilidad de que en n ensayos x pertenezca a M y (n - x) pertenezca a (N - M) está dada por:
DEPARTAMENTO DE CIENCIAS BÁSICAS
7
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
 M  N − M 

 
 x  x − n 
P(x, N, M, n) =
N
 
n
Gráficamente se puede representar como:
E
E’
M
N-M
x
n-x
N
n
donde:
N
n
M
N-M
x
n-x
= El tamaño de espacio muestral S
= El número de ensayos
= El número de éxitos en el espacio muestral
= Número de fracasos del espacio muestral
= Número de éxitos en la muestra
= Número de fracasos de la muestra.
Si en una empresa se presentan para cubrir dos vacantes 13 aspirantes de los cuales 5 son hombres y
8 son mujeres, calcular " El número de hombres contratados."
N
A
E0
E1
E2
= {13 aspirantes para cubrir 2 vacantes}
= {Número de hombres contratados}
= Se contratan x0 = 0 hombres, equivale a contratar (n - x0) = 2 mujeres.
= Se contratan x1 = 1 hombres, equivale a contratar (n - x1) = 1 mujeres.
= Se contratan x2 = 2 hombres, equivale a contratar (n - x2) = 0 mujeres.
DEPARTAMENTO DE CIENCIAS BÁSICAS
E
E’
M=5
N-M = 8
x=0
n-x = 2
8
N = 13
n=2
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
desarrollando
N = 13 total de aspirantes
M = 5 aspirantes hombres
N-M = 8 aspirantes mujer
n = 2 vacantes totales
x = 0,1,2 hombres posibles a contratar
n-x = 2,1,0 mujeres posibles a contratar
 5  8 
  
28
 0  2 
P(E0) = P(0,13,5,2) =
=
= 0.3588 = 35.88%
78
13 
 
2
 5  8 
  
40
 1  1 
P(E1) = P(1,13,5,2) =
=
= 0.5128 = 51.28%
78
13 
 
2
 5  8 
  
10
 2  0 
P(E2) = P (2,13,5,2) =
=
= 0.1282 = 12.82%
78
13 
 
2
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN
El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas:
M
µ = n 
N
σ2 =
nM(N − M)(N − n)
N 2 (N − 1)
σ=
σ2
µ = Media
σ2 = Varianza
σ = Desviación estándar
DEPARTAMENTO DE CIENCIAS BÁSICAS
9
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
sustituyendo en el ejemplo anterior.
5
µ = 2  = 0.7693
 13 
σ2 =
(2)(5)(13 − 5)(13 − 2)
(13) 2 (13 − 1)
σ=
= 0.4339
0.4339 = 0.6587
DISTRIBUCIÓN HIPERGEOMÉTRICA GENERALIZADA (MULTIVARIADA)
Si N resultados pueden dividirse en la k celdas N1, N2, ..., Nk con k1 ,k2, ..., kn elementos
respectivamente, entonces la distribución de probabilidad representa el número de elementos
selecionados, en una muestra aleatoria de tamaño n, es:
 N 1  N 2   N n 

 K 


 k 1  k 2   k n 
P(n; k 1, k 2 , K , k n ) =
N
 
n
Si en un refrigerador hay 12 envases de refrescos de los cuales son 10 de manzana, 5 de naranja y 4
de uva, cúal es la probabilidad de que al surtir un pedido de 7 envases tomados al azar 2 sean de
manzana, 4 de naranja y 1 de uva.
N1 = 3
N2 = 5
N3 = 4
N = 12
k1 = 2
k2 = 4
k3 = 4
n=7
 3  5  4 
   
 2  4  1 
P(7;2,4,1) =
= 0.0758
12 
 
7
DEPARTAMENTO DE CIENCIAS BÁSICAS
10
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
DISTRIBUCIÓN DE POISSON
Esta función de distribución de variable discreta se emplea para calcular las probabilidades asociadas a
la variable aleatoria dentro de un intervalo continuo de tiempo o espacio; este intervalo es generalmente
una unidad de medida conocida: cm2, km, gramos, litros, pulgadas, etc.
Algunos de los problemas que presentan como un fenómeno con distribución de Poisson son:
- Los embotellamientos que se producen por día.
- Número de llamadas por hora.
- Defectos por m2 de tela.
- Número de defectos por lote de un proceso de producción.
- Número de negocios cerrados por semana.
A este tipo de problemas se les conoce el número de éxitos x obtenidos por unidad de medida en n
ensayos; pero es totalmente imposible conocer el número de fracasos (n - x).
Se dice que se da un proceso de Poisson si se pueden observar eventos discretos en un intervalo
continuo en forma tal que si se acorta el intervalo lo suficiente:
1.2.3.-
La probabilidad de observar exactamente un éxito en el intervalo es estable.
La probabilidad de observar dos o más éxitos en el intervalo es cero.
La ocurrencia de un éxito en cualquier intervalo es estadísticamente independiente de que
suceda en cualquier otro intervalo.
La distribución de Poisson se expresa mediante la siguiente fórmula.
P(E) = P(x, λ ) =
λ x e -λ
x!
donde:
n
= Número de ensayos
x
= Número de éxitos esperados en n ensayos
e
= 2.71828...
λ
= n p = Constante igual al número de éxitos promedio por unidad de medida
p
= Probabilidad constante durante el proceso igual al número de éxitos promedio por unidad de
medida.
Un conmutador recibe en promedio 5 llamadas sobre autos extraviados por hora. ¿Cuál es la
probabilidad de que en una hora tomada al azar reciba?
a) Ninguna llamada.
b) Exactamente 3 llamadas.
c) No más de 3 llamadas.
DEPARTAMENTO DE CIENCIAS BÁSICAS
11
M. en C. José Luis Hernández González
INSTITUTO TECNOLÓGICO DE APIZACO
Estadística
Para este problema λ = 5, en otros casos deberá calcularse con: λ = n p.
a) Ninguna llamada. x = 0
5 0 e .5
P (E 0 ) = P (0,5) =
= 0.00674963
0!
b) Exactamente 3 llamadas: x = 3
P (E 3 ) = P (3,5) =
5 3 e .5
= 0.1404
3!
c) No más de 3 llamadas: x < 4
P(x < 4) = P(x ≤ 3) = P(x0 = 0) + P(x1 = 1) + P(x2 = 2) + P(x3 = 3)
P(x < 4) = 0.0067+ 0.0337 + 0.0842 + 0.1406 = 0.2652 = 26.52 %
MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIÓN
El cálculo de estas magnitudes pueden realizarse con las siguientes fórmulas:
µ = λ = np
σ2 = λ
σ=
λ
µ = Media
σ2 = Varianza
σ = Desviación estándar
DEPARTAMENTO DE CIENCIAS BÁSICAS
12
M. en C. José Luis Hernández González
Descargar