Tema 5: Principales Distribuciones de Probabilidad

Anuncio
Tema 5: Principales Distribuciones de Probabilidad
Estadística. 4o Curso.
Licenciatura en Ciencias Ambientales
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
1 / 17
Índice
1
Distribución uniforme discreta
2
Distribución binomial
3
Distribución uniforme continua
4
Distribución normal
5
Distribuciones chi-cuadrado, t de Student y F de Snedecor
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
2 / 17
Distribución uniforme discreta
Es la distribución de probabilidad se asocia a variables cuyos posibles valores tienen
todos la misma probabilidad. Si una variable aleatoria X cuyos posibles valores son
x1 , . . . , xn , tiene distribución uniforme discreta entonces
P(X = x1 ) = P(X = x2 ) = · · · = P(X = xn ) =
1
n
Intuitivamente, esta variable está asociada al experimento similares al de elegir al azar
un número entre 1 y n sin disponer de ninguna información adicional.
µ=
x1 + · · · + xn
= x̄
n
Licenciatura en Ciencias Ambientales (4o Curso)
,
σ2 =
(x1 − µ)2 + · · · + (xn − µ)2
n
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
3 / 17
Distribución binomial
Distribución de Bernoulli de parámetro p
Es la distribución de probabilidad que se asocia a variables que sólo toman dos
valores, el 0 y el 1.
P(X = 1) = p
,
P(X = 0) = 1 − p
,
0<p<1
Intuitivamente, una variable dicotómica ó de Bernoulli aparece asociada a un
experimento éxito-fracaso, donde 1 representa el éxito y 0 el fracaso.
µ=p
Licenciatura en Ciencias Ambientales (4o Curso)
,
σ 2 = p(1 − p)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
4 / 17
Distribución binomial
Distribuciones binomial de parámetros n y p (B(n, p))
Es la distribución de probabilidad que se asocia a variables que toman los valores
0, 1, . . . , n con probabilidades
n
P(X = i) =
pi (1 − p)n−i , i = 0, . . . , n , 0 < p < 1
i
Intuitivamente, una variable binomial modeliza el recuento del número de éxitos al
repetir n veces un experimento éxito-fracaso (de Bernoulli) de parámetro p.
µ = np ,
Licenciatura en Ciencias Ambientales (4o Curso)
σ 2 = np(1 − p)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
5 / 17
Distribución binomial
Ejemplo 1
Con objeto de estudiar el número de salmones de cierto río que llegan vivos al mar se
marca el 20% de la camada en el lugar de nacimiento. Posteriormente, en una estación
de seguimiento río abajo, se registra el paso de 10 salmones de dicha camada. ¿Cuál
es la probabilidad de que se registren 3 de los marcados? ¿Y con qué probabilidad se
registrarán 2 ó menos de los marcados?
X ≡ número de salmones marcados que se registran ∼ B(10, 0.2)
10!
10
P(X = 3) =
0.23 0.87 =
0.23 0.87 = 0.2013
3
3! 7!
P(X ≤ 2) =P(X = 0) + P(X = 1) + P(X = 2)
=0.1074 + 0.2684 + 0.3020 = 0.6778
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
6 / 17
Distribución uniforme continua
Distribuciones Uniforme Continua en el intervalo [a, b] (U[a, b])
Es la distribución de probabilidad que se asocia a variables aleatorias que pueden
tomar cualquier valor en el intervalo [a, b] y cuya función de densidad es:
f (x) =
1
b−a
,
x ∈ [a, b]
Intuitivamente, es la distribución de probabilidad que se asocia a experimentos
similares a elegir un número al azar entre los valores a y b. La gráfica de su función
de densidad es
0.0
0.1
0.2
0.3
0.4
0.5
U[2,6]
●
0
2
●
4
6
8
10
x
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
7 / 17
Distribución normal
Distribución normal de parámetros µ y σ (N(µ, σ))
Es la distribución de probabilidad que viene determinada por la siguiente función de
densidad, definida en toda la recta real:
f (x) =
2
2
1
√ e−(x−µ) /2σ
σ 2π
,
−∞ < x < ∞
Intuitivamente, es la distribución de probabilidad que se asume para una variable
cuyos posibles valores se disponen de forma simétrica en torno a su media de modo
que los valores próximos a dicha media tendrán mayor probabilidad de ser
alcanzados. Conforme más alejados estén de la media, los valores tienen menor
probabilidad de ser alcanzados.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
8 / 17
Distribución normal
Distribución normal de parámetros µ y σ (N(µ, σ))
La gráfica de la función de densidad de la distribución normal es la denominada
campana de Gauss y se representa del siguiente modo:
0.15
0.20
N(2,2)
0.00
0.05
0.10
Los parámetros de esta distribución
son la media, µ, que es el eje de simetría de la gráfica, y la desviación
típica σ.
−4
−2
0
2
4
6
8
x
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
9 / 17
Distribución normal
Distribución normal de parámetros µ y σ (N(µ, σ))
En el siguiente gráfico se ve la variación que se produce en la gráfica de la normal
cuando cambiamos su media y su desviación típica:
N(0, 2)
0.0
0.00
0.2
0.10
0.4
0.20
N(0, 1)
−4
−2
0
2
4
−4
2
4
N(2, 2)
0.10
0.4
0.00
0.2
0.0
−4
Licenciatura en Ciencias Ambientales (4o Curso)
0
0.20
N(2, 1)
−2
−2
0
2
4
−4
−2
0
2
Tema 5: Principales Distribuciones de Probabilidad
4
Curso 2009-2010
10 / 17
Distribución normal
Distribución normal de media 0 y desviación típica 1 (N(0, 1))
La distribución N(µ, σ) se puede relacionar con la distribución N(0, 1), mediante el
siguiente proceso al que se denomina tipificación o estandarización:
X ∼ N(µ, σ) ⇒ Z =
X−µ
∼ N(0, 1)
σ
A la distribución N(0, 1) se le denomina Normal Estándar.
Aproximación de la Binomial por la Normal
Cuando n > 30 podemos aproximar la distribución
binomial de parámetros n, p por la
p
Normal de media np y desviación típica np(1 − p).
p
B(n, p) ≈ N(np, np(1 − p))
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
11 / 17
Distribución normal
Distribución normal de media 0 y desviación típica 1 (N(0, 1))
Como ya dijimos anteriormente, la distribución N(0, 1) es simétrica respecto al 0, es
decir, si Z ∼ N(0, 1)
P(Z ≤ x) = P(Z ≥ −x)
Gráficamente, las siguientes áreas son idénticas:
x
Licenciatura en Ciencias Ambientales (4o Curso)
0
0
Tema 5: Principales Distribuciones de Probabilidad
−x
Curso 2009-2010
12 / 17
Distribución normal
Ejemplo 2
La vida de un semiconductor láser a una potencia constante se distribuye
normalmente con media 7000 horas y desviación típica 600 horas. ¿Cuál es la
probabilidad de que la vida del láser esté entre 6280 y 7120 horas?
X ≡ vida del semiconductor (en horas) ∼ N(7000, 600)
Tipificación:
Z=
6280 − 7000
7120 − 7000
X − 7000
∼ N(0, 1) ,
= −1.2 ,
= 0.2
600
600
600
P(6280 ≤ X ≤ 7120) = P(−1.2 ≤ Z ≤ 0.2)
=P(Z ≤ 0.2) − P(Z ≤ −1.2) = 0.5793 − 0.1151 = 0.4642
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
13 / 17
Distribución normal
Ejemplo 2 (continuación)
Veamos una interpretación gráfica del cálculo anterior. La probabilidad que tenemos
que calcular es igual al siguiente área:
P(− 1.2 ≤ Z ≤ 0.2)
−1.2
0.2
Dicho recinto está incluido en el del gráfico que aparece a la izquierda. La parte que
sobra es precisamente la que está sombreada en el gráfico de la derecha:
P(Z ≤ 0.2)
P(Z ≤ − 1.2)
0.2
−1.2
P(−1.2 ≤ Z ≤ 0.2) = P(Z ≤ 0.2) − P(Z ≤ −1.2)
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
14 / 17
Distribuciones chi-cuadrado, t de Student y F de Snedecor
Distribución chi-cuadrado (χ2 (n))
La distribución de probabilidad chi-cuadrado con n grados de libertad (χ2 (n)) es la
asociada a una variable aleatoria que se obtiene como suma de los cuadrados de n
variables independientes con distribución N(0, 1).
Por tanto, esta distribución sólo toma valores positivos y además su función de
densidad es muy compleja. En el siguiente gráfico aparecen representadas las
funciones de densidad de una χ2 (3) (línea continua) y una χ2 (5) (línea discontinua):
0.00
0.05
0.10
0.15
0.20
0.25
χ2(3) y χ2(5)
0
2
4
6
8
10
Intuitivamente, esta distribución es de utilidad para obtener información de la varianza
poblacional a partir de un conjunto de datos extraídos de una variable normal.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
15 / 17
Distribuciones chi-cuadrado, t de Student y F de Snedecor
Distribución t de Student (t(n))
La distribución de probabilidad t de Student con n grados de libertad (t(n)) es la
asociada a una variable aleatoria que se obtiene a partir del cociente de una variable
N(0, 1) y la raíz cuadrada de una variable χ2 (n).
Por tanto, esta distribución puede tomar cualquier valor real. Su función de densidad
es muy compleja y su gráfica es parecida a la de la distribución N(0, 1). En el
siguiente gráfico aparecen representadas las función de densidad de una t(4):
0.0
0.1
0.2
0.3
t(4)
−4
−2
0
2
4
Intuitivamente, esta distribución es de utilidad para obtener información o establecer
comparaciones entre las medias poblacionales a partir de uno o dos conjuntos de
datos
de una
variableTema
normal.
Licenciaturaextraídos
en Ciencias Ambientales
(4o Curso)
5: Principales Distribuciones de Probabilidad
Curso 2009-2010
16 / 17
Distribuciones chi-cuadrado, t de Student y F de Snedecor
Distribución F de Snedecor (F(n, m))
La distribución de probabilidad F de Snedecor con n y m grados de libertad (F(n, m))
es la asociada a una variable aleatoria que se obtiene a partir del cociente de una dos
variables chi-cuadrado con n y m grados de libertad respectivamente.
Por tanto, esta distribución sólo tomar valores positivos. Su función de densidad es
muy compleja y su gráfica es parecida a la de la distribución chi-cuadrado. En el
siguiente gráfico aparecen representada las función de densidad de una F(3, 6):
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
F(3,5)
0
2
4
6
8
10
Intuitivamente, esta distribución es de utilidad para establecer comparaciones entre las
varianzas poblacionales a partir de dos conjuntos de datos extraídos de una variable
normal.
Licenciatura en Ciencias Ambientales (4o Curso)
Tema 5: Principales Distribuciones de Probabilidad
Curso 2009-2010
17 / 17
Descargar