Tema 5: Principales Distribuciones de Probabilidad Estadística. 4o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 1 / 17 Índice 1 Distribución uniforme discreta 2 Distribución binomial 3 Distribución uniforme continua 4 Distribución normal 5 Distribuciones chi-cuadrado, t de Student y F de Snedecor Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 2 / 17 Distribución uniforme discreta Es la distribución de probabilidad se asocia a variables cuyos posibles valores tienen todos la misma probabilidad. Si una variable aleatoria X cuyos posibles valores son x1 , . . . , xn , tiene distribución uniforme discreta entonces P(X = x1 ) = P(X = x2 ) = · · · = P(X = xn ) = 1 n Intuitivamente, esta variable está asociada al experimento similares al de elegir al azar un número entre 1 y n sin disponer de ninguna información adicional. µ= x1 + · · · + xn = x̄ n Licenciatura en Ciencias Ambientales (4o Curso) , σ2 = (x1 − µ)2 + · · · + (xn − µ)2 n Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 3 / 17 Distribución binomial Distribución de Bernoulli de parámetro p Es la distribución de probabilidad que se asocia a variables que sólo toman dos valores, el 0 y el 1. P(X = 1) = p , P(X = 0) = 1 − p , 0<p<1 Intuitivamente, una variable dicotómica ó de Bernoulli aparece asociada a un experimento éxito-fracaso, donde 1 representa el éxito y 0 el fracaso. µ=p Licenciatura en Ciencias Ambientales (4o Curso) , σ 2 = p(1 − p) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 4 / 17 Distribución binomial Distribuciones binomial de parámetros n y p (B(n, p)) Es la distribución de probabilidad que se asocia a variables que toman los valores 0, 1, . . . , n con probabilidades n P(X = i) = pi (1 − p)n−i , i = 0, . . . , n , 0 < p < 1 i Intuitivamente, una variable binomial modeliza el recuento del número de éxitos al repetir n veces un experimento éxito-fracaso (de Bernoulli) de parámetro p. µ = np , Licenciatura en Ciencias Ambientales (4o Curso) σ 2 = np(1 − p) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 5 / 17 Distribución binomial Ejemplo 1 Con objeto de estudiar el número de salmones de cierto río que llegan vivos al mar se marca el 20% de la camada en el lugar de nacimiento. Posteriormente, en una estación de seguimiento río abajo, se registra el paso de 10 salmones de dicha camada. ¿Cuál es la probabilidad de que se registren 3 de los marcados? ¿Y con qué probabilidad se registrarán 2 ó menos de los marcados? X ≡ número de salmones marcados que se registran ∼ B(10, 0.2) 10! 10 P(X = 3) = 0.23 0.87 = 0.23 0.87 = 0.2013 3 3! 7! P(X ≤ 2) =P(X = 0) + P(X = 1) + P(X = 2) =0.1074 + 0.2684 + 0.3020 = 0.6778 Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 6 / 17 Distribución uniforme continua Distribuciones Uniforme Continua en el intervalo [a, b] (U[a, b]) Es la distribución de probabilidad que se asocia a variables aleatorias que pueden tomar cualquier valor en el intervalo [a, b] y cuya función de densidad es: f (x) = 1 b−a , x ∈ [a, b] Intuitivamente, es la distribución de probabilidad que se asocia a experimentos similares a elegir un número al azar entre los valores a y b. La gráfica de su función de densidad es 0.0 0.1 0.2 0.3 0.4 0.5 U[2,6] ● 0 2 ● 4 6 8 10 x Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 7 / 17 Distribución normal Distribución normal de parámetros µ y σ (N(µ, σ)) Es la distribución de probabilidad que viene determinada por la siguiente función de densidad, definida en toda la recta real: f (x) = 2 2 1 √ e−(x−µ) /2σ σ 2π , −∞ < x < ∞ Intuitivamente, es la distribución de probabilidad que se asume para una variable cuyos posibles valores se disponen de forma simétrica en torno a su media de modo que los valores próximos a dicha media tendrán mayor probabilidad de ser alcanzados. Conforme más alejados estén de la media, los valores tienen menor probabilidad de ser alcanzados. Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 8 / 17 Distribución normal Distribución normal de parámetros µ y σ (N(µ, σ)) La gráfica de la función de densidad de la distribución normal es la denominada campana de Gauss y se representa del siguiente modo: 0.15 0.20 N(2,2) 0.00 0.05 0.10 Los parámetros de esta distribución son la media, µ, que es el eje de simetría de la gráfica, y la desviación típica σ. −4 −2 0 2 4 6 8 x Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 9 / 17 Distribución normal Distribución normal de parámetros µ y σ (N(µ, σ)) En el siguiente gráfico se ve la variación que se produce en la gráfica de la normal cuando cambiamos su media y su desviación típica: N(0, 2) 0.0 0.00 0.2 0.10 0.4 0.20 N(0, 1) −4 −2 0 2 4 −4 2 4 N(2, 2) 0.10 0.4 0.00 0.2 0.0 −4 Licenciatura en Ciencias Ambientales (4o Curso) 0 0.20 N(2, 1) −2 −2 0 2 4 −4 −2 0 2 Tema 5: Principales Distribuciones de Probabilidad 4 Curso 2009-2010 10 / 17 Distribución normal Distribución normal de media 0 y desviación típica 1 (N(0, 1)) La distribución N(µ, σ) se puede relacionar con la distribución N(0, 1), mediante el siguiente proceso al que se denomina tipificación o estandarización: X ∼ N(µ, σ) ⇒ Z = X−µ ∼ N(0, 1) σ A la distribución N(0, 1) se le denomina Normal Estándar. Aproximación de la Binomial por la Normal Cuando n > 30 podemos aproximar la distribución binomial de parámetros n, p por la p Normal de media np y desviación típica np(1 − p). p B(n, p) ≈ N(np, np(1 − p)) Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 11 / 17 Distribución normal Distribución normal de media 0 y desviación típica 1 (N(0, 1)) Como ya dijimos anteriormente, la distribución N(0, 1) es simétrica respecto al 0, es decir, si Z ∼ N(0, 1) P(Z ≤ x) = P(Z ≥ −x) Gráficamente, las siguientes áreas son idénticas: x Licenciatura en Ciencias Ambientales (4o Curso) 0 0 Tema 5: Principales Distribuciones de Probabilidad −x Curso 2009-2010 12 / 17 Distribución normal Ejemplo 2 La vida de un semiconductor láser a una potencia constante se distribuye normalmente con media 7000 horas y desviación típica 600 horas. ¿Cuál es la probabilidad de que la vida del láser esté entre 6280 y 7120 horas? X ≡ vida del semiconductor (en horas) ∼ N(7000, 600) Tipificación: Z= 6280 − 7000 7120 − 7000 X − 7000 ∼ N(0, 1) , = −1.2 , = 0.2 600 600 600 P(6280 ≤ X ≤ 7120) = P(−1.2 ≤ Z ≤ 0.2) =P(Z ≤ 0.2) − P(Z ≤ −1.2) = 0.5793 − 0.1151 = 0.4642 Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 13 / 17 Distribución normal Ejemplo 2 (continuación) Veamos una interpretación gráfica del cálculo anterior. La probabilidad que tenemos que calcular es igual al siguiente área: P(− 1.2 ≤ Z ≤ 0.2) −1.2 0.2 Dicho recinto está incluido en el del gráfico que aparece a la izquierda. La parte que sobra es precisamente la que está sombreada en el gráfico de la derecha: P(Z ≤ 0.2) P(Z ≤ − 1.2) 0.2 −1.2 P(−1.2 ≤ Z ≤ 0.2) = P(Z ≤ 0.2) − P(Z ≤ −1.2) Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 14 / 17 Distribuciones chi-cuadrado, t de Student y F de Snedecor Distribución chi-cuadrado (χ2 (n)) La distribución de probabilidad chi-cuadrado con n grados de libertad (χ2 (n)) es la asociada a una variable aleatoria que se obtiene como suma de los cuadrados de n variables independientes con distribución N(0, 1). Por tanto, esta distribución sólo toma valores positivos y además su función de densidad es muy compleja. En el siguiente gráfico aparecen representadas las funciones de densidad de una χ2 (3) (línea continua) y una χ2 (5) (línea discontinua): 0.00 0.05 0.10 0.15 0.20 0.25 χ2(3) y χ2(5) 0 2 4 6 8 10 Intuitivamente, esta distribución es de utilidad para obtener información de la varianza poblacional a partir de un conjunto de datos extraídos de una variable normal. Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 15 / 17 Distribuciones chi-cuadrado, t de Student y F de Snedecor Distribución t de Student (t(n)) La distribución de probabilidad t de Student con n grados de libertad (t(n)) es la asociada a una variable aleatoria que se obtiene a partir del cociente de una variable N(0, 1) y la raíz cuadrada de una variable χ2 (n). Por tanto, esta distribución puede tomar cualquier valor real. Su función de densidad es muy compleja y su gráfica es parecida a la de la distribución N(0, 1). En el siguiente gráfico aparecen representadas las función de densidad de una t(4): 0.0 0.1 0.2 0.3 t(4) −4 −2 0 2 4 Intuitivamente, esta distribución es de utilidad para obtener información o establecer comparaciones entre las medias poblacionales a partir de uno o dos conjuntos de datos de una variableTema normal. Licenciaturaextraídos en Ciencias Ambientales (4o Curso) 5: Principales Distribuciones de Probabilidad Curso 2009-2010 16 / 17 Distribuciones chi-cuadrado, t de Student y F de Snedecor Distribución F de Snedecor (F(n, m)) La distribución de probabilidad F de Snedecor con n y m grados de libertad (F(n, m)) es la asociada a una variable aleatoria que se obtiene a partir del cociente de una dos variables chi-cuadrado con n y m grados de libertad respectivamente. Por tanto, esta distribución sólo tomar valores positivos. Su función de densidad es muy compleja y su gráfica es parecida a la de la distribución chi-cuadrado. En el siguiente gráfico aparecen representada las función de densidad de una F(3, 6): 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 F(3,5) 0 2 4 6 8 10 Intuitivamente, esta distribución es de utilidad para establecer comparaciones entre las varianzas poblacionales a partir de dos conjuntos de datos extraídos de una variable normal. Licenciatura en Ciencias Ambientales (4o Curso) Tema 5: Principales Distribuciones de Probabilidad Curso 2009-2010 17 / 17