Estadística B0. Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Estadística Distribución Normal Dada una variable aleatoria X ≡ N ( µ , σ ) es el modelo de probabilidad caracterizado por la función de densidad: ⎡ 1 ⎛ x− µ ⎢ − ⎜ ⎢ 2 ⎝ σ ⎣ 1 f ( x) = e σ 2p ⎞ ⎟ ⎠ 2 ⎤ ⎥ ⎥ ⎦ • Distribución de probabilidad más importante en estadística • Modelo general pero no universal • Su adecuación debe contrastarse siempre que sea posible a través de técnicas de Inferencia Estadística Estadística Distribución Normal Propiedades El dominio de la variable es cualquier valor real (-∞, +∞). Simétrica respecto a la media µ. P( X < µ − 1) = P( X > µ + 1) Tiene su máximo en la media µ. Crece hasta la media y decrece a partir de ella. Estadística Distribución Normal La probabilidad equivale al área encerrada bajo la curva: P(µ-σ < X ≤ µ+σ)=0.6826 68.26% P(µ-2σ < X ≤ µ+2σ)=0.954 95.45 % P(µ-3σ < X ≤ µ+3σ)=0.997 99.73 % Estadística Distribución Normal No se puede mostrar la imagen. Puede que su equipo no tenga suficiente memoria para abrir la imagen o que ésta esté dañada. Reinicie el equipo y, a continuación, abra el archivo de nuevo. Si sigue apareciendo la x roja, puede que tenga que borrar la imagen e insertarla de nuevo. Distribución Normal Estándar N(0,1) Su media µ=0 Su desviación típica σ=1 f ( x) = 1 2p x2 − e 2 Estadística Distribución Normal No se puede mostrar la imagen. Puede que su equipo no tenga suficiente memoria para abrir la imagen o que ésta esté dañada. Reinicie el equipo y, a continuación, abra el archivo de nuevo. Si sigue apareciendo la x roja, puede que tenga que borrar la imagen e insertarla de nuevo. Tipificación de la variable x Dada una variable X que sigue una distribución N(µ,σ), se transforma en otra variable Z que sigue una distribución N(0,1). X N(µ,σ) Z z= Ventaja: Valores tabulados N(0,1) x−µ σ Estadística Ejercicios No se puede mostrar la imagen. Puede que su equipo no tenga suficiente memoria para abrir la imagen o que ésta esté dañada. Reinicie el equipo y, a continuación, abra el archivo de nuevo. Si sigue apareciendo la x roja, puede que tenga que borrar la imagen e insertarla de nuevo. Ejercicios propuestos La longitud X en mm de una población de lubinas sigue una distribución N(3,5). Calcular la probabilidad de que la lubina que pesquemos mida 6 mm o menos. ⎛ x − 3 6 − 3 ⎞ P( X ≤ 6) = P⎜ ≤ ⎟ = P(Z ≤ 0.6) = 0.7257 5 ⎠ ⎝ 5 ¿Y la probabilidad de que esté entre 1 y 6 mm? Estadística Normal como aproximación a otras distribuciones Teorema del límite central Para cualquier variable con E(X) µ y n lo bastante grande, la distribución de la variable (X − µ )/(errorest) es una normal estándar. Binomial np = λ > 1 Poisson p < 0.1 µ = np σ = npq A partir de Peña, 2001 npq > 5 Normal λ >5 µ =λ σ= λ Estadística Normal como aproximación a otras distribuciones Aproximación de la binomial a la normal Sea X una variable aleatoria con distribución binomial de parámetros n y p. Si n es grande, entonces la distribución de X es aproximadamente normal con esperanza µ = np y varianza σ 2 = np (1 − p ) Se suele utilizar esta aproximación cuando np y n(1 – p) son mayores que 5, o bien cuando n > 30. Como alternativa se puede coger directamente npq > 5 Tener en cuenta que para pasar de discretas a continuas se debe hacer corrección de continuidad: Estadística Normal como aproximación a otras distribuciones Fuente: Plaza 1999 Estadística Normal como aproximación a otras distribuciones Aproximación de la binomial a la normal ComparaciÛn B(20,0.1)-N(m,s) ComparaciÛn B(100,0.1)-N(m,s) 0.5 1.0 1.5 n 2.0 2.5 3.0 0.10 0.08 0.04 0.00 0.02 0.05 0.00 0.0 0.06 Probabilidad 0.15 0.10 Probabilidad 0.4 0.2 0.0 Probabilidad 0.20 0.6 0.25 0.12 ComparaciÛn B(3,0.1)-N(m,s) 0 5 10 n 15 20 0 20 40 60 n 80 100 Estadística Normal como aproximación a otras distribuciones Aproximación de la poisson a la normal Estadística Normal como aproximación a otras distribuciones Ejemplo: Del ejemplo que teníamos para el apartado de distribución binomial, con una población de cetáceos en la que se sabe que el 60% son machos, ahora se extraen un conjunto de 100, ¿cuál es la probabilidad de que en ese conjunto haya 32? X = Nº de hembras en el conjunto n = 100 p = 0.4 ⎛100 ⎞ 30 100−30 ⎟⎟0.4 0.6 P( X = 32) = ⎜⎜ = 0.0216 ⎝ 30 ⎠ Estadística Normal como aproximación a otras distribuciones Alternativa aproximando por una normal: 1. Comprobamos que podemos aplicar el teorema: npq = 100 ⋅ 0.4 ⋅ 0.6 = 24 > 5 2. Calculamos los parámetros de la normal µ = np = 40 σ = npq = 24 = 4.90 3. Calculamos a partir de la Normal P( X = 32) = P(32 − 0.5 ≤ X ≤ 32 + 0.5) 32.5 − 40 ⎞ ⎛ 31.5 − 40 P( X = 32) = P⎜ ≤X≤ ⎟ = P(− 1.7347 ≤ Z ≤ −1.5306 ) = 4.90 ⎠ ⎝ 4.90 0.95818 − 0.93699 = 0.02119 Estadística Normal como aproximación a otras distribuciones ¿Y si ajustamos por Poisson? f (k , λ ) = λk k! e −λ 1. Comprobamos que podemos aplicar el teorema: np = 100 ⋅ 0.4 = 40 > 1 p = 0.4 > 0.1 Apliquémoslo de todos modos, a ver qué sale: 4032 −40 P( X = 32) = e = 0.02978 32! λ = np = 100 ⋅ 0.4 = 40 Estadística Normal como aproximación a otras distribuciones Estadística Distribuciones continuas: Normal Comando a utilizar con R: • dnorm(x,media,sd): Función de densidad • pnorm(x,media,sd): F. distribución • qnorm(prob.media,sd): Quantiles • rnorm(nobs,media,sd): Números pseudoaleatorios Estadística Distribuciones discretas: Binomial Comando a utilizar con R: • dbinom(x,tamaño,prob): Función de probabilidad • pbinom(x,tamaño,prob): F. prob. acumulada • qbinom(prob,tamaño,prob): Quantiles • rbinom(nobs,tamaño,prob): Números pseudoaleatorios