Tema 7: Introducción a la Teoría sobre Estimación Estadística. 4o Curso. Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 1/8 Índice 1 Objetivos de la estimación estadística 2 Estimación puntual de parámetros 3 Estimación por intervalos de confianza 4 Estimación de la media 5 Estimación de la varianza 6 Estimación de una proporción Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 2/8 Objetivos de la estimación estadística Su finalidad es proporcionarnos las herramientas necesarias para poder determinar buenas aproximaciones (a los que llamaremos estimaciones) a aquellos valores desconocidos en la población (a los que técnicamente se les denomina parámetros) y que estamos interesados en conocer. Planteamiento del problema de estimación X variable cuantitativa en una población. La distribución de probabilidad de X es conocida salvo por uno o varios parámetros (por ejemplo, la media poblacional, µ, la varianza poblacional, σ 2 , la proporción asociada a una distribución binomial, p etc.) Disponemos de los datos x1 , . . . , xn que constituyen una Muestra Aleatoria Simple de la variable X. La estimación estadística de un parámetro (llamémosle θ) consiste en determinar valores, calculados a partir de x1 , . . . , xn que de alguna manera aproximen a θ: bien proporcionando valores cercanos a θ (estimación puntual), bien proporcionando un par de valores entre los cuales se encuentre el de θ (estimación por intervalos). Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 3/8 Estimación puntual de parámetros Un estimador puntual de θ es una función θ̂ de los datos x1 , . . . , xn que aproxima el valor de θ. Cuando se da el valor del estimador θ̂, hay que dar también una estimación del error que se comete al aproximar el valor del parámetro θ mediante θ̂. Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 4/8 Estimación por intervalos de confianza Intervalos de confianza Si T1 y T2 son dos valores, obtenidos a partir de los datos x1 , . . . , xn y tales que P(T1 ≤ θ ≤ T2 ) = 1 − α entonces [T1 , T2 ] es un intervalo de confianza para θ con un nivel de confianza de 1 − α. Intuitivamente, T1 , T2 son dos valores tales que el 100(1 − α)% de las veces que repitamos el experimento en esa población, el valor desconocido de θ estará entre estos dos valores. El nivel de confianza 1 − α es un valor entre 0 y 1 que debe estar próximo a 1( 0.90, 0.95, 0.99, . . . ). De ello resulta que el valor de α es próximo a 0 ( 0.1, 0.05, 0.01, . . . ). Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 5/8 Estimación de la media Sea x1 , . . . , xn una Muestra Aleatoria Simple de una variable N(µ, σ). Estimación puntual: µ̂ = X̄ S Error estándar = √ n , Intervalos de confianza: σ conocida σ X̄ ± √ zα/2 n σ desconocida S X̄ ± √ tn−1,α/2 n zα/2 : cuantil por la derecha de orden α/2 de una distribución N(0, 1). tn−1,α/2 : cuantil por la derecha de orden α/2 de una distribución t(n − 1). Si n ≥ 60 los intervalos anteriores son válidos aunque no se verifique la hipótesis de normalidad. Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 6/8 Estimación de la varianza Sea x1 , . . . , xn una Muestra Aleatoria Simple de una variable N(µ, σ) Estimación puntual: n σ̂ 2 = S2 = 1 X (xi − X̄)2 n−1 i=1 Intervalos de confianza: "P (xi − µ)2 , χ2n,α/2 µ conocida " µ desconocida (xi − µ)2 χ2n,1−α/2 P (n − 1)S2 (n − 1)S2 , 2 2 χn−1,α/2 χn−1,1−α/2 # # χ2k,α/2 , χ2k,1−α/2 : cuantiles por la derecha de orden α/2 y 1 − α/2 de una distribución χ2 (k). Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 7/8 Estimación de una proporción En caracteres cualitativos el parámetro de interés es la proporción p de individuos de la población que presentan cada modalidad del carácter. La variable que modeliza estas situaciones será dicotómica o de Bernoulli con probabilidad de éxito p. Para modelizar esta situación consideraremos x1 , . . . , xn una Muestra Aleatoria Simple de una variable con distribución de Bernoulli de parámetro p. Estimación puntual de p: n P p̂ = i=1 n xi no de éxitos en la muestra = n s , Error estándar = p̂ (1 − p̂) n Intervalos de confianza para p: q q p̂(1−p̂) p̂(1−p̂) , p̂ + z p̂ − zα/2 α/2 n n Puesto que se utiliza la aproximación de la binomial por la normal, los intervalos anteriores serán válidos si np̂(1 − p̂) > 5. Licenciatura en Ciencias Ambientales (4o Curso) Tema 7: Introducción a la Teoría sobre Estimación Curso 2009-2010 8/8