Inferencia estadística – Intervalos de confianza Cuando se obtiene una estimación puntual de un parámetro, es conveniente acompañar dicha estimación por una “medida” de la precisión de la estimación. Un modo de hacerlo es informar el estimador y su error standard. Otro modo es reemplazar la estimación puntual por un intervalo de valores posibles para el parámetro. Ejemplo: Supongamos que tenemos una m.a. X 1 , X 2 ,..., X n de una distribución N ( µ , σ o2 ) con varianza σ o2 conocida. Por ser los datos normales, sabemos que σ2 X ~ N µ , o n ⇔ X −µ ~ N (0,1) σo n y, por lo tanto, sabemos que la probabilidad de que n X −µ se encuentre entre –1.96 y σo 1.96 es 0.95, es decir X −µ P − 1.96 ≤ n ≤ 1.96 = 0.95 σo A partir de esta expresión obtenemos 174 σ σ P − 1.96 o ≤ X − µ ≤ 1.96 o = 0.95 n n ⇔ σ σ P X − 1.96 o ≤ µ ≤ X + 1.96 o = 0.95 n n Es decir, que la probabilidad de que el intervalo σo σ , X + 1.96 o X − 1.96 n n contenga al verdadero valor del parámetro µ es 0.95. Este intervalo se denomina intervalo de confianza para µ de nivel de confianza 0.95. Observaciones: 1) No es correcto decir “la probabilidad de que θ pertenezca al intervalo (a,b) es 1 - α” porque θ no es una variable aleatoria. El intervalo es aleatorio ya que sus extremos son funciones de la muestra y por lo tanto, debemos decir “la probabilidad de que el intervalo (a,b) contenga al parámetro θ es 1 - α” 2) Una vez construído el intervalo a partir de una muestra dada, ya no tiene sentido hablar de probabilidad. En todo caso, tenemos “confianza” de que el intervalo contenga a θ. La confianza está puesta en el método de construcción de los intervalos, que nos asegura que (1 - α) 100% de las muestras producirán intervalos que contienen a θ. Intervalos de confianza para los parámetros de una distribución normal n 1 2 2 Distribución t: Sean dos v.a. Z ~N(0,1) y U ~ χ n2 = Γ , independientes, entonces T= Z U ~ tn n Se dice que T tiene distribución t de Student con n grados de libertad. Esta distribución está tabulada para diferentes valores de n. Su densidad es simétrica respecto al 0 y tiene forma de campana, pero tiene colas más pesadas que la distribución normal standard. Cuando n tiende a infinito, la distribución de Student tiende a la distribución normal standard. Proposición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ2), entonces a) σ2 X ~ N µ , n ⇔ n X −µ ~ N (0,1) σ 175 n b) (n − 1) S ~ χ n2−1 2 σ c) X y S 2 son independientes 2 d) n con S 2 = ∑ (X i =1 i − X )2 n −1 X −µ ~ t n −1 S Dem: a) Ya hemos visto que cualquier combinación de v.a. normales independientes es normal y el promedio es una combinación lineal particular. b) y c) Están fuera del alcance de este curso. e) Resulta de a) b) y c) pues X −µ n ~ N (0,1) σ y (n − 1) S 2 ~ χ n2−1 2 σ son v.a. independientes. Entonces, por definición de la distribución t de Student, X −µ X −µ σ = n ~ t n −1 S (n − 1) S 2 σ 2 (n − 1) n Intervalo de confianza para la media de la distribución normal con varianza conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ o2 ), con varianza σ o2 conocida, entonces n X −µ ~ N (0,1) σo X −µ P − zα / 2 ≤ n ≤ zα / 2 = 1 − α σo de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ, 176 σo σ , X + zε / 2 o X − zε / 2 n n (1) Intervalo de confianza para la media de la distribución normal con varianza desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces n X −µ ~ t n −1 S X −µ P − t n −1,α / 2 ≤ n ≤ t n −1,α / 2 = 1 − α S de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ, S S , X + t n −1,α / 2 X − t n −1,α / 2 n n Intervalo de confianza para la varianza de la distribución normal con media conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µo, σ 2 ), con media µo conocida, entonces X i − µo ~ N (0,1) σ 2 ∀1 ≤ i ≤ n ⇒ X i − µo 1 1 ~ χ 12 = Γ , 2 2 σ ∀1 ≤ i ≤ n Como además las v.a. son independientes 2 X i − µo n 1 ~ χ n2 = Γ , ∑ σ 2 2 i =1 n ¿Cómo elegimos los percentiles de la distribución χ2 que encierran un área igual a 1 - α? 177 χ n2,1−α / 2 χ n2,α / 2 Los elegimos de manera tal que quede un área igual a α/2 en cada extremo. Entonces, n ( X i − µ o )2 ∑ 2 2 i =1 ≤ χ n ,α / 2 = 1 − α P χ n ,1−α / 2 ≤ 2 σ Se obtiene el siguiente intervalo n n 2 ( ) ( X i − µ o )2 X − µ ∑ o ∑ i i =1 2 , i =1 2 χ n ,α / 2 χ n ,1−α / 2 Intervalo de confianza para la varianza de la distribución normal con media desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces (n − 1) S 2 ~ χ n2−1 2 σ Por lo tanto, (n − 1) S 2 P χ n2−1,1−α / 2 ≤ ≤ χ n2−1,α / 2 = 1 − α 2 σ 178 Se obtiene el siguiente intervalo (n − 1) S 2 (n − 1) S 2 , 2 2 χ n −1,ε / 2 χ n −1,1−ε / 2 Ejemplos: Sea X 1 , X 2 ,..., X 49 una m.a., X i ~ N ( µ , σ 2 ) . a) Supongamos que el verdadero valor del desvío standard es σo = 35 y que se observa x = 160 y construyamos un intervalo de confianza para la media de nivel 0.95. Como las v.a. son normales y la varianza es conocida, el intervalo para µ será de la forma σ σ X − z ε / 2 o , X + z ε / 2 o n n con zα / 2 = z 0.025 = 1.96 , σ o = 35, n = 49 y valor observado de X igual a 160. Obtenemos 35 35 160 − 1.96 = (160 − 9.8, 160 + 9.8) = (150.2, 169.8) , 160 + 1.96 49 49 b) Supongamos ahora que la varianza es desconocida pero que el valor observado de S es s=35. El correspondiente intervalo de confianza para µ será de la forma S S X − t n −1,α / 2 , X + t n −1,α / 2 n n con t n −1,α / 2 = t 48, 0.025 = 2.01 . Obtenemos 35 35 160 − 2.01 = (160 − 10.05, 160 + 10.05) = (149.95, 170.05) , 160 + 2.01 49 49 Notemos que es más ancho que el anterior c) Suponiendo como antes que observamos x = 160 y s = 35 , hallemos un intervalo de confianza para σ2 de nivel 0.95. Por tratarse de una muestra normal con media desconocida, el intervalo para σ2 será de la forma (n − 1) S 2 (n − 1) S 2 , 2 χ2 n −1,ε / 2 χ n −1,1−ε / 2 179 2 con χ n2−1,α / 2 = χ 48 , 0.025 = 69.02 y χ n −1,1−α / 2 = χ 48, 0.975 = 30.75 . Obtenemos 48 ⋅ 35 2 48 ⋅ 35 2 , 69.02 30.75 = (851.93, 1912.20) y un intervalo de confianza para σ de nivel 0.95 será 48 ⋅ 35 2 48 ⋅ 35 2 , 69.02 30.75 = ( ) 851.93 , 1912.20 = (29.19, 43.73) Esto último resulta de aplicar una función monótona creciente a cada extremo del intervalo para σ2 Determinación del tamaño de muestra: Consideremos el intervalo de confianza para µ con varianza conocida en el caso de una m.a. normal. La longitud del intervalo obtenido (1) es L = 2 zα / 2 σo n y depende de • • • nivel de confianza (α) varianza o desvío standard de las observaciones (σo) tamaño de la muestra (n) Un modo de obtener mayor precisión, es decir un intervalo más angosto, es aumentando el tamaño de la muestra. Si se desea una longitud menor o igual que Lo, entonces L = 2 zα / 2 2z σ 2z σ ≤ Lo ⇔ n ≥ α / 2 o ⇔ n ≥ α / 2 o Lo n Lo σo 2 Ejemplo: Supongamos que σo = 35, ¿qué tamaño de muestra se requiere como mínimo para obtener un intervalo de nivel 0.95 de longitud menor o igual que 10?. Por lo tanto, Lo = 10, σ o = 35 y z 0.025 = 1.96 , entonces 2 2 ⋅ 1.96 ⋅ 35 n≥ = 188.23 10 ⇒ n ≥ 189 En el caso de varianza desconocida el problema es más complejo porque el percentil t también depende del tamaño de muestra. 180 Método general para obtener intervalos de confianza: Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro θ. Supongamos que existe una función T ( X 1 , X 2 ,..., X n , θ ) (es decir, una función de la muestra y del parámetro) cuya distribución no depende de θ ni de ningún otro parámetro desconocido. Entonces, existen dos valores a y b tales que P(a ≤ T ( X 1 , X 2 ,..., X n ,θ ) ≤ b ) = 1 − α y, a partir de esta expresión, es posible obtener un intervalo de confianza para θ. La función T ( X 1 , X 2 ,..., X n , θ ) se denomina pivote. Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución exponencial de parámetro λ. Hemos demostrado que n ∑X i =1 i ~ Γ(n, λ ) Usando este resultado y que, si V ~ Γ(α , λ ) y a > 0 entonces aV ~ Γα, λ , se puede a demostrar que n 2n 1 2λ ∑ X i ~ χ 22n = Γ , 2 2 i =1 función T ( X 1 , X 2 ,..., X n , λ ) = 2λ Usando como pivote la n ∑X i =1 i , podemos obtener un intervalo de confianza de nivel 1 - α para el parámetro λ. n P χ 22n ,1−α / 2 ≤ 2λ ∑ X i ≤ χ 22n ,α / 2 = 1 − α i =1 χ 2 n ,1−α / 2 χ 2 n ,α / 2 P n ≤λ ≤ n 2∑ X i 2∑ X i i =1 i =1 =1−α y el intervalo requerido es 181 χ χ 2 nn,1−α / 2 , 2nn ,α / 2 2∑ X i 2 ∑ X i i =1 i =1 Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución U(0,θ). Para obtener un intervalo de confianza para θ , recordemos que el EMV de θ es θˆ = max ( X 1 ,..., X n ) y probemos que la distribución de θˆ / θ no depende de θ. Llamemos V a la v.a. max ( X 1 ,..., X n ) . Recordemos que, si X 1 , X 2 ,..., X n es una m.a. de una distribución FX, entonces la función de distribución de V está dada por FV (v) = (FX (v) ) n Queremos demostrar que la distribución de V/θ. no depende de θ. ( V FV / θ ( w) = P ≤ w = P(V ≤ θ w) = FV (θ w) = FX i (θ w) θ ) n Como, en nuestro caso, X i ~U(0,θ), ( FV / θ ( w) = FX i (θw) ) n si θ w ≤ 0 0 θw n = θ 1 si 0 < θ w < θ si θ w ≥ θ 0 = w n 1 si w ≤ 0 si 0 < w < 1 si w ≥ 1 Por lo tanto, la distribución de V/θ no depende de θ. Derivando, se obtiene la densidad de V/θ f V / θ ( w) = n w n −1 I ( 0,1) ( w) Utilizando T ( X 1 , X 2 ,..., X n , θ ) = max ( X 1 ,..., X n ) como pivote, obtendremos un intervalo θ de confianza para θ de nivel 1 - α. Buscamos a y b tales que max ( X 1 ,..., X n ) P a ≤ ≤ b = 1−α θ y, obtenemos el siguiente intervalo 182 max ( X 1 ,..., X n ) max ( X 1 ,..., X n ) , b a ¿Cómo elegimos a y b?. Observando (2), debemos hallar a y b , 0 < a < b < 1, tales que b ∫nw n −1 dw = w n a b a = bn − an =1 − α (2) Obviamente hay infinitas soluciones de esta ecuación, pero podríamos elegir la solución que produce el intervalo de menor longitud esperada, es decir, buscar a y b que minimicen E(L) sujeto a la condición (2), siendo 1 1 L = max ( X 1 ,..., X n ) − a b Como ya hemos demostrado que E (max ( X 1 ,..., X n ) = n θ , debemos minimizar n +1 n 1 1 θ − n +1 b a (3) sujeto a la condición b n − a n = 1 − α . Esto puede hacerse utilizando multiplicadores de Lagrange o bien, despejando de esta última expresión a en función de b, reemplazándola en (3) y minimizando la expresión resultante respecto de a. El intervalo de mínima longitud esperada es max( X 1 ,..., X n ) max ( X 1 ,..., X n ) , n 1 α Intervalos de confianza de nivel asintótico 1 - α: En muchos problemas no es posible encontrar intervalos de confianza de nivel exacto 1 - α, o bien son de muy difícil construcción. En otro casos disponemos de muy poca información sobre la distribución de las variables aleatorias. En estas situaciones es posible obtener intervalos de confianza de nivel aproximado cuando tenemos un tamaño de muestra grande. Definición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro θ. Dadas dos sucesiones {a n ( X 1 , X 2 ,...., X n )} y {bn ( X 1 , X 2 ,...., X n )} tales que lim P(a n ( X 1 , X 2 ,..., X n ) ≤ θ ≤ bn ( X 1 , X 2 ,..., X n ) ) = 1 − α n→∞ 183 la sucesión de intervalos [a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )] es una sucesión de intervalos de confianza de nivel asintótico 1 - α para el parámetro θ. También se dice que, si n es suficientemente grande, el intervalo [a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )] tiene nivel aproximado 1 - α. ¿Porqué calcular intervalos de nivel asintótico? • • • Porque no es posible encontrar una función pivote que no dependa del parámetro Porque no se conoce a distribución exacta de la función pivote Porque en general es más fácil encontrar la distribución asintótica que la exacta de la función pivote Ejemplos: 1) Sea X 1 , X 2 ,..., X n una m.a. de una distribución F con E(Xi) = µ y 2 V(Xi) = σ < ∞. Buscamos un intervalo de confianza para µ. Sabemos que X es un estimador insesgado y consistente de µ. No conocemos su distribución exacta porque no conocemos la de Xi, pero sabemos que n X −µ d → N (0,1) σ Si σ2 es conocido, esta función podría servir de pivote para el intervalo de nivel aproximado, pero qué usamos si σ2 es desconocido. Propiedad: d Yn → Y p Un → a ⇒ d U n Yn aY → p → σ por ser un estimador consistente, entonces Como s σ p s p →1 y →1 . s σ Luego, X −µ d → N (0,1) σ σ p →1 s n ⇒ n X −µ d → N (0,1) s A partir de este resultado, X −µ P − zα / 2 ≤ n ≤ zα / 2 → 1 − α s 184 y se obtiene el siguiente intervalo de nivel aproximado 1 - α s s , X + zα / 2 X − zα / 2 n n Intervalo de confianza de nivel asintótico 1 - α para el parámetro p de la distribución Binomial: X 1 , X 2 ,..., X n una Sea m.a. de una distribución Bi(1,p) . Entonces n X = ∑ X i ~ Bi (n, p) . Queremos construir un intervalo de nivel asintótico 1 - α para p. i =1 Recordemos que, por el TCL, n X pˆ = = n ∑X i =1 n i (a) p (1 − p ) ~ N p, n y, por lo tanto P − zα / 2 ≤ X −p n ≤ zα / 2 ≅ 1 − α p (1 − p ) n (4) Hay dos formas de obtener un intervalo para p a partir de esta última expresión. n X = a) Como n ∑X i =1 n i p → p por la Ley de los Grandes Números, podemos aplicar la Propiedad enunciada antes y reemplazar en el denominador del pivote p por su estimador. Entonces P − zα / 2 ≤ X −p n ≤ zα / 2 ≅ 1 − α pˆ (1 − pˆ ) n 185 X P − z α / 2 n X n X 1 − X n ≤ p ≤ + zα / 2 n n X n X 1 − n ≅1−α n obteniendo un intervalo para p de nivel aproximado 1 – α. b) Reescribimos la expresión (4) en la forma P X −p n ≤ zα / 2 ≅ 1 − α p(1 − p) n ⇔ 2 X − p n ≤ z2 ≅1−α P α/2 p(1 − p) n Observemos que 2 X − p n ≤ z2 α /2 p (1 − p ) n 2 p (1 − p ) X 2 − p ≤ zα / 2 n n ⇔ 2 ⇔ ⇔ p(1 − p ) X X 2 2 ≤0 − 2 p + p − zα / 2 n n n z2 p 2 1 + α / 2 − n 2 2 X zα2 / 2 X + ≤0 p + n n n Buscamos las raíces de esta ecuación de segundo grado, que llamaremos p̂1 y p̂ 2 y el intervalo pedido será ( pˆ 1 , pˆ 2 ) 186