Estimacion puntual y por Intervalo •El objetivo es efectuar una generalización de los resultados de la muestra a la población. Inferir o adivinar el comportamiento de la población a partir del conocimiento de una muestra. En general nos interesará conocer algún parámetro determinado de la población (media, varianza, proporción, etc.) •Para ello es necesario conocer las distribuciones de probabilidad de ciertas funciones de las muestras que constituyen variables aleatorias asociadas al experimento aleatorio, selección de una muestra al azar de una población. •Esta variable aleatoria es un estadístico muestral, y su distribución es la distribución muestral •Podemos distinguir entre estimación puntual y por intervalo •Estimación puntual: se proporciona un solo valor numérico del parámetro desconocido. Estimación por intervalo: se proporciona un intervalo dentro del cual se afirma que se encuentra el parámetro desconocido con una confianza dada. El nivel de confianza expresa en términos de probabilidad el grado de seguridad que tenemos al afirmar que el intervalo incluirá al parámetro. Estimacion puntual y por Intervalo Definición de estimador Dado un parámetro θ un estimador del parámetro, que notaremos con estadístico muestral que se emplea para conocer el parámetro θˆ , es un El valor concreto que tome para la muestra seleccionada se denomina estimación puntual de θ Es deseable que los estimadores presenten ciertas propiedades tales como insesgadez (la esperanza o media del estimador coincide con el parámetro estimado); eficiencia (dados dos estimadores insesgados es más eficiente el de menor varianza), entre otras. La elección del estimador adecuado dependerá de estas propiedades A veces se usa como estimador el mismo resumen estadístico que define el parámetro. Por ejemplo, como estimador de la media de la población se usa la media de la muestra; de la proporción en la población, la de la muestra; de la varianza en la población, la de la muestra. Pero no siempre es esta la mejor elección. Por ejemplo, la cuasivarianza muestral es mejor estimador de la varianza de la población desde el punto de vista de la insesgadez. Ejemplo: Estimador de la media de una población Población: X variable aleatoria Estimador: Estadístico muestral media muestral Distribución de X en la Población µ e Inf X Xmuestra X Distribución muestral de medias cia n re Valor de la variable Muestra seleccionada x1,x2,x3,…,xn Estimación: Media de la muestra Xmuestra Estimacion puntual y por Intervalo Intervalo de confianza para la media µ con σ conocida Sea una población sobre la que se observa una variable aleatoria X con distribución X → N (µ ,σ ) Usaremos como estimador de la media poblacional la media muestral. Sabemos que X → N (µ , σ n ) Por tanto, la variable estandarizada sigue un modelo N(0,1): Z= X −µ σ → N (0, 1) n Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en el centro de la distribución un área (probabilidad) igual (1 − α ) α /2 α /2 (1 − α ) − zα / 2 zα / 2 1 − α = P ( − zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤ Z X −µ σ n ≤ zα / 2 ) = Estimacion puntual y por Intervalo Intervalo de confianza para la media µ α /2 con α /2 n ≤ X − µ ≤ zα / 2 σ n Z zα / 2 1 − α = P ( − zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤ = P (− zα / 2 conocida (continúa) (1 − α ) − zα / 2 σ σ X −µ σ n ) = P ( − X − zα / 2 = P ( X − zα / 2 σ n ≤ zα / 2 ) = σ n ≤ µ ≤ X + zα / 2 ≤ − µ ≤ − X + zα / 2 σ n El intervalo de confianza para la media al nivel (1 − α ) σ ⎡ , X − z α /2 ⎢ n ⎣ X + zα / 2 σ ⎤ n ⎥⎦ ) σ n )= Estimacion puntual y por Intervalo Ejemplo: Intervalo de confianza para la media µ con σ conocida Se ha seleccionado una muestra de 25 viviendas de un barrio. Se sabe que la superficie de éstas se distribuye normalmente con media desconocida y varianza 49. Estime el valor medio de la superficie por vivienda en dicho barrio a un nivel de confianza del 95%, sabiendo que la media observada en las 25 viviendas de la muestra fue de 102,5m2. El intervalo de confianza para la media al nivel (1 − α ) σ ⎡ , X − z α /2 ⎢ n ⎣ X + zα / 2 σ ⎤ ⎥ n⎦ 7 7 ⎤ ⎡ 102 , 5 − 1 , 96 , 102 , 5 + 1 , 96 ⎢ 25 25 ⎥⎦ ⎣ Estimacion puntual y por Intervalo Intervalo de confianza para la media µ con σ desconocida Sea una población sobre la que se observa una variable aleatoria X con distribución X → N (µ ,σ ) Usaremos como estimador de la media poblacional la media muestral. Sabemos que el estadístico muestral Ut,v sigue un modelo t de Student con n-1 grados de libertad U t ,υ = (X − µ) → t n −1 S n Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en el centro de la distribución un área (probabilidad) igual (1 − α ) α /2 α /2 (1 − α ) − tα / 2 1 − α = P (−tα / 2 ≤ t n −1 ≤ tα / 2 ) = P ( −tα / 2 ≤ tα / 2 t de Studen con n-1 g.l X −µ ≤ tα / 2 ) = s n Estimacion puntual y por Intervalo Intervalo de confianza para la media µ α /2 con σ α /2 (1 − α ) − tα / 2 desconocida (continúa) tα / 2 t de Studen con n-1 g.l X −µ ≤ tα / 2 ) = s n s s s ) = P (− X − tα / 2 ≤ − µ ≤ − X + tα / 2 )= n n n 1 − α = P (−tα / 2 ≤ t n −1 ≤ tα / 2 ) = P ( −tα / 2 ≤ = P (−tα / 2 s ≤ X − µ ≤ tα / 2 n = P ( X − tα / 2 s s ≤ µ ≤ X + tα / 2 ) n n El intervalo de confianza para la media al nivel (1 − α ) n s ⎡ X − t , α / 2 ⎢ n ⎣ X + tα / 2 s ⎤ n ⎥⎦ Donde s es la cuasivarianza muestral s= ∑ (x − X ) i =1 i n −1 Nota: cuando el tamaño muestral es grande la t de Student se aproxima a una normal 2 Estimacion puntual y por Intervalo Ejemplo: Intervalo de confianza para la media µ con σ desconocida Se ha seleccionado una muestra de 25 viviendas de un barrio. Se sabe que la superficie de éstas se distribuye normalmente con media y varianza desconocidas. Estime el valor medio de la superficie por vivienda en dicho barrio a un nivel de confianza del 95%, sabiendo que la media y la varianza observadas en la muestra fueron de 102,5 y 64, respectivamente. El intervalo de confianza para la media al nivel (1 − α ) s ⎡ X − t , α /2 ⎢ n ⎣ S2 = X + tα / 2 s ⎤ n ⎥⎦ n 25 Var (muestra) = 64 = 66,667 n −1 24 S= 25 64 = 66,667 = 8,165 24 8,165 8,165 ⎤ ⎡ 102 , 5 − 2 , 064 , 102 , 5 + 2 , 064 ⎢ ⎥ 25 25 ⎦ ⎣ Estimacion puntual y por Intervalo Intervalo de confianza para la proporción p Sea una población sobre la que se observa una variable aleatoria X con distribución X → B (1, p ) Usaremos como estimador de la proporción poblacional la proporción muestral. Sabemos que el estadístico muestral Up sigue un modelo normal para muestras suficientemente grandes Up → N ( p, pq ) n De modo equivalente Z= Up − p pq n → N (0, 1) Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en el centro de la distribución un área (probabilidad) igual (1 − α ) α /2 α /2 (1 − α ) − zα / 2 zα / 2 1 − α = P (− zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤ Z Up − p pq n ≤ zα / 2 ) = Estimacion puntual y por Intervalo Intervalo de confianza para la proporción α /2 − zα / 2 pq ≤ U p − p ≤ zα / 2 n Up − p pq n pq ) = P (−U p − zα / 2 n = P(U p − zα / 2 Z zα / 2 1 − α = P (− zα / 2 ≤ Z ≤ zα / 2 ) = P (− zα / 2 ≤ = P (− zα / 2 α /2 (1 − α ) ≤ zα / 2 ) = pq ≤ − p ≤ −U p + zα / 2 n pq ≤ p ≤ U p + zα / 2 n pq )= n pq ) n El intervalo de confianza para p al nivel (1 − α ) ⎡ U p (1 − U p ) U p (1 − U p ) ⎤ , U p + zα / 2 ⎢U p − zα / 2 ⎥ n n ⎣⎢ ⎦⎥ Observa que se ha sustituido p por su estimador, dado que este es desconocido Estimacion puntual y por Intervalo Ejemplo: Intervalo de confianza para la proporción En un centro escolar se ha seleccionado una muestra al azar de 120 padres de alumnos para estimar la proporción de éstos que ayudan en las tareas escolares a sus hijos. De entre los 120 seleccionados 97 respondieron afirmativamente. Obtenga un intervalo de confianza del 80% para estimar la proporción de padres del centro que ayudan a sus hijos. El intervalo de confianza para p al nivel (1 − α ) ⎡ U p (1 − U p ) U p (1 − U p ) ⎤ , U p + zα / 2 ⎢U p − zα / 2 ⎥ n n ⎢⎣ ⎥⎦ 97 = 0,803 120 1 − u p = 0,197 up = ⎡ 0,803(1 − 0,803) 0,803(1 − 0,803) ⎤ , 0,803 + 1,28 ⎢0,803 − 1,28 ⎥ 120 120 ⎣ ⎦ [0,803 − 0,046, 0,803 + 0,046] = (0,757, 0,849) Estimacion puntual y por Intervalo Intervalo de confianza para la varianza de una población Sea una población sobre la que se observa una variable aleatoria X con distribución X → N (µ ,σ ) Usaremos como estimador de la varianza poblacional la cuasivarianza muestral. Sabemos que el estadístico muestral Uchi sigue un modelo Chi-cuadrado con n-1 grados de libertad n U chi = (n − 1) S 2 σ2 →χ 2 n −1 S2 = donde ∑(X i =1 i − X )2 n −1 Dado un nivel de confianza (1 − α ) podemos encontrar en la distribución los valores que encierran en el centro de la distribución un área (probabilidad) igual (1 − α ) α /2 χ 1 − α = P( χ 2 1−α / 2 α /2 (1 − α ) ≤ U chi ≤ χα / 2 ) = P ( χ 2 Chi-cuadrado con n-1 g.l χα / 2 2 1−α / 2 2 2 1−α / 2 ≤ (n − 1) S 2 σ 2 ≤ χα2 / 2 ) = Estimacion puntual y por Intervalo Intervalo de confianza para la varianza α /2 α /2 (1 − α ) χ12−α / 2 1 − α = P( χ = P( 2 1−α / 2 1 χ12−α / 2 ≥ ≤ U chi ≤ χα / 2 ) = P ( χ 2 σ2 (n − 1) S 2 ≥ 1 χα2 / 2 Chi-cuadrado con n-1 g.l χα2 / 2 ) = P( 2 1−α / 2 ≤ (n − 1) S 2 (n − 1) S 2 χ12−α / 2 σ 2 ≥σ ≥ 2 ≤ χα2 / 2 ) = (n − 1) S 2 χα2 / 2 ) El intervalo de confianza para la varianza al nivel (1 − α ) ⎡ (n − 1) S 2 , ⎢ 2 ⎣ χα / 2 (n − 1) S 2 ⎤ χ12−α / 2 ⎥⎦ Estimacion puntual y por Intervalo Ejemplo: Intervalo de confianza para la varianza Se desea estimar la variabilidad resultante en los pesos de una máquina de empaquetado. Se ha seleccionado una muestra de 15 paquetes cuyos pesos presentan una varianza igual a 25 gramos. Estime la varianza con la que trabaja la máquina a un nivel de confianza del a) 90% b) 95% ⎡ (n − 1) S 2 (n − 1) S 2 ⎤ , ⎢ ⎥ 2 2 El intervalo de confianza para la varianza al nivel ⎣ χα / 2 (1 − αχ)1−α / 2 ⎦ s2 = n 15 var = 25 = 26,786 n −1 14 ⎡ (15 − 1)26,786 , ⎢ 23,8 ⎣ ⎡ (15 − 1)26,786 , ⎢ 26,3 ⎣ (15 − 1)26,786 ⎤ = (15,756, 56,991) ⎥ 6,58 ⎦ (15 − 1)26,786 ⎤ = (14,259, 66,608) ⎥ 5,63 ⎦