www.grupoekd.es TEMA 1: MUESTREO Y DISTRIBUCIONES MUESTRALES 1. CONCEPTOS BÁSICOS SOBRE MUESTREO · Definiciones: - Inferencia estadística: proceso que tiene por objeto sacar conclusiones sobre una población a partir de una muestra. - Variable: rasgo o característica que queremos estudiar de un objeto de una población. - Muestra aleatoria simple (m.a.s.): muestra en la que cada objeto tiene la misma probabilidad de ser seleccionado, y los objetos han sido seleccionados seleccionados de forma independiente (la selección de un objeto no cambia la probabilidad de elegir otro). - Diferencia entre parámetro y estadístico: o El parámetro hace referencia a la población (ej: µ) o El estadístico se construye con la muestra para sacar conclusiones conclusi sobre el parámetro (ej: x) - Distribución muestral: distribución de probabilidad de un estadístico o Los estadísticos son variables aleatorias, porque nos dan un valor u otro dependiendo de la muestra aleatoria con el que lo calculemos o Por eso los estadísticos estadís tienen distribuciones muestrales. 2. DISTRIBUCIÓN DE LA MEDIA MUESTRAL Y TEOREMA CENTRAL DEL LÍMITE 2.1. PROPIEDADES ESTADÍSTICAS DE LA MEDIA MUESTRAL · Si tenemos una m.a.s. X1, X2,…, Xn (esto es n variables aleatorias v.a., independientes e . / ∑ $ / 0 . 0 idénticamente distribuidas i.i.d.) entonces la media muestral viene dada por: $ · Cálculo de la esperanza y la varianza de la media muestral: - Si X1, X2,…, Xn tiene o Media μ=E(Xi) o Varianza σ E X μ E X ! E X ! - Y sabiendo dos propiedades básicas de la esperanza: ∑ aE X o E ∑ aX b b o Si X son independientes, Var ∑ a X b - Podemos demostrar que: La esperanza de la media muestral, muestral es la media poblacional: # $ - Demostración: E X E& ∑ ∑ X' E X nμ ∑ a Var X % μ La varianza de la media muestral es la varianza poblacional dividida entre n: )*+ $ - Demostración: Var X Var & ∑ X' , ∑ Var X , nσ 3, 12 / 2.2. ¿CÓMO CÓMO SE DISTRIBUYE LA MEDIA MUESTRAL? MUESTRAL · Distribución normal: - Sea X una v.a. con distribución normal N(μ,σ N( 2) - Propiedad de “linealidad”: o Las transformaciones lineales de v.a. normales, siguen siendo v.a. normales o SiX~N μ, σ → aX b~N aμ b, a σ ekd@grupoekd.es Estadística e intro a la econometría Tema 1 1 www.grupoekd.es - Normalización (tipificación, estandarización): Si X~N μ, σ o entonces <=> 3 tiene una distribución N(0,1) llamada distribución normal estándar. - Combinaciones lineales de normales independientes: o Si X son v.a. independientes con X ~N μ , σ o Y si c son números reales o Entonces ∑ c X ~N ∑ c μ , ∑ c σ ! - Si tenemos Z~N 0,1 1 denotamos por zα al número que deja a la derecha una probabilidad α. o Esto es: P Z 9 zC α o Ejemplo: z0.025=1.96, esto significa que P Z 9 1.96 0.025 · Aplicación a la media muestral: - Si tenemos una m.a.s. de una v.a. X~N μ, σ Demostración: o X E X Var X - ∑ X E& ∑ X' Var & ∑ Otro resultado importante: <=> , ?@ A X' entonces X~N &μ, ∑ ~N 0,1 E X , ∑ nμ Var X 3, μ , ' nσ 3, 2.3. TEOREMA CENTRAL DEL LÍMITE · Si tenemos: - X1, … , Xn una m.a.s. de una v.a. X. - E(X)=µ - Var(X)= σ2 - El tamaño muestral n es “suficientemente” grande. Si aplicamos el TCL tenemos que X se distribuye aproximadamente como una normal X ≅ N μ, σ · Aplicación a la media muestral: - - Sabemos que E X μ y que Var X TCL entonces: $ ≅ ; &%, 12 / 3, , si n es suficientemente grande y aplicamos ' En caso de que queremos tipificar, se distribuirá como una normal estándar: Z <=> , ?@ A ~N 0,1 · Es importante diferencia entre cuando se distribuye exactamente como una normal y cuando se distribuye aproximadamente como una normal: - Si X se distribuye como una normal: cuando tipificamos Z es exactamente normal estándar. - Si X no se distribuye como una normal: Z se distribuye aproximadamente como una normal estándar al aplicar TCL. ekd@grupoekd.es Estadística e intro a la econometría Tema 1 2 www.grupoekd.es 3. DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL · Queremos estudiar la proporción de la población (p) que satisface una cierta característica. - Llamamos Xi a esta variable aleatoria 1sieli ésimoelementodelamuestrasatisfacelacaracter característica a X J 0encasocontrario contrario - Características: o Distribución binomial: X ~Bi 1, p o Además, si Xi son independientes: ∑ X ~Bi n, p o Esperanza: E(Xi)=p o Varianza: Var(Xi)=p(1-p) - La proporción poblacional es p (proporción de la población que sí satisface la característica). - ∑ La proporción muestral es pQ o Esperanza: E pQ p Varianza: Var pQ X Demo: E pQ o X E & ∑ =X Var & ∑ Demo: Var pQ · ¿Cómo se distribuye pQ ? : aplicamos el TCL - Sabiendo que E pQ X' p y que Var pQ X' X ∑ , ∑ E X Var X np p , np 1 p X =X =X Si n es suficientemente grade (suele funcionar cuando np(1-p)>5 np(1 p)>5 en las proporciones) Entonces podemos aplicar el TCL: o Resultado: pQ ≅ N &p, o Y si tipificamos: Y =X X X Z [\Z ? A =X ' ] N 0,1 4. DISTRIBUCIÓN DE LA VARIANZA MUESTRAL · Si tenemos: - Una m.a.s. X1, X2,…, Xn - Con media μ - Con varianza σ Entonces la varianza muestral viene dada por: S , ∑A ^_[ <^ =< = , , ∑A ^_[ <^ = < = · La esperanza de la varianza muestral es la varianza poblacional: E(S2)=σ2 - Demostración resumida: resumida ∑ X nX E ∑ X nX ! n σ μ n Var X E S ER ` n 1 n 1 n 1 σ nσ σ nμ n n nμ n 1 σ σ n 1 n 1 ekd@grupoekd.es Estadística e intro a la econometría Tema 1 E X 3 www.grupoekd.es · Distribución chi-cuadrado (χχn2): - Se llama distribución chi-cuadrado chi cuadrado con n grados de libertad a la distribución de la v.a. ∑ Z siendo Zi v.a. i.i.d. con distribución normal estándar. - Propiedades: o Es una v.a. continua o Siempre toma valores no negativos o Esperanza: n (demo en clase) o Varianza: 2n o Es asimétrica o Depende de n o Denotaremos por χ ;C al número que deja a la derecha una probabilidad de d α P χ 9χ · Teorema: ;C ! α Si tenemos X1, X2, …, Xn m.a.s. de una v.a. X~N μ, σ entonces cuadrado con n-1 1 grados de libertad. libertad - Ten en cuenta que: o o d= e , f, ekd@grupoekd.es es una chi- , ∑j i_[ hi =h f, Si cambiamos la media muestral por la media poblacional, es una chi-cuadrado chi con n grados de libertad: libertad o = g, ~χ = 3, , ∑A ^_[ <^ => 3, ∑ <^ => ' 3 & ∑ Z ~χ Este teorema permite calcular probabilidades sobre la varianza muestral cuando conocemos σ. Estadística e intro a la econometría Tema 1 4