Estadísticas y distribuciones de muestreo DIANA DEL PILAR COBOS DEL ANGEL 27/11/2011 Estadísticas 2 Una estadística es cualquier función de las observaciones en una muestra aleatoria que no depende de parámetros desconocidos. Por ejemplo, si X1, X2,…,Xn es una muestra aleatoria de tamaño n, entonces la media de la muestra X, la varianza de la muestra S2 y la desviación estándar S son estadísticas. n X Xi i 1 n n S2 (X i 1 i X )2 n 1 El proceso de extraer conclusiones en torno a poblaciones con base en datos de muestras utiliza estadísticas en forma considerable. Diana Cobos del Angel 27/11/2011 1 Distribuciones muestrales 3 Supóngase que se toma una muestra aleatoria de tamaño n, X1, X2, …, Xn de una población con distribución Normal, N(m,s2). Cada observación es una v.a. con distribución N(m,s2) Entonces la media X es una v. a. con distribución N(m,s2/n) Diana Cobos del Angel 27/11/2011 Teorema de Límite Central 4 Si X es la media de una muestra aleatoria de tamaño n que se toma de una población con media m y varianza s2, entonces, el estadístico Z X m s/ n Se aproxima a una distribución Normal estándar cuando n tiende a infinito. Observación: esta aproximación será mejor para n ≥ 30 sin importar la forma de la población. Si n < 30 la aproximación es buena sólo si la población no difiere mucho de una distribución Normal. Diana Cobos del Angel 27/11/2011 2 Distribución Ji cuadrada c2 5 Sean Z1, Z2, …, Zn variables aleatorias con distribución normal estándar, es decir N(0,1). Entonces n Y Zi2 Z12 Z 22 ... Z n2 c n2 i 1 Tiene la función de densidad Ji cuadrada con n grados de libertad Diana Cobos del Angel 27/11/2011 Distribución Ji cuadrada c2 6 Diana Cobos del Angel 27/11/2011 3 Características de Ji cuadrada c2 7 Asimétrica y asintótica al eje x por la derecha; Su dominio va de 0 a + Área bajo la curva desde 0 a + =1 Tiene parámetro = n (g.l.) Al aumentar n se aproxima a la normal Representa distribución muestral de varianza. Entre las aplicaciones: Determinación intervalos confianza para varianzas Pruebas de hipótesis para una varianza El ajuste de datos a una distribución dada conocida Las pruebas de independencia. Diana Cobos del Angel 27/11/2011 Gráficas de Ji cuadrada c2 8 Diana Cobos del Angel 27/11/2011 4 Distribución Ji cuadrada c2 9 Diana Cobos del Angel 27/11/2011 Probabilidad c2 Excel 10 =DISTR.CHI(x;) Devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución Ji cuadrada de una sola cola con gl. P(X>c2) Diana Cobos del Angel 27/11/2011 5 Probabilidad c2 11 Diana Cobos del Angel 27/11/2011 Probabilidad c2 Inversa Excel 12 =PRUEBA.CHI.INV(P,) Devuelve el valor de c2 para una probabilidad dada, de una distribución Ji-cuadrada de una sola cola con g.l. Diana Cobos del Angel 27/11/2011 6 Ejercicios Ji cuadrada c2 13 a) Calcular la probabilidad de obtener un valor mayor de 23.7 en una distribución c2 con = 14 g.l., es decir P( c142 23.7) b) Calcular el valor de c2 después del cual se encuentre el 5 % del área en una distribución Ji-cuadrado con 4 g.l., es decir P( c42 c 2 ) 0.05 Diana Cobos del Angel 27/11/2011 Distribución “t” de Student 14 Desarrollada con base en distribuciones de frecuencia empíricas por el estadístico William Gosset, cuyo seudónimo era “Student”. Gosset trabajó en la Cervecería Guiness de Dublín y tenía dificultades al usar la distribución Normal en muestras pequeñas “The probable error of a mean” Biometrika 1908 Fisher fue quien encontró mas aplicaciones para ésta. Diana Cobos del Angel 27/11/2011 7 Distribución “t” de Student 15 La distribución muestral de la media de una muestra aleatoria X se ajusta muy bien a la distribución Normal si se conoce s. Si n es grande, esto no presenta ningún problema, aún cuando s sea desconocida, por lo que en este caso es razonable sustituirla por s. Sin embargo, en el caso de usar valores de n < 30, o sea en el caso de pequeñas muestras, esto no funciona tan bien, y la distribución que mejor se ajusta es la t de Student. Diana Cobos del Angel 27/11/2011 Distribución “t” de Student 16 Sean Z es una v.a. Normal estándar y V es una v.a. Ji con k grados de libertad. Si Z y V son independientes, entonces la v.a. Z T V /k tiene una distribución t con n grados de libertad, cuya función de densidad es: Diana Cobos del Angel 27/11/2011 8 Distribución “t” de Student 17 Definiendo el estadístico t: t= x -m s/ n Se puede probar que siendo `x la media de una muestra de tamaño n tomada de una población Normal con media m y varianza s2, el estadístico t es el valor de una variable aleatoria con distribución "t" de Student y parámetro (grados de libertad) = n-1. Diana Cobos del Angel 27/11/2011 Distribución “t” de Student 18 Diana Cobos del Angel 27/11/2011 9 Distribución “t” de Student 19 Diana Cobos del Angel 27/11/2011 Características de la distribución “t” 20 Tiene media igual 0, es asintótica al eje x y su dominio va de - a +; El área bajo la curva desde - a + es igual a 1 m 0, s2 depende parámetro (grados libertad) Varianza > 1, pero se aproxima a 1 cuando n Al aumentar n, la distribución “t se aproxima a la Normal; n > 30 ó más, excelente aproximación Entre las aplicaciones: Estimación de intervalos de confianza para medias a partir de muestras pequeñas Pruebas de hipótesis basadas en muestras < 30 Diana Cobos del Angel 27/11/2011 10 Distribución “t” de Student 21 Diana Cobos del Angel 27/11/2011 Distribución “t” de Student 22 Las tablas brindan sólo los puntos porcentuales de la cola superior Diana Cobos del Angel 27/11/2011 11 Probabilidad “t” en Excel 23 =DISTR.T(x,,colas) Devuelve el área a la derecha de x (a) x= valor de t (solo positivo) = grados de libertad Colas = 1 o 2 colas colas= 1, P( X>t ) colas = 2, P(|X| > t); P(X > t o X < -t). Diana Cobos del Angel 27/11/2011 Probabilidad “t” Inversa en Excel 24 =DISTR.T.INV(a,) Devuelve el valor de t de dos colas, después del cual se encuentra el a x 100% del área de la curva. P(|X| > t) = P(X < -t o X > t). Para una cola, remplazar a por 2 a. Diana Cobos del Angel 27/11/2011 12 Ejercicio distribución “t” de Student 25 a) Calcular la probabilidad de obtener un valor mayor que 2,26 en una distribución t con 9 gdl b) Calcular la probabilidad de obtener un valor mayor que 2,26 o menor que -2,26 en una distribución t con 9 gdl c) Calcular el valor de t después del cual se encuentre el 5% del área de la curva con 9 gdl d) Calcular el valor de t para a= 0,05 con 9 gdl y dos colas Diana Cobos del Angel 27/11/2011 Distribución "F” de Fisher 26 Sean W y Y v.a. con distribución Ji cuadrada, independientes con n1 y n2 grados de libertad respectivamente. Entonces el cociente F W / n1 Y / n2 Sigue la distribución F con n1= u g.l. en el numerador y n2 = v g.l. en el denominador y su función de densidad es: Diana Cobos del Angel 27/11/2011 13 Distribución "F” de Fisher 27 También llamada "F” de Fisher - Schnedecor Representa la distribución muestral de la razón de dos varianzas. Es decir que se obtiene de la razón de dos distribuciones Ji-cuadradas. Definimos el estadístico F como: s12 F= 2 s2 El cual es el valor de una variable aleatoria que tiene distribución F con parámetros n1 y n2 Diana Cobos del Angel 27/11/2011 Propiedades de distribución F 28 Asimétrica, y asintótica al eje x por el lado derecho Su dominio va de 0 a + Área bajo curva desde 0 a + =1 Tiene parámetros n1 y n2 Entre sus aplicaciones: Pruebas de hipótesis entre 2 varianzas Análisis de varianza Análisis de covarianza. Diana Cobos del Angel 27/11/2011 14 Gráfica de la distribución F 29 Diana Cobos del Angel 27/11/2011 Propiedades de Distribución F 30 n E(F ) 2 n2 2 2n22 (n1 n2 2) V (F ) n1 (n2 2)2 (n2 4) Diana Cobos del Angel 27/11/2011 15 Gráfica de la distribución F 31 Diana Cobos del Angel 27/11/2011 Probabilidad F Excel 32 =DISTR.F(x,1, 2) Devuelve el área a la derecha de un valor en una distribución F con 1 y 2 g.l. P( F>x ) Diana Cobos del Angel 27/11/2011 16 Probabilidad F Inversa Excel 33 =DISTR.F.INV(a, 1, 2) Devuelve el valor crítico de F(a) para una distribución F con 1, 2 g.l. Diana Cobos del Angel 27/11/2011 Ejercicios sobre la distribución F 34 a) Determine la probabilidad de tener un valor de F mayor que 9.28 en una distribución F con 1=3 y 2=3 g.l. b) Halle la el valor crítico de F(0.05) para 1=3 y 2=15 g.l. Diana Cobos del Angel 27/11/2011 17