TEMA 5: DISTRIBUCIONES DE PROBABILIDAD DISTRIBUCIONES PARA VARIABLES ALEATORIAS CONTINUAS • Las distribuciones t de Student, Chi cuadrado () y F, se derivan de la distribución Normal y están relacionadas con la teoría del muestreo pequeño n< 30. • Son muy importantes pues son la base de metodologías inferenciales, tales como Intervalos de Confianza y Pruebas de Hipótesis. • Las variables t, y F surgen de transformaciones de variables aleatorias en las que están involucrados estadísticos muestrales, tales como la media y la variancia. En la práctica, por lo tanto, no podemos decir por Ej. que el peso, la altura, etc., se distribuyen según t, y F DISTRIBUCIÓN DE STUDENT O DISTRIBUCIÓN t En muchos casos se seleccionan de una población normal, muestras de tamaño pequeño n < 30 y x desconocido El estadístico t será DEFINICIÓN Una variable con distribución t de Student se define como el cociente entre una variable normal estandarizada y la raíz cuadrada positiva de una variable dividida por sus grados de libertad. CARACTERISTICAS • La distribución se denomina distribución de Student o distribución t. • Es simétrica, con media de 0, y variancia mayor que 1. • Es más achatada que la normal y adopta diferentes formas, según el número de grados de libertad. • La variable t se extiende desde − a +. • A medida que aumenta los (n −1) grados de libertad la distribución t se aproxima en su forma a una distribución normal. • El parámetro de la distribución es (n−1) grados de libertad, originando una distribución diferente para cada tamaño de muestra. ¿Cómo se deduce una distribución de t? • Extraigo K muestras de tamaño n < 30. • Calculo para cada muestra el valor de t. • Grafique la distribución para cada tamaño muestral Distribución t para diferentes grados de libertad (n−1) 1 DISTRIBUCIÓN CHI_ CUADRADO Para muestras extraídas de una población normal con variancia , con tamaño n < 30, siendo S2 la variancia de la muestra entonces el estadístico será DEFINICIÓN Una variable Chi cuadrado se define como la suma de n variables normales estandarizadas elevadas al cuadrado. CARACTERISTICAS • Por definición, una variable adopta valores positivos: 0 " " ". • La distribución es asimétrica positiva. • A medida que aumenta el tamaño de la muestra la curva es menos asimétrica, aproximándose a una curva normal. • Para cada tamaño muestral, se tendrá una distribución diferente. • El parámetro que caracteriza a una distribución son sus grados de libertad (n−1), originado una distribución para cada grado de libertad, ¿Cómo se deduce una distribución ? • Extraer K muestras de tamaño n < 30 • Para cada muestra, por ejemplo n = 5, transformamos cada valor de x: x1, x2, x3, x4 y x5 en Z: z1, z2, z3, z4 y z5, utilizando: • Para cada muestra calculamos: • Entonces podríamos escribir , así: (1) • Si cambiamos en (1) la media poblacional por X, resulta: 2 (2) • Dado que: , despejando tenemos: , al reemplazar en (2) llegamos a: • Finalmente si se calcula para cada una de las K muestras y se grafica en un eje de coordenadas el se genera una distribución de con (n−1) grados de libertad. Distribución de ji−cuadrado para algunos valores de grados de libertad. DISTRIBUCIÓN F DE FISHER Considerando dos muestras aleatorias independientes, de tamaño n1 y n2, extraídas de una población normal, el estadístico F será DEFINICIÓN Una variable F se define como el cociente entre dos variables ji−cuadrado divididas por sus correspondientes grados de libertad. CARACTERISTICAS • Una variable con distribución F es siempre positiva por lo tanto su campo de variación es 0 " F "" • La distribución de la variable es asimétrica, pero su asimetría disminuye cuando aumentan los grados de libertad del numerador y denominador. 3 • Hay una distribución F por cada par de grados de libertad. • Parámetros: Grados de libertad asociados al numerador y denominador ¿Cómo se deduce una distribución F? • Extraiga k pares de muestras aleatorias independientes de tamaño n < 30. • Calcule para cada par el cociente de variancias que proporciona un valor de F. • Graficar los valores de F de los k pares de muestras. Distribución F para diferentes grados de libertad 4