FUNDACION CENTRO COLOMBIANO DE ESTUDIOS PROFESIONALES. AREA: ESTADISTICA INFERENCIAL PERIODO ACADEMICO: II-2012 DISTRIBUCION t STUDENT NOMBRE: GRADO: No: FECHA: DISTRIBUCION T STUDENT Se usa para la estimación de intervalo de confianza para la media (𝜎 desconocida). En la generalidad de los casos, no disponemos de la desviación estándar de la población, sino de una estimación calculada a partir de una muestra extraída de la misma y por lo tanto no podemos calcular Z. En estos casos calculamos el estadístico t. 𝑥−𝜇 t= 𝑠 con s = 𝑖:1 La desviación estándar. (𝑥𝑖− 𝑥̅ )2 𝑛−1 Donde se debe conocer 𝑥̅ : Media. 𝑥𝑖 : n-1 son valores libres de variar : grados de libertad. EJEMPLO: Si una muestra de 5 valores tiene una media de 20. Los términos son: 𝑋1 = 21, 𝑋2 = 16, 𝑋3 = 23, 𝑋4 = 19, 𝑋5 = Desconocido, Tenemos que n = 5, entonces necesitamos conocer n-1 elementos de la muestra. n-1 = 5 – 1 = 4. Debe conocer 4 datos. Nos indica que 𝑋̅ = ∑𝑛 𝑖=1 𝑋𝑖 ∑𝑛 𝑖=1 𝑋𝑖 𝑛 𝑛 = 20. Evaluando tenemos que = 20 ∑5𝑖=1 𝑋𝑖 = 20n = 20(5) = 100. Como se conocen 4 elementos y el 5º no puede variar, porque la sumatoria debe dar 100, 𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5 = 100 21 + 16 + 23 + 19 + 𝑋5 = 100 79 + 𝑋5 = 100 𝑋5 = 100 – 79 𝑋5 = 21 PROPIEDADES DE LA DISTRIBUCION t STUDENT. 1. Es muy similar a la distribución normal estandarizada. 2. También tiene forma de campana. 3. Es de mayor área en los extremos y menor en el centro, porque 𝜎 (La desviación estándar) es desconocida. 4. Los grados de libertad n-1 están relacionados con el tamaño de la muestra. 5. Para n ≥ 120 s estima a 𝜎 para que entre t y z haya poca diferencia INTERVALO DE CONFIANZA. 𝑆 , se puede calcular por: √𝑛 𝑆 𝑆 𝑡𝑛−1 𝑛 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝑛−1 𝑛 √ √ ̅ Como 𝑋 𝑋̅ − ± 𝑡𝑛−1 Para 𝑡1 podemos hallar el límite inferior 𝑋̅𝑖 = 𝑡1 = −1.6604 110.27 𝑆 √𝑛 𝑆 𝑡𝑛−1 𝑛 √ 𝑋̅ − 𝑡𝑛−1 Para 𝑡2 podemos hallar el límite superior 𝑋̅𝑠 = 𝑋̅ + EJEMPLO: Una empresa de remodelaciones selecciona una muestra de 100 facturas de la población de las ventas durante un mes; la media de la muestra de las 100 facturas de ventas es US 110.27, con una desviación estándar de de US 28.95. Para un nivel de confianza del 90%, determinar el intervalo de confianza. 𝑡2 = +1.6604 0 𝑠 Los limites del intervalo son: 𝑋̅𝑖 = 𝑋̅ + 𝑡𝑛−1 √𝑛 𝑠 Para 𝑡1 = −1.6604 𝑋̅1 = 𝑋̅ − 𝑡1 Para 𝑡2 = +1.6604 Grados de libertad: La Varianza se calcula para una muestra 𝑛 (𝑥𝑖− 𝑥̅ )2 𝑠 2: ∑ 𝑛−1 𝑖:1 90% 𝑛−1 𝑥−𝜇 𝑡: 𝑠 √𝑛 𝑛 0.0500 2 ̅ ∑𝑛 𝑖=1(𝑋 −𝑋𝑖 ) √ Donde S es la desviación estándar muestral, calculada con n-1 grados de libertad. William S Gosset es el que desarrolla este método, pero utiliza el seudónimo de Student por protección con la empresa. Si la variable aleatoria X se distribuye normalmente. El estadístico tiene una distribución t con n-1 grados de libertad. 𝜎: √∑ Grados de libertad. n – 1 = 100 – 1 = 99. La desviación estándar de la muestra. S = 28.95. La media muestral. 𝑋̅ = 110.27 𝑛 = 100 𝑋̅ = 110.27𝑢𝑠 𝑆 = 28.97𝑢𝑠 Grados de libertad 𝑛 − 1 = 100 − 1 = 99 Desviación Estándar de la muestra. 𝑆 28.95 𝜎𝑋̅ = = = 2.895 √𝑛 √100 Colas del Intervalo. 100% − 90% 10% 𝐶𝑜𝑙𝑎𝑠 = = = 5% 2 2 Cada cola representa una área de 𝐴 = 0.0500. 𝑋̅1 𝑋̅1 𝑋̅1 𝑋̅2 √𝑛 = 110.27 − (1.6604)(2.895) = 110.27 − 4.80 = 105.47 𝑠 = 𝑋̅ − 𝑡1 √𝑛 𝑋̅2 = 110.27 + (1.6604)(2.895) 𝑋̅2 = 110.27 + 4.80 𝑋̅2 = 115.07 El intervalo de confianza es: 105.47 ≤ 𝜇 ≤ 115.07 CONCLUSION: Con un 95% de confianza podemos asegurar que la media de la vida útil de los bombillos de la población, está entre: [105.47; 115.07] EJEMPLO. La vida útil promedio de una muestra aleatoria de 10 bombillas metal Higt ligth (Para escenarios deportivos) es 4000 horas, con una desviación estándar muestral de 200 horas. Se supone que la vida útil de los bombillos tiene una distribución aproximadamente normal. Si se estima la vida útil promedio de la población de la cual se tomo la muestra y utilizando un intervalo de confianza del 95%. Cuál es el intervalo de confianza? 𝑛 = 10 𝑋̅ = 4.000 ℎ𝑟𝑠 𝑆 = 200 Grados de libertad 𝑛 − 1 = 10 − 1 = 9 Desviación Estándar de la muestra. 𝑆 200 𝜎𝑋̅ = = = 63.24 √𝑛 √10 Colas del Intervalo. 100% − 95% 5% 𝐶𝑜𝑙𝑎𝑠 = = = 2.5% 2 2 Cada cola representa una área de 𝐴 = 0.0250. 0.0250 95% 𝑡1 = −2.262 4.000 𝑡2 = +2.262 0 𝑠 Los limites del intervalo son: 𝑋̅𝑖 = 𝑋̅ + 𝑡𝑛−1 √𝑛 𝑠 Para 𝑡1 = −2.262 𝑋̅1 = 𝑋̅ − 𝑡1 √𝑛 𝑋̅1 = 4.000 − (2.262)(63.24) 𝑋̅1 = 4.000 − 143.04 𝑋̅1 = 3.856.96 𝑠 Para 𝑡2 = +2.262 𝑋̅2 = 𝑋̅ − 𝑡1 √𝑛 𝑋̅2 = 4.000 + (2.262)(63.24) 𝑋̅2 = 4.000 + 143.04 𝑋̅2 = 4.143.04 El intervalo de confianza es: 3.856.96 ≤ 𝜇 ≤ 4.143.04 CONCLUSION: Con un 95% de confianza podemos asegurar que la media de la vida útil de los bombillos de la población, está entre: [3.856.96; 4.143.04] 1. Un fabricante de focos afirma que su producto durará un promedio de 500 horas de trabajo. Para conservar este promedio esta persona verifica 25 focos cada mes. Si el valor y calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho con esta afirmación. ¿Qué conclusión deberá él sacar de una muestra de 25 focos cuya duración fue?: 520 521 511 513 510 513 522 500 521 495 496 488 500 502 512 510 510 475 505 521 506 503 487 493 500 𝜇 = 500 𝑛 = 25 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 = 90% Hallamos la media aritmética de la muestra. 520+513+496+⋯…+512+512+512 12.364 𝑋̅ = = = 505.36 25 muestra poblacional está por encima de esta, y por lo tanto debería estar por encima de 500. 2. El gerente de una fábrica de cierto tipo de alimentos asegura que el peso promedio del producto que elabora es de 165,285 g. Un inspector toma una muestra de 16 paquetes del producto y los pesa. Los resultados fueron los siguientes: 165 158, 153, 162, 171, 175, 173, 169, 166, 170, 164, 177, 148, 167, 152, 149. Encuentre la probabilidad de x < 163.6875. 𝑃(𝑋 < 163.6875) = 𝑃(𝑡 < −𝑂. 6915) = 0.250 1. Establecer datos. n =16 μ = 165.285 gr. 2. Hallar los valores de la media aritmética y la desviación estándar de la muestra. 25 datos ̅ −𝝁 𝑿 ̅ − 𝝁)𝟐 (𝑿 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 165 158 153 162 171 175 173 169 166 170 164 177 148 167 152 149 1,31 -5,69 -10,69 -1,69 7,31 11,31 9,31 5,31 2,31 6,31 0,31 13,31 -15,69 3,31 -11,69 -14,69 1,7227 32,3477 114,2227 2,8477 53,4727 127,9727 86,7227 28,2227 5,3477 39,8477 0,0977 177,2227 246,0977 10,9727 136,5977 215,7227 𝑋̅ 2619 163,6875 S 𝜎 1279,4375 85,2958 9,24 Calculamos la desviación estándar de la muestra. 2 ̅ ∑𝑛 𝑖=1(𝑋 −𝑋𝑖 ) 𝑠=√ 𝑛−1 3.493.76 =√ 24 = √145.57 = 12.07 Los valores de la media aritmética y la desviación estándar se pueden hallar por la siguiente tabla. DATOS ̅−𝝁 𝑿 ̅ − 𝝁)𝟐 (𝑿 520 513 496 510 506 521 522 488 510 503 511 500 500 475 487 513 521 502 505 493 510 495 512 521 500 14,64 7,64 -9,36 4,64 0,64 15,64 16,64 -17,36 4,64 -2,36 5,64 -5,36 -5,36 -30,36 -18,36 7,64 15,64 -3,36 -0,36 -12,36 4,64 -10,36 6,64 15,64 -5,36 214,3296 58,3696 87,6096 21,5296 0,4096 244,6096 276,8896 301,3696 21,5296 5,5696 31,8096 28,7296 28,7296 921,7296 337,0896 58,3696 244,6096 11,2896 0,1296 152,7696 21,5296 107,3296 44,0896 244,6096 28,7296 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 3. 4. 𝑋̅ = 163.6875 S = 9.24. Hallamos la desviación estándar para la muestra de Student. 𝑆 9.24 𝜎= = = 2.31 √𝑛 √16 Aplicar la fórmula para estandarizar los valores de x y hallamos t. 𝑡= 5. 𝑥 − 𝜇 163.6875 − 165.285 −1.5975 = = −0.6915 𝑠 = 2.31 2.31 √𝑛 Elaborar gráfica del problema. Representa una área de A = 0.250, según tabla de Student. 0. 2500 12634 505,36 3.493,76 145,57 12,07 Determinemos la desviación estándar de t. 𝜎𝑥̅ = 𝑠 √𝑛 = Hallamos las unidades t para 𝑡: 12.07 √25 = 2.41 𝑥 − 𝜇 505.36 − 500 5.36 = = 2.2240 𝑠 = 2.41 2.41 √𝑛 Grados de libertad: 𝑛 − 1 = 25 − 1 = 24 Colas del Intervalo. 100% − 90% 10% 𝐶𝑜𝑙𝑎𝑠 = = = 5% 2 2 Cada cola representa una área de 𝐴 = 0.0500 0.0500 90% 𝑡1 = −1.7109 0 𝑡2 = +1.7109 500 CONCLUSION: Se puede concluir que la media poblacional no es 500, porque la 𝑡1 = −0.6915 0 165,285 6. Conclusión: La probabilidad de que el promedio del peso del producto sea inferior a 163.6875 es de 0.25. El 25% de los artículos tendrán un peso inferior a 163.6875. Lic. Simeón Cedano Rojas ESTIMACION DISTRIBUCION T STUDENT RESUELTO