ESTIMACION DISTRIBUCION T STUDENT DISTRIBUCION MEDIA

Anuncio
FUNDACION CENTRO COLOMBIANO DE ESTUDIOS PROFESIONALES.
AREA: ESTADISTICA INFERENCIAL
PERIODO ACADEMICO: II-2012
DISTRIBUCION t STUDENT
NOMBRE:
GRADO:
No:
FECHA:
DISTRIBUCION T STUDENT
Se usa para la estimación de intervalo de confianza para la media (𝜎
desconocida).
En la generalidad de los casos, no disponemos de la desviación
estándar de la población, sino de una estimación calculada a partir de
una muestra extraída de la misma y por lo tanto no podemos calcular
Z.
En estos casos calculamos el estadístico t.
𝑥−𝜇
t=
𝑠
con s =
𝑖:1
La desviación estándar.
(𝑥𝑖− 𝑥̅ )2
𝑛−1
Donde se debe conocer
𝑥̅ : Media.
𝑥𝑖 : n-1 son valores libres de variar : grados de libertad.
EJEMPLO:
Si una muestra de 5 valores tiene una media de 20. Los términos son:
𝑋1 = 21, 𝑋2 = 16, 𝑋3 = 23, 𝑋4 = 19, 𝑋5 = Desconocido,
Tenemos que n = 5, entonces necesitamos conocer n-1 elementos de
la muestra.
n-1 = 5 – 1 = 4. Debe conocer 4 datos.
Nos indica que 𝑋̅ =
∑𝑛
𝑖=1 𝑋𝑖
∑𝑛
𝑖=1 𝑋𝑖
𝑛
𝑛
= 20. Evaluando tenemos que
= 20 ∑5𝑖=1 𝑋𝑖 = 20n = 20(5) = 100.
Como se conocen 4 elementos y el 5º no puede variar, porque la
sumatoria debe dar 100,
𝑋1 + 𝑋2 + 𝑋3 + 𝑋4 + 𝑋5 = 100
21 + 16 + 23 + 19 + 𝑋5 = 100
79 + 𝑋5 = 100
𝑋5 = 100 – 79
𝑋5 = 21
PROPIEDADES DE LA DISTRIBUCION t STUDENT.
1. Es muy similar a la distribución normal estandarizada.
2. También tiene forma de campana.
3. Es de mayor área en los extremos y menor en el centro, porque
𝜎 (La desviación estándar) es desconocida.
4. Los grados de libertad n-1 están relacionados con el tamaño de
la muestra.
5. Para n ≥ 120 s estima a 𝜎 para que entre t y z haya poca
diferencia
INTERVALO DE CONFIANZA.
𝑆
, se puede calcular por:
√𝑛
𝑆
𝑆
𝑡𝑛−1 𝑛 ≤ 𝜇 ≤ 𝑋̅ + 𝑡𝑛−1 𝑛
√
√
̅
Como 𝑋
𝑋̅ −
± 𝑡𝑛−1
Para 𝑡1 podemos hallar el límite inferior 𝑋̅𝑖 =
𝑡1 = −1.6604
110.27
𝑆
√𝑛
𝑆
𝑡𝑛−1 𝑛
√
𝑋̅ − 𝑡𝑛−1
Para 𝑡2 podemos hallar el límite superior 𝑋̅𝑠 =
𝑋̅ +
EJEMPLO:
Una empresa de remodelaciones selecciona una muestra de 100
facturas de la población de las ventas durante un mes; la media de la
muestra de las 100 facturas de ventas es US 110.27, con una
desviación estándar de de US 28.95. Para un nivel de confianza del
90%, determinar el intervalo de confianza.
𝑡2 = +1.6604
0
𝑠
Los limites del intervalo son: 𝑋̅𝑖 = 𝑋̅ + 𝑡𝑛−1
√𝑛
𝑠
Para 𝑡1 = −1.6604
𝑋̅1 = 𝑋̅ − 𝑡1
Para 𝑡2 = +1.6604
Grados de libertad:
La Varianza se calcula para una muestra
𝑛
(𝑥𝑖− 𝑥̅ )2
𝑠 2: ∑
𝑛−1
𝑖:1
90%
𝑛−1
𝑥−𝜇
𝑡: 𝑠
√𝑛
𝑛
0.0500
2
̅
∑𝑛
𝑖=1(𝑋 −𝑋𝑖 )
√
Donde S es la desviación estándar muestral, calculada con n-1 grados
de libertad.
William S Gosset es el que desarrolla este método, pero utiliza el
seudónimo de Student por protección con la empresa.
Si la variable aleatoria X se distribuye normalmente.
El estadístico tiene una distribución t con n-1 grados de libertad.
𝜎: √∑
Grados de libertad. n – 1 = 100 – 1 = 99.
La desviación estándar de la muestra. S = 28.95.
La media muestral. 𝑋̅ = 110.27
𝑛 = 100
𝑋̅ = 110.27𝑢𝑠
𝑆 = 28.97𝑢𝑠
Grados de libertad 𝑛 − 1 = 100 − 1 = 99
Desviación Estándar de la muestra.
𝑆
28.95
𝜎𝑋̅ =
=
= 2.895
√𝑛 √100
Colas del Intervalo.
100% − 90% 10%
𝐶𝑜𝑙𝑎𝑠 =
=
= 5%
2
2
Cada cola representa una área de 𝐴 = 0.0500.
𝑋̅1
𝑋̅1
𝑋̅1
𝑋̅2
√𝑛
= 110.27 − (1.6604)(2.895)
= 110.27 − 4.80
= 105.47
𝑠
= 𝑋̅ − 𝑡1
√𝑛
𝑋̅2 = 110.27 + (1.6604)(2.895)
𝑋̅2 = 110.27 + 4.80
𝑋̅2 = 115.07
El intervalo de confianza es:
105.47 ≤ 𝜇 ≤ 115.07
CONCLUSION:
Con un 95% de confianza podemos asegurar que la media de la vida
útil de los bombillos de la población, está entre:
[105.47; 115.07]
EJEMPLO.
La vida útil promedio de una muestra aleatoria de 10 bombillas metal
Higt ligth (Para escenarios deportivos) es 4000 horas, con una
desviación estándar muestral de 200 horas. Se supone que la vida útil
de los bombillos tiene una distribución aproximadamente normal. Si
se estima la vida útil promedio de la población de la cual se tomo la
muestra y utilizando un intervalo de confianza del 95%. Cuál es el
intervalo de confianza?
𝑛 = 10
𝑋̅ = 4.000 ℎ𝑟𝑠
𝑆 = 200
Grados de libertad 𝑛 − 1 = 10 − 1 = 9
Desviación Estándar de la muestra.
𝑆
200
𝜎𝑋̅ =
=
= 63.24
√𝑛 √10
Colas del Intervalo.
100% − 95% 5%
𝐶𝑜𝑙𝑎𝑠 =
=
= 2.5%
2
2
Cada cola representa una área de 𝐴 = 0.0250.
0.0250
95%
𝑡1 = −2.262
4.000
𝑡2 = +2.262
0
𝑠
Los limites del intervalo son: 𝑋̅𝑖 = 𝑋̅ + 𝑡𝑛−1
√𝑛
𝑠
Para 𝑡1 = −2.262
𝑋̅1 = 𝑋̅ − 𝑡1
√𝑛
𝑋̅1 = 4.000 − (2.262)(63.24)
𝑋̅1 = 4.000 − 143.04
𝑋̅1 = 3.856.96
𝑠
Para 𝑡2 = +2.262
𝑋̅2 = 𝑋̅ − 𝑡1
√𝑛
𝑋̅2 = 4.000 + (2.262)(63.24)
𝑋̅2 = 4.000 + 143.04
𝑋̅2 = 4.143.04
El intervalo de confianza es:
3.856.96 ≤ 𝜇 ≤ 4.143.04
CONCLUSION:
Con un 95% de confianza podemos asegurar que la media de la vida
útil de los bombillos de la población, está entre:
[3.856.96; 4.143.04]
1. Un fabricante de focos afirma que su producto durará un
promedio de 500 horas de trabajo. Para conservar este
promedio esta persona verifica 25 focos cada mes. Si el valor y
calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho
con esta afirmación. ¿Qué conclusión deberá él sacar de una
muestra de 25 focos cuya duración fue?:
520
521
511
513
510
513
522
500
521
495
496
488
500
502
512
510
510
475
505
521
506
503
487
493
500
𝜇 = 500
𝑛 = 25
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 = 90%
Hallamos la media aritmética de la muestra.
520+513+496+⋯…+512+512+512
12.364
𝑋̅ =
=
= 505.36
25
muestra poblacional está por encima de esta, y por lo tanto debería
estar por encima de 500.
2. El gerente de una fábrica de cierto tipo de alimentos asegura
que el peso promedio del producto que elabora es de 165,285 g.
Un inspector toma una muestra de 16 paquetes del producto y
los pesa. Los resultados fueron los siguientes: 165 158, 153, 162,
171, 175, 173, 169, 166, 170, 164, 177, 148, 167, 152, 149.
Encuentre la probabilidad de x < 163.6875.
𝑃(𝑋 < 163.6875) = 𝑃(𝑡 < −𝑂. 6915) = 0.250
1. Establecer datos.
n =16
μ = 165.285 gr.
2. Hallar los valores de la media aritmética y la desviación estándar
de la muestra.
25
datos
̅ −𝝁
𝑿
̅ − 𝝁)𝟐
(𝑿
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
165
158
153
162
171
175
173
169
166
170
164
177
148
167
152
149
1,31
-5,69
-10,69
-1,69
7,31
11,31
9,31
5,31
2,31
6,31
0,31
13,31
-15,69
3,31
-11,69
-14,69
1,7227
32,3477
114,2227
2,8477
53,4727
127,9727
86,7227
28,2227
5,3477
39,8477
0,0977
177,2227
246,0977
10,9727
136,5977
215,7227
𝑋̅
2619
163,6875
S
𝜎
1279,4375
85,2958
9,24
Calculamos la desviación estándar de la muestra.
2
̅
∑𝑛
𝑖=1(𝑋 −𝑋𝑖 )
𝑠=√
𝑛−1
3.493.76
=√
24
= √145.57 = 12.07
Los valores de la media aritmética y la desviación estándar se pueden
hallar por la siguiente tabla.
DATOS
̅−𝝁
𝑿
̅ − 𝝁)𝟐
(𝑿
520
513
496
510
506
521
522
488
510
503
511
500
500
475
487
513
521
502
505
493
510
495
512
521
500
14,64
7,64
-9,36
4,64
0,64
15,64
16,64
-17,36
4,64
-2,36
5,64
-5,36
-5,36
-30,36
-18,36
7,64
15,64
-3,36
-0,36
-12,36
4,64
-10,36
6,64
15,64
-5,36
214,3296
58,3696
87,6096
21,5296
0,4096
244,6096
276,8896
301,3696
21,5296
5,5696
31,8096
28,7296
28,7296
921,7296
337,0896
58,3696
244,6096
11,2896
0,1296
152,7696
21,5296
107,3296
44,0896
244,6096
28,7296
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
3.
4.
𝑋̅ = 163.6875
S = 9.24.
Hallamos la desviación estándar para la muestra de Student.
𝑆
9.24
𝜎=
=
= 2.31
√𝑛 √16
Aplicar la fórmula para estandarizar los valores de x y hallamos t.
𝑡=
5.
𝑥 − 𝜇 163.6875 − 165.285 −1.5975
=
= −0.6915
𝑠 =
2.31
2.31
√𝑛
Elaborar gráfica del problema.
Representa una área de A = 0.250, según tabla de Student.
0. 2500
12634
505,36
3.493,76
145,57
12,07
Determinemos la desviación estándar de t.
𝜎𝑥̅ =
𝑠
√𝑛
=
Hallamos las unidades t para
𝑡:
12.07
√25
= 2.41
𝑥 − 𝜇 505.36 − 500 5.36
=
= 2.2240
𝑠 =
2.41
2.41
√𝑛
Grados de libertad: 𝑛 − 1 = 25 − 1 = 24
Colas del Intervalo.
100% − 90% 10%
𝐶𝑜𝑙𝑎𝑠 =
=
= 5%
2
2
Cada cola representa una área de 𝐴 = 0.0500
0.0500
90%
𝑡1 = −1.7109
0
𝑡2 = +1.7109
500
CONCLUSION:
Se puede concluir que la media poblacional no es 500, porque la
𝑡1 = −0.6915
0
165,285
6.
Conclusión:
La probabilidad de que el promedio del peso del producto sea
inferior a 163.6875 es de 0.25.
El 25% de los artículos tendrán un peso inferior a 163.6875.
Lic. Simeón Cedano Rojas
ESTIMACION DISTRIBUCION T STUDENT RESUELTO
Descargar