TAREA 4 difieren los factores de tratamiento y de bloque?

Anuncio
TAREA 4
1. En que situaciones se aplica un diseño de bloques completos al azar? En que
difieren los factores de tratamiento y de bloque?
Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor sin
que las posibles diferencias se deban a otros factores que no se consideraron en el
estudio. En el diseño DBCA, en cada bloque se prueban todos los tratamientos. La
aleatorización se hace dentro de cada bloque. Un tratamiento es una combinación de
niveles de todos los factores y los factores de bloque son las variables adicionales al
factor de interés que se incorporan de manera explicita en un experimento
comparativo para no sesgar la comparación.
2. Que diferencia hay entre un DBCA y los diseños en cuadro latino?
En el DBCA se consideran tres fuentes de variabilidad: el factor de tratamientos, el
factor de bloque y el error aleatorio, mientras que en el diseño en cuadro latino se
controlan dos factores de bloque y uno de tratamientos; los tres factores tienen la
misma cantidad de niveles. Los tratamientos se representan por letras latinas y se
distribuyen en forma adecuada en un cuadro.
3. De acuerdo con el modelo estadístico para un diseño en bloques, porque a través de
este diseño se reduce el error aleatorio?
Porque ahora al considerar los bloques, la variabilidad observada que no se podía
explicar por los factores estudiados resulta del efecto de dichos bloques y del error
experimental.
9. A continuación se muestran los datos para un diseño en bloques al azar.
Bloque
Total por
tratamiento
Tratamiento
1
2
3
4
A
3
4
2
6
Y1. =
B
7
9
3
10
Y2. =
C
4
6
3
7
Y3. =
.
.
.
.
Total por bloque
Y1 =
Y2 =
Y3 =
Y4 =
Y..
a) Complete las sumas totales que se piden en la tabla anterior.
Bloque
Total por
tratamiento
Tratamiento
1
2
3
4
A
3
4
2
6
Y1. = 15
B
7
9
3
10
Y2. = 29
C
4
6
3
7
Y3. = 20
.
.
.
.
Total por bloque
Y 1 = 14
Y 2 = 19
Y3 = 8
Y 4 = 23
Y.. = 64
b) Calcule las sumas de cuadrados correspondientes: SCTrat, SCB, SCT y SCE
SCT =
+ 42 + … + 72) – (642/12) = 72.6667
SCTrat = ((152 + 292 + 202) / 4) - (642/12) = 25.1667
SCB = (142 + 192 +82 +232) /3) - (642/12) = 42.0000
SCE = 72.6667 – 25.1667 – 42.0000 = 5.5000
c) Obtenga la tabla de análisis de varianza y anote las principales conclusiones.
Empleando el SW Minitab se obtiene la siguiente información:
(32
Two-way ANOVA: Respuesta versus Tratamiento, Bloque
Source
DF
Tratamiento 2
Bloque
3
Error
6
Total
11
SS
MS
F
P
25.1667 12.5833 13.73 0.006
42.0000 14.0000 15.27 0.003
5.5000 0.9167
72.6667
d) Obtenga la diferencia mínima significativa (LSD) para comparar
tratamientos en este diseño en bloques.
LSD  t 0.025,(31)( 41)
2(0.9167)
2(0.9167)
 2.4469
 (2.4469)(0.45835)  1.1215
4
4
10. Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar
moscas. Para ello, cada producto se aplica a un grupo de 100 moscas y se cuenta el
número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en
días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a
esta fuente de variación. Los datos obtenidos se muestran a continuación.
Número de réplica (día)
Marca de
1
2
3
4
5
6
atomizador
1
72
65
67
75
62
73
2
55
59
68
70
53
50
3
64
74
61
58
51
69
a) Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.
Modelo estadístico:
Yij = μ + τi + γj + εij ; i = 1,2,3 y j = 1,2,3,4,5,6
Las hipótesis adecuadas son:
Ho: μ1 + μ2 + μ3 = μ
Ha: μi ≠ μj para algún i ≠ j
Que también se puede expresar como:
Ho: τ1 = τ2 = τ3 = 0
Ha: τi ≠ 0 para algún i
b) Existe diferencia entre la efectividad promedio de los atomizadores?
Empleando el SW Minitab se obtiene la siguiente información:
Two-way ANOVA: Respuesta_1 versus Marca Atomizador, Día
Source
DF
SS
Marca Atomizador
2
296.33
Día
5
281.33
Error
10
514.33
Total
17 1092.00
MS
F
P
148.167 2.88 0.103
56.267 1.09 0.421
51.433
De esta tabla se observa que para marca atomizador se obtuvo un valor-p = 0.103 >
0.05, por lo tanto se acepta Ho. Es decir que no existe diferencia entre la efectividad
promedio de los atomizadores.
c) Hay algún atomizador mejor? Argumente su respuesta.
Empleando el SW Minitab se obtiene la siguiente información:
Individual 95% CIs For Mean Based on
Marca
Pooled StDev
Atomizador Mean --+---------+---------+---------+------1
69.0000
(----------*----------)
2
59.1667 (----------*---------)
3
62.8333
(----------*----------)
--+---------+---------+---------+------54.0
60.0
66.0
72.0
En este caso como los intervalos de confianza se traslapan entonces los atomizadores
son estadísticamente iguales en cuanto a sus medias.
d) Hay diferencias significativas en los resultados de diferentes días en que se realizó
el experimento? Argumente su respuesta.
Individual 95% CIs For Mean Based on
Pooled StDev
Día Mean
--+---------+---------+---------+------1
63.6667
(-----------*----------)
2
66.0000
(-----------*----------)
3
65.3333
(-----------*----------)
4
67.6667
(-----------*----------)
5
55.3333 (----------*-----------)
6
64.0000
(-----------*-----------)
--+---------+---------+---------+------48.0
56.0
64.0
72.0
En este caso como los intervalos de confianza se traslapan entonces los resultados de
diferentes días en que se realizo el experimento son estadísticamente iguales en cuanto
a sus medias.
e) Verifique los supuestos de normalidad y de igual varianza entre las marcas.
Residual Plots for Respuesta_1
Residuals Versus the Fitted Values
99
10
90
5
Residual
Percent
Normal Probability Plot of the Residuals
50
10
-10
-5
0
Residual
5
10
50
Histogram of the Residuals
55
60
65
Fitted Value
70
Residuals Versus the Order of the Data
10
4.8
5
3.6
Residual
Frequency
-5
-10
1
2.4
1.2
0.0
0
0
-5
-10
-10
-5
0
Residual
5
10
2
4
6
8
10
12
14
Observation Order
16
18
En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los
residuos y se observa que estos siguen una distribución normal ya que tienden a
quedar alineados en una línea recta.
En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos
contra los residuos y se observa que los puntos se distribuyen de manera aleatoria en
una banda horizontal (sin ningún patrón claro y contundente), por lo que se cumple el
supuesto de que los tratamientos tienen igual varianza.
16. Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre
el tiempo de reacción de un proceso químico. Cada lote de material solo permite cinco
corridas y cada corrida requiere aproximadamente 1.5 horas, por lo que solo se pueden
realizar cinco corridas diarias. El experimentador decide correr los experimentos con un
diseño en cuadro latino para controlar activamente a los lotes y días. Los datos
obtenidos son:
Día
1
2
3
4
5
Lote 1
A=8
B=7
D=1
C=7
E=3
Lote 2
C = 11
E=2
A=7
D=3
B=8
Lote 3
B=4
A=9
C = 10
E=1
D=5
Lote 4
D=6
C=8
E=6
B=6
A = 10
Lote 5
E=4
D=2
B=3
A=8
C=8
a) Cómo se aleatorizó el experimento?
Se siguió la siguiente estrategia:
1. Se construye el cuadro latino estándar más sencillo.
2. Se aleatoriza el orden de los renglones (o columnas) y después se aleatoriza el
orden de las columnas (o renglones).
3. Por último, los tratamientos a comparar se asignan en forma aleatoria a las
letras latinas.
Así se cumple que cada letra debe aparecer solo una vez en cada renglón y en cada
columna.
b) Anote la ecuación del modelo y las hipótesis estadísticas correspondientes.
Modelo estadístico:
Yij = μ + τi + γj + δl + εij ; i = 1,2,3,4,5 j = 1,2,3,4,5, l = 1,2,3,4,5
Las hipótesis adecuadas son:
Ho: μ1 + μ2 + μ3 + μ4 + μ5= μ
Ha: μi ≠ μj para algún i ≠ j
Que también se puede expresar como:
Ho: τ1 = τ2 = τ3 = τ4 = τ5 = 0
Ha: τi ≠ 0 para algún i
c) Existen diferencias entre los tratamientos? Cuáles tratamientos son diferentes entre
si?
Analysis of Variance for Y, using Adjusted SS for Tests
Source
DF
Catalizador 4
Lote
4
Día
4
Error
12
Total
24
Seq SS
141.440
15.440
12.240
37.520
206.640
Adj SS AdjMS
141.440 35.360
15.440
3.860
12.240
3.060
37.520
3.127
F
P
11.31 0.000
1.23 0.348
0.98 0.455
S = 1.76824 R-Sq = 81.84% R-Sq(adj) = 63.69%
De esta tabla se observa que para Catalizador se obtuvo un valor-p = 0.000 < 0.05, por
lo tanto se rechaza Ho. Es decir que al menos dos de los catalizadores son diferentes.
Interval Plot of Respuesta vs Catalizador
95% CI for the Mean
12
10
Respuesta
8
6
4
2
0
1
2
3
Catalizador
4
5
De tal forma, los intervalos de confianza de los catalizadores 1 y 2 se traslapan por lo
que sus respuestas medias son iguales estadísticamente. Los intervalos de confianza de
los catalizadores 2 y 3 se traslapan por lo que sus respuestas medias son iguales
estadísticamente. Los intervalos de confianza de los catalizadores 4 y 5 se traslapan
por lo que sus respuestas medias son iguales estadísticamente. Los intervalos de
confianza de los catalizadores 2 y 4 se traslapan por lo que sus respuestas medias son
iguales estadísticamente. Los intervalos de confianza de los catalizadores 2 y 5 se
traslapan por lo que sus respuestas medias son iguales estadísticamente. Finalmente al
no traslaparse los intervalos los catalizadores1 y 2 son diferentes a los catalizadores 4
y 5.
De igual forma el análisis se realiza para los 2 bloques.
Interval Plot of Respuesta vs Lote
95% CI for the Mean
12
10
Respuesta
8
6
4
2
0
1
2
3
Lote
4
5
De tal forma, los intervalos de confianza de los lotes se traslapan por lo que sus
respuestas medias son iguales estadísticamente.
Interval Plot of Respuesta vs Día
95% CI for the Mean
10
Respuesta
8
6
4
2
0
1
2
3
Día
4
5
De tal forma, los intervalos de confianza de los días se traslapan por lo que sus
respuestas medias son iguales estadísticamente.
d) Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?
Del ANOVA se observa que para lote se obtuvo un valor-p = 0.348 > 0.05, por lo tanto
se acepta Ho. Es decir que no existe diferencia entre el tiempo de reacción de un
proceso químico de los lotes.
Por otro lado, del ANOVA se observa que para días se obtuvo un valor-p = 0.455 >
0.05, por lo tanto se acepta Ho. Es decir que no existe diferencia entre el tiempo de
reacción de un proceso químico de los días.
e) Dibuje los gráficos de medias para los tratamientos, los lotes y los días. Cuál
tratamiento es el mejor?
Sería el tratamiento 5, puesto que tiene la media más baja respecto al tiempo de
reacción del proceso.
f) Verifique los supuestos del modelo, considerando que los datos se obtuvieron
columna por columna, día a día.
Residual Plots for Y
Normal Probability Plot of the Residuals
Residuals Versus the Fitted Values
99
2
Residual
Percent
90
50
10
1
1
0
-1
-2
-3.0
-1.5
0.0
Residual
1.5
3.0
2
Histogram of the Residuals
10
2
4.5
Residual
Frequency
6
8
Fitted Value
Residuals Versus the Order of the Data
6.0
3.0
1.5
0.0
4
1
0
-1
-2
-2
-1
0
1
Residual
2
2
4
6
8 10 12 14 16 18 20 22 24
Observation Order
En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los
residuos y se observa que estos siguen una distribución normal ya que tienden a
quedar alineados en una línea recta.
En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos
contra los residuos y se observa que los puntos se distribuyen de manera aleatoria en
una banda horizontal (sin ningún patrón claro y contundente), por lo que se cumple el
supuesto de que los tratamientos tienen igual varianza.
23. Un investigador está interesado en el efecto del porcentaje de lisina y del
porcentaje de proteína en la producción de vacas lecheras. Se consideran 7 niveles de cada
factor.
% de lisina: 0,0 (A), 0,1 (B), 0,2 (C), 0,3 (D), 0,4 (E), 0,5 (F), 0,6 (G),
% de proteína: 2 (), 4(β), 6(χ), 8(σ), 10(ε), 12(φ), 14(γ)
Para el estudio, se seleccionan siete vacas al azar, a las cuales se les da un seguimiento de
siete períodos de tres meses. Los datos en galones de leche fueron los siguientes:
Vaca/Período
1
2
3
4
5
1
304
436
350
504
417
2
381
505
425
564
494
3
432
566
479
357
461
4
442
372
536
366
495
5
496
449
493
345
509
6
534
421
352
427
346
7
543
386
435
485
406
a) Analice este experimento, qué factores tienen efecto en
leche?
Empleando el SW Minitab se obtiene la siguiente información:
Analysis of Variance for Respuesta, using Adjusted SS for Tests
Source
DF Seq SS Adj SS Adj MS
Vaca
6
8754
8588
1431
período
6
1761
1702
284
% lisina
6 38906 40171
6695
% proteina 6 148628 148628 24771
Error
24 24792
24792
1033
Total
48 222841
F
1.39
0.27
6.48
23.98
6
7
519
432
350
413
340
502
425
507
481
380
478
397
554
410
la producción de
P
0.261
0.943
0.000
0.000
S = 32.1406 R-Sq = 88.87% R-Sq(adj) = 77.75%
Del ANOVA se observa que para VACA se obtuvo un valor-p = 0.261 > 0.05, por lo
tanto se acepta Ho. Es decir que no existe diferencia en la producción de leche.
Por otro lado, del ANOVA se observa que para PERIODO se obtuvo un valor-p =
0.943 > 0.05, por lo tanto se acepta Ho.
De igual forma para el % DE LISINA se obtuvo un valor-p = 0.000 < 0.05, por lo
tanto se se rechaza Ho. Es decir si existe diferencia en la producción de leche debida a
dicho porcentaje.
De igual forma para el % DE PROTEINA se obtuvo un valor-p = 0.000 < 0.05, por lo
tanto se se rechaza Ho. Es decir si existe diferencia en la producción de leche debida a
dicho porcentaje.
b) Interprete los resultados usando gráficos de medias.
Interval Plot of Respuesta vs Vaca
95% CI for the Mean
525
500
Respuesta
475
450
425
400
375
350
1
2
3
4
Vaca
5
6
7
De tal forma, los intervalos de confianza de las vacas se traslapan por lo que sus
respuestas medias son iguales estadísticamente.
Interval Plot of Respuesta vs período
95% CI for the Mean
550
Respuesta
500
450
400
350
1
2
3
4
período
5
6
7
De tal forma, los intervalos de confianza de los períodos se traslapan por lo que sus
respuestas medias son iguales estadísticamente.
Interval Plot of Respuesta vs % lisina
95% CI for the Mean
550
Respuesta
500
450
400
350
300
1
2
3
4
% lisina
5
6
7
De tal forma, los intervalos de confianza de los % de lisina se traslapan por lo que sus
respuestas medias son iguales estadísticamente.
Interval Plot of Respuesta vs % proteina
95% CI for the Mean
600
550
Respuesta
500
450
400
350
300
1
2
3
4
% proteina
5
6
7
De tal forma, los intervalos de confianza de los % de proteína no se traslapan por lo
que sus respuestas medias no son iguales estadísticamente.
c) Cómo puede explicar la falta de efectos en vacas y período?
El diseño pretendía verificar el efecto del porcentaje de lisina y del porcentaje de
proteína en la producción de vacas lecheras por lo que se bloquearon los aspectos
relacionados a las vacas y al período.
d) Que porcentajes de lisina y proteína dan los mejores resultados?
De las gráficas anteriores, % de lisina que brinda los mejores resultados es: 0,4 (E).
Respecto del % de proteínas, el mejor es: 14(γ).
e) Verifique los supuestos del modelo.
Residual Plots for Respuesta
Normal Probability Plot of the Residuals
Residuals Versus the Fitted Values
99
50
Residual
Percent
90
50
10
1
-50
-25
0
Residual
25
-25
50
300
400
500
Fitted Value
600
Residuals Versus the Order of the Data
50
12
9
Residual
Frequency
0
-50
Histogram of the Residuals
6
3
0
25
25
0
-25
-50
-60
-30
0
Residual
30
60
1
5
10
15 20 25 30 35
Observation Order
40
45
En la gráfica 1 (Normal Probability Plot of the Residuals) se han graficado los
residuos y se observa que estos siguen una distribución normal ya que tienden a
quedar alineados en una línea recta.
En la gráfica 2 (Residuals Versus the Fitted Values) se han graficado los predichos
contra los residuos y se observa que los puntos se distribuyen de manera aleatoria en
una banda horizontal (sin ningún patrón claro y contundente), por lo que se cumple el
supuesto de que los tratamientos tienen igual varianza.
Descargar