Revisado_feb_2016_LWB/YC CLAVE- Lab 9 - Efectos Aleatorios y Mixtos; Diseños Anidados PARTE I 1. La figura abajo es de una isla imaginaria con las localidades de humedales representadas con diamantes y hexágonos. En la isla hay dos tipos de humedales: alimentados por agua de precipitación (P – los hexágonos) y alimentados por agua subterránea (ST – los diamantes). Con el objetivo de determinar si la fuente de agua alimentando un humedal influía sobre las tasas de producción de metano, se muestrearon tres humedales de cada tipo de agua. Estos tres humedales (rotulados 1, 2, y 3 en la figura) se eligieron aleatoriamente de un conjunto grande de humedales que tenían cada tipo de agua. En cada humedal seleccionado, se obtuvieron 3 muestras de suelo (en lugares aleatoriamente elegidos dentro de cada humedal). Estas muestras se transportaron al laboratorio y se incubaron a temperatura constante. Las tasas de producción de metano que se obtuvieron aparecen en la tabla en la próxima página. 2. a. b. c. d. ¿Son los efectos de tipo de humedal fijos o aleatorios? Fijos ¿Son los efectos de humedal fijos o aleatorios? Aleatorios La estructura ¿es factorial o anidada? Anidada Defina los valores de a=2 b=3 n = 3 (las 3 muestras) e. Prepare una tabla de anova con las fuentes de variación, los grados de libertad y los cuadrados medios esperados. FV A: Tipo de agua B(A): Humedal(Tipo de agua) Error AGRO 6600 – CLAVE – LAB 9 GL a-1 = 2-1 = 1 a(b-1) = 2(3-1) = 4 ab(n-1) = 2*3*(3-1) = 12 CME σ2 + 3σ2β + 3(3)Σαi2/(2-1) σ2 + 3σ2β σ2 Page 1 Revisado_feb_2016_LWB/YC Tipo de Agua Humedal Muestra producción metano (umol/l/hr) G 1 1 6.63 G 1 2 6.77 G 1 3 5.64 G 2 1 12.4 G 2 2 13.5 G 2 3 11.9 G 3 1 7.64 G 3 2 6.18 G 3 3 5.42 P 1 1 1.74 P 1 2 2.55 P 1 3 2.09 P 2 1 0.59 P 2 2 0.32 P 2 3 0.8 P 3 1 1.98 P 3 2 4.56 P 3 3 3.67 f. Formule y pruebe las hipótesis de interés. Use Infostat y SAS para obtener e interpretar sus conclusiones. Favor de considerar el ejemplo en la última página de este laboratorio!! Ho: α1 = α2 = 0 Ha: Al menos un αi es diferente de 0 Conclusión: como p=0.0450, se rechaza Ho. Ho: σ β2 = 0 Ha: σ β2 > 0 Conclusión: como p<0.0001, se rechaza Ho. INFOSTAT: Variable producción metano um N 18 R² 0.97 R² Aj CV 0.96 16.08 En este ejemplo, el “error” (denominador en la prueba F) para probar el efecto de Tipo de Agua es Humedal/Tipo de Agua (=Tipo de Agua >Humedal). Sí esto no aparece en su salida, entonces InfoStat no va a hacer la prueba F correctamente (va a incorrectamente usar el residual (Error) en el denominador) Cuadro de Análisis de la Varianza (SC tipo III) F.V. Modelo Tipo de Agua Tipo de Agua>Humedal Error SC gl 274.94 5 185.47 1 89.46 4 8.53 12 AGRO 6600 – CLAVE – LAB 9 CM F 54.99 77.40 185.47 8.29 22.37 31.48 0.71 p-valor (Error) <0.0001 0.0450 (Tipo de Agua>Humedal) <0.0001 Page 2 Revisado_feb_2016_LWB/YC Total 283.46 17 SAS: The SAS System The GLM Procedure Class Level Information Class Levels Values tipohum 2 GP humedal 3 123 Number of Observations Read 18 Number of Observations Used 18 The SAS System The GLM Procedure Dependent Variable: prodmetano Source DF Sum of Squares Mean Square F Value Pr > F Model 5 274.9381333 54.9876267 77.40 <.0001 Error 12 8.5254667 0.7104556 Corrected Total 17 283.4636000 R-Square Coeff Var Root MSE prodmetano Mean 0.969924 16.07537 0.842885 5.243333 Tests of Hypotheses Using the Type III MS for humedal(tipohum) as an Error Term Source tipohum DF Type III SS Mean Square F Value Pr > F 1 185.4738000 185.4738000 8.29 0.0450 OJO*** Favor de verificar que este cuadro sale en su salida de SAS. En SAS, la línea “test h=tipohum e=humedal(tipohum);” generó esta tabla The GLM Procedure AGRO 6600 – CLAVE – LAB 9 Page 3 Revisado_feb_2016_LWB/YC t Tests (LSD) for prodmetano Note: This test controls the Type I comparisonwise error rate, not the experimentwise error rate. Alpha 0.05 Error Degrees of Freedom 4 Error Mean Square 22.36608 Critical Value of t 2.77645 Least Significant Difference 6.1898 Means with the same letter are not significantly different. t Grouping Mean N Tipohum A 8.453 9 G B 2.033 9 P Conclusiones: Hay diferencias significativas en el tipo de agua en la producción promedio de metano: el humedal alimentado con agua subterránea (8.453 um) produce significativamente más metano que el humedal alimentado con agua de precipitación (2.033 um). Además, hay variabilidad significativa entre los efectos de humedal en el mismo tipo de agua. g. Realice un intervalo de confianza del 95% para la diferencia entre las tasas de producción de metano en humedales con agua subterránea y con agua de precipitación. __ __ (Y1•• – Y2••) ± tα/2 √(2CMB(A)/bn) = (8.453 – 2.033) ± 2.776 √(2x22.37/9) = = (0.231, 12.609) h. Estime todas las componentes de varianza presentes en este modelo. ̂2 (error experimental) y 𝝈 ̂(la varianza de humedales). No Hay 2 varianzas para estimar: 𝝈 estimamos la varianza de tipo de agua (tipo de humedal) porque es un efecto fijo, no aleatorio. ̂2 (estimación del error experimental) 0.71 = 𝝈 CMB( A) ˆ 2 3ˆ 2 CME ˆ 2 ̂2 + 3𝝈 ̂ 22.37 = 𝝈 ̂ 22.37 = 0.71 + 3𝝈 ̂ 𝝈 ̂ (varianza de humedales dentro de tipos de agua) 𝝈 3. El Departamento de Transportación desea realizar un estudio para evaluar la erosión del suelo en áreas con pendiente cercanas a futuras autopistas. Entre las posibles especies a ser usadas, se tomó una muestra aleatoria de 6 especies vegetales nativas que podrían servir como coberturas (es decir que crecen en forma AGRO 6600 – CLAVE – LAB 9 Page 4 Revisado_feb_2016_LWB/YC rastrera y podrían controlar la erosión). En un área con pendiente cercana a una futura autopista se dispusieron 36 parcelas. En el mes de enero se sembraron 12 de estas parcelas aleatoriamente escogidas (dos parcelas con cada especie), en el mes de mayo se sembraron otras 12 parcelas aleatoriamente escogidas (dos parcelas con cada especie) y finalmente en el mes de septiembre se sembraron las 12 restantes (dos con cada especie). Se midió el porcentaje de cobertura del suelo a los dos años de implantadas las parcelas. mes enero enero enero enero enero enero enero enero enero enero enero enero mayo mayo mayo mayo mayo mayo mayo mayo mayo mayo mayo mayo septi septi septi septi septi septi septi septi septi septi septi septi especie 1 1 2 2 3 3 4 4 5 5 6 6 1 1 2 2 3 3 4 4 5 5 6 6 1 1 2 2 3 3 4 4 5 5 6 6 repet 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 cobertura 63.9 66.6 69.8 68.5 67.2 70.5 66.4 63.5 61.4 65.7 68.1 68.4 69.1 70.1 72.5 70.7 63.9 65.2 71.9 69.9 67.7 67.1 68.7 72 76.5 70.9 74.3 73.8 73.4 72.3 77.4 78.9 75.3 74.6 73.9 75.6 a. ¿Son las especies fijas o aleatorias? aleatorias b. ¿Son las épocas fijas o aleatorias? Fijas (se considera época como el factor A para poder usar la tabla en la notas de conferencia – el orden es arbitrario en un factorial) c. La estructura ¿es factorial o anidada? Factorial d. Defina los valores de a, b y n AGRO 6600 – CLAVE – LAB 9 Page 5 Revisado_feb_2016_LWB/YC a = 3 (épocas) b = 6 (especies) n = 2 (muestras o repeticiones) e. Prepare una tabla de anova con las fuentes de variación, los grados de libertad y los cuadrados medios esperados. FV A: Época B: Especie A*B Error GL a-1 = 3-1 = 2 b-1 = 6-1 = 5 (a-1)*(b-1) = 2*5 = 10 ab(n-1) = 3*6*(2-1) = 18 CME σ2 + 2 σ2αβ + 2(6)Σαi2/(3-1) σ2 + 2(3)σ2β σ2 + 2σ2αβ σ2 f. Formule y pruebe las hipótesis de interés. Use Infostat para obtener e interpretar sus conclusiones. Interacción Época x Especie: (A) Ho: σ 2αβ = 0 Ha: σ 2αβ > 0 Valor p 0.0094 < 0.05 Rechazo Ho, es decir que la variabilidad debida a la interacción entre época y especie es significativa. Como las especies fueron elegidas aleatoriamente, la interacción también es aleatoria; por lo tanto, se analizarán las hipótesis de efectos principales. (B) Ho: σ 2β = 0 Ha: σ 2β > 0 Para la especie hubo un valor de p menor que 0.0179; o sea, hay variabilidad significativa entre especies. (C) Ho: α1= α2= α3=0 Ha: al menos una época es diferente Como p=0.0003, hay diferencias significativas entre las medias de época. Variable N cobertura 36 R² 0.915 Cuadro de Análisis de la F.V. SC Modelo. 572.283 mes 412.685 especie 54.589 mes*especie 105.008 Error 53.245 Total 625.528 AGRO 6600 – CLAVE – LAB 9 R² Aj 0.834 CV 2.451 Varianza (SC tipo III) gl CM F 17 33.664 11.380 2 206.343 19.650 5 10.918 3.691 10 10.501 3.550 18 2.958 35 p-valor <0.0001 0.0003 0.0179 0.0094 (Error) (mes*especie) Page 6 Revisado_feb_2016_LWB/YC g. Compare las medias de épocas mediante una prueba de Tukey usando α=0.05. Test:Tukey Alfa=0.05 DMS=3.62654 Error: 10.5008 gl: 10 mes Medias n E.E. septi 74.74 12 0.94 A mayo 69.07 12 0.94 enero 66.67 12 0.94 B B Medias con una letra común no son significativamente diferentes (p > 0.05) UD. DEBERÍA SABER COMO HACER EL MISMO CÁLCULO DE ARRIBA (DMS DE TUKEY), A MANO. El “error” en la fórmula de Tukey es el CM de la interacción (=10.501), no el CME (2.958). De igual manera, los grados de libertad para t son los de la interacción (10 gl), no los gl de error (18 gl). h. Estime todas las componentes de varianza presentes en este modelo. ̂2 (estimación del error experimental) 2.96 = 𝝈 CMB ˆ 2 6ˆ 2 CMAB ˆ 2 2ˆ2 CME ˆ 2 ̂2 + 2𝝈 ̂ 10.50 = 𝝈 ̂ 𝝈 ̂ (10.50-2.96)/2 = 𝝈 ̂ 3.77 = 𝝈 ̂2 + 6𝝈 ̂ 10.92 = 𝝈 ̂ 10.92 = 2.96 + 6𝝈 ̂ (10.92-2.96)/6 = 6𝝈 ̂ 1.33 = 6𝝈 Parte II Para cada una de las siguientes situaciones: a. decida cuáles son los factores en estudio, y los niveles de cada uno. b. decida cuál es el diseño experimental usado. c. decida si cada factor constituye un efecto fijo o aleatorio. d. decida si los factores están anidados (diseño anidado) o cruzados (experimento factorial). e. realice un esquema de la tabla de ANOVA que incluya fuentes de variación, grados de libertad y estadísticos F. 1. Con el objeto de comparar las tres marcas más comúnmente usadas de aceite para automóvil, se tomaron 24 motores, 12 de cada uno de dos fabricantes (estos dos fabricantes son los dos que normalmente proveen este tipo de motores. Cada marca de aceite se usó en cuatro motores de cada fabricante (elegidos aleatoriamente) y luego de esto los motores se vaciaron y se hicieron funcionar sin aceite. Se registró el tiempo en que cada motor dejó de funcionar. a. Factor A: Marca aceite con 3 niveles Factor B: Fabricante motor con 2 niveles AGRO 6600 – CLAVE – LAB 9 Page 7 Revisado_feb_2016_LWB/YC b. DCA con arreglo factorial 3x2 y 4 repeticiones c. Marca aceite: Fijo y Fabricante motor: Fijo d. F.V. A: Marca Aceite B: Fabricante Motor A*B: Aceite*Motor Error Total 2. gl 2 1 2 18 23 F CMA/CME CMB/CME CMA*B/CME Una compañía farmacéutica desea examinar la potencia de un medicamento líquido que se mezcla en tambores grandes antes de ser embotellado. Para ello se eligen aleatoriamente 4 plantas de producción, y en cada planta se escogen 5 tambores (también aleatoriamente). De cada tambor se analizan cuatro muestras aleatoriamente tomadas del líquido. a. Factor A: Planta de producción (4 niveles). Factor B: Tambor en cada planta (5 niveles) b. DCA con factores anidados (ambos aleatorios) y 4 repeticiones c. A, B: Aleatorio d. F.V. gl F A: Planta 3 CMA/CMB(A) B(A): Tambor dentro de 16 CMB(A)/CME planta Error 60 Total 79 3. Después de realizar un cruzamiento de varias líneas de maíz, se desea evaluar la variabilidad genética generada por estos cruzamientos. Para ello se seleccionan al azar 10 líneas (de las 250 disponibles) y se siembran de acuerdo a un diseño en bloques completos al azar con 4 repeticiones. a. Factor A: Línea de maíz con 10 niveles b. DBCA con modelo de efecto aleatorio y 4 repeticiones c. Línea: Aleatorio d. F.V. gl F A: Línea maíz 9 CMA/CME B: Bloque 3 CMB/CME Error 27 Total 39 4. Se desea comparar la calidad de naranjas de tres variedades cosechadas en tres épocas diferentes (20 de diciembre, 20 de enero y 20 de febrero) en una estación experimental. Para ello se analizan 10 naranjas de cada variedad tomadas aleatoriamente en cada una de las fechas y se determina la concentración de azúcar en cada una. a. Factor A: Variedad naranja con 3 niveles AGRO 6600 – CLAVE – LAB 9 Page 8 Revisado_feb_2016_LWB/YC Factor B: Época con 3 niveles b. DCA con arreglo factorial 3x3 y 10 repeticiones c. Variedad naranja: Fijo y Época: Fijo d. F.V. gl A: Variedad naranja 2 B: Época 2 A*B: Variedad *Época 4 Error 81 Total 89 5. Se estudió el consumo de oxígeno de dos especies de ostras bajo distintos niveles de concentración de agua de mar (50%, 75% y 100%). Para ello se usaron 24 piletas, que se llenaron con agua destilada y de mar en la concentración respectiva (8 con 50% de agua de mar, 8 con 75% y 8 con 100%; seleccionadas aleatoriamente). Se colocaron ostras de la especie A en 12 piletas (cuatro con cada concentración, elegidas aleatoriamente) y ostras de la especie B en las otras 12 piletas. Se registró el consumo (l O2 / mg de peso corporal seco / min) a 22C. a. Factor A: Especie ostras con 2 niveles Factor B: Concentración agua mar con 3 niveles b. DCA con arreglo factorial 2x3 y 4 repeticiones c. Especie ostras: Fijo y Concentración agua mar: Fijo d. F.V. gl A: Especie ostra 1 B: Concentración agua mar 2 A*B: Especie *Concentración 2 Error 18 Total 23 6. F CMA/CME CMB/CME CMA*B/CME F CMA/CME CMB/CME CMA*B/CME En el mes de enero, cinco muestras de suelo se toman aleatoriamente en cada una de 6 localidades (también escogidas aleatoriamente) dentro de un área contaminada que está siendo limpiada. Las mismas 6 localidades se muestrean nuevamente (5 muestras aleatorias en cada una) durante el mes de junio. Las muestras se analizan para determinar la concentración de derivados de insecticidas clorados. a. Factor A: Época con 2 niveles Factor B: Localidad con 6 niveles b. DCA con arreglo factorial 2x6 y 5 repeticiones c. Época: Fijo y Localidad: Aleatorio d. F.V. gl F A: Época 1 CMA/CMA*B B: Localidad 5 CMB/CME A*B: Época*Localidad 5 CMA*B/CME Error 48 Total 59 AGRO 6600 – CLAVE – LAB 9 Page 9 Revisado_feb_2016_LWB/YC 7. Se compara la producción diaria de leche bajo 12 dietas diferentes. Las 12 dietas son todas las combinaciones de 3 niveles de vitamina A (0, 10 y 20 mg/kg), 2 fuentes proteicas (harina de pescado y harina de soya), con y sin suplementación mineral. Cuatro vacas se asignaron aleatoriamente a cada una de las dietas. a. Factor A: Vitamina A con 3 niveles Factor B: Fuente proteica con 2 niveles Factor C: Suplemento mineral con 2 niveles b. DCA con arreglo factorial 3x2x2 y 4 repeticiones c. Vitamina A: Fijo, Fuente proteica: Fijo, Suplemento mineral: Fijo d. F.V. gl F A: Vitamina A 2 CMA/CME B: Fuente proteica 1 CMB/CME C: Suplemento mineral 1 CMC/CME A*B: Vitamina*Proteína 2 CMA*B/CME A*C: Vitamina* Suplemento 2 CMA*C/CME B*C: Proteína*Suplemento 1 CMB*C/CME A*B*C: 2 CMA*B*C/CME Vitamina*Proteína*Suplemento Error 36 Total 47 8. Se desea comparar el peso de conejos entrampados en distintas semanas en varios bosques de un área de interés. Para ello se eligen al azar cuatro bosques en el área. En cada bosque se colocan aleatoriamente 10 trampas (cada trampa tiene lugar para exactamente un conejo). Luego de una semana se retiran los conejos entrampados y se registra su peso. Las 10 trampas vuelven a ubicarse aleatoriamente en el bosque, se espera una semana y se registra el peso de los conejos entrampados. Este proceso se repite hasta tener cuatro semanas de datos. a. Factor A: semana con 4 niveles, Factor B: bosque con 4 niveles b. DCA con modelo mixto y 10 repeticiones c. Semana: Fijo, Bosque: aleatorio d. F.V. gl F Semana 3 CMA/CMAB Bosque 3 CMB/CME Semana x Bosque 9 CMAB/CME Error 144 Total 159 AGRO 6600 – CLAVE – LAB 9 Page 10