(Revisado enero 2016_LWB/CL) CLAVE-LAB 3-Supuestos del Análisis de la Varianza El archivo Excel con los datos para este laboratorio está en la página del curso. Los datos provienen de un estudio realizado para comparar los efectos de un insecticida sintético y de un insecticida natural sobre la población de cierto insecto en plantas de habichuela. Se aplicaron 3 tratamientos diferentes (1=control, 2=insecticida natural, 3=insecticida sintético) a 30 parcelas homogéneas plantadas con la misma variedad de habichuela. La asignación de los tratamientos a las parcelas se hizo según un diseño completamente aleatorizado con 10 repeticiones de cada tratamiento. Para evitar contagios, cada parcela se rodeó con un pasto no susceptible al insecto. Las observaciones son los recuentos de insectos en un área de 1 m2 ubicada al azar en cada parcela. 1. ¿Es éste un estudio experimental u observacional? ¿Porqué? Es un estudio experimental porque a la unidad se le ha asignado el tratamiento. 2. ¿Cuál es la unidad experimental? ¿y la unidad de muestreo? Unidad experimental: Una parcela Unidad de muestreo: área de 1 m2 PARTE A – trabajando con los datos originales (recuentos) En InfoStat: Residuos = RDUO Valor absoluto de residuos = RABS Predichos = PRED Residuos estandarizados = RE 3. En InfoStat, grafique los datos usando diagramas de cajas para los tres tratamientos. Comente sobre la validez del supuesto de homogeneidad de varianzas. Utilice la Tabla A en la próxima página para resumir sus comentarios. AGRO 6600 – CLAVE - LAB 3 Page 1 (Revisado enero 2016_LWB/CL) Boxplot de recuento en los tres tratamientos de insecticidas 24 Recuento 18 12 6 0 1 3 2 Tratamiento 4. Indique las hipótesis, analice los datos en Infostat e indique sus conclusiones. Utilice la opción de guardar los residuos, valores predichos, y valores absolutos de residuos (InfoStat va a crear nuevas columnas rotulados “RDUO”, “RABS”, y “PRED”) Ho: α1 = α2 = α3=0 Ha: al menos un αi es diferente (o al menos una αi no igual a 0) Análisis de la varianza Variable Recuento N 30 R² 0.79 R² Aj CV 0.77 41.16 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 940.20 2 470.10 49.33 <0.0001 Tratamiento 940.20 2 470.10 49.33 <0.0001 Error 257.30 27 9.53 Total 1197.50 29 Rechazo Ho porque el p (0.0001) es menor que el α (0.05). Por lo tanto, acepto Ha que nos indica que existe diferencia en el efecto de los tratamientos (control, insecticida natural e insecticida sintético) sobre la población de cierto insecto en plantas de habichuela. 5. Grafique los residuales (“RDUO”) con un gráfico Q-Q. Comente sobre la validez del supuesto de normalidad. AGRO 6600 – CLAVE - LAB 3 Page 2 (Revisado enero 2016_LWB/CL) Q-Q plot de los residuales de recuento Cuantiles observados(RDUO_Recuento) n= 30 r= 0.972 (RDUO_Recuento) 7.60 4.10 0.60 -2.90 -6.40 -6.40 -2.90 0.60 4.10 7.60 Cuantiles de una Normal(-4.1448E-016,8.8724) 6. Realice una prueba de normalidad de Shapiro-Wilks. Comente sobre la validez del supuesto de normalidad. Ho: Se cumple con el supuesto de Normalidad Ha: No se cumple con el supuesto de Normalidad Shapiro-Wilks (modificado) Variable RDUO_Recuento n 30 Media D.E. 0.00 2.98 W* 0.96 p (una cola) 0.5475 Se acepta Ho porque el p (0.5475) es mayor que α (0.05). Sí se cumple con el supuesto de Normalidad. 7. Grafique residuales vs. valores predichos. Comente sobre la validez del supuesto de homogeneidad de varianzas. Residuales vs. Predichos AGRO 6600 – CLAVE - LAB 3 Page 3 (Revisado enero 2016_LWB/CL) Residuales vs predichos de los recuentos 8.30 RDUO_Recuento 4.45 0.60 -3.25 -7.10 2.49 5.87 9.25 12.63 16.02 PRED_Recuento Puntos en gráficos forman un embudo; por lo tanto, no hay homogeneidad de varianza. Los residuos para el insecticida control son más variables que los de insecticidas sintéticos o naturales. 8. Utilice “Medidas Resumen” para buscar las varianzas [var(n-1)] de los tres tratamientos. A mano, realice la prueba de Fmax(Hartley). Comente sobre la validez del supuesto de homogeneidad de varianzas. Ho: Se cumple con el supuesto de Homogeneidad de varianzas σ12 = σ22 = σ32 Ha: No se cumple con el supuesto de Homogeneidad de varianzas Al menos un σi2 es diferente Estadística Tratamiento 1 2 3 descriptiva Variable Recuento Recuento Recuento n 10 10 10 Media 15.40 4.00 3.10 D.E. 4.70 2.05 1.52 Var(n-1) 22.04 4.22 2.32 F max > F max tab con t = 3 y gl = n-1 = 10 – 1 = 9 S2max/S2min > F max tab 22.04/2.32=9.49 > 5.34; por lo tanto, no hay homogeneidad de varianzas 9. Realice la prueba de Levene. Comente sobre la validez del supuesto de homogeneidad de varianzas. Prueba Levene Análisis de la varianza AGRO 6600 – CLAVE - LAB 3 Page 4 (Revisado enero 2016_LWB/CL) Variable RABS_Recuento N 30 R² 0.30 R² Aj CV 0.25 72.54 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 31.50 2 15.75 5.86 0.0077 Tratamiento 31.50 2 15.75 5.86 0.0077 Error 72.58 27 2.69 Total 104.07 29 Se rechaza Ho porque el p (0.0077) es menor que el α (0.05). Por lo tanto acepto Ha y concluye que no hay homogeneidad de varianzas. PARTE B – trabajando con los datos transformados - ln(recuentos+1) y raíz(recuentos) 10. A efectos de verificar los supuestos bajo distintas transformaciones, vamos a transformar cada observación Y en ln(Y+1) y en Y . Las transformaciones se pueden hacer en forma muy sencilla en Infostat usando el menú Datos>Fórmulas. Si la variable recuento es la que tiene los recuentos, Ud. puede crear dos variables nuevas: en la ventana de la fórmula, escriba logrecuento=ln(recuento+1) o raizrec=raiz(recuento) (o raizrec=(recuento)^0.05). 11. Analice los datos transformados en ln(Y+1) y Y , y repita 3 a 9. Título 4 raizrec 3 2 1 0 1 3 2 Tratamiento lnrec AGRO 6600 – CLAVE - LAB 3 raizrec Page 5 (Revisado enero 2016_LWB/CL) Transformación logarítmica: Ho: α1 = α2 = α3 Ha: al menos un αi es diferente ANOVA LOGRECUENTO Análisis de la varianza Variable N logrecuento 30 R² 0.75 R² Aj CV 0.73 20.46 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 11.87 2 5.94 40.28 <0.0001 Tratamiento 11.87 2 5.94 40.28 <0.0001 Error 3.98 27 0.15 Total 15.85 29 Rechazo Ho porque el p (0.0001) es menor que el α (0.05). Por lo tanto, acepto Ha que nos indica que existe diferencia en el efecto de los tratamientos (control, insecticida natural e insecticida sintético) sobre la población de cierto insecto en plantas de habichuela. AGRO 6600 – CLAVE - LAB 3 Page 6 (Revisado enero 2016_LWB/CL) Q-Q plot RESIDUO LOGRECUENTO Q-Q plot residuo log recuento Cuantiles observados(RE_logrecuento) n= 30 r= 0.969 (RE_logrecuento) 2.08 1.04 0.00 -1.04 -2.08 -2.08 -1.04 0.00 1.04 2.08 Cuantiles de una Normal(2.2945E-016,1.0345) Ho: Se cumple con el supuesto de Normalidad Ha: No se cumple con el supuesto de Normalidad Shapiro-Wilks (modificado) Variable RDUO_logrecuento n 30 Media D.E. 0.00 0.37 W* 0.89 p (una cola) 0.0103 Se rechaza Ho porque el p (0.0103) es menor que α (0.05). No se cumple con el supuesto de Normalidad. Residuales vs. Predichos RESIDUO LOGRECUENTO REs vs Pred Res Log Rec 0.61 RDUO_logrecuento 0.28 -0.05 -0.38 -0.70 1.27 1.66 2.05 2.44 2.83 PRED_logrecuento Puntos en gráficos no forman un embudo; por lo tanto, sí hay homogeneidad de varianza. AGRO 6600 – CLAVE - LAB 3 Page 7 (Revisado enero 2016_LWB/CL) Ho: Se cumple con el supuesto de Homogeneidad de varianzas σ12 = σ22 = σ32 Ha: No se cumple con el supuesto de Homogeneidad de varianzas Al menos un σi2 es diferente Estadística Tratamiento 1 2 3 descriptiva Variable logrecuento logrecuento logrecuento n 10 10 10 Media 2.76 1.53 1.34 D.E. 0.30 0.42 0.42 Var(n-1) 0.09 0.18 0.18 F max log rec > F max tab con t = 3 y gl = n-1 = 10 – 1 = 9 S2max/S2min > F max tab 0.18/0.09 > 5.34 2 < 5.34; por lo tanto, sí hay homogeneidad de varianzas. Prueba Levene log rec Análisis de la varianza Variable N R² R² Aj CV RABS_logrecuento 30 0.13 0.07 53.69 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 0.12 2 0.06 2.08 0.1449 Tratamiento 0.12 2 0.06 2.08 0.1449 Error 0.79 27 0.03 Total 0.92 29 Se acepta Ho porque el p (0.1449) es mayor que el α (0.05). Por lo tanto acepto Ho y concluyo que sí hay homogeneidad de varianzas. Transformación raíz cuadrada: Ho: α1 = α2 = α3 Ha: al menos un αi es diferente ANOVA RAIZRECUENTO Análisis de la varianza Variable N R² R² Aj CV raizrec 30 0.79 0.77 21.35 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 28.59 2 14.30 49.88 <0.0001 Tratamiento 28.59 2 14.30 49.88 <0.0001 Error 7.74 27 0.29 Total 36.33 29 Rechazo Ho porque el p (0.0001) es menor que el α (0.05). Por lo tanto, acepto Ha que nos indica que existe diferencia en el efecto de los tratamientos (control, AGRO 6600 – CLAVE - LAB 3 Page 8 (Revisado enero 2016_LWB/CL) insecticida natural e insecticida sintético) sobre la población de cierto insecto en plantas de habichuela. Q-Q plot RESIDUO RAIZRECUENTO Q-Q plot Res Raiz Rec Cuantiles observados(RDUO_raizrec) n= 30 r= 0.981 (RDUO_raizrec) 1.05 0.53 0.00 -0.53 -1.05 -1.05 -0.53 0.00 0.53 1.05 Cuantiles de una Norm al(-1.2953E-016,0.26685) Ho: Se cumple con el supuesto de Normalidad Ha: No se cumple con el supuesto de Normalidad Shapiro-Wilks (modificado) Variable RDUO_raizrec n 30 Media D.E. 0.00 0.52 W* 0.92 p (una cola) 0.0864 Se acepta Ho porque el p (0.0864) es mayor que α (0.05). Sí se cumple con el supuesto de Normalidad. Residuales vs. Predichos RESIDUO RAIZRECUENTO REs vs Pred Res Raiz Rec 1.00 RDUO_raizrec 0.51 0.02 -0.48 -0.97 1.59 2.19 2.79 3.39 3.99 PRED_raizrec Puntos en gráficos no forman un embudo; por lo tanto, sí hay homogeneidad de varianza. AGRO 6600 – CLAVE - LAB 3 Page 9 (Revisado enero 2016_LWB/CL) Ho: Se cumple con el supuesto de Homogeneidad de varianzas σ12 = σ22 = σ32 Ha: No se cumple con el supuesto de Homogeneidad de varianzas Al menos un σi2 es diferente Estadística Tratamiento 1 2 3 descriptiva Variable raizrec raizrec raizrec n 10 10 10 Media 3.88 1.94 1.70 D.E. 0.61 0.52 0.47 Var(n-1) 0.37 0.27 0.22 F max raiz rec > F max tab con t = 3 y gl = n-1 = 10 – 1 = 9 S2max/S2min > F max tab 0.37/0.22 > 5.34 1.68 < 5.34; por lo tanto, sí hay homogeneidad de varianzas Prueba Levene raiz rec Análisis de la varianza Variable N R² R² Aj CV RABS_raizrec 30 0.02 0.00 59.54 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 0.03 2 0.01 0.22 0.8071 Tratamiento 0.03 2 0.01 0.22 0.8071 Error 1.86 27 0.07 Total 1.89 29 Se acepta Ho porque el p (0.8071) es mayor que el α (0.05). Por lo tanto acepto Ho y concluyo que sí hay homogeneidad de varianzas. 12. ¿Es necesaria una transformación para los datos de este problema? ¿Cuál de las transformaciones le parece más apropiada? Es necesaria la transformación porque el supuesto de varianzas homogéneas en la escala original no se cumple. La transformación raíz cuadrada parece más apropiada en este caso porque cumplimos con ambos supuestos: Homogeneidad de varianzas y Normalidad. Tabla A Diagnóstico Gráfico de Cajas Recuentos No cumple con supuesto de homogenidad de varianzas AGRO 6600 – CLAVE - LAB 3 ln(Recuentos+1) Cumple con supuesto de homogenidad de varianzas √𝐑𝐞𝐜𝐮𝐞𝐧𝐭𝐨𝐬 Cumple con supuesto de homogenidad de varianzas Page 10 (Revisado enero 2016_LWB/CL) ANOVA (prueba F) Q-Q Plot Hay diferencias significativas Hay diferencias significativas Hay diferencias significativas Cumple con supuesto de normalidad de errores (aunque la interpretación es bastante sujectivo!) No cumple con supuesto de normalidad de errores (aunque la interpretación es bastante sujectivo!) No cumple con supuesto de normalidad de errores Cumple con supuesto de normalidad de errores (aunque la interpretación es bastante sujectivo!) Cumple con supuesto de normalidad de errores Cumple con supuesto de homogenidad de varianzas Cumple con supuesto de homogenidad de varianzas Cumple con supuesto de homogenidad de varianzas Shapiro-Wilks Cumple con supuesto de normalidad de errores Residuos vs. Predichos No cumple con supuesto de homogenidad de varianzas No cumple con supuesto de homogenidad de varianzas No cumple con supuesto de homogenidad de varianzas Fmax (Hartley) Levene AGRO 6600 – CLAVE - LAB 3 Cumple con supuesto de homogenidad de varianzas Cumple con supuesto de homogenidad de varianzas Cumple con supuesto de homogenidad de varianzas Page 11