AGRO 6600 Examen Final 2004 Nombre: _______________________________ Instrucciones: • Apague celulares. Se descontarán puntos si su celular suena durante el examen. • Por favor lea los enunciados y las preguntas cuidadosamente. • Se pueden usar el libro y la calculadora. • Para obtener crédito parcial las respuestas deben ser consistentes. • Tenga en cuenta que algunos de los resultados parciales presentados podrían no ser relevantes al problema en cuestión. • Todo acto de deshonestidad académica conllevará una nota de 0 en el examen y la radicación de cargos disciplinarios. • El examen dura 2 horas. 1. (30 puntos; 6 cada parte) Se desea encontrar una ecuación que permita predecir el peso de un árbol dadas distintas variables fácilmente medibles (diámetro a la altura del pecho, altura del árbol, edad y gravedad específica de la madera). Para ello se observan estas variables en 47 árboles y luego de derribados se pesan. Se ajustaron dos modelos: El modelo uno (1) usa el peso (weight, en libras) como variable independiente y el diámetro (dbh, en pulgadas), la altura (height, en pies), la gravedad específica (grav) y la edad (age, en años) como variables independientes. En el modelo dos (2) se usó el logaritmo natural del peso como variable dependiente, y el logaritmo natural de la altura, el logaritmo natural del diámetro, la gravedad específica y la edad como variables independientes. Los resultados se presentan a continuación. Estadística descriptiva Variable Media Mín weight 369.340 58.000 dbh 6.153 3.500 height 49.596 27.000 age 17.043 10.000 grav 0.445 0.353 logweight 5.495 4.060 logdbh 1.766 1.253 logheight 3.870 3.296 Máx 1692.000 12.100 79.000 27.000 0.508 7.434 2.493 4.369 Modelo 1: Análisis de regresión lineal Variable N weight 47 R² 0.9144 R² Aj 0.9062 ECMP 22112.1365 Coeficientes de regresión y estadísticos asociados Coef const dbh height age grav Est. -362.1466 166.7656 4.1444 -0.5846 -1100.9154 EE LI(95%) 228.1907 -822.6540 16.9133 132.6331 2.9990 -1.9078 3.6246 -7.8993 578.4182 -2268.2105 Cuadro de Análisis de la Varianza (SC tipo III) F.V. SC gl CM Modelo 6516119.1969 4 1629029.7992 dbh 1412120.6689 1 1412120.6689 height 27738.7523 1 27738.7523 age 377.8471 1 377.8471 grav 52618.8227 1 52618.8227 Error 610051.3563 42 14525.0323 Total 7126170.5532 46 LS(95%) 98.3609 200.8981 10.1966 6.7301 66.3797 T p-valor CpMallows -1.5870 0.1200 9.8600 <0.0001 98.9821 1.3819 0.1743 5.8886 -0.1613 0.8726 4.0487 -1.9033 0.0639 7.5616 F 112.1533 97.2198 1.9097 0.0260 3.6226 p-valor <0.0001 <0.0001 0.1743 0.8726 0.0639 Modelo 2: Análisis de regresión lineal Variable logweight N 47 R² 0.9818 R² Aj 0.9800 ECMP 0.0219 Coeficientes de regresión y estadísticos asociados Coef const logdbh logheight age grav Est. -1.6463 2.2021 0.8857 -0.0069 -0.1309 Cuadro de Análisis de la F.V. SC Modelo 36.5795 logdbh 5.9086 logheight 0.5476 age 0.0517 grav 0.0007 Error 0.6788 Total 37.2583 EE 0.3827 0.1152 0.1522 0.0039 0.6218 Varianza gl 4 1 1 1 1 42 46 LI(95%) LS(95%) T p-valor CpMallows -2.4186 -0.8740 -4.3019 0.0001 1.9697 2.4345 19.1208 <0.0001 361.1250 0.5786 1.1927 5.8210 <0.0001 37.1192 -0.0147 0.0009 -1.7881 0.0810 7.1463 -1.3857 1.1240 -0.2105 0.8343 4.0665 (SC tipo III) CM F 9.1449 565.8499 5.9086 365.6042 0.5476 33.8839 0.0517 3.1974 0.0007 0.0443 0.0162 p-valor <0.0001 <0.0001 <0.0001 0.0810 0.8343 a. ¿Cuál de los dos modelos elegiría Ud. para predecir mejor el peso de un árbol dado si conoce la altura, el diámetro, la edad y la gravedad específica de la madera? Justifique su respuesta brevemente. b. Para el modelo seleccionado en la parte a, interprete claramente el coeficiente de regresión asociado con altura (o log altura). c. Interprete, si es posible, el intercepto. Si no es posible hacerlo, justifique. d. Para realizar un proceso de selección BACKWARD, Ud. debería comenzar en el primer paso eliminado cuál(es) de las variables i. “AGE” ii. “GRAV” iii. “AGE” y “GRAV” iv. No se puede determinar a partir de la información provista. e. Prediga (si es posible) el peso de un árbol que tiene un diámetro de 10” (ln diam=2.30), una altura de 50 pies (ln altura=3.91), 15 años de edad y es de una especie cuya gravedad específica es 0.450. (Recuerde que si Ud. ha escogido el modelo 2, el resultado que obtiene será del logaritmo del peso, por lo que deberá ser exponenciado para llevarlo a la escala original) PÁGINA EN BLANCO 2. (31 puntos) Se diseñó un estudio para evaluar el agregado de una hormona de crecimiento (citoquinina, dosis 0, 10, 20, 30 ppm) sobre el rendimiento de yautía en dos épocas de siembra (abril y junio). Para ello se usó un diseño con 4 bloques completos aleatorizados. Una mitad de cada bloque (aleatoriamente seleccionada) se sembró en abril y la otra mitad en junio. Cada parcela se trató con la dosis correspondiente de la hormona mediante aplicaciones foliares. a. (9 puntos) Mencione el/los factor/es en este estudio. Indique si son fijos o aleatorios y el número de niveles de cada uno de ellos. b. (6 puntos) Realice un esquema del diseño de campo, indicando una posible aleatorización del (o de los) factor(es). c. (6 puntos) Mencione el nombre completo del diseño de este estudio e indique el número de repeticiones. d. (10 puntos) Presente una tabla de ANOVA con las fuentes de variación, los grados de libertad y los estadísticos F. Indique los números (no las letras) cuando sea posible. 3. (30 puntos, 5 puntos cada parte) Se realizó un experimento para evaluar la efectividad de una vacunación con inmunoglobulina a cerdas antes de parir, para así mejorar las defensas de los cerditos. Para ver si la cantidad de inmunoglobulina A presente en la sangre era mayor en las cerdas vacunadas que en las sin vacunar, se eligieron 20 cerdas. Diez de estas cerdas (aleatoriamente seleccionadas) se vacunaron con la dosis recomendada de IgA, mientras que a las otras 10 se les inyectó un placebo (solución fisiológica). Como cada cerda tiene su propia cantidad natural de IgA, la concentración de IgA (ppm) en sangre de cada cerda se determinó inmediatamente antes de vacunarlas (IgA0), para usar esta cantidad como covariable. A las 3 semanas después del parto se volvió a determinar la concentración de IgA en sangre (IgA1). Los datos y resultados del análisis en SAS se muestran a continuación. cerda 1 2 3 4 5 6 7 8 9 10 trat vac vac vac vac vac novac novac novac novac novac Estadística Variable IgA0 IgA1 IgA0 49.7 43.2 55.0 52.1 40.2 45.2 56.4 52.4 50.2 50.0 IgA1 62.8 59.0 64.3 60.6 54.7 49.2 53.8 54.9 53.3 49.8 descriptiva n Media 10 49.44 10 56.24 proc glm; class trat; model IgA1= trat IgA0 / solution; lsmeans trat; run; Class Level Information Class trat Levels 2 Values novac vac Number of observations 10 Dependent Variable: IgA1 Source Model Error Corrected Total DF 2 7 9 R-Square 0.913897 Sum of Squares 223.3784241 21.0455759 244.4240000 Coeff Var 3.083089 Mean Square 111.6892120 3.0065108 Root MSE 1.733929 F Value 37.15 IgA1 Mean 56.24000 Pr > F 0.0002 Source trat IgA0 DF 1 1 Parameter Intercept trat novac trat vac IgA0 Type III SS 209.1806340 60.1624241 Estimate 35.09173000 B -9.54809234 B 0.00000000 B 0.52431869 Mean Square 209.1806340 60.1624241 Standard Error 5.68390423 1.14468834 . 0.11720984 F Value 69.58 20.01 t Value 6.17 -8.34 . 4.47 Pr > F <.0001 0.0029 Pr > |t| 0.0005 <.0001 . 0.0029 Least Squares Means trat IgA1 LSMEAN novac vac 51.4659538 61.0140462 proc glm; class trat; model IgA1= trat IgA0 trat*IgA0; run; Dependent Variable: IgA1 Source Model Error Corrected Total DF 3 6 9 R-Square 0.914926 Source trat IgA0 IgA0*trat Sum of Squares 223.6297512 20.7942488 244.4240000 Coeff Var 3.310173 DF 1 1 1 Mean Square 74.5432504 3.4657081 Root MSE 1.861641 Type III SS 0.62997592 48.02748471 0.25132708 F Value 21.51 Pr > F 0.0013 IgA1 Mean 56.24000 Mean Square 0.62997592 48.02748471 0.25132708 F Value 0.18 13.86 0.07 Pr > F 0.6847 0.0098 0.7967 Escriba las ecuaciones estimadas que le permitirán predecir IgA1 en función de IgA0 para cerdas vacunadas y para cerdas no vacunadas. Debe indicar las dos ecuaciones. b. ¿Existen diferencias entre los tratamientos una vez eliminado el efecto de la cantidad inicial de IgA? Formule y pruebe las hipótesis correspondientes usando α=.05. c. ¿Hay alguna relación lineal entre IgA1 e IgA0 en cada uno de los tratamientos? Formule y pruebe las hipótesis correspondientes usando α=.05. d. ¿Es la pendiente de la relación lineal entre IgA1 e IgA0 la misma en cada tratamiento? Formule y pruebe las hipótesis correspondientes usando α=.05. e. Interprete claramente la pendiente estimada en el modelo en términos de este problema. a. f. Observando que la media de IgA0 para las 10 cerdas es 49.44, indique claramente cómo se puede calcular el valor observado de media ajustada para IgA1 en cerdas vacunadas (61.014). 4. (9 puntos: 3 cada parte) Indique cierto/falso. Justifique brevemente. a. En una regresión polinomial, el valor de R 2 nunca disminuye a medida que consideramos términos de mayor grado (es decir, para los mismos datos, una regresión cúbica va a tener un R 2 mayor o igual que el de una cuadrática) _____________ b. En regresión múltiple, el primer paso usado en los métodos de selección FORWARD, BACKWARD y STEPWISE (es decir, los tres métodos comienzan ajustando el mismo modelo) ________________ c. En un modelo con dos factores, la prueba F para probar la interacción es la misma si ambos factores son fijos, si ambos factores son aleatorios, o si uno es fijo y el otro aleatorio _________________