Lab 12

Anuncio
Revisado_Abril_2015_LW B
LAB 12 - Regresión Múltiple
1. Para estudiar la relación entre ciertas características del suelo y la producción de biomasa (g) de una planta
forrajera natural se obtuvieron 45 muestras en diferentes ambientes, y en cada muestra se estimó la biomasa (g)
y se registraron las características del suelo en el que crecía. Los datos están en el archivo Salinidad en InfoStat
(Archivo>Abrir datos de prueba).
a) Ajuste un modelo de regresión lineal múltiple (modelo 1) usando biomasa como variable dependiente, y
pH, salinidad, zinc y potasio como variables independientes. Guarde los valores predichos y los residuos
estudentizados.
b) Obtenga la ecuación estimada de regresión y el valor del coeficiente de determinación. Interprete los
coeficientes de regresión parciales en términos de este problema.
c) Para verificar validez del modelo, construya gráficos de dispersión de residuos estudentizados versus
cada una de las variables independientes. ¿Qué información obtenemos con estos gráficos? Observe con
cuidado el gráfico residuos vs. salinidad.
d) Ajuste un modelo (modelo 2) que incluya todas las variables independientes usadas anteriormente y un
término cuadrático para salinidad (use la opción polinomios). Guarde nuevamente los residuos
estudentizados y valores predichos.
e) Para verificar validez del modelo, construya gráficos de dispersión de residuos estudentizados versus
cada una de las variables independientes.
f) Para este modelo, interprete los coeficientes de regresión parciales asociados con pH, potasio y zinc.
¿Por qué no se puede interpretar el coeficiente asociado a salinidad?
g) Ajuste un modelo que no incluya potasio (modelo 3). Incluya solamente ph, zinc, salinidad y salinidad al
cuadrado (use polinomios), guarde los residuos estudentizados y grafíquelos versus cada una de las
variables independientes (incluyendo potasio).
h) ¿Cuál de los tres modelos seleccionaría? Justifique su respuesta e indique la ecuación del modelo
estimado.
i) Para el modelo seleccionado verifique los supuestos de normalidad y homogeneidad de varianzas
mediante gráficos y/o pruebas adecuadas.
j) Prediga, si es posible, la biomasa producida en suelo de pH 6, con una salinidad de 35, un contenido de
zinc de 20 y un contenido de potasio de 900.
2. Los datos abajo (gansos) se tomaron para estudiar el efecto de varias variables ambientales sobre el tiempo en
el que una especie de ganso migratorio deja su nido a la mañana para ir a buscar alimento. Estos datos se
tomaron durante varios días en un refugio de vida silvestre cerca de la costa de Texas en el invierno de 1987/88.
La variable TIEMPO se indica en minutos antes (-) o después (+) del amanecer. La variable TEMP es la
temperatura del aire en C, HUM es la humedad relativa ambiente, LUZ es la intensidad lumínica y NUBES es
el porcentaje del cielo cubierto por nubes.
AGRO 6600 – LAB 12
Page 1
Fecha
10-Nov-87
13-Nov-87
14-Nov-87
15-Nov-87
17-Nov-87
18-Nov-87
21-Nov-87
22-Nov-87
23-Nov-87
25-Nov-87
30-Nov-87
5-Dic-87
14-Dic-87
18-Dic-87
24-Dic-87
26-Dic-87
27-Dic-87
28-Dic-87
30-Dic-87
31-Dic-87
2-Ene-88
3-Ene-88
4-Ene-88
5-Ene-88
6-Ene-88
7-Ene-88
8-Ene-88
10-Ene-88
11-Ene-88
12-Ene-88
14-Ene-88
15-Ene-88
16-Ene-88
20-Ene-88
21-Ene-88
22-Ene-88
23-Ene-88
24-Ene-88
Tiempo
11
2
-2
-11
-5
2
-6
22
22
21
8
25
9
7
8
18
-14
-21
-26
-7
-15
-6
-23
-14
-6
-8
-19
-23
-11
5
-23
-7
9
-27
-24
-29
-19
-9
Temp
11
11
11
20
8
12
6
18
19
21
10
18
20
14
19
13
3
4
3
15
15
6
5
2
10
2
0
-4
-2
5
5
8
15
5
-1
-2
3
6
Hum
78
88
100
83
100
90
87
82
91
92
90
85
93
92
96
100
96
86
89
93
43
60
80
92
90
96
83
88
80
80
61
81
100
51
74
69
65
73
Luz
12.6
10.8
9.7
12.2
14.2
10.5
12.5
12.9
12.3
9.4
11.7
11.8
11.1
8.3
12
11.3
4.8
6.9
7.1
8.1
6.9
7.6
8.8
9
8
7.1
3.9
8.1
10.3
9
5.1
7.4
7.9
3.8
6.3
6.3
7.8
9.5
Nubes
100
80
30
50
0
90
30
20
80
100
60
40
95
90
40
100
100
100
40
95
100
100
100
60
100
100
100
20
10
95
95
100
100
0
0
0
30
30
a. Prepare e interprete una matriz de diagramas de dispersión (“scatterplot matrix”) y una matriz de
correlación en Infostat.
b. Ajuste ecuaciones de regresión lineal simple entre TIEMPO y cada una de las variables independientes
¿Cuáles variables muestran una relación lineal fuerte con TIEMPO?
c. Conduzca un análisis de regresión múltiple para predecir el tiempo (Y) usando todas las otras variables
como independientes (temp, hum, luz y nubes). Obtenga la ecuación estimada de regresión y el valor del
coeficiente de determinación. Interprete los coeficientes de regresión parciales en términos de este
problema. Use InfoStat y SAS.
d. Prediga el tiempo promedio que estas aves dejan su nido cuando la temperatura es de 15C, la humedad
relativa del 70%, la intensidad de luz de 10.5 y la cobertura de nubes del 65%.
e. Pruebe 2  4  0.
Descargar