1 Universidad Nacional Agraria La Molina Departamento de

Anuncio
Universidad Nacional Agraria La Molina
Departamento de Estadística e Informática
Maestría en Estadística Aplicada
Ciclo 2012 – 1
Examen Parcial de Regresión Aplicada
1. Se aplicó un estudio de orientación a una muestra de niños nacidos en Berkeley,
California entre enero 1928 y junio 1929 sobre los que se realizaron diferentes mediciones
hasta los 18 años. Los datos se encuentran en el archivo Berkeley.txt y las variables
consideradas son:
Peso2
Talla2
Peso9
Talla9
Diametro9
Fuerza9
Peso18
Talla18
Diametro18
Fuerza18
Puntuacion
Peso a los 2 años (en kilogramos)
Talla a los 2 años (en centímetros)
Peso a los 9 años (en kilogramos)
Talla a los 9 años (en centímetros)
Diámetro de la pierna a los 9 años (en centímetros)
Fuerza a los 9 años (en kilogramos)
Peso a los 18 años (en kilogramos)
Diámetro de la pierna a los 18 años (en centímetros)
Diámetro de la pierna a los 18 años (en centímetros)
Fuerza a los 18 años (en kilogramos)
Puntuación desde 1 (muy delgado) hasta 7 (obeso)
a. Obtener la matriz de dispersión y la matriz de correlaciones muestrales. Comente sus
resultados.
3.0 ptos
b. Suponer que el punto de partida es la función media que solo considera la variable
predictora Peso9. Use el gráfico de variable añadida para evaluar el agregar
Diametro9 a la función media anterior. Obtenga los cuatro gráficos equivalentes a los
obtenidos en la Figura 3.1. Comente sus resultados.
3.0 ptos
c. Estimar el modelo de regresión lineal múltiple cuya función media incluye las
variables predictoras Talla2, Peso2, Talla9, Peso9 y Fuerza9. Hallar el coeficiente de
determinación y el cuadro de ANVA. Use el estadístico t para evaluar si cada
coeficiente de regresión es igual a cero. Comente sus resultados.
3.0 ptos
d. Obtener el análisis de variancia secuencial estimando las variables de acuerdo al orden
mencionado en la pregunta anterior. Plantear las hipótesis correspondientes y
comentar los resultados obtenidos.
3.0 ptos
e. Obtener el análisis de variancia secuencial estimando las variables en orden inverso al
usado en la pregunta anterior. Explicar las diferencias obtenidas. ¿Qué gráficos
podrían ayudarnos a comprender estas diferencias?
3.0 ptos
1
2. El archivo Grasa.txt contiene información que sirve para estimar el porcentaje de grasa en
el cuerpo humano en función de X 1  Edad (en años), X 2  Peso (en libras), X 3  Altura
(en pulgadas), X 4  Longitud del cuello (en cm), X 5  Longitud del pecho (en cm),
X 6  Longitud del abdomen (en cm), X 7  Longitud de la cadera (en cm),
X 8  Longitud del muslo (en cm), X 9  Longitud de la rodilla, X 10  Longitud del tobillo
(en cm), X 11  Longitud del bíceps (en cm), X 12  Longitud del antebrazo (en cm) y
X 13  Longitud de la muñeca (en cm). Se tomaron las mediciones anteriores en una
muestra de 252 sujetos. Analice el conjunto de datos para encontrar el mejor modelo de
regresión.
5.0 ptos
La Molina, 19 de diciembre del 2011
2
Descargar