Universidad Nacional Agraria La Molina Departamento de Estadística e Informática Maestría en Estadística Aplicada Ciclo 2011 – 2 Examen Final de Regresión Aplicada El plazo de entrega vence el 20 de diciembre. La solución del examen debe enviarse a clopez@lamolina.edu.pe incluyendo su trabajo final. Use un nivel de significación del 5%. Los resultados se publicaran el 21 de diciembre en la página web del curso. Cualquier reclamo debe ser comunicado de inmediato al correo mencionado. 1. Se sospecha que en los pacientes con ulcera péptica que han seguido un tratamiento, el tiempo que tarda en reaparecer la sintomatología ulcerosa está relacionado con el tiempo que tarda el paciente en responder al tratamiento. Para comprobarlo se somete a tratamiento a un conjunto de pacientes con ulcera péptica, siendo todos ellos fumadores, y periódicamente (cada semana) se comprueba si la sintomatología ulcerosa persiste o ha reaparecido. Una vez desaparecida el paciente sigue sometido a revisiones mensuales para comprobar el tiempo que tardan en reaparecer los síntomas. Antes de comenzar el tratamiento, algunos de los pacientes han decidido abandonar el hábito de fumar, por lo que se sospecha que en la reaparición de los síntomas, además del tiempo de respuesta al tratamiento, puede influir el abandono del tabaco, así como otros aspectos relacionados con los hábitos del individuo tales como el consumo de alcohol. Para predecir el tiempo de reaparición de los síntomas, conocidos el tiempo de respuesta al tratamiento y los distintos hábitos del paciente, se aplicará un análisis de regresión lineal a partir de una muestra de 312 pacientes. Las variables son: Y Tiempo de reaparición de la sintomatología ulcerosa (en meses) X 1 Tiempo de respuesta al tratamiento de la sintomatología ulcerosa (en semanas) X 2 El paciente ha dejado de fumar durante el tratamiento. (Sí = 0 y No = 1) X 3 Consumo de alcohol (en gramos diarios) Hallar el mejor modelo de regresión lineal e interprete sus parámetros estimados. Los datos se encuentran en el archivo Ulcera.txt. 4.0 ptos 2. El archivo Grasa.txt contiene información que sirve para estimar el porcentaje de grasa en el cuerpo humano en función de X 1 Edad (en años), X 2 Peso (en libras), X 3 Altura (en pulgadas), X 4 Longitud del cuello (en cm), X 5 Longitud del pecho (en cm), X 6 Longitud del abdomen (en cm), X 7 Longitud de la cadera (en cm), X 8 Longitud del muslo (en cm), X 9 Longitud de la rodilla, X 10 Longitud del tobillo (en cm), X 11 Longitud del bíceps (en cm), X 12 Longitud del antebrazo (en cm) y X 13 Longitud de la muñeca (en cm). Se tomaron las mediciones anteriores en 252 sujetos. a. Analice el problema de multicolinealidad para luego encontrar el mejor modelo de regresión. Comente. 4.0 ptos b. Para el modelo anterior detectar la presencia de posibles observaciones influyentes e inusuales. Comente. 4.0 ptos c. Aplique el procedimiento de Box and Tidwell en el modelo anterior. ¿Se puede establecer un mejor modelo de regresión? Comente. 4.0 ptos 1 3. Una empresa desea investigar la relación que existe entre X la antigüedad de sus vendedores en meses y Y el número de balanzas electrónicas de laboratorio que venden. Los datos en el archivo Ventas.txt presentan la información correspondiente a 15 de sus vendedores elegidos al azar. Determine a partir de un diagrama de dispersión el mejor modelo de regresión no lineal. Comente sus resultados. 4.0 ptos La Molina, 19 de diciembre del 2011 2