PONTIFICIA UNIVERSIDAD CATÓLICA DE CHILE FACULTAD DE MATEMÁTICA DEPARTAMENTO DE PROBABILIDAD Y ESTADÍSTICA Análisis estadístico para datos discretos ELM2450 Profesor: Reinaldo Arellano Segundo Semestre 2000 Tarea Nº2 EJERCICIO 2 Usando la base de datos ICU, descrita en la tarea anterior, considere un modelo de regresión logística múltiple para la variable “estado vital” (STA), con la edad (“AGE”), presencia de problemas de cáncer (“CAN”), CPR anterior al ingreso a la admisión ICU (“CPR”), probable infección (“INF”) y raza (“RACE”). 1.1 La variable RACE está codificada en tres niveles. Prepare una tabla mostrando la codificación en los dos niveles para incluir esta variable en regresión logística. 1.2-. Escriba las ecuaciones del modelo de regresión logística de STA con AGE, CAN, CPR, INF, y RACE. Escriba las ecuaciones de la transformación logit del modelo de regresión logística. ¿Cuántos parámetros contiene este modelo? 1.3-. Escriba una expresión para la verosimilitud y para la log-verosimilutud del modelo de regresión logística del problema 1.2. ¿ Cuántas ecuaciones de verosimilitud hay ? Escriba una expresión para la forma típica de las ecuaciones de verosimilitud de este problema. 1.4-. Usando un software de regresión logística obtenga el estimador de máxima verosimilitud de los parámetros del modelo de regresión logística del problema 1.2. Usando estos estimadores, escriba las ecuaciones de los valores ajustados, esto es, las estimaciones de probabilidad logísticas. 1.5-. Usando los resultados de la salida desde el software, analizar la significación del modelo usando el test de razón de verosimilitud. ¿ Qué supuestos son necesarios para el cálculo de los “valores p” para validar este test? ¿Cuál es el valor de la lejanía para el modelo ajustado? 1.6-. Use el estadístico de Wald para obtener una aproximación para la significancia de los coeficientes individuales en el modelo. Ajuste un modelo reducido que elimine las variables no significativas de acuerdo al test de Wald. Presente los resultados de la ajuste del modelo reducido en una tabla. Definición de Variables: STA: Estado vital de la persona ( 0 = Vivo; 1 = muerto) AGE: Edad en años cumplidos. CAN : Presencia de problemas de cáncer (0 = No; 1 = Si) CPR: CPR anterior a la admisión en ICU (0 = No; 1 = Si) INF : Presencia de infección al momento de ingreso a ICU 0 = No; 1 = Si) RACE: Raza ( 1= blanco; 2 = negro; 3 = otro).