Lista de ejercicios nº 1 MODELO LINEAL CLÁSICO 1.) Dado el modelo Yi = β0 + β1 X1i + β2 X2i + ε i y las observaciones muestrales de X e Y en la siguiente tabla: i 1 2 3 4 5 6 7 8 9 10 Yi 2 3 4 1 1 4 6 2 4 3 X1i 1 1 1 1 1 2 2 2 2 2 X2i 0 0 0 1 1 0 0 1 1 1 a) Especifique las matrices X y (X´X) cuando escribimos el modelo con notación matricial (Y = Xβ + ε ). b) Calcule los estimadores mínimo cuadráticos de los parámetros β. c) Estime por mínimos cuadrados la varianza del término de error. d) Calcule la matriz de varianzas-covarianzas de los estimadores de β. e) ¿Cuáles son las desviaciones típicas de las estimaciones de los parámetros β? f) Calcule el coeficiente de determinación, R2. 2.) Dado el siguiente modelo: Yi = β0 + β1 X1i + β2 X2i + β3 X3i + ε i , para i = 1, 2, 3, ... N. Se sabe que cov (X1i , X2i) = cov (X1i , X3i ) = cov (X2i , X3i ) = 0. a) Obtenga en forma matricial los estimadores de β1 , β2 y β3. b) Indique, comprobándolo adecuadamente, si sería equivalente efectuar regresiones separadas para cada variable exógena. 3.) El camionero Pedro Martínez se dedica a realizar transportes locales de corto recorrido sin salir de Murcia. Suele repostar siempre en la misma gasolinera, próxima a su domicilio, y anotar los litros servidos y la distancia recorrida en cada ocasión. Las últimas observaciones han sido: Km. recorridos Litros repostados 320 168 356 192 596 318 325 170 220 118 423 223 365 195 La siguiente ocasión en que reposta en la gasolinera se encuentra con que esta ha cambiado de dueño y recoge la observación de 234 km. y 140 litros. Más tarde oye el rumor de que el nuevo dueño ha trucado el contador de la gasolinera de forma que factura a sus clientes más litros de los que realmente cargan. Suponiendo que las condiciones del camión no han variado, contraste la hipótesis de que el contador de la gasolinera funciona erróneamente. 4.) El servicio de estudios del Ayuntamiento de Murcia ha desarrollado un modelo para explicar el precio de venta (en decenas de miles de euros) de las viviendas unifamiliares en el municipio (Pi) en función del número de metros cuadrados construidos, Si; de la superficie no construida de la finca en m2, Fi; del número de dormitorios, Di; y del número de cuartos de baño, Bi. Para una muestra aleatoria de 80 viviendas se ha estimado la siguiente ecuación: Pi = 2,0 + 0,08 Si + 0,02 Fi + 1,63 Di + 0,52 Bi + ε i (0,82) (0,025) (0,022) (0,64) (0,42) R2 = 0,64 Entre paréntesis se dan las desviaciones típicas estimadas. a) Efectúe un contraste de significatividad conjunta de la ecuación anterior para un nivel de significación del 5%. ¿Qué significado tiene rechazar la hipótesis nula en este caso? b) Interprete los coeficientes de regresión. c) Contraste la hipótesis de que βS - βF = 0 para un nivel de significación del 5% sabiendo que la correlación entre los coeficientes estimados de βS y βF es igual a 0,4. ¿Qué interpretación económica tiene el resultado de este contraste? 5.) Los datos de una serie de trabajadores sirvieron para estimar la ecuación siguiente: ESCOLÂRIDAD = 10,36 – 0,094 HERMANOS + 0,131 ESCMADRE + 0,210 ESCPADRE N=722, R2 = 0,214 en donde ESCOLARIDAD son los años de escolaridad, HERMANOS el número de hermanos, ESCMADRE la escolaridad en años de la madre y ESCPADRE la del padre. a) ¿Tiene HERMANOS el efecto esperado? Explíquelo. Si se mantienen fijas ESCMADRE y ESCPADRE ¿cuánto tiene que aumentar HERMANOS para reducir en uno los años pronosticados de escolaridad? (Se acepta un número no entero por respuesta) b) Analice la interpretación del coeficiente de ESCMADRE. c) Supongamos que el hombre A no tiene hermanos y sus padres tienen cada uno 12 años de formación. El hombre B tampoco tiene hermanos pero sus padres tienen una escolaridad de 16 años. ¿Cuál es la diferencia predicha en años de educación entre A y B? 6.) El modelo siguiente es una versión simplificada del modelo de regresión múltiple que emplearon Biddle y Hamermesh (1990) para estudiar el equilibrio entre el tiempo dedicado a dormir y a trabajar y para analizar otros factores que influyen en el sueño: Si = β0 + β1 TRABAJOi + β2 EDUCACIONi + β3 EDADi + ε i en el que S (sueño) y TRABAJO (trabajo total) se miden en minutos por semana, en tanto que EDUCACION y EDAD en años. a) Si los adultos cambian sueño por trabajo, ¿cuál es el signo de β1? b) ¿Qué signos cree que tendrán β2 y β3? c) Estimando esta ecuación en Eviews se obtienen los siguientes resultados: Dependent Variable: S Method: Least Squares Date: 10/08/03 Time: 00:12 Sample: 1 706 Included observations: 706 Variable Coefficient C 3638.245 TRABAJO -0.148373 EDUCACION -11.13381 EDAD 2.199885 R-squared 0.113364 Adjusted R-squared 0.109575 S.E. of regression 419.3589 Sum squared resid 1.23E+08 Log likelihood -5263.106 Durbin-Watson stat 1.942609 Std. Error t-Statistic 112.2751 32.40474 0.016694 -8.888075 5.884575 -1.892034 1.445717 1.521657 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) Prob. 0.0000 0.0000 0.0589 0.1285 3266.356 444.4134 14.92098 14.94681 29.91889 0.000000 Si alguien trabaja cinco horas más por semana, ¿cuántos minutos se espera que disminuirá el sueño? ¿Es un cambio grande? d) Analice el signo y la magnitud del coeficiente estimado de EDUCACION. e) ¿Diría usted que TRABAJO, EDUCACION y EDAD explican buena parte de la variación en sueño? ¿Qué otros factores influirían en el tiempo dedicado a dormir? ¿Es probable que se correlacionen con TRABAJO? 7.) Con los datos de la estimación en Eviews de la ecuación del modelo del problema 7, se pide: a) ¿Es EDUCACION o EDAD significativa individualmente al nivel de 5% contra la alternativa bilateral? Razone la respuesta. b) Al eliminar EDUCACION y EDAD del modelo se obtiene la siguiente estimación: Dependent Variable: S Method: Least Squares Date: 10/08/03 Time: 00:57 Sample: 1 706 Included observations: 706 Variable Coefficient Std. Error t-Statistic C 3586.377 38.91243 92.16534 TRABAJO -0.150746 0.016740 -9.004992 R-squared 0.103287 Mean dependent var Adjusted R-squared 0.102014 S.D. dependent var S.E. of regression 421.1357 Akaike info criterion Sum squared resid 1.25E+08 Schwarz criterion Log likelihood -5267.096 F-statistic Durbin-Watson stat 1.954559 Prob(F-statistic) Prob. 0.0000 0.0000 3266.356 444.4134 14.92662 14.93953 81.08987 0.000000 ¿Son EDUCACION y EDAD conjuntamente significativas en la ecuación original al nivel de 5%? Justifique la respuesta. c) ¿Incluir EDUCACION y EDAD en el modelo influye mucho en la relación entre dormir y trabajar? 8.) Sea RENTA la renta mensual promedio pagada por unidades en arrendamiento en una ciudad universitaria de Estados Unidos. POBL denota la población total de la ciudad, INGR es el promedio de ingreso en la ciudad y PEST la población estudiantil como porcentaje de la población total. Una ecuación que representa este modelo es: log(RENTA) = β0 + β1 log(POBL) + β2 log(INGR) + β3 PEST + ε a) Plantee la hipótesis nula de que el tamaño de la población estudiantil relativa a la población total no tiene un efecto ceteris paribus en las rentas mensuales. Establezca al alternativa de que sí hay un efecto. b) ¿Qué signos espera usted para β1 y β2. c) La ecuación estimada de los datos de 64 ciudades universitarias es Log(RÊNTA) = 0,043 + 0,066 log(POBL) + 0,507 log(INGR) + 0,0056 PEST (0,084) (0,039) (0,081) (0,0017) N=64, R2=0,458 Entre paréntesis se dan las desviaciones típicas de los distintos coeficientes estimados. ¿Qué es incorrecto en el planteamiento: “un aumento de 10% en la población se asocia con un incremento de cerca de 6,6% en la renta”? d) Pruebe la hipótesis planteada en el apartado a) al nivel del 1 por ciento.