EXAMEN ECONOMETRÍA I Febrero de 2004. Grupo 3A-31 NOMBRE Y APELLIDOS _____________________________________________ 1. Demuestre que el modelo básico de regresión lineal realiza un ajuste perfecto en el punto de las medias 2. Calcular la varianza del error de predicción con x n+h = x media 3. En el caso de omisión de variables relevantes en el modelo, como se ven afectados los estimadores 4. Cuáles son las causas más comunes de regresores estocásticos en el MBRL. Qué problemas producen 5. ¿Qué ocurriría en modelo de corte transversal para determinar el precio de la vivienda en Madrid si incluyera como variable explicativa el impuesto de transmisiones patrimoniales (6%) como variable explicativa? 6. ¿Cómo corregiría un problema de multicolinealidad en el MBRL? 7. Demuestre como se distribuye teóricamente la suma de los errores al cuadrado estandarizada en el MBRL PARTE PRÁCTICA De cara a a tasar el valor de las viviendas de segunda mano en Madrid, una empresa inmobiliaria plantea el siguiente modelo: PRECIO = C(1)+ C(2)*ESTADO + C(3)*DORMITORIOS + C(4)*METROS + C(5)*ZONA +C(6)*PLANTA +C(7)*FIC1249 Donde: Precio: Estado: Dormitorios: Metros: Zona: Planta: Fic1249: precio de la vivienda variable dicotómica que vale 1 si está “para reformar” o cero en el resto de los casos número de dormitorios de la vivienda metros cuadrados de la vivienda variable del 1 al 31 que simplemente diferencia entre distintos barrios en Madrid altura de la vivienda (-1, sótano; 0, bajo; 0.5, entresuelo; 1, primero; 2, segundo, ...) una variable ficticia que vale uno para la vivienda número 1249 de la muestra y cero para el resto Se pide: - - Rellena los huecos marcados con interrogantes en las diferentes salidas del examen Contraste la validez del modelo utilizado para determinar el precio de una vivienda La empresa considera que las variables “metros” y “dormitorios” pudieran estar explicando lo mismo y que quizá pudiera prescindirse de una de las dos ¿Aconsejaría Vd. eliminar alguna del modelo? En su caso ¿Cuál? Parece que el comportamiento del precio de la vivienda podría, influido por la zona en la que está, marcarse según características diferentes a partir de la vivienda número 1273. ¿Podría confirmar este hecho? REGRESIÓN INICIAL Dependent Variable: PRECIO Method: Least Squares Sample: 1 1407 Included observations: 1406 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. C ESTADO DORMITORIOS METROS ZONA PLANTA FIC1249 27094.33 ????? -36141.24 ????? -1465.644 1087.008 1552659. 7288.365 ????? 3131.238 ????? ????? 865.0309 85464.51 3.717477 -2.909327 -11.54216 ????? -6.117993 1.256612 ????? 0.0002 0.0037 0.0000 0.0000 0.0000 0.2091 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat ????? ????? ????? ????? -17951.64 1.402654 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) ????? ????? 25.54572 25.57185 1215.642 0.000000 2500000 2000000 1500000 1000000 500000 600000 0 400000 200000 0 -200000 -400000 -600000 200 400 600 800 Residual 1000 1200 Actual 1400 Fitted MATRIZ DE VARIANZAS-COVARIANZAS DE LOS PARÁMETROS C ESTADO DORMITORIOS METROS ZONA PLANTA FIC1249 C ESTADO DORMITORIOS METROS ZONA PLANTA FIC1249 53120264 -2638075. -9379488. -75319.99 -870896.9 -1293255. 1768305. -2638075. 48277497 -4382240. 57971.92 145392.5 146753.8 -45732728 -9379488. -4382240. 9804653. -160953.9 -38654.21 -59815.94 7464569. -75319.99 57971.92 -160953.9 5354.595 2121.758 -10749.86 -102370.0 -870896.9 145392.5 -38654.21 2121.758 57390.38 -7658.182 -1005324. -1293255. 146753.8 -59815.94 -10749.86 -7658.182 748278.5 797902.5 1768305. -45732728 7464569. -102370.0 -1005324. 797902.5 7.30E+09 Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient 84875.59 58855.38 17.40828 0.105794 CUSUM SQUARED RESID 1.2 1.0 0.8 0.6 0.4 0.2 0.0 -0.2 1260 1280 1300 1320 1340 CUSUM of Squares 1360 1380 1400 5% Significance ESTADÍSTICAS DESCRIPTIVAS DE LAS VARIABLES Mean Median Maximum Minimum PRECIO ESTADO 346076.6 299952.5 2200000. 78134.00 0.129445 0.000000 1.000000 0.000000 DORMITORI OS 2.603841 3.000000 7.000000 0.000000 METROS ZONA PLANTA FIC1249 92.31650 85.00000 440.0000 15.00000 13.65078 9.000000 31.00000 1.000000 3.376245 3.000000 25.00000 -1.000000 0.000711 0.000000 1.000000 0.000000 Std. Dev. 211645.8 0.335812 1.056530 45.48627 9.599582 2.719178 0.026669 MATRIZ DE CORRELACIONES ENTRE LAS VARIABLES PRECIO ESTADO DORMITOR METROS ZONA PLANTA FIC1249 PRECIO 1.000000 0.000335 0.533211 0.882571 -0.162139 0.233884 0.182962 ESTADO 0.000335 1.000000 0.168713 0.043958 -0.080906 -0.012063 0.069186 DORMITOR 0.533211 0.168713 1.000000 0.713042 -0.059054 0.196355 -0.015253 METROS 0.882571 0.043958 0.713042 1.000000 -0.116989 0.257277 -0.010160 ZONA -0.162139 -0.080906 -0.059054 -0.116989 1.000000 0.007696 0.042673 REGRESIONES ADICIONALES Dependent Variable: PRECIO Method: Least Squares Date: 01/30/04 Time: 11:48 Sample: 1273 1406 Included observations: 134 Variable Coefficient Std. Error t-Statistic Prob. C ESTADO DORMITORIOS METROS ZONA PLANTA 1487610. -50297.18 -20257.31 3871.750 -47951.22 1705.633 368687.2 19729.38 8638.658 270.7960 12045.19 2442.623 4.034883 -2.549354 -2.344960 14.29766 -3.980944 0.698279 0.0001 0.0120 0.0206 0.0000 0.0001 0.4863 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.694836 0.682915 62236.11 4.96E+11 -1666.253 1.656777 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 249793.5 110523.6 24.95900 25.08876 58.28928 0.000000 Dependent Variable: PRECIO Method: Least Squares Date: 01/30/04 Time: 11:56 Sample: 1 1272 Included observations: 1271 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. C ESTADO DORMITORIOS METROS ZONA PLANTA 27719.86 -7508.795 -39271.13 4736.989 -1490.737 936.4910 8558.413 8200.142 3724.660 86.14921 332.8150 1024.588 3.238902 -0.915691 -10.54355 54.98587 -4.479176 0.914017 0.0012 0.3600 0.0000 0.0000 0.0000 0.3609 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.801337 0.800552 96985.04 1.19E+13 -16394.48 1.472229 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 356384.1 217165.0 25.80721 25.83151 1020.514 0.000000 PLANTA 0.233884 -0.012063 0.196355 0.257277 0.007696 1.000000 -0.013507 FIC1249 0.182962 0.069186 -0.015253 -0.010160 0.042673 -0.013507 1.000000 Dependent Variable: METROS Method: Least Squares Date: 01/30/04 Time: 12:01 Sample: 1 1407 Included observations: 1406 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. C DORMITORIOS ESTADO ZONA PLANTA 14.06556 30.04754 -10.70974 -0.393724 2.006044 2.634699 0.813556 2.513392 0.086736 0.311271 5.338583 36.93360 -4.261070 -4.539325 6.444692 0.0000 0.0000 0.0000 0.0000 0.0000 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.534750 0.533422 31.07008 1352455. -6823.884 1.268496 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 92.31650 45.48627 9.713918 9.732582 402.5717 0.000000 Dependent Variable: DORMITORIOS Method: Least Squares Date: 02/02/04 Time: 13:02 Sample: 1 1407 Included observations: 1406 Excluded observations: 1 Variable Coefficient Std. Error t-Statistic Prob. C ESTADO METROS ZONA PLANTA FIC1249 0.956636 0.446955 0.016416 0.003942 0.006101 -0.761329 0.056712 0.058090 0.000445 0.002042 0.007382 0.729183 16.86840 7.694231 36.92968 1.930645 0.826493 -1.044085 0.0000 0.0000 0.0000 0.0537 0.4087 0.2966 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.529173 0.527492 0.726251 738.4158 -1542.298 1.673928 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 2.603841 1.056530 2.202415 2.224812 314.6988 0.000000