Econometrı́a I Tema 3: Modelo múltiple: estimación Guı́a de respuestas para algunos ejercicios 1. a. El guión de comandos de Gretl: Output del guión de comandos: 1 b. Gretl output: Como observamos en los resultados de la estimación utilizando matrices coincide con la estimación para los menús. Podemos guardar los residuos con la opción del menú del output: Save → Residuals c. û1 = y1 − βˆ0 − βˆ1 x11 − βˆ2 x12 = 2 − 5, 37 − 0, 74 · (−1) + 1, 68 · 2 = 0, 74. El valor del residuo coincide con lo que obtendrı́amos utilizando el guión de Gretl. d. P5 ûi = 0, 74+0−1, 105+1, 47−1, 105 = 0. También, como tenemos los residuos 5 X guardados, podemos utilizar el guión de Gretl para comprobar que ûi = 0 i=1 i=1 escribiendo en el guión el comando: scalars = sum(uhat). Vemos que 2. Consideramos el siguiente modelo: M odelo(1) ln(pricei ) = β0 + β1 ln(noxi ) + β2 roomsi + ui donde price – precio medio de la vivienda en una zona expresado en dólares, nox – nivel de contaminación medido por la presencia de óxido nitroso, rooms – número de habitaciones que tienen en promedio las viviendas de la zona. a. Esperamos que el signo para β1 sea negativo: la contaminación se refleje negativamente en el precio de una casa. Ası́ que esperemos una elasticidad negativa del precio respecto a la contaminación. El parámetro β2 es una semielasticidad. Esperamos que β2 sea positivo, ya que esperamos que tener una habitación adicional estará asociado a tener un precio más alto en promedio. b. Después de importar los datos hprice2.xls desde Gretl, hemos de crear los logarı́tmos de las variables price y nox. Después escribimos el guión de comandos de Gretl: 2 Gretl guión output: c. Gretl output: Como vemos, la estimación definiendo las matrices apropiadas o utilizando los menús de Gretl coinciden. d. Regresión ajustada: \ i ) = 9, 2337 − 0, 7176 · ln(noxi ) + 0, 3059 · roomsi ln(price R2 = 0, 514 e. Consideramos que una casa A tiene una habitación adicional en comparación a una casa B, pero las dos estan en la misma zona. Entonces: \ A ) = 9, 2337 − 0, 7176 · ln(noxA ) + 0, 3059 · (roomsB + 1) ln(price \ B ) = 9, 2337 − 0, 7176 · ln(noxB ) + 0, 3059 · (roomsB ) ln(price \ A ) − ln(price \ B ) = 0, 3059 ln(price \ = 0, 3059 ∆lnprice 3 Una casa como la A serı́a, en media, 30,59 % más cara que una casa como la B. f. Dado que la variable dependiente y el regresor estan en logarı́tmos, podemos interpretar el coeficientes como una elasticidad. Ası́, de acuerdo con nuestras estimaciones, un 1% más contaminación estará asociado a un precio un 0.718% más bajo, controlando por el número de habitaciones. g. Para poder interpretar la estimación de β1 como el efecto causal de la contaminación sobre los precios de las casas, los cambios en la contaminación se han de realizar bajo condiciones ceteris paribus. Es decir, la contaminación no se ha de correlacionar con la perturbación. En otras palabras, cuando la contaminación varı́a, nada más relevante no observado se ha de mover de forma sistemática. E(u|ln(nox), rooms) = 0 Pensad, que una variable que se incloye en u podrı́a ser el ingreso medio de la zona en la que se encuentra la casa. Áreas con ingresos más bajoos tienden a bajar los precios de las casas. Pero, también, se podrı́a pensar que las activitades contaminantes tienden a situar-se en zonas de ingresos más bajos. En este caso, ln(nox) se correlacionarı́a con la perturbación, u negativamente. Las condiciones ceteris paribus no se cumplirı́an. 4. a. Gretl output: b. Guión de comandos: Output: 4 Nota: A pesar de que no era una parte de la pregunta, podemos ver que este guión de comandos hace todos los cálculos siguientes: 1 1 0 1 3 −1 1 4 0 1 5 1 X= 1 7 −1 1 8 0 1 10 −1 1 10 2 10 25 32 43 y= 58 62 67 71 Entonces: βb = (X 0 X)−1 X 0 y −1 8 48 0 368 = 48 364 5 2710 0 5 8 35 0, 62 −0, 08 0, 05 368 = −0, 08 0, 01 −0, 008 2710 0, 05 −0, 008 0, 13 35 6, 47 = 6, 59 0, 26 u b = y − yb = y − X β̂ 10 1 1 0 25 1 3 −1 32 1 4 0 6, 47 43 1 5 1 = 58 − 1 7 −1 6, 59 0, 26 62 1 8 0 67 1 10 −1 71 1 10 2 −3, 06 10 13, 06 25 25, 98 −0, 98 32 32, 82 −0, 82 43 39, 67 3, 33 = − = 5, 67 58 52, 33 62 59, 18 2, 82 67 72, 10 −5, 10 71 72, 87 −1, 87 Ası́, la estimación de la varianza de las perturbaciones es: σ̂ 2 = SRC û0 û 91, 65 = = = 18, 33 n−K 8−3 5 5 La matriz de varianzas estimadas de β̂ es: b = σ vd ar(β) b2 (X 0 X)−1 0, 62 −0, 08 0, 05 = 18, 33 · −0, 08 0, 01 −0, 008 0, 05 −0, 008 0, 13 11, 34 −1, 51 0, 94 = −1, 51 0, 25 −0, 16 0, 94 −0, 16 2, 39 La varianza estimada de βb0 , βb1 y βb2 es: Vd ar(βb0 ) = 11, 34 Vd ar(βb1 ) = 0, 25 Vd ar(βb2 ) = 2, 39 Consecuentemente, ee(βb0 ) = p 11, 34 = 3, 67 ee(βb1 ) = p 0, 25 = 0, 5 ee(βb2 ) = c. El modelo ajustado es: ybi = 6, 47 + 6, 59·xi1 + 0, 26·xi2 (3,37) 5. (0,5) R2 = 0, 97 (1,55) a. Utilizando menús de Gretl hacemos la siguiente estimación: b. El guión de comandos de Gretl: 6 p 2, 39 = 1, 55 c. El guión de comandos output: Como vemos los resultados de la estimación en forma matricial y utilizando Gretl menús coinciden. 7. a. Para un modelo con K = 3, SRC asociada a la estimació de este modelo es: Min n X βe0 ,βe1 ,βe2 i=1 ũ2i = n X (yi − β̃0 − β̃1 xi1 − β˜2 xi2 )2 , i=1 y las ecuaciones normales vienen dadas por: −2 n X (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0 (1) xi1 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0 (2) xi2 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0 (3) i=1 −2 −2 n X i=1 n X i=1 Vamos a reorganizar estas ecuaciones un poco: n X yi = β̂0 + β̂1 xi1 + β̂2 xi2 (1) yi xi1 = β̂0 xi1 + β̂1 x2i1 + β̂2 xi2 xi1 (2) yi xi2 = β̂0 xi2 + β̂1 xi1 xi2 + β̂2 x2i2 (3) i=1 n X i=1 n X i=1 7 Si xi2 = 2xi1 , podemos substituir xi2 p0r xi1 en las ecuaciones 1, 2 y 3. Obtenemos: n X yi = β̂0 + β̂1 xi1 + 2β̂2 xi1 (1’) yi xi1 = β̂0 xi1 + β̂1 x2i1 + 2β̂2 x2i1 (2’) yi xi1 = 2β̂0 xi1 + 2β̂1 x2i1 + 4β̂2 x2i1 (3’) i=1 n X i=1 2 n X i=1 Podemos ver que las ecuaciones 2’ y 3’ son las mismas. Ası́, tenemos sólo dos ecuaciones relevantes y tres incógnitas: β̂0 , β̂1 y β̂2 . El sistema es indeterminado, tiene infinitas soluciones. Por tanto, no se puede obtener una solución única para β̂0 , β̂1 y β̂2 . b. Fijémonos que si xi3 = 2xi2 , entonces la matriz X tiene dos columnas en combinación lineal perfecta. 1 x11 2 · x11 1 x11 x12 1 x21 x22 1 x21 2 · x21 X = .. .. .. .. = .. .. . . . . . . 1 xn1 2 · xn1 1 xn1 xn2 Esta caracterı́stica se traspasa a la matriz X 0 X, haciendo que dos columnas y dos filas guarden también una relación lineal perfecta. Pn n i=1 xi1 2· Pn i=1 xi1 Pn Pn 2 Pn 2 2 · i=1 xi1 XX= i=1 xi1 i=1 xi1 Pn 2 Pn 2 Pn 2 · i=1 xi1 2 · i=1 xi1 4 · i=1 xi1 0 Ası́, esta matriz no tendrá rango completo. Es una matriz singular. det(X 0 X) = 0 ⇐⇒ rang(X 0 X) < 3 Dado que X 0 X no tiene rango completo, @(X 0 X)−1 ⇒ @β̂ c. Bajo colinealidad perfecta, como es este caso, la muestra no permite estimar los parámetros asociados a los regresores colineales de forma única. Su estimación es indeterminada. Existen infinitas estimaciones por M CO de los parámetros β1 y 8 β2 que minimizan la SRC. V ar(βb1 /x) y V ar(βb2 /x) es infinita. Fijémonos que otra forma de verlo es que: V ar(βb1 |x) = σ 2 · 1 1 1 1 · = σ2 · · =∞ 2 ST C1 1 − R1 ST C1 1 − 1 (4) Dado R12 , que es el coeficiente de determinación de la regresión auxiliar xi1 = α0 + α1 xi2 + ui . 8. a. El output de esta estimación es: b. \ i = 116, 974 − 0, 4634cigsi + 0, 093 f aminci bwght (1,04898) (0,0915) R2 = 0, 0298 (0,0292) c. Bajo el supuesto de que podemos interpretar los parámetros en términos de causalidad, el signo de la estimación obtenida de β1 es el esperado si creemos que un aumento del consumo de tabaco durante el embarazo tiende a perjudicar la salud de la madre y por tanto el peso del recién nacido. Bajo el mismo supuesto, el signo de la estimación obtenida de β2 es el esperado si creemos que un mejor nivel de renta tiende a beneficiar la dieta de la madre y consecuentemente, el peso del nacido. El coeficiente de determinación es 0,0298. Es decir, sólo cerca de un 3% de la variabilidad observada en el peso de los nacidos en esta muestra se puede explicar por diferencias en el consumo de cigarrillos de sus madres y de las diferencias en su renta. d. Los regresores cigs y f aminc podrı́an estar correlacionados positivamente si consideramos que al aumentar el nivel de renta de la famı́lia, el consumo de tabaco sube linealmente. Podrı́an estar correlacionados negativamente si consideramos que el tabac es un bien inferior. Por otro lado, si consideramos que son variables independientes, que no guardan ninguna relación, entonces su correlación serı́a cero. e. Necesitamos estimar la regresión auxiliar: cigsi = α1 + α2 f aminci + vi 9 Ası́: F IV2 = 1 = 1, 031 1 − 0.029945 f. Para analizar la correlación dentro de una muestra entre dos variables podemos utilizar el coeficiente de correlación muestral. En este caso, utilizamos Gretl: Parece presentar una correlación negativa, pero baja. g. Utilizando la opción del menú de Gretl: Fijémonos que tanto F IV1 como F IV2 son muy cercanos a 1, que es el valor mı́nimo que puede tomar este estadı́stico. Ası́ no parece que la colinealidad sea un problema en este caso. h. Gretl output asociado a la estimación del M odelo(2): Podemos ver que la estimación de β1 casi no ha variado en relación a la obtenida estimando el M odelo(1), cosa que indica que la correlación presente en la muestra entre el regresor incluido, cigs, y el excluido, f aminc, es baja. 10 i. Definimos R2 (1) y R2 (2) como el coeficiente de determinación asociado a la estimación del M odelo(1) y M odelo(2) respectivamente: SRC(1) ST C(1) SRC(2) R2 (2) ≡ 1 − ST C(2) R2 (1) ≡ 1 − Dado que los dos modelos tienen la misma variable dependiente y se estiman con la misma muestra, ST C(1) = ST C(2). Ası́: SRC(1) ST C SRC(2) R2 (2) ≡ 1 − ST C Fijémonos que el M odelo(2) es una versión restringida del M odelo(1). Es decir, el M odelo(2) es un caso especial del M odelo(1) cuando imponemos que β2 = 0, ası́, al estimar el segundo modelo por MCO es equivalente a decir que estamos estimando el primer modelo bajo la restricción β2 = 0, haciendo que: R2 (1) ≡ 1 − SRC(1) ≤ SRC(2) → R2 (1) ≥ R2 (2) Es, por lo tanto, fácil ver que en general, el coeficiente de determinación baja cuando sacamos regresores de un determinado modelo. 9. a. Ahora, f aminc∗ = f aminc·1000. Por tanto, la estimación del coeficiente asociado a los ingresos familiares del M odelo(1)∗ , β̂2∗ , es la del M odelo(1), β̂2 , dividida por 1.000: β̂2∗ = β̂2 /1000. Empleando algebra matricial podemos mostrar que si β̂ = (X 0 X)−1 X 0 Y y β̂ ∗ = ((1000 · X)0 · (1000 · X))−1 · (1000 · X)0 · Y entonces β̂ ∗ = 1000 (X 0 X)−1 X 0 Y 10002 = 1 (X 0 X)−1 X 0 Y 1000 = 1 β̂. 1000 b. El coeficiente de determinación no cambia porque la variabilidad de los regresores no se ve afectada por un cambio en las unitades de medida de estos regresores. c. Llamando faminc* en Gretl como “faminc dol” estimamos por MCO el M odelo(1)∗ : Por tanto, comprobamos que β̂2∗ = β̂2 /1000 = 0, 0927/1000 = 0, 0000927. 10. Vamos a estimar el siguiente modelo: educi = β0 + β1 sibsi + β2 meduci + β3 f educi + ui donde educi =años de educación de una persona i, sibsi =número de hermanos de la persona i, meduci =número de años de educación de la madre y f educi =número de años de educación del padre. 11 a. Gretl output para la estimación: b. Recta ajustada de regresión: [i = 10, 364 − 0, 094 · sibsi + 0, 131 · meduci + 0, 210 · f educi educ (0,359) (0,034) (0,033) R2 = 0, 214 (0,027) c. El signo positivo de la educacion de los padres sobre los hijos es el esperado. De hecho, la educación de los niños depende mucho de la educación de sus padres. Los padres con más educación tienden a hijos con más educación. La relación con el número de hermanos no es tan clara. Por un lado, cuantos más hermanos menos recursos pueden destinar los padres (tanto en tiempo como en dinero) y podrı́a afectar negativamente al nivel de educación de una persona. Desde el otro lado, tener hermanos puede tener un efecto positivo si consideramos que los hermanos enseñan los unos a los otros. El primer efecto parece prevalecer en nuestra muestra. La bondad de ajuste es 21,4%, parece baja, indicando otros factores que no tenemos en cuenta, pero son importantes en la determinación de la educación. d. La educación de la madre y el padre podrı́an estar correlacionadas si hay aparejamiento selectivo. El número de hermanos también se podrı́a correlacionar con la educación de los padres y madres. e. Utilizando menús de Gretl, calculamos factores de inflación de varianza asociados a cada regresor: En nuestro modelo los valores de F IV s estan entre 1 y 1,5, lo que significa que no hay multicolinealidad en el modelo. Tenemos la sospecha de multicolinealidad cuando F IV > 10. 12 f. Ahora calcularemos F IVsibs nosotros mismos: (a) En primer lugar, se estima la regresión auxiliar para sibs: sibsi = α0 + α1 · meduci + α2 · f educi + ui (b) Ahora calculamos: F IVsibs = 1 1 = 1, 099 = 2 1−R 1 − 0, 09 Este valor coincide con el valor que tenemos en la parte anterior de la estimación con menús de Gretl. 11. Vamos a estimar el siguiente modelo: M odelo(1) lnSi = β0 + β1 · edi + β2 · exi + ui Donde lnSi =el logarı́tmo natural de los salarios de una persona i, edi =años de educación, exi =años de experiencia en el mercado laboral. a. Gretl output de la estimación: Recta ajustada analı́tica: di = 4, 666 + 0, 0932 · edi + 0, 0407 · exi lnS (0,0638) (0,0036) R2 = 0, 1813 (0,0023) Los signos son los esperados, ambos, educación y experiencia se relacionan positivamente con el salario. La bondad de ajuste es 18,13%, siendo baixa. 13 b. Un año adicional de educación se espera que esté asociado a un salario un 9,3% más alto: d ≈ βb1 · ∆ed = 0, 093 · 1 = 0, 093(9, 3%) ∆lnS c. Un año adicional de experiencia se espera que aumente el salario en 4,1% : d ≈ βb2 · ∆ex = 0, 041 · 1 = 0, 041(4, 1%) ∆lnS d. La diferencia entre los M odelo(1) y M odelo(2) se encuentra en los supuestos de como la experiencia se relaciona con el salario. En el M odelo(1) se supone que el efecto marginal de la experiencia sobre los salarios (en forma de tasa) es constante, mientras que en el M odelo(2) el efecto marginal de la experiencia sobre los salarios varı́a dependiendo del nivel de experiencia. e. El output para la estimación del M odelo(2): Recta ajustada de regresión: di = 4, 469 + 0, 0932 · edi + 0, 0898 · exi − 0, 0025 · ex2 lnS i (0,0687) (0,0036) (0,0071) R2 = 0, 1958 (0,0004) f. El efecto marginal de la experiencia sobre los salarios (com una tasa), para un nivel dado de educación, se puede estimar: d ∂ lnS = βb2 + 2 · βb3 · ex ∂ex Por tanto, el efecto marginal depende de la experiencia. Dado que β̂3 < 0, podemos ver que el efecto marginal de la experiencia sobre los salarios disminuye con la experiencia: Años de experiencia ex=0 ex=1 ex=2 ... ex=10 Efecto marginal 0, 0898(8, 98%) 0, 0898 − 0, 0025 · 1 = 0, 0873(8, 73%) 0, 0898 − 0, 0025 · 2 = 0, 0848(8, 48%) ... 0, 0898 − 0, 0025 · 10 = 0, 0406(4, 06%) 14