5 - UAB

Econometrı́a I Tema 3: Modelo múltiple: estimación Guı́a de respuestas para algunos ejercicios 1. a. El guión de comandos de Gretl: Output del guión de comandos: 1 b. Gretl output: Como observamos en los resultados de la estimación utilizando matrices coincide con la estimación para los menús. Podemos guardar los residuos con la opción del menú del output: Save → Residuals c. û1 = y1 − βˆ0 − βˆ1 x11 − βˆ2 x12 = 2 − 5, 37 − 0, 74 · (−1) + 1, 68 · 2 = 0, 74. El valor del residuo coincide con lo que obtendrı́amos utilizando el guión de Gretl. d. P5 ûi = 0, 74+0−1, 105+1, 47−1, 105 = 0. También, como tenemos los residuos 5 X guardados, podemos utilizar el guión de Gretl para comprobar que ûi = 0 i=1 i=1 escribiendo en el guión el comando: scalars = sum(uhat). Vemos que 2. Consideramos el siguiente modelo: M odelo(1) ln(pricei ) = β0 + β1 ln(noxi ) + β2 roomsi + ui donde price – precio medio de la vivienda en una zona expresado en dólares, nox – nivel de contaminación medido por la presencia de óxido nitroso, rooms – número de habitaciones que tienen en promedio las viviendas de la zona. a. Esperamos que el signo para β1 sea negativo: la contaminación se refleje negativamente en el precio de una casa. Ası́ que esperemos una elasticidad negativa del precio respecto a la contaminación. El parámetro β2 es una semielasticidad. Esperamos que β2 sea positivo, ya que esperamos que tener una habitación adicional estará asociado a tener un precio más alto en promedio. b. Después de importar los datos hprice2.xls desde Gretl, hemos de crear los logarı́tmos de las variables price y nox. Después escribimos el guión de comandos de Gretl: 2 Gretl guión output: c. Gretl output: Como vemos, la estimación definiendo las matrices apropiadas o utilizando los menús de Gretl coinciden. d. Regresión ajustada: \ i ) = 9, 2337 − 0, 7176 · ln(noxi ) + 0, 3059 · roomsi ln(price R2 = 0, 514 e. Consideramos que una casa A tiene una habitación adicional en comparación a una casa B, pero las dos estan en la misma zona. Entonces: \ A ) = 9, 2337 − 0, 7176 · ln(noxA ) + 0, 3059 · (roomsB + 1) ln(price \ B ) = 9, 2337 − 0, 7176 · ln(noxB ) + 0, 3059 · (roomsB ) ln(price \ A ) − ln(price \ B ) = 0, 3059 ln(price \ = 0, 3059 ∆lnprice 3 Una casa como la A serı́a, en media, 30,59 % más cara que una casa como la B. f. Dado que la variable dependiente y el regresor estan en logarı́tmos, podemos interpretar el coeficientes como una elasticidad. Ası́, de acuerdo con nuestras estimaciones, un 1% más contaminación estará asociado a un precio un 0.718% más bajo, controlando por el número de habitaciones. g. Para poder interpretar la estimación de β1 como el efecto causal de la contaminación sobre los precios de las casas, los cambios en la contaminación se han de realizar bajo condiciones ceteris paribus. Es decir, la contaminación no se ha de correlacionar con la perturbación. En otras palabras, cuando la contaminación varı́a, nada más relevante no observado se ha de mover de forma sistemática. E(u|ln(nox), rooms) = 0 Pensad, que una variable que se incloye en u podrı́a ser el ingreso medio de la zona en la que se encuentra la casa. Áreas con ingresos más bajoos tienden a bajar los precios de las casas. Pero, también, se podrı́a pensar que las activitades contaminantes tienden a situar-se en zonas de ingresos más bajos. En este caso, ln(nox) se correlacionarı́a con la perturbación, u negativamente. Las condiciones ceteris paribus no se cumplirı́an. 4. a. Gretl output: b. Guión de comandos: Output: 4 Nota: A pesar de que no era una parte de la pregunta, podemos ver que este guión de comandos hace todos los cálculos siguientes:   1 1 0 1 3 −1   1 4 0    1 5 1   X= 1 7 −1   1 8 0    1 10 −1 1 10 2   10 25   32   43  y= 58   62   67 71 Entonces: βb = (X 0 X)−1 X 0 y  −1   8 48 0 368 = 48 364 5 2710 0 5 8 35    0, 62 −0, 08 0, 05 368 = −0, 08 0, 01 −0, 008 2710 0, 05 −0, 008 0, 13 35   6, 47 = 6, 59 0, 26 u b = y − yb = y − X β̂     10 1 1 0 25 1 3 −1     32 1 4 0        6, 47 43 1 5 1      =  58 − 1 7 −1 6, 59     0, 26 62 1 8 0      67 1 10 −1 71 1 10 2       −3, 06 10 13, 06 25 25, 98 −0, 98       32 32, 82 −0, 82       43 39, 67  3, 33        =  −  =  5, 67  58 52, 33       62 59, 18  2, 82        67 72, 10 −5, 10 71 72, 87 −1, 87 Ası́, la estimación de la varianza de las perturbaciones es: σ̂ 2 = SRC û0 û 91, 65 = = = 18, 33 n−K 8−3 5 5 La matriz de varianzas estimadas de β̂ es: b = σ vd ar(β) b2 (X 0 X)−1   0, 62 −0, 08 0, 05 = 18, 33 · −0, 08 0, 01 −0, 008 0, 05 −0, 008 0, 13   11, 34 −1, 51 0, 94 = −1, 51 0, 25 −0, 16 0, 94 −0, 16 2, 39 La varianza estimada de βb0 , βb1 y βb2 es: Vd ar(βb0 ) = 11, 34 Vd ar(βb1 ) = 0, 25 Vd ar(βb2 ) = 2, 39 Consecuentemente, ee(βb0 ) = p 11, 34 = 3, 67 ee(βb1 ) = p 0, 25 = 0, 5 ee(βb2 ) = c. El modelo ajustado es: ybi = 6, 47 + 6, 59·xi1 + 0, 26·xi2 (3,37) 5. (0,5) R2 = 0, 97 (1,55) a. Utilizando menús de Gretl hacemos la siguiente estimación: b. El guión de comandos de Gretl: 6 p 2, 39 = 1, 55 c. El guión de comandos output: Como vemos los resultados de la estimación en forma matricial y utilizando Gretl menús coinciden. 7. a. Para un modelo con K = 3, SRC asociada a la estimació de este modelo es: Min n X βe0 ,βe1 ,βe2 i=1 ũ2i = n X (yi − β̃0 − β̃1 xi1 − β˜2 xi2 )2 , i=1 y las ecuaciones normales vienen dadas por: −2 n X (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0 (1) xi1 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0 (2) xi2 (yi − β̂0 − β̂1 xi1 − β̂2 xi2 ) = 0 (3) i=1 −2 −2 n X i=1 n X i=1 Vamos a reorganizar estas ecuaciones un poco: n X yi = β̂0 + β̂1 xi1 + β̂2 xi2 (1) yi xi1 = β̂0 xi1 + β̂1 x2i1 + β̂2 xi2 xi1 (2) yi xi2 = β̂0 xi2 + β̂1 xi1 xi2 + β̂2 x2i2 (3) i=1 n X i=1 n X i=1 7 Si xi2 = 2xi1 , podemos substituir xi2 p0r xi1 en las ecuaciones 1, 2 y 3. Obtenemos: n X yi = β̂0 + β̂1 xi1 + 2β̂2 xi1 (1’) yi xi1 = β̂0 xi1 + β̂1 x2i1 + 2β̂2 x2i1 (2’) yi xi1 = 2β̂0 xi1 + 2β̂1 x2i1 + 4β̂2 x2i1 (3’) i=1 n X i=1 2 n X i=1 Podemos ver que las ecuaciones 2’ y 3’ son las mismas. Ası́, tenemos sólo dos ecuaciones relevantes y tres incógnitas: β̂0 , β̂1 y β̂2 . El sistema es indeterminado, tiene infinitas soluciones. Por tanto, no se puede obtener una solución única para β̂0 , β̂1 y β̂2 . b. Fijémonos que si xi3 = 2xi2 , entonces la matriz X tiene dos columnas en combinación lineal perfecta.     1 x11 2 · x11 1 x11 x12 1 x21 x22  1 x21 2 · x21      X =  .. .. ..  ..  =  .. .. . . .  .  . . 1 xn1 2 · xn1 1 xn1 xn2 Esta caracterı́stica se traspasa a la matriz X 0 X, haciendo que dos columnas y dos filas guarden también una relación lineal perfecta.  Pn n i=1 xi1 2· Pn i=1 xi1     Pn Pn 2  Pn 2 2 · i=1 xi1  XX= i=1 xi1 i=1 xi1     Pn 2 Pn 2 Pn 2 · i=1 xi1 2 · i=1 xi1 4 · i=1 xi1 0 Ası́, esta matriz no tendrá rango completo. Es una matriz singular. det(X 0 X) = 0 ⇐⇒ rang(X 0 X) < 3 Dado que X 0 X no tiene rango completo, @(X 0 X)−1 ⇒ @β̂ c. Bajo colinealidad perfecta, como es este caso, la muestra no permite estimar los parámetros asociados a los regresores colineales de forma única. Su estimación es indeterminada. Existen infinitas estimaciones por M CO de los parámetros β1 y 8 β2 que minimizan la SRC. V ar(βb1 /x) y V ar(βb2 /x) es infinita. Fijémonos que otra forma de verlo es que: V ar(βb1 |x) = σ 2 · 1 1 1 1 · = σ2 · · =∞ 2 ST C1 1 − R1 ST C1 1 − 1 (4) Dado R12 , que es el coeficiente de determinación de la regresión auxiliar xi1 = α0 + α1 xi2 + ui . 8. a. El output de esta estimación es: b. \ i = 116, 974 − 0, 4634cigsi + 0, 093 f aminci bwght (1,04898) (0,0915) R2 = 0, 0298 (0,0292) c. Bajo el supuesto de que podemos interpretar los parámetros en términos de causalidad, el signo de la estimación obtenida de β1 es el esperado si creemos que un aumento del consumo de tabaco durante el embarazo tiende a perjudicar la salud de la madre y por tanto el peso del recién nacido. Bajo el mismo supuesto, el signo de la estimación obtenida de β2 es el esperado si creemos que un mejor nivel de renta tiende a beneficiar la dieta de la madre y consecuentemente, el peso del nacido. El coeficiente de determinación es 0,0298. Es decir, sólo cerca de un 3% de la variabilidad observada en el peso de los nacidos en esta muestra se puede explicar por diferencias en el consumo de cigarrillos de sus madres y de las diferencias en su renta. d. Los regresores cigs y f aminc podrı́an estar correlacionados positivamente si consideramos que al aumentar el nivel de renta de la famı́lia, el consumo de tabaco sube linealmente. Podrı́an estar correlacionados negativamente si consideramos que el tabac es un bien inferior. Por otro lado, si consideramos que son variables independientes, que no guardan ninguna relación, entonces su correlación serı́a cero. e. Necesitamos estimar la regresión auxiliar: cigsi = α1 + α2 f aminci + vi 9 Ası́: F IV2 = 1 = 1, 031 1 − 0.029945 f. Para analizar la correlación dentro de una muestra entre dos variables podemos utilizar el coeficiente de correlación muestral. En este caso, utilizamos Gretl: Parece presentar una correlación negativa, pero baja. g. Utilizando la opción del menú de Gretl: Fijémonos que tanto F IV1 como F IV2 son muy cercanos a 1, que es el valor mı́nimo que puede tomar este estadı́stico. Ası́ no parece que la colinealidad sea un problema en este caso. h. Gretl output asociado a la estimación del M odelo(2): Podemos ver que la estimación de β1 casi no ha variado en relación a la obtenida estimando el M odelo(1), cosa que indica que la correlación presente en la muestra entre el regresor incluido, cigs, y el excluido, f aminc, es baja. 10 i. Definimos R2 (1) y R2 (2) como el coeficiente de determinación asociado a la estimación del M odelo(1) y M odelo(2) respectivamente: SRC(1) ST C(1) SRC(2) R2 (2) ≡ 1 − ST C(2) R2 (1) ≡ 1 − Dado que los dos modelos tienen la misma variable dependiente y se estiman con la misma muestra, ST C(1) = ST C(2). Ası́: SRC(1) ST C SRC(2) R2 (2) ≡ 1 − ST C Fijémonos que el M odelo(2) es una versión restringida del M odelo(1). Es decir, el M odelo(2) es un caso especial del M odelo(1) cuando imponemos que β2 = 0, ası́, al estimar el segundo modelo por MCO es equivalente a decir que estamos estimando el primer modelo bajo la restricción β2 = 0, haciendo que: R2 (1) ≡ 1 − SRC(1) ≤ SRC(2) → R2 (1) ≥ R2 (2) Es, por lo tanto, fácil ver que en general, el coeficiente de determinación baja cuando sacamos regresores de un determinado modelo. 9. a. Ahora, f aminc∗ = f aminc·1000. Por tanto, la estimación del coeficiente asociado a los ingresos familiares del M odelo(1)∗ , β̂2∗ , es la del M odelo(1), β̂2 , dividida por 1.000: β̂2∗ = β̂2 /1000. Empleando algebra matricial podemos mostrar que si β̂ = (X 0 X)−1 X 0 Y y β̂ ∗ = ((1000 · X)0 · (1000 · X))−1 · (1000 · X)0 · Y entonces β̂ ∗ = 1000 (X 0 X)−1 X 0 Y 10002 = 1 (X 0 X)−1 X 0 Y 1000 = 1 β̂. 1000 b. El coeficiente de determinación no cambia porque la variabilidad de los regresores no se ve afectada por un cambio en las unitades de medida de estos regresores. c. Llamando faminc* en Gretl como “faminc dol” estimamos por MCO el M odelo(1)∗ : Por tanto, comprobamos que β̂2∗ = β̂2 /1000 = 0, 0927/1000 = 0, 0000927. 10. Vamos a estimar el siguiente modelo: educi = β0 + β1 sibsi + β2 meduci + β3 f educi + ui donde educi =años de educación de una persona i, sibsi =número de hermanos de la persona i, meduci =número de años de educación de la madre y f educi =número de años de educación del padre. 11 a. Gretl output para la estimación: b. Recta ajustada de regresión: [i = 10, 364 − 0, 094 · sibsi + 0, 131 · meduci + 0, 210 · f educi educ (0,359) (0,034) (0,033) R2 = 0, 214 (0,027) c. El signo positivo de la educacion de los padres sobre los hijos es el esperado. De hecho, la educación de los niños depende mucho de la educación de sus padres. Los padres con más educación tienden a hijos con más educación. La relación con el número de hermanos no es tan clara. Por un lado, cuantos más hermanos menos recursos pueden destinar los padres (tanto en tiempo como en dinero) y podrı́a afectar negativamente al nivel de educación de una persona. Desde el otro lado, tener hermanos puede tener un efecto positivo si consideramos que los hermanos enseñan los unos a los otros. El primer efecto parece prevalecer en nuestra muestra. La bondad de ajuste es 21,4%, parece baja, indicando otros factores que no tenemos en cuenta, pero son importantes en la determinación de la educación. d. La educación de la madre y el padre podrı́an estar correlacionadas si hay aparejamiento selectivo. El número de hermanos también se podrı́a correlacionar con la educación de los padres y madres. e. Utilizando menús de Gretl, calculamos factores de inflación de varianza asociados a cada regresor: En nuestro modelo los valores de F IV s estan entre 1 y 1,5, lo que significa que no hay multicolinealidad en el modelo. Tenemos la sospecha de multicolinealidad cuando F IV > 10. 12 f. Ahora calcularemos F IVsibs nosotros mismos: (a) En primer lugar, se estima la regresión auxiliar para sibs: sibsi = α0 + α1 · meduci + α2 · f educi + ui (b) Ahora calculamos: F IVsibs = 1 1 = 1, 099 = 2 1−R 1 − 0, 09 Este valor coincide con el valor que tenemos en la parte anterior de la estimación con menús de Gretl. 11. Vamos a estimar el siguiente modelo: M odelo(1) lnSi = β0 + β1 · edi + β2 · exi + ui Donde lnSi =el logarı́tmo natural de los salarios de una persona i, edi =años de educación, exi =años de experiencia en el mercado laboral. a. Gretl output de la estimación: Recta ajustada analı́tica: di = 4, 666 + 0, 0932 · edi + 0, 0407 · exi lnS (0,0638) (0,0036) R2 = 0, 1813 (0,0023) Los signos son los esperados, ambos, educación y experiencia se relacionan positivamente con el salario. La bondad de ajuste es 18,13%, siendo baixa. 13 b. Un año adicional de educación se espera que esté asociado a un salario un 9,3% más alto: d ≈ βb1 · ∆ed = 0, 093 · 1 = 0, 093(9, 3%) ∆lnS c. Un año adicional de experiencia se espera que aumente el salario en 4,1% : d ≈ βb2 · ∆ex = 0, 041 · 1 = 0, 041(4, 1%) ∆lnS d. La diferencia entre los M odelo(1) y M odelo(2) se encuentra en los supuestos de como la experiencia se relaciona con el salario. En el M odelo(1) se supone que el efecto marginal de la experiencia sobre los salarios (en forma de tasa) es constante, mientras que en el M odelo(2) el efecto marginal de la experiencia sobre los salarios varı́a dependiendo del nivel de experiencia. e. El output para la estimación del M odelo(2): Recta ajustada de regresión: di = 4, 469 + 0, 0932 · edi + 0, 0898 · exi − 0, 0025 · ex2 lnS i (0,0687) (0,0036) (0,0071) R2 = 0, 1958 (0,0004) f. El efecto marginal de la experiencia sobre los salarios (com una tasa), para un nivel dado de educación, se puede estimar: d ∂ lnS = βb2 + 2 · βb3 · ex ∂ex Por tanto, el efecto marginal depende de la experiencia. Dado que β̂3 < 0, podemos ver que el efecto marginal de la experiencia sobre los salarios disminuye con la experiencia: Años de experiencia ex=0 ex=1 ex=2 ... ex=10 Efecto marginal 0, 0898(8, 98%) 0, 0898 − 0, 0025 · 1 = 0, 0873(8, 73%) 0, 0898 − 0, 0025 · 2 = 0, 0848(8, 48%) ... 0, 0898 − 0, 0025 · 10 = 0, 0406(4, 06%) 14

5 - UAB

Documentos relacionados

Productos

Apoyo

5 - UAB

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib