Solución del control de Econometrıa (GECO) del 16 de mayo de

Anuncio
Solución del control de Econometrı́a (GECO) del 16 de mayo de 2013. Grupos A y B.
Se dispone de datos sobre el peso al nacer de 1000 bebés en kilogramos (bwght), la renta familiar en
miles de dólares (faminc), el sexo del recién nacido (sexo), la raza en los grupos blanco y no blanco
(etnic) y por último, el número de cigarrillos diarios que fumó la madre durante el embarazo (cigs).
Se ha estimado el siguiente modelo lineal para el peso de los recién nacidos (donde log() indica el
logaritmo neperiano):
(Intercept)
log(faminc)
sexoVarón
etnicNo blanco
cigs
Estimate
3.3401
—
0.0655
-0.1291
-0.0150
Std. Error t value Pr(>|t|)
0.0731
45.70
0.0000
0.0205
0.90
0.3660
0.0345
1.90
0.0574
0.0447
-2.89
0.0040
0.0028
—
0.0000
Pregunta 1. ¿Cuánto es el coeficiente β̂ asociado a la renta familiar? Interprete dicho coeficiente.
ˆ
El estadı́stico t para H0 : β2 = 0 es √ β2 ˆ , por lo que despejando β̂2 = 0,0205 · 0,90 = 0,018. Dado
V (β2 )
que la variable explicativa está en logaritmos, pero no la dependiente, ante un aumento de un 1 % en
la renta familiar se espera un aumento de peso de 0.018/100 kilogramos o 0.18 gramos.
Pregunta 2. ¿Cuánto se espera que varı́e el peso del bebé de una familia que ingresa 30 000 dólares
a una familia que ingresa 40 000 dólares a igualdad de otros factores?
La diferencia en peso esperado entre los dos bebés es ŷf aminc=40 −ŷf aminc=30 = 0,018 [log 40 − log 30] =
40
0,018 log 30
= 0,0052 kg. (5.2 gramos). El resultado anterior es exacto, pero lo podemos aproximar usando el resultado de la pregunta 1, de esa forma, la variación en peso es, aproximadamente,
0,018 40−30
= 0,006. Si la tasa de variación (sea la logarı́tmica, sea la convencional) la expresamos en %
30
en lugar de tanto por uno, habrı́a que dividir por 100.
Pregunta 3. ¿Cuánto es el test t de significación individual para βcigs ? ¿Cuánto se espera que varı́e
el peso del bebé de una madre no fumadora a una que fuma 5 cigarrillos diarios a igualdad de otros
factores?
El test t para H0 : β5 = 0 es √ β̂5 ˆ =
V (β5 )
−0,0150
0,0028
= −5,36. Siguiendo los pasos de la pregunta 2,
ŷcigs=5 − ŷcigs=0 = −0,0150(5 − 0) = −0,075 kilos. Como la variable explicativa no está transformada,
cada unidad adicional en los cigarrillos fumados por la madre produce un descenso en el peso esperado
de 15 gramos.
Pregunta 4. ¿Cómo es la variación del peso del bebé en función de su sexo (a igualdad de otros
factores)? ¿Es significativa a los niveles habituales?
A la vista de que β̂3 = 0,0655, se puede decir que el peso medio de un recién nacido es 65.5 gramos
superior al de una recién nacida. Dicho efecto es significativamente distinto de cero al 10 %, pero no
se puede rechazar la nula para α ≤ 0,05.
Pregunta 5. A la vista de la estimación anterior y sabiendo que R2 = 0,0509 y que R̄2 = 0,04708
¿qué se puede decir de la especificación del modelo?
Si bien el R2 es pequeño, dicha cifra no es extraña en modelos con muchos datos de sección
cruzada o con series temporales estacionarias. En todo caso, el valor del R2 es poco o nada relevante.
La reducción del R̄2 comparado con R2 puede explicarse por la no significatividad de log(f aminc) y en
menor medida por la variable sexo. [NOTA: eliminado la variable log(f aminc), resulta R2 = 0,04512
y R̄2 = 0,04224].
Pregunta 6. Contraste la significación conjunta de las pendientes del modelo ¿cuál es el valor del
estadı́stico de contraste? Si P [F (4, 995) ≤ 2,3809] = 0,95, ¿qué hace con la hipótesis nula?
En la pregunta 5 nos proporcionan el R2 de la regresión, por lo que el estadı́stico de contraste se
0,0509
R2
puede calcular F = n−k
= 995
= 13,34. Puesto que el valor del estadı́stico es superior al
k−1 1−R2
4 1−0,0509
∗
valor crı́tico (c = 2,3809), se rechaza la nula al 5 % de significación.
Pregunta 7. ¿Cuánto es el peso esperado de una niña que nacida en una familia con 37 500 dólares
de ingresos, no blancos y cuya madre no fumó durante el embarazo?
Aplicamos la estimación del modelo a los datos facilitados:
ŷ = 3,3401 + 0,018 log(37,5) + 0,0655 · 0 − 0,1291 · 1 − 0,0150 · 0 = 3,2762.
A continuación se presenta la matriz de varianzas y covarianzas de los coeficientes estimados del
modelo redondeada a cuatro decimales.
(Intercept)
log(faminc)
sexoVarón
etnicNo blanco
cigs
(Intercept)
0.0053
-0.0014
-0.0007
-0.0014
-0.0001
log(faminc)
-0.0014
0.0004
0.0000
0.0003
0.0000
sexoVarón
-0.0007
0.0000
0.0012
0.0000
0.0000
etnicNo blanco
-0.0014
0.0003
0.0000
0.0020
0.0000
Pregunta 8. Calcule el estadı́stico de contraste para H0 : 2βV aron = −βN o
calcuları́a el p-valor.
cigs
-0.0001
0.0000
0.0000
0.0000
0.0000
Blanco .
Detalle cómo
En este caso, es necesario formular la nula como Aβ = c y calcular el contraste F con la forma de
Wald o la versión t equivalente ya que tenemos una única restricción. Ası́, Aβ̂ − c = 2β̂3 + β̂4 − 0 =
2 · 0,0655 − 0,1291 = 0,0019 y V (Aβ̂) = V (2β̂3 + β̂4 ) = 4V (β̂3 ) + V (β̂4 ) + 2 · 2cov(β̂3 , β̂4 ). En la
tabla, cov(β̂3 , β̂4 ) = 0, por lo que V (Aβ̂) = 4 · 0,0012 + 0,0020 = 0,0068. El estadı́stico de contraste es
= 0,0230. Aproximando la distribución t995 por la N (0, 1), el p-valor se puede
t = √Aβ̂−c = √0,0019
0,0068
V (Aβ̂)
expresar α∗ = 2P [N (0, 1) > 0,023] (ya que la alternativa es de dos colas).
Pregunta 9. Calcule el estadı́stico de contraste para la hipótesis nula de que no hay diferencia de
peso al nacer ni por sexo ni por raza. Deje clara la distribución del estadı́stico de contraste y cuál es
la región crı́tica.
Aquı́ es necesario recurrir a la forma de Wald sin simplificación: F = m1 (Aβ̂−c)T [AV (β̂)AT ]−1 (Aβ̂−
c) ∼ Fm,n−k , para lo que es necesario expresar la hipótesis nula en la forma Aβ = c. Ası́, la nula resulta:


β1
 β2  
β3
0
0 0 1 0 0 
 β3  = 0 .
H0 :
=
⇒ H0 :

0
β4
0
0 0 0 1 0 
 β4 
β5
0,0655
0,0012
0
T
Resulta evidente que Aβ̂ − c =
y que AV (β̂)A =
. La inversa
0
0,0020 −0,1291
1/0,0012
0
es trivial, puesto que la matriz es diagonal: [AV (β̂)AT ]−1 =
. Sólo queda
0
1/0,0020
multiplicar:
T 1
1 0,06552 (−0,1291)2
0,0655
1/0,0012
0
0,0655
F =
=
+
= 5,95.
0
1/0,0020
−0,1291
2 −0,1291
2 0,0012
0,0020
La región crı́tica (F > c∗ ) se obtiene de la distribución F2,995 , donde el valor crı́tico para una significación α debe cumplir que P [F2,995 > c∗ ] = α.
Descargar