Subido por Melanie Zarate Díaz

U4 - Modelos de variable dependiente limitada

Anuncio
Microeconometría
Unidad 4: Modelos con Variables Dependientes Limitadas
Luis Ledesma Goyzueta
Facultad de Economía
Universidad Peruana de Ciencias Aplicadas (UPC)
Mayo 2022
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
1 / 43
Índice
1
Introducción
2
Modelo Tobit
3
Modelos censurados y truncados
4
Modelo de Heckman
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
2 / 43
Introducción
Introducción
Hasta ahora solo hemos considerado modelos de variables dependientes
limitadas si la variable dependiente toma dos o un número limitado de
valores enteros.
Ahora consideramos modelos donde la variable dependiente es continua pero
tiene algunas restricciones debido a problemas económicos subyacentes o
debido al proceso de recopilación de datos:
Modelo de solución de esquina (Tobit)
Modelo censurado
Modelo truncado
Asimismo, considerarmos el modelo de Heckman para corregir el sesgo de
selección.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
3 / 43
Introducción
Introducción
Para respuestas de solución de esquina.
Ejemplo: una variable dependiente continua y positiva con un centro de
masa en 0. Por ejemplo, las horas trabajadas en datos de oferta de
trabajo.
Estructuras de datos similares son relevantes si tenemos problemas de
recolección de datos. Por ejemplo, si no podemos observar valores
negativos para la variable de respuesta. En este caso, la variable se
codifica como 0.
Esta última es una forma de censura y, por lo tanto, las soluciones de
esquina y la censura pueden imponer los mismos límites a la variación
de la variable dependiente.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
4 / 43
Introducción
Introducción
¿Cuáles son las consecuencias de esta estructura de datos?
Todavía podríamos estimar el modelo por MCO, pero existen limitaciones
similares a las del MPL:
Valores estimados negativos (siempre que todos los valores de la
variable dependiente sean positivos y haya un centro de masa en 0).
Un efecto parcial constante en E (yi | Xi ) puede ser engañoso.
Var (yi | Xi ) sería heteroscedástico (usar errores estándar y estadísticos
robustos).
yi no puede tener una distribución normal condicional ya que hay un
centro de masa. Por esta razón, toda inferencia solo tendría una
justificación asintótica.
El modelo Tobit es bastante conveniente para superar estas limitaciones del
modelo lineal.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
5 / 43
Modelo Tobit
Modelo Tobit
El modelo Tobit expresa la respuesta observada yi en términos de una
variable latente subyacente:
yi∗ = Xi β + ui ,
ui | Xi ∼ Normal 0, σ 2
yi = max (0, yi∗ )
donde la intersección se absorbe en Xi por conveniencia de notación.
La variable latente yi∗ satisface los supuestos del modelo lineal clásico.
La variable observada yi es igual a yi∗ si yi∗ es mayor o igual a 0 y, de lo
contrario, es cero.
Debido a que yi∗ se distribuye normalmente, yi tiene una distribución
continua sobre valores estrictamente positivos.
Además, la densidad de yi dado Xi es la misma que la densidad de yi∗ dado
Xi e yi positivo.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
6 / 43
Modelo Tobit
Modelo Tobit
También podemos escribir:
P (yi = 0 | Xi ) = P (yi∗ < 0 | Xi )
= P (ui < −Xi β | X ) = P (ui /σ < −Xi β/σ | Xi )
= Φ (−Xi β/σ) = 1 − Φ (Xi β/σ)
Por lo tanto, la función de densidad de yi dado Xi es:
h i
− 1
2
2πσ 2 2 exp − (yi − Xi β) /2σ 2 = (1/σ) φ [(yi − Xi β) /σ] ,
yi > 0
P (yi = 0 | Xi ) = 1 − Φ (Xi β/σ)
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
7 / 43
Modelo Tobit
Modelo Tobit
Entonces la función de log-verosimilitud para cada observación es
simplemente:
(yi − Xi β)
Xi β
1
`i (β, σ) = di (yi = 0) log Φ −
+ di (yi > 0) log
φ
σ
σ
σ
Esta es ahora una función en β y σ
La log verosimilitud para una muestra aleatoria se obtiene sumando el total
de `i para todo i.
Los estimadores de MV se obtienen maximizando la función de log
verosimilitud.
Esto se hace por métodos numéricos.
Los paquetes de computadora también reportan errores estándar. Se
puede utilizar para construir el estadístico t.
La prueba de hipótesis es esencialmente la misma que en los modelos
logit y probit. Utilice el test de Wald o LR.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
8 / 43
Modelo Tobit
Modelo Tobit
Interpretación de las estimaciones
Las estimaciones de Tobit se pueden obtener fácilmente con la ayuda de
paquetes estadísticos y parecen similares a las estimaciones de MCO.
Desafortunadamente, no podemos interpretar los coeficientes del
modelo como si fueran estimaciones de una regresión lineal.
Esto se debe a que βj mide el efecto parcial de xj sobre E (yi∗ | Xi ) en
lugar de E (yi | Xi ). Como observamos yi , esta es la variable de interés
para nosotros.
Podemos estimar fácilmente P (yi = 0 | Xi ) y, por lo tanto, también
P (yi > 0 | Xi ).
Sin embargo, ¿cómo podemos estimar la esperanza condicional de yi dado
Xi ?
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
9 / 43
Modelo Tobit
Modelo Tobit
Interpretación de las estimaciones
Podemos escribir:
E (yi | Xi ) = P (yi > 0 | Xi ) E (yi | yi > 0, Xi ) = Φ
Xi β
σ
E (yi | yi > 0, Xi )
lo que implica que todavía necesitamos obtener E (yi | yi > 0, Xi )
Esto es un poco más complicado pero podemos escribir:
E (yi | yi > 0, Xi ) = Xi β + E (ui | ui > −Xi β)
E (yi | yi > 0, Xi ) = Xi β + σE uσi | uσi > − Xσi β
Por tanto,
E (yi | yi > 0, Xi ) = Xi β + σ
Luis Ledesma (UPC)
EF73: Microeconometría
φ (Xi β/σ)
Φ (Xi β/σ)
Mayo 2022
10 / 43
Modelo Tobit
Modelo Tobit
Interpretación de las estimaciones
Esto implica que E (yi | yi > 0, X ) se puede escribir en función de los
coeficientes del modelo:
Xi β
φ (Xi β/σ)
= X β + σλ
E (yi | yi > 0, Xi ) = Xi β + σ
Φ (Xi β/σ)
σ
donde λ (c) =
φ(c)
Φ(c)
es el ratio inverso de Mills.
¿Qué aprendemos de esto?
E (yi | yi > 0, X ) no es simplemente Xi β.
El segundo término es positivo como σ > 0 y el ratio inverso de Mills
es mayor que cero.
Si sólo usamos observaciones con yi > 0, nuestras estimaciones serán
generalmente inconsistentes ya que el ratio inverso de Mills
generalmente se correlaciona con las variables independientes y sería
omitido.
Ignorar las observaciones con y = 0 implica un "problema de selección
muestral".
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
11 / 43
Modelo Tobit
Modelo Tobit
Interpretación de las estimaciones
Así, obtenemos:
E (yi | Xi ) = P (yi > 0 | Xi ) E (yi | yi > 0, Xi )= Φ (Xi β/σ) E (yi | yi > 0, Xi )
= Φ (Xi β/σ) [Xi β + σλ (Xi β/σ)]
= Φ (Xi β/σ) Xi β + σφ (Xi β/σ)
E (yi | Xi ) es, por lo tanto, una función no lineal de Xi y β.
Se puede demostrar que el lado derecho es positivo para cualquier valor de
Xi y β. Por esta razón, los valores estimados de yi son siempre positivos.
Esta propiedad tiene el costo de que la ecuación anterior es más complicada
que en el modelo lineal.
Los efectos parciales en este modelo también son más complicados que en el
modelo lineal.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
12 / 43
Modelo Tobit
Modelo Tobit
Efectos marginales
Asi como otros modelos no lineales, depende de la variable independiente
cómo se calcula el efecto parcial:
Si xj es binario, tenemos que calcular E (yi | Xi ) para los dos valores de
xj y tomar la diferencia entre los dos.
Si xj es continuo, existe una solución analítica:
Primero, tomar en cuenta que:
i β/σ)
∂E (yi | yi > 0, Xi ) /∂xj = βj + βj ∂λ(X
∂Xi β/σ
n
h
io
Xi β
Xi β
= βj 1 − λ Xσi β
+
λ
σ
σ
Esto muestra que el efecto parcial en E (yi | yi > 0, Xi ) no solo está
determinado por βj .
También hay un factor de ajuste en {...}. Se puede demostrar que este
factor de ajuste se encuentra estrictamente entre 0 y 1.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
13 / 43
Modelo Tobit
Modelo Tobit
Efectos marginales
También tener en cuenta que, dado que P (yi > 0 | Xi ) = Φ
∂P (y > 0 | X )
=
∂xj
βj
σ
Xi β
σ
:
Xi β
φ
σ
Por consiguiente:
∂E (yi |Xi )
∂xj
=
∂P(yi >0|X )
E
∂xj
= βj Φ
Xi β
σ
i >0,Xi )
(yi | yi > 0, Xi ) + P (yi > 0 | Xi ) ∂E (yi |y
∂xj
Para estimar el efecto parcial, se utiliza estimadores MV de β y σ.
Tener en cuenta que el efecto parcial depende del coeficiente σ.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
14 / 43
Modelo Tobit
Modelo Tobit
Efectos marginales
Tenemos que,
∂E (yi | Xi )
= βj Φ
∂xj
Xi β
σ
Esta ecuación nos permite comparar las estimaciones Tobit con las del MCO
(usando la muestra completa).
Para obtener algo comparable a las estimaciones de MCO, debemos
multiplicar las estimaciones Tobit por un factor de ajuste.
El factor de ajuste depende del valor de Xi (no hay un factor único).
Se puede calcular, por ejemplo, con el promedio de X .
Φ X̄ β̂/σ̂
o podemos promediar factores de ajuste individuales:
n−1
n
X
Φ Xi β̂/σ̂
i=1
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
15 / 43
Modelo Tobit
Modelo Tobit
Ejemplo: Oferta laboral anual de mujeres casadas
Data: MROZ.dta.
Datos sobre las horas trabajadas de 753 mujeres casadas, de las cuales
428 trabajaban fuera de la casa (yi > 0) y 325 no trabajaban (yi = 0).
El rango de yi para observaciones con yi > 0 es de 12 a 4,950.
Por lo tanto, esta data es útil para un modelo Tobit. Alternativamente,
también estimamos la ecuación de oferta de trabajo por MCO.
El factor de ajuste para hacer que
los resultados
de Tobit y MCO sean
P −1
más comparables es n
i Φ Xi β̂/σ̂ = 0,589
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
16 / 43
Modelo Tobit
Modelo Tobit
Ejemplo: Oferta laboral anual de mujeres casadas
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
17 / 43
Modelo Tobit
Modelo Tobit
Ejemplo: Oferta laboral anual de mujeres casadas
Vemos que en esta aplicación las estimaciones de Tobit son principalmente
mayores que las estimaciones de MCO.
Aunque después de multiplicar por 0.589 las estimaciones se reducen,
excepto el coeficiente en kidsge6 , las estimaciones de Tobit son mayores.
Por ejemplo educ: 0.589 x 80.65 = 47.50 que aún es más grande que el
coeficiente MCO (28.76).
Todos los valores estimados del modelo Tobit son positivos, mientras que 39
valores estimados del modelo MCO son negativos.
El modelo Tobit sugiere un aumento del efecto marginal de la educación en
las horas trabajadas.
El modelo lineal produce valores esperados generalmente más altos de horas
trabajadas con respecto a la educación.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
18 / 43
Modelo Tobit
Modelo Tobit
Algunas observaciones
El modelo Tobit se basa fundamentalmente en el supuesto del modelo, en
particular la normalidad de los errores y la homocedasticidad.
Si se violan estos supuestos, es difícil decir qué se están estimando los
parámetros MV del modelo Tobit .
En caso de que las desviaciones de los supuestos sean menores, es probable
que el modelo de Tobit todavía ofrezca una estimación adecuada de los
efectos parciales.
El modelo Tobit implica que el efecto parcial de xj sobre P (yi > 0 | Xi ) es
proporcional a βj , así como en el efecto sobre E (yi | yi > 0, Xi ).
El efecto marginal tiene el mismo signo y depende de los mismos parámetros
βj .
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
19 / 43
Modelo Tobit
Modelo Tobit
Resumen
El modelo Tobit es aplicable a resultados no negativos que se
acumulan en cero, pero también toman una amplia gama de valores
positivos.
Si eliminamos las observaciones con valor cero, generalmente
obtendremos estimaciones inconsistentes.
El modelo Tobit es estimado por MV.
El valor esperado de E (yi | Xi ) depende de Xi y β de manera no lineal.
Hemos derivado expresiones para los efectos parciales.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
20 / 43
Modelos censurados y truncados
Datos censurados y truncados
Hemos visto modelos con variables dependientes limitadas, donde
modelamos características importantes de la distribución de yi .
Hemos visto el modelo de Tobit donde una fracción no trivial de la población
elige no trabajar (yi = 0).
Si bien esto es el resultado de una decisión económica observable, existen
estructuras de datos similares o incluso idénticas que se deben a otras
razones.
Si una variable de respuesta ha sido censurada por encima o por debajo de
cierto umbral.
Típicamente debido al diseño de la encuesta o las limitaciones
institucionales.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
21 / 43
Modelos censurados y truncados
Datos censurados y truncados
Ejemplo de datos “completos”
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
22 / 43
Modelos censurados y truncados
Datos censurados y truncados
Ejemplo de datos censurados
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
23 / 43
Modelos censurados y truncados
Datos censurados y truncados
En este caso tenemos que aplicar un modelo de regresión censurado.
Falta el valor de la variable dependiente, pero tenemos información sobre la
variable cuando esta falta (umbral superior o inferior conocido).
Un caso diferente surge cuando excluimos, sobre la base de yi , un
subconjunto de la población.
Por ejemplo, todas las observaciones con yi = 0 no están disponibles en el
ejemplo de oferta de trabajo.
No tenemos una muestra aleatoria, pero conocemos cómo se creó la muestra
(umbral inferior o superior).
En este caso tenemos que aplicar un modelo de regresión truncado.
El truncamiento es solo un caso especial de selección de muestra no
aleatoria. Otro ejemplo es el truncamiento incidental, cuando y solo se
observa en respuesta al resultado de otra variable.
Métodos de corrección de muestra (Método Heckit).
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
24 / 43
Modelos censurados y truncados
Datos censurados y truncados
Ejemplo de datos truncados
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
25 / 43
Modelos censurados y truncados
Modelo de regresión censurado (normal)
Tenemos i = 1, ..., n observaciones aleatorias (wi , Xi ) del siguiente modelo
de población:
yi = Xi β + ui , ui | Xi ∼ Normal 0, σ 2
wi = min (yi , ci )
Este caso se refiere a la censura a la derecha ya que la variable
dependiente no se observa por encima de cierto nivel. Hay un umbral
superior conocido ci .
Ejemplos de censura a la derecha son:
El valor sólo se conoce hasta una constante porque técnicamente no fue
posible recopilar datos sobre valores más altos (razones administrativas) o los
datos se modificaron para que sea más difícil revelar información individual
(número de empleados en una empresa).
Si los datos contienen duraciones de estar en un estado del mercado laboral,
puede estar censurado a la derecha porque el período de observación ha
terminado en un punto del tiempo mientras que las duraciones pueden
continuar.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
26 / 43
Modelos censurados y truncados
Modelo de regresión censurado (normal)
Es técnicamente similar tratar con la censura a la izquierda:
yi = Xi β + ui , ui | Xi ∼ Normal 0, σ 2
wi = max (yi , ci )
Por ejemplo, no observamos el valor del dependiente variable si está por
debajo de cierto nivel ci .
Esto es muy similar al modelo Tobit visto anteriormente cuando ci = 0. Sin
embargo, los motivos de la estructura de datos en el modelo Tobit son
bastante diferentes.
A continuación sólo consideraremos la censura a la derecha.
¿Por qué no simplemente estimar por MCO utilizando observaciones no
censuradas?
Similar al modelo Tobit, esto lleva a un problema de selección de muestra y,
por lo tanto, produce resultados inconsistentes.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
27 / 43
Modelos censurados y truncados
Modelo de regresión censurado (normal)
Bajo los supuestos del modelo poblacional, podemos estimar β y σ por
máxima verosimilitud.
Para hacer esto, necesitamos calcular la densidad de wi dado Xi , ci .
Para observaciones sin censura, wi = yi , la densidad
condicional de wi es la
misma que parayi ; la densidad de N Xi β, σ 2 : (1/σ) φ [(Xi β) /σ].
Para observaciones censuradas, es la probabilidad P (wi = ci | Xi ), que es
para la i-ésima observación:
P (wi = ci | Xi ) = P (yi ≥ ci | Xi )
= P (ui ≥ ci − Xi β)
= 1 − Φ [(ci − Xi β) /σ]
La probabilidad es por lo tanto:
h
i
n
iβ
`i (β, σ) = di (wi = ci ) log 1 − Φ wi −X
+
d
(w
<
c
)
log
i
i
i
σ
Luis Ledesma (UPC)
EF73: Microeconometría
1
σ
wi −Xi β o
φ
σ
Mayo 2022
28 / 43
Modelos censurados y truncados
Modelo de regresión censurado (normal)
h
i
n
iβ
`i (β, σ) = di (wi = ci ) log 1 − Φ wi −X
+
d
(w
<
c
)
log
i
i
i
σ
1
σ
wi −Xi β o
φ
σ
Tomando la suma de todas las observaciones y maximizando con respecto a
los coeficientes, obtenemos los estimadores MV para el modelo de regresión
normal censurado.
Es importante tener en cuenta que la interpretación de los coeficientes del
modelo es la misma que en el modelo lineal.
Esto contrasta con el modelo Tobit, donde primero se tienen que
calcular los efectos parciales.
Se requiere la normalidad y homoscedasticidad de los errores. Si esto no se
cumple, las estimaciones se vuelven inconsistentes. Por lo tanto, hay un
costo si se emplea el modelo de censura.
Hay métodos más avanzados disponibles que relajan los supuestos del
modelo, pero no se presentan aquí.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
29 / 43
Modelos censurados y truncados
Modelo de regresión censurado (normal)
Ejemplo: duración de la reincidencia
Data: RECID.dta.
Una duración es una variable que mide el tiempo antes de que ocurra un
determinado evento. Si el evento ocurre después del final del período de
observación, la duración no se observa completamente y hay una censura a
la derecha.
Tiempo en meses hasta que un preso es arrestado después de ser liberado de
la prisión:
Usamos ln (durat) como variable dependiente.
1,445 observaciones. 893 no habían sido arrestados = observaciones
censuradas (61 %). Los tiempos de censura oscilan entre 70 y 81 meses.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
30 / 43
Modelos censurados y truncados
Modelo de regresión censurado (normal)
Ejemplo: duración de la reincidencia
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
31 / 43
Modelos censurados y truncados
Modelo de regresión censurado (normal)
Ejemplo: duración de la reincidencia
Como el grado de censura es alto, es probable que el uso de la regresión censurada
cambie sustancialmente los resultados usando MCO.
Los coeficientes MCO están más cerca de cero. Aunque la dirección de los efectos
es la misma, su magnitud disminuye.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
32 / 43
Modelos censurados y truncados
Modelo de regresión truncada
Similar al modelo de regresión censurado, pero ahora no observamos
información alguna sobre un segmento de una población.
Ejemplo:
Una encuesta se dirige solo a un subconjunto específico de la población
debido a la viabilidad o restricciones de costos. Por lo tanto, ignora a
la otra parte de la población.
Esto implica que la muestra no es aleatoria. Es una muestra aleatoria
condicional que los individuos cumplan con otra condición observada.
Un sorteo aleatorio yi , Xi es observado solo si yi ≤ ci . Donde ci es el umbral
de truncamiento que puede depender de las variables explicativas (como el
ingreso, el tamaño del hogar, etc.).
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
33 / 43
Modelos censurados y truncados
Modelo de regresión truncada
Esto significa que si (yi , Xi ) para i = 1, . . . , n es nuestra muestra observada,
entonces yi es menor o igual que ci .
De otra manera,ambos yi y Xi no se observan.
Supongamos que el modelo poblacional es:
yi = Xi β + ui , ui | Xi ∼ Normal 0, σ 2
Luego, para estimar los coeficientes, necesitamos especificar la distribución
de yi , dado que yi ≤ ci y dado Xi . Esto se puede escribir como una densidad
condicional:
f y | Xi β, σ 2
g (y | Xi , ci ) =
, y ≤ ci
F (ci | Xi β, σ 2 )
con f y | Xi β, σ 2 es la densidad normal y F ci | Xi β, σ 2 es la cdf normal,
ambos con valor esperado Xi β y varianza σ 2 .
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
34 / 43
Modelos censurados y truncados
Modelo de regresión truncada
f y | Xi β, σ 2
g (y | Xi , ci ) =
, y ≤ ci
F (ci | Xi β, σ 2 )
Es, por lo tanto, la densidad de población para yi , dado Xi , dividida por la
probabilidad de que yi sea menor o igual a ci .
Renormalización de la función de densidad f .
Cuando tomamos el logaritmo y tomamos la suma de todas las
observaciones disponibles, obtenemos la función log-verosimilitud.
Al maximizar esta función con respecto a los coeficientes β y σ, obtenemos
los estimadores MV.
Propiedades estándar y métodos de inferencia para los estimadores MV.
La consistencia y la validez de los estadísticos requieren la normalidad de los
errores y homocedasticidad. Si hay desviaciones sustanciales de estos
supuestos, no está claro qué estima el método MV.
Cuando se aplica MCO a datos truncados (de la forma que consideramos
aquí), las estimaciones resultantes generalmente están sesgadas hacia cero.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
35 / 43
Modelos censurados y truncados
Modelo de regresión truncada
Observaciones
¿Puedo estimar una regresión truncada en presencia de datos censurados
eliminando todas las observaciones censuradas?
Se puede, pero pierde información valiosa ya que todas las observaciones
censuradas serán ignoradas. Si se realiza una regresión censurada, todavía
contribuyen a la función de probabilidad.
En el ejemplo de oferta de trabajo, ¿se puede estimar una regresión truncada
en lugar del modelo de Tobit al descartar todas las observaciones con horas
= 0?
Se puede. pero la misma historia se aplica nuevamente: pierdes información
valiosa. Sin embargo, esto es mejor que simplemente aplicar OLS.
El comando STATA para la regresión truncada es en este caso:
truncreg hours nwifeinc educ exper expersq age . . . if hours>0, ll(0)
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
36 / 43
Modelos censurados y truncados
Modelo de regresión truncada
Resumen
Los modelos de regresión censurados y truncados manejan tipos específicos
de problemas de datos faltantes.
En la regresión censurada, la variable dependiente se censura por debajo
o por encima de un umbral, pero se observan variables explicativas.
En la regresión truncada, una parte de la población está
completamente excluida.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
37 / 43
Modelo de Heckman
Modelo de Heckman (sesgo de selección)
No considerar el caso de la variable dependiente limitada, se puede generar
sesgos de seleccion muestral.
El modelo de Heckman se expresa como:
∀ wi∗ > 0
(
1 , wi∗ > 0
wi =
0 , wi∗ ≤ 0
yi = Xi β + ui ,
wi = Zi γ + vi ,
Si wi∗ > 0 entonces Zi γ + vi > 0, y por tanto: vi > −Zi γ
Entonces, se puede afirmar que:
E (yi | wi∗ > 0) = E (yi | wi = 1) = E (yi | vi > −Zi γ)
Asimismo, tenemos que:
E (yi | vi > −Zi γ) = Xi β + E (ui | vi > −Zi γ)
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
38 / 43
Modelo de Heckman
Modelo de Heckman (sesgo de selección)
Del mismo modo, asumiendo que:
2
ui
0
σu
∼N
,
vi
0
ρσu
ρσu
σv2
Se puede demostrar lo siguiente:
E (ui | vi > −Zi γ) = ρσu
φ (Zi γ)
Φ (Zi γ)
Por consiguiente, tenemos que:
E (yi | vi > −Zi γ) = Xi β + ρσu
donde
φ(Zi γ)
Φ(Zi γ)
φ (Zi γ)
Φ (Zi γ)
es el ratio de Mills λ (Zi γ)
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
39 / 43
Modelo de Heckman
Modelo de Heckman (sesgo de selección)
Estimación del modelo
Estimación en dos etapas:
Estimación del modelo probit
Estimación por MCO
Primera etapa:
Estimación consistente de βλ por MV, con observaciones truncadas y
no truncadas (probit).
Los resultados permiten estimar λ̂ (Zi γ) para todas las observaciones.
Segunda etapa:
Estimar por MCO el siguiente modelo:
yi = Xi β + βλ λ̂i + ui ,
Luis Ledesma (UPC)
EF73: Microeconometría
βλ = ρσu
Mayo 2022
40 / 43
Modelo de Heckman
Modelo de Heckman (sesgo de selección)
Estimación del modelo
El estimador de Heckman (βλ ) es consistente, pero no eficiente.
Es posible evaluar si: H0 : ρ = 0 (o βλ = 0)
El método enfrenta un problema de indentificación:
Respecto a la relación de Xi y Zi . (Si al menos una de las variables de
Zi no se relaciona con Xi ).
Supuestos:
E (ui | Xi , Zi ) = 0
Xi es un subconjunto de Zi .
Debe se presentarse un sesgo de selección (ui y vi deben de estar
correlacionados).
Probar que H0 : ρ = 0 (o βλ = 0) equivale a probar la ausencia de
sesgo de selección.
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
41 / 43
Modelo de Heckman
Modelo de Heckman (sesgo de selección)
Ejemplo: Oferta laboral anual de mujeres casadas
Considerar el mismo conjunto de datos de MROZ.dta.
Notar que sólo se observan los salarios para aquellas mujeres que decidieron
trabajar (ofrecer horas en el mercado laboral).
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
42 / 43
Modelo de Heckman
Modelo de Heckman (sesgo de selección)
Ejemplo: Oferta laboral anual de mujeres casadas
Luis Ledesma (UPC)
EF73: Microeconometría
Mayo 2022
43 / 43
Descargar