Microeconometría Unidad 4: Modelos con Variables Dependientes Limitadas Luis Ledesma Goyzueta Facultad de Economía Universidad Peruana de Ciencias Aplicadas (UPC) Mayo 2022 Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 1 / 43 Índice 1 Introducción 2 Modelo Tobit 3 Modelos censurados y truncados 4 Modelo de Heckman Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 2 / 43 Introducción Introducción Hasta ahora solo hemos considerado modelos de variables dependientes limitadas si la variable dependiente toma dos o un número limitado de valores enteros. Ahora consideramos modelos donde la variable dependiente es continua pero tiene algunas restricciones debido a problemas económicos subyacentes o debido al proceso de recopilación de datos: Modelo de solución de esquina (Tobit) Modelo censurado Modelo truncado Asimismo, considerarmos el modelo de Heckman para corregir el sesgo de selección. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 3 / 43 Introducción Introducción Para respuestas de solución de esquina. Ejemplo: una variable dependiente continua y positiva con un centro de masa en 0. Por ejemplo, las horas trabajadas en datos de oferta de trabajo. Estructuras de datos similares son relevantes si tenemos problemas de recolección de datos. Por ejemplo, si no podemos observar valores negativos para la variable de respuesta. En este caso, la variable se codifica como 0. Esta última es una forma de censura y, por lo tanto, las soluciones de esquina y la censura pueden imponer los mismos límites a la variación de la variable dependiente. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 4 / 43 Introducción Introducción ¿Cuáles son las consecuencias de esta estructura de datos? Todavía podríamos estimar el modelo por MCO, pero existen limitaciones similares a las del MPL: Valores estimados negativos (siempre que todos los valores de la variable dependiente sean positivos y haya un centro de masa en 0). Un efecto parcial constante en E (yi | Xi ) puede ser engañoso. Var (yi | Xi ) sería heteroscedástico (usar errores estándar y estadísticos robustos). yi no puede tener una distribución normal condicional ya que hay un centro de masa. Por esta razón, toda inferencia solo tendría una justificación asintótica. El modelo Tobit es bastante conveniente para superar estas limitaciones del modelo lineal. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 5 / 43 Modelo Tobit Modelo Tobit El modelo Tobit expresa la respuesta observada yi en términos de una variable latente subyacente: yi∗ = Xi β + ui , ui | Xi ∼ Normal 0, σ 2 yi = max (0, yi∗ ) donde la intersección se absorbe en Xi por conveniencia de notación. La variable latente yi∗ satisface los supuestos del modelo lineal clásico. La variable observada yi es igual a yi∗ si yi∗ es mayor o igual a 0 y, de lo contrario, es cero. Debido a que yi∗ se distribuye normalmente, yi tiene una distribución continua sobre valores estrictamente positivos. Además, la densidad de yi dado Xi es la misma que la densidad de yi∗ dado Xi e yi positivo. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 6 / 43 Modelo Tobit Modelo Tobit También podemos escribir: P (yi = 0 | Xi ) = P (yi∗ < 0 | Xi ) = P (ui < −Xi β | X ) = P (ui /σ < −Xi β/σ | Xi ) = Φ (−Xi β/σ) = 1 − Φ (Xi β/σ) Por lo tanto, la función de densidad de yi dado Xi es: h i − 1 2 2πσ 2 2 exp − (yi − Xi β) /2σ 2 = (1/σ) φ [(yi − Xi β) /σ] , yi > 0 P (yi = 0 | Xi ) = 1 − Φ (Xi β/σ) Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 7 / 43 Modelo Tobit Modelo Tobit Entonces la función de log-verosimilitud para cada observación es simplemente: (yi − Xi β) Xi β 1 `i (β, σ) = di (yi = 0) log Φ − + di (yi > 0) log φ σ σ σ Esta es ahora una función en β y σ La log verosimilitud para una muestra aleatoria se obtiene sumando el total de `i para todo i. Los estimadores de MV se obtienen maximizando la función de log verosimilitud. Esto se hace por métodos numéricos. Los paquetes de computadora también reportan errores estándar. Se puede utilizar para construir el estadístico t. La prueba de hipótesis es esencialmente la misma que en los modelos logit y probit. Utilice el test de Wald o LR. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 8 / 43 Modelo Tobit Modelo Tobit Interpretación de las estimaciones Las estimaciones de Tobit se pueden obtener fácilmente con la ayuda de paquetes estadísticos y parecen similares a las estimaciones de MCO. Desafortunadamente, no podemos interpretar los coeficientes del modelo como si fueran estimaciones de una regresión lineal. Esto se debe a que βj mide el efecto parcial de xj sobre E (yi∗ | Xi ) en lugar de E (yi | Xi ). Como observamos yi , esta es la variable de interés para nosotros. Podemos estimar fácilmente P (yi = 0 | Xi ) y, por lo tanto, también P (yi > 0 | Xi ). Sin embargo, ¿cómo podemos estimar la esperanza condicional de yi dado Xi ? Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 9 / 43 Modelo Tobit Modelo Tobit Interpretación de las estimaciones Podemos escribir: E (yi | Xi ) = P (yi > 0 | Xi ) E (yi | yi > 0, Xi ) = Φ Xi β σ E (yi | yi > 0, Xi ) lo que implica que todavía necesitamos obtener E (yi | yi > 0, Xi ) Esto es un poco más complicado pero podemos escribir: E (yi | yi > 0, Xi ) = Xi β + E (ui | ui > −Xi β) E (yi | yi > 0, Xi ) = Xi β + σE uσi | uσi > − Xσi β Por tanto, E (yi | yi > 0, Xi ) = Xi β + σ Luis Ledesma (UPC) EF73: Microeconometría φ (Xi β/σ) Φ (Xi β/σ) Mayo 2022 10 / 43 Modelo Tobit Modelo Tobit Interpretación de las estimaciones Esto implica que E (yi | yi > 0, X ) se puede escribir en función de los coeficientes del modelo: Xi β φ (Xi β/σ) = X β + σλ E (yi | yi > 0, Xi ) = Xi β + σ Φ (Xi β/σ) σ donde λ (c) = φ(c) Φ(c) es el ratio inverso de Mills. ¿Qué aprendemos de esto? E (yi | yi > 0, X ) no es simplemente Xi β. El segundo término es positivo como σ > 0 y el ratio inverso de Mills es mayor que cero. Si sólo usamos observaciones con yi > 0, nuestras estimaciones serán generalmente inconsistentes ya que el ratio inverso de Mills generalmente se correlaciona con las variables independientes y sería omitido. Ignorar las observaciones con y = 0 implica un "problema de selección muestral". Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 11 / 43 Modelo Tobit Modelo Tobit Interpretación de las estimaciones Así, obtenemos: E (yi | Xi ) = P (yi > 0 | Xi ) E (yi | yi > 0, Xi )= Φ (Xi β/σ) E (yi | yi > 0, Xi ) = Φ (Xi β/σ) [Xi β + σλ (Xi β/σ)] = Φ (Xi β/σ) Xi β + σφ (Xi β/σ) E (yi | Xi ) es, por lo tanto, una función no lineal de Xi y β. Se puede demostrar que el lado derecho es positivo para cualquier valor de Xi y β. Por esta razón, los valores estimados de yi son siempre positivos. Esta propiedad tiene el costo de que la ecuación anterior es más complicada que en el modelo lineal. Los efectos parciales en este modelo también son más complicados que en el modelo lineal. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 12 / 43 Modelo Tobit Modelo Tobit Efectos marginales Asi como otros modelos no lineales, depende de la variable independiente cómo se calcula el efecto parcial: Si xj es binario, tenemos que calcular E (yi | Xi ) para los dos valores de xj y tomar la diferencia entre los dos. Si xj es continuo, existe una solución analítica: Primero, tomar en cuenta que: i β/σ) ∂E (yi | yi > 0, Xi ) /∂xj = βj + βj ∂λ(X ∂Xi β/σ n h io Xi β Xi β = βj 1 − λ Xσi β + λ σ σ Esto muestra que el efecto parcial en E (yi | yi > 0, Xi ) no solo está determinado por βj . También hay un factor de ajuste en {...}. Se puede demostrar que este factor de ajuste se encuentra estrictamente entre 0 y 1. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 13 / 43 Modelo Tobit Modelo Tobit Efectos marginales También tener en cuenta que, dado que P (yi > 0 | Xi ) = Φ ∂P (y > 0 | X ) = ∂xj βj σ Xi β σ : Xi β φ σ Por consiguiente: ∂E (yi |Xi ) ∂xj = ∂P(yi >0|X ) E ∂xj = βj Φ Xi β σ i >0,Xi ) (yi | yi > 0, Xi ) + P (yi > 0 | Xi ) ∂E (yi |y ∂xj Para estimar el efecto parcial, se utiliza estimadores MV de β y σ. Tener en cuenta que el efecto parcial depende del coeficiente σ. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 14 / 43 Modelo Tobit Modelo Tobit Efectos marginales Tenemos que, ∂E (yi | Xi ) = βj Φ ∂xj Xi β σ Esta ecuación nos permite comparar las estimaciones Tobit con las del MCO (usando la muestra completa). Para obtener algo comparable a las estimaciones de MCO, debemos multiplicar las estimaciones Tobit por un factor de ajuste. El factor de ajuste depende del valor de Xi (no hay un factor único). Se puede calcular, por ejemplo, con el promedio de X . Φ X̄ β̂/σ̂ o podemos promediar factores de ajuste individuales: n−1 n X Φ Xi β̂/σ̂ i=1 Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 15 / 43 Modelo Tobit Modelo Tobit Ejemplo: Oferta laboral anual de mujeres casadas Data: MROZ.dta. Datos sobre las horas trabajadas de 753 mujeres casadas, de las cuales 428 trabajaban fuera de la casa (yi > 0) y 325 no trabajaban (yi = 0). El rango de yi para observaciones con yi > 0 es de 12 a 4,950. Por lo tanto, esta data es útil para un modelo Tobit. Alternativamente, también estimamos la ecuación de oferta de trabajo por MCO. El factor de ajuste para hacer que los resultados de Tobit y MCO sean P −1 más comparables es n i Φ Xi β̂/σ̂ = 0,589 Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 16 / 43 Modelo Tobit Modelo Tobit Ejemplo: Oferta laboral anual de mujeres casadas Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 17 / 43 Modelo Tobit Modelo Tobit Ejemplo: Oferta laboral anual de mujeres casadas Vemos que en esta aplicación las estimaciones de Tobit son principalmente mayores que las estimaciones de MCO. Aunque después de multiplicar por 0.589 las estimaciones se reducen, excepto el coeficiente en kidsge6 , las estimaciones de Tobit son mayores. Por ejemplo educ: 0.589 x 80.65 = 47.50 que aún es más grande que el coeficiente MCO (28.76). Todos los valores estimados del modelo Tobit son positivos, mientras que 39 valores estimados del modelo MCO son negativos. El modelo Tobit sugiere un aumento del efecto marginal de la educación en las horas trabajadas. El modelo lineal produce valores esperados generalmente más altos de horas trabajadas con respecto a la educación. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 18 / 43 Modelo Tobit Modelo Tobit Algunas observaciones El modelo Tobit se basa fundamentalmente en el supuesto del modelo, en particular la normalidad de los errores y la homocedasticidad. Si se violan estos supuestos, es difícil decir qué se están estimando los parámetros MV del modelo Tobit . En caso de que las desviaciones de los supuestos sean menores, es probable que el modelo de Tobit todavía ofrezca una estimación adecuada de los efectos parciales. El modelo Tobit implica que el efecto parcial de xj sobre P (yi > 0 | Xi ) es proporcional a βj , así como en el efecto sobre E (yi | yi > 0, Xi ). El efecto marginal tiene el mismo signo y depende de los mismos parámetros βj . Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 19 / 43 Modelo Tobit Modelo Tobit Resumen El modelo Tobit es aplicable a resultados no negativos que se acumulan en cero, pero también toman una amplia gama de valores positivos. Si eliminamos las observaciones con valor cero, generalmente obtendremos estimaciones inconsistentes. El modelo Tobit es estimado por MV. El valor esperado de E (yi | Xi ) depende de Xi y β de manera no lineal. Hemos derivado expresiones para los efectos parciales. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 20 / 43 Modelos censurados y truncados Datos censurados y truncados Hemos visto modelos con variables dependientes limitadas, donde modelamos características importantes de la distribución de yi . Hemos visto el modelo de Tobit donde una fracción no trivial de la población elige no trabajar (yi = 0). Si bien esto es el resultado de una decisión económica observable, existen estructuras de datos similares o incluso idénticas que se deben a otras razones. Si una variable de respuesta ha sido censurada por encima o por debajo de cierto umbral. Típicamente debido al diseño de la encuesta o las limitaciones institucionales. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 21 / 43 Modelos censurados y truncados Datos censurados y truncados Ejemplo de datos “completos” Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 22 / 43 Modelos censurados y truncados Datos censurados y truncados Ejemplo de datos censurados Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 23 / 43 Modelos censurados y truncados Datos censurados y truncados En este caso tenemos que aplicar un modelo de regresión censurado. Falta el valor de la variable dependiente, pero tenemos información sobre la variable cuando esta falta (umbral superior o inferior conocido). Un caso diferente surge cuando excluimos, sobre la base de yi , un subconjunto de la población. Por ejemplo, todas las observaciones con yi = 0 no están disponibles en el ejemplo de oferta de trabajo. No tenemos una muestra aleatoria, pero conocemos cómo se creó la muestra (umbral inferior o superior). En este caso tenemos que aplicar un modelo de regresión truncado. El truncamiento es solo un caso especial de selección de muestra no aleatoria. Otro ejemplo es el truncamiento incidental, cuando y solo se observa en respuesta al resultado de otra variable. Métodos de corrección de muestra (Método Heckit). Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 24 / 43 Modelos censurados y truncados Datos censurados y truncados Ejemplo de datos truncados Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 25 / 43 Modelos censurados y truncados Modelo de regresión censurado (normal) Tenemos i = 1, ..., n observaciones aleatorias (wi , Xi ) del siguiente modelo de población: yi = Xi β + ui , ui | Xi ∼ Normal 0, σ 2 wi = min (yi , ci ) Este caso se refiere a la censura a la derecha ya que la variable dependiente no se observa por encima de cierto nivel. Hay un umbral superior conocido ci . Ejemplos de censura a la derecha son: El valor sólo se conoce hasta una constante porque técnicamente no fue posible recopilar datos sobre valores más altos (razones administrativas) o los datos se modificaron para que sea más difícil revelar información individual (número de empleados en una empresa). Si los datos contienen duraciones de estar en un estado del mercado laboral, puede estar censurado a la derecha porque el período de observación ha terminado en un punto del tiempo mientras que las duraciones pueden continuar. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 26 / 43 Modelos censurados y truncados Modelo de regresión censurado (normal) Es técnicamente similar tratar con la censura a la izquierda: yi = Xi β + ui , ui | Xi ∼ Normal 0, σ 2 wi = max (yi , ci ) Por ejemplo, no observamos el valor del dependiente variable si está por debajo de cierto nivel ci . Esto es muy similar al modelo Tobit visto anteriormente cuando ci = 0. Sin embargo, los motivos de la estructura de datos en el modelo Tobit son bastante diferentes. A continuación sólo consideraremos la censura a la derecha. ¿Por qué no simplemente estimar por MCO utilizando observaciones no censuradas? Similar al modelo Tobit, esto lleva a un problema de selección de muestra y, por lo tanto, produce resultados inconsistentes. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 27 / 43 Modelos censurados y truncados Modelo de regresión censurado (normal) Bajo los supuestos del modelo poblacional, podemos estimar β y σ por máxima verosimilitud. Para hacer esto, necesitamos calcular la densidad de wi dado Xi , ci . Para observaciones sin censura, wi = yi , la densidad condicional de wi es la misma que parayi ; la densidad de N Xi β, σ 2 : (1/σ) φ [(Xi β) /σ]. Para observaciones censuradas, es la probabilidad P (wi = ci | Xi ), que es para la i-ésima observación: P (wi = ci | Xi ) = P (yi ≥ ci | Xi ) = P (ui ≥ ci − Xi β) = 1 − Φ [(ci − Xi β) /σ] La probabilidad es por lo tanto: h i n iβ `i (β, σ) = di (wi = ci ) log 1 − Φ wi −X + d (w < c ) log i i i σ Luis Ledesma (UPC) EF73: Microeconometría 1 σ wi −Xi β o φ σ Mayo 2022 28 / 43 Modelos censurados y truncados Modelo de regresión censurado (normal) h i n iβ `i (β, σ) = di (wi = ci ) log 1 − Φ wi −X + d (w < c ) log i i i σ 1 σ wi −Xi β o φ σ Tomando la suma de todas las observaciones y maximizando con respecto a los coeficientes, obtenemos los estimadores MV para el modelo de regresión normal censurado. Es importante tener en cuenta que la interpretación de los coeficientes del modelo es la misma que en el modelo lineal. Esto contrasta con el modelo Tobit, donde primero se tienen que calcular los efectos parciales. Se requiere la normalidad y homoscedasticidad de los errores. Si esto no se cumple, las estimaciones se vuelven inconsistentes. Por lo tanto, hay un costo si se emplea el modelo de censura. Hay métodos más avanzados disponibles que relajan los supuestos del modelo, pero no se presentan aquí. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 29 / 43 Modelos censurados y truncados Modelo de regresión censurado (normal) Ejemplo: duración de la reincidencia Data: RECID.dta. Una duración es una variable que mide el tiempo antes de que ocurra un determinado evento. Si el evento ocurre después del final del período de observación, la duración no se observa completamente y hay una censura a la derecha. Tiempo en meses hasta que un preso es arrestado después de ser liberado de la prisión: Usamos ln (durat) como variable dependiente. 1,445 observaciones. 893 no habían sido arrestados = observaciones censuradas (61 %). Los tiempos de censura oscilan entre 70 y 81 meses. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 30 / 43 Modelos censurados y truncados Modelo de regresión censurado (normal) Ejemplo: duración de la reincidencia Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 31 / 43 Modelos censurados y truncados Modelo de regresión censurado (normal) Ejemplo: duración de la reincidencia Como el grado de censura es alto, es probable que el uso de la regresión censurada cambie sustancialmente los resultados usando MCO. Los coeficientes MCO están más cerca de cero. Aunque la dirección de los efectos es la misma, su magnitud disminuye. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 32 / 43 Modelos censurados y truncados Modelo de regresión truncada Similar al modelo de regresión censurado, pero ahora no observamos información alguna sobre un segmento de una población. Ejemplo: Una encuesta se dirige solo a un subconjunto específico de la población debido a la viabilidad o restricciones de costos. Por lo tanto, ignora a la otra parte de la población. Esto implica que la muestra no es aleatoria. Es una muestra aleatoria condicional que los individuos cumplan con otra condición observada. Un sorteo aleatorio yi , Xi es observado solo si yi ≤ ci . Donde ci es el umbral de truncamiento que puede depender de las variables explicativas (como el ingreso, el tamaño del hogar, etc.). Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 33 / 43 Modelos censurados y truncados Modelo de regresión truncada Esto significa que si (yi , Xi ) para i = 1, . . . , n es nuestra muestra observada, entonces yi es menor o igual que ci . De otra manera,ambos yi y Xi no se observan. Supongamos que el modelo poblacional es: yi = Xi β + ui , ui | Xi ∼ Normal 0, σ 2 Luego, para estimar los coeficientes, necesitamos especificar la distribución de yi , dado que yi ≤ ci y dado Xi . Esto se puede escribir como una densidad condicional: f y | Xi β, σ 2 g (y | Xi , ci ) = , y ≤ ci F (ci | Xi β, σ 2 ) con f y | Xi β, σ 2 es la densidad normal y F ci | Xi β, σ 2 es la cdf normal, ambos con valor esperado Xi β y varianza σ 2 . Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 34 / 43 Modelos censurados y truncados Modelo de regresión truncada f y | Xi β, σ 2 g (y | Xi , ci ) = , y ≤ ci F (ci | Xi β, σ 2 ) Es, por lo tanto, la densidad de población para yi , dado Xi , dividida por la probabilidad de que yi sea menor o igual a ci . Renormalización de la función de densidad f . Cuando tomamos el logaritmo y tomamos la suma de todas las observaciones disponibles, obtenemos la función log-verosimilitud. Al maximizar esta función con respecto a los coeficientes β y σ, obtenemos los estimadores MV. Propiedades estándar y métodos de inferencia para los estimadores MV. La consistencia y la validez de los estadísticos requieren la normalidad de los errores y homocedasticidad. Si hay desviaciones sustanciales de estos supuestos, no está claro qué estima el método MV. Cuando se aplica MCO a datos truncados (de la forma que consideramos aquí), las estimaciones resultantes generalmente están sesgadas hacia cero. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 35 / 43 Modelos censurados y truncados Modelo de regresión truncada Observaciones ¿Puedo estimar una regresión truncada en presencia de datos censurados eliminando todas las observaciones censuradas? Se puede, pero pierde información valiosa ya que todas las observaciones censuradas serán ignoradas. Si se realiza una regresión censurada, todavía contribuyen a la función de probabilidad. En el ejemplo de oferta de trabajo, ¿se puede estimar una regresión truncada en lugar del modelo de Tobit al descartar todas las observaciones con horas = 0? Se puede. pero la misma historia se aplica nuevamente: pierdes información valiosa. Sin embargo, esto es mejor que simplemente aplicar OLS. El comando STATA para la regresión truncada es en este caso: truncreg hours nwifeinc educ exper expersq age . . . if hours>0, ll(0) Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 36 / 43 Modelos censurados y truncados Modelo de regresión truncada Resumen Los modelos de regresión censurados y truncados manejan tipos específicos de problemas de datos faltantes. En la regresión censurada, la variable dependiente se censura por debajo o por encima de un umbral, pero se observan variables explicativas. En la regresión truncada, una parte de la población está completamente excluida. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 37 / 43 Modelo de Heckman Modelo de Heckman (sesgo de selección) No considerar el caso de la variable dependiente limitada, se puede generar sesgos de seleccion muestral. El modelo de Heckman se expresa como: ∀ wi∗ > 0 ( 1 , wi∗ > 0 wi = 0 , wi∗ ≤ 0 yi = Xi β + ui , wi = Zi γ + vi , Si wi∗ > 0 entonces Zi γ + vi > 0, y por tanto: vi > −Zi γ Entonces, se puede afirmar que: E (yi | wi∗ > 0) = E (yi | wi = 1) = E (yi | vi > −Zi γ) Asimismo, tenemos que: E (yi | vi > −Zi γ) = Xi β + E (ui | vi > −Zi γ) Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 38 / 43 Modelo de Heckman Modelo de Heckman (sesgo de selección) Del mismo modo, asumiendo que: 2 ui 0 σu ∼N , vi 0 ρσu ρσu σv2 Se puede demostrar lo siguiente: E (ui | vi > −Zi γ) = ρσu φ (Zi γ) Φ (Zi γ) Por consiguiente, tenemos que: E (yi | vi > −Zi γ) = Xi β + ρσu donde φ(Zi γ) Φ(Zi γ) φ (Zi γ) Φ (Zi γ) es el ratio de Mills λ (Zi γ) Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 39 / 43 Modelo de Heckman Modelo de Heckman (sesgo de selección) Estimación del modelo Estimación en dos etapas: Estimación del modelo probit Estimación por MCO Primera etapa: Estimación consistente de βλ por MV, con observaciones truncadas y no truncadas (probit). Los resultados permiten estimar λ̂ (Zi γ) para todas las observaciones. Segunda etapa: Estimar por MCO el siguiente modelo: yi = Xi β + βλ λ̂i + ui , Luis Ledesma (UPC) EF73: Microeconometría βλ = ρσu Mayo 2022 40 / 43 Modelo de Heckman Modelo de Heckman (sesgo de selección) Estimación del modelo El estimador de Heckman (βλ ) es consistente, pero no eficiente. Es posible evaluar si: H0 : ρ = 0 (o βλ = 0) El método enfrenta un problema de indentificación: Respecto a la relación de Xi y Zi . (Si al menos una de las variables de Zi no se relaciona con Xi ). Supuestos: E (ui | Xi , Zi ) = 0 Xi es un subconjunto de Zi . Debe se presentarse un sesgo de selección (ui y vi deben de estar correlacionados). Probar que H0 : ρ = 0 (o βλ = 0) equivale a probar la ausencia de sesgo de selección. Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 41 / 43 Modelo de Heckman Modelo de Heckman (sesgo de selección) Ejemplo: Oferta laboral anual de mujeres casadas Considerar el mismo conjunto de datos de MROZ.dta. Notar que sólo se observan los salarios para aquellas mujeres que decidieron trabajar (ofrecer horas en el mercado laboral). Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 42 / 43 Modelo de Heckman Modelo de Heckman (sesgo de selección) Ejemplo: Oferta laboral anual de mujeres casadas Luis Ledesma (UPC) EF73: Microeconometría Mayo 2022 43 / 43