Economía Aplicada Causalidad y Experimentos Sociales Departmento de Economía Universidad Carlos III de Madrid Outline 1 Resultados Potenciales y Causalidad 2 Efectos del tratamiento 3 El Estimador de Diferencias El Estimador de Diferencias y ATE El Estimador de Diferencias en Medias y ATT 4 Exogeneidad 5 Ejemplo Resultados Potenciales y Causalidad El problema básico En economía muchas veces estamos interesados en estudiar el efecto de una poliítica o un programa en cierta variable de interés El programa o política es lo que llamamos La variable de interés es el tratamiento resultado Nos interesa determinar el efecto causal del tratamiento en el resultado: el efecto del tratamiento Ejemplos de Tratamientos y Resultados: Hospitalización y Estado de Salud, Salario Mínimo y Horas de Trabajo, Entrenamiento y Empleo, Educación e Ingresos, Tamaño de la Clase y Nivel Educativo, Servicio Militar e Ingresos. Denir claramente tratamiento y resultados. 1 / 25 Resultados Potenciales y Causalidad Ejemplo Supongamos que el gobierno establece un programa de entrenamiento para desempleados de larga duración ¾Es razonable evaluar si la política fue exitosa mirando los niveles de desempleo de quienes recibieron entrenamiento una vez terminado el programa? Para quienes recibieron el entrenamiento observamos los efectos de participar, pero no observamos los efectos de no participar Para quienes no recibieron el entrenamiento no observamos los efectos de participar, sino que observamos los efectos de no participar 2 / 25 Resultados Potenciales y Causalidad Deniciones Resultados potenciales y0 : resultado sin tratamiento (situación laboral no habiendo recibido entrenamiento, o estado de salud de un individuo que no fue al hospital) y1 : resultado con tratamiento (situación laboral luego del entrenamiento, o estado de salud luego de ir al hospital) Nos gustaría conocer y1 − y0 : el efecto del tratamiento para cada individuo, pero: un individuo no puede existir en ambos estados: los participantes no pueden ser simultáneamente no participantes! no observamos a la vez y1 e y0 3 / 25 Resultados Potenciales y Causalidad Más deniciones Participación D= 1 si recibe tratamiento 0 si no recibe tratamiento Resultados observados y= y1 y0 si D=1 si D=0 ⇒ y = y1 D + y0 (1 − D ) 4 / 25 Efectos del tratamiento Efectos del tratamiento No es posible calcular el efecto causal individual: ningún individuo puede estar en dos estados de participación al mismo tiempo Sin embargo, es posible estimar El efecto medio del tratamiento esperado para un individuo tomado al azar de la población de participantes y no participantes (Efecto Promedio del Tratamiento o Average Treatment Eect: ATE) El efecto medio del tratamiento para el grupo de participantes (Efecto Promedio del Tratamiento en los Tratados o Average Eect of Treatment on the Treated: ATT) 5 / 25 Efectos del tratamiento Efecto Promedio del Tratamiento (ATE) αATE = E [y1 ] − E [y0 ]: αATE efecto promedio en la población nos dice el efecto del programa para un individuo sacado al azar de la población puede interpretarse como efecto causal en el sentido de que es el mejor predictor del resultado del programa sin tener más información el verdadero efecto del programa para ciertos individuos puede en realidad ser muy diferente del efecto medio en la población 6 / 25 Efectos del tratamiento Efecto Promedio del Tratamiento en los Tratados (ATT) Efecto Promedio del Tratamiento en los Tratados αATT = E [y1 |D = 1 ] − E [y0 |D = 1 ] podemos querer conocer el efecto medio en aquellos individuos que recibieron el tratamiento (por ejemplo aquéllos que tomaron los cursos de entrenamiento) necesitamos conocer y en ausencia de tratamiento 7 / 25 El Estimador de Diferencias El Estimador de Diferencias Estimador de diferencias d̂ = Ê [y |D = 1 ] − Ê [y |D = 0 ] donde: Ê [y |D = 1 ] = N1 ∑ yi : Resultado medio de los tratados D =1 Ê [y |D = 0 ] = N10 ∑ yi : Resultado medio de los no tratados 1 D =0 ¾Resulta útil la simple comparación de promedios para tratados y no tratados? Por ejemplo comparar las tasas de desempleo promedio para entrenados y no entrenados, o el estado de salud promedio para hospitalizados y no hospitalizados. 8 / 25 El Estimador de Diferencias Propiedades Asintóticas Ley de Grandes Números plim(d̂ ) = E [y |D = 1 ] − E [y |D = 0 ] = d Teorema Central del Límite 1 a N 2 d̂ − d → N (0, AsyVar ) 9 / 25 El Estimador de Diferencias El Estimador de Diferencias y ATE ¾Es el Estimador de Diferencias un buen estimador de αATE ? ¾Bajo qué condiciones el estimador d̂ es un estimador consistente de αATE ? Intuición si las dos poblaciones, los tratados y los no tratados, son similares en términos de resultados, entonces la comparación de medias parece adecuada si los tratados son esencialmente diferentes de los no tratados en relación a los resultados, tendremos sesgo de selección por ejemplo, si los participantes en el programa de entrenamiento asisten porque son quienes más se beneciarán del programa, entonces d̂ probablemente sobreestimará los efectos positivos de los programas de entrenamiento 10 / 25 El Estimador de Diferencias El Estimador de Diferencias en Medias y ATT ¾Es el Estimador de Diferencias en Medias un buen estimador de αATT ? ¾Bajo qué condiciones d̂ es un estimador consistente de αATT ? Intuición si tratados y no tratados son similares en relación a los resultados en ausencia de tratamiento, entonces los resultados promedio de los no tratados serán una buena estimación del (inobservable) resultado promedio en los tratados en ausencia de tratamiento. sin embargo, si el tratamiento resulta de decisiones individuales, puede sueceder que individuos con bajo y0 elijan el tratamiento con mayor probabilidad que aquellos individuos con alto y0 (individuos con mala salud es más probable que se hospitalicen que individuos con buena salud). 11 / 25 El Estimador de Diferencias d El Estimador de Diferencias en Medias y ATT y αATT d = E [y |D = 1 ] − E [y |D = 0 ] = E [y1 |D = 1 ] + {−E [y0 |D = 1 ] + E [y0 |D = 1 ]} − E [y0 |D = 0 ] = {E [y1 |D = 1 ] − E [y0 |D = 1 ]} + E [y0 |D = 1 ] − E [y0 |D = 0 ] por lo tanto: d = αATT + E [y0 |D = 1 ] − E [y0 |D = 0 ] La diferencia observada en el resultado promedio entre tratados y no tratados (d) se compone de dos términos: el efecto del tratamiento en los tratados y un sesgo de selección. 12 / 25 El Estimador de Diferencias El Estimador de Diferencias en Medias y ATT d = αATT + E [y |D = 1 ] − E [y |D = 0 ] 0 0 E [y0 |D = 1 ] = E [y0 |D = 0 ] ⇒ plim(d̂ ) = αATT tratados y no tratados son similares en ausencia de tratamiento por ejemplo, implicaría que hospitalizados y no hospitalizados tienen estados de salud similares antes de ir al hospital E [y0 |D = 1 ] 6= E [y0 |D = 0 ] ⇒ plim(d̂ ) 6= αATT esto sucede si tratados son diferentes respecto a y en ausencia de tratamiento por ejemplo, si las tasas de desempleo de los tratados son más altas sin tratamiento, d̂ probablemente subestimará los efectos positivos del programa en los tratados 13 / 25 El Estimador de Diferencias El Estimador de Diferencias en Medias y ATT Un Modelo Simple y1 = E [y1 ] + v1 y0 = E [y0 ] + v0 v1 : ganancias personales de recibir tratamiento (desviación respecto a la media) v0 : ganancias personales de no recibir tratamiento y1 − y0 = E [y1 ] − E [y0 ] + v1 − v0 = αATE + v1 − v0 donde v1 − v0 es la ganancia personal de recibir tratamiento 14 / 25 El Estimador de Diferencias d El Estimador de Diferencias en Medias y ATT y αATT Condicionando la ecuación anterior para D =1 obtenemos E [y1 − y0 |D = 1] = αATE + E [v1 − v0 |D = 1] αATT = αATE + E [v1 − v0 |D = 1] Si los individuos pueden elegir si participar del tratamiento, es de esperar que las personas con expectativas de mayores ganancias participen más y por tanto E [v1 − v0 |D = 1] > 0 15 / 25 Exogeneidad Asignación Aleatoria (1/3) En un experimento controlado, el tratamiento es asignado aleatoriamente en la población En ese caso, y1 e y0 son independientes de la participación D E [y1 |D = 1] = E [y1 |D = 0] = E [y1 ] E [y0 |D = 1] = E [y0 |D = 0] = E [y0 ] Entonces, la simple diferencia de medias d d = E [y |D = 1] − E [y |D = 0] = E [y1 ] − E [y0 ] = αATE un estimador consistente de αATE es la diferencia entre los resultados promedio de tratados y no tratados: ȳ1 − ȳ0 16 / 25 Exogeneidad Asignación Aleatoria (2/3) de manera similar puede probarse que d = αATT Recordemos que: d = αATT + E [y0 |D = 1] − E [y0 |D = 0] Dado que con asignación aleatoria, E [y0 |D = 1] = E [y0 |D = 0] ⇒ d = αATT Por tanto, la asignación aleatoria elimina el sesgo de selección plim(d̂ ) = d = αATE = αATT 17 / 25 Exogeneidad Asignación Aleatoria (3/3) Si la asignación es aleatoria, los individuos no eligen si reciben el tratamiento Parece entonces razonable pensar que Por lo tanto de nuevo E [v 1 − v 0|D = 1] = 0 αATE = αATT 18 / 25 Exogeneidad Experimentos Aleatorios 1/2 denir la población de interés (elegible) necesitamos un contrafactual (grupo de comparación, no tratado, de control...), que nos indique qué hubiera pasado en ausencia del programa (o política o intervención) entonces, del grupo de individuos elegibles, podemos asignar aleatoriamente quienes participan en el programa (excluidos) los excluidos serán en promedio, un adecuado grupo de control para comparar con los participantes 19 / 25 Exogeneidad Experimentos Aleatorios 2/2 idealmente la única diferencia entre ambos grupos es la participación en el programa en esos casos podremos estimar d via MCO, sin necesidad de controlar por ninguna otra variable que no sea la del tratamiento ya que si encontramos resultados diferentes para ambos grupos, podemos suponer que las diferencias se deben al programa. Recordar el caso de un modelo con una variable articial D: Y = β0 + β1 D + u E (Y |D = 0) = β0 E (Y |D = 1) = β0 + β1 20 / 25 Exogeneidad Un buen contrafactual 1/2 Queremos saber si ciertos insumos (fertilizantes) utilizados mejoran la producción. Podríamos comparar granjeros que utilizan fertilizantes con los que no. Entonces si encontramos que los primeros tienen mayor rendimiento, ¾Podemos concluir que el uso de fertilizantes incrementa la producción? ¾Son los grupos similares? ¾Son los granjeros que no usan fertilizantes un buen contrafactual? 21 / 25 Exogeneidad Un buen contrafactual 2/2 ¾Son los individuos que no participan del programa de entrenamiento un buen contrafactual? ¾Es el mismo individuo después del programa un buen contrafactual? Para saber el efecto del tamaño de la clase en el rendimiento escolar ¾Son los niños que acuden a colegios con clases de pocos alumnos por clase un buen contrafactual de los que acuden a colegios con muchos alumnos por clase? 22 / 25 Ejemplo Ejemplo - NSW 1/3 El programa NSW fue diseñado en los EEUU a mitad de los 70 para proveer entrenamiento a mujeres con problemas de empleo. El programa garantizaba 12 meses de empleo. Para ser elegibles las mujeres debían haber estado desempleadas al menos 3 de los últimos 6 meses, haber recibido ayuda de la seguridad social en los últimos 3 años y no tener niños menores de 6 años. Las mujeres que aplicaron al programa(todas elegibles), fueron asignadas aleatoriamente a un grupo de tratamiento o de control. Todas las mujeres que aplicaron, tratadas o no, fueron entrevistadas al inicio y después de implantado el programa cada nueve meses. 23 / 25 Ejemplo Ejemplo - NSW 2/3 La gura, tomada de Ham y LaLonde (1996) en Econometrica, muestra los efectos del programa. Gracias a la randomización, una simple comparación de medias en las tasas de empleo de ambos grupos fue suciente para estimar los efectos del programa. 24 / 25 Ejemplo Ejemplo - NSW 3/3 El archivo ex_NSW contiene información sobre el programa NSW. La variable treat es el indicador del tratamiento. La variable re78 representa los ingresos en 1978, nuestra variable de interés. Estime el efecto medio del tratamiento en los ingresos en 1978. Contrastar la hipótesis nula de que el efecto del tratamiento es cero. Tenemos información sobre la edad de las personas. ¾Qué esperaría observar si considerara la variable edad como resultado de interés y estimara el efecto del tratamiento en la edad? Contrastar la hipótesis nula de que el efecto del tratamiento es cero. 25 / 25