Economía Aplicada Causalidad y Experimentos Sociales

Anuncio
Economía Aplicada
Causalidad y Experimentos Sociales
Departmento de Economía
Universidad Carlos III de Madrid
Outline
1
Resultados Potenciales y Causalidad
2
Efectos del tratamiento
3
El Estimador de Diferencias
El Estimador de Diferencias y ATE
El Estimador de Diferencias en Medias y ATT
4
Exogeneidad
5
Ejemplo
Resultados Potenciales y Causalidad
El problema básico
En economía muchas veces estamos interesados en estudiar el efecto
de una poliítica o un programa en cierta variable de interés
El programa o política es lo que llamamos
La variable de interés es el
tratamiento
resultado
Nos interesa determinar el efecto causal del tratamiento en el
resultado: el
efecto del tratamiento
Ejemplos de Tratamientos y Resultados: Hospitalización y Estado de
Salud, Salario Mínimo y Horas de Trabajo, Entrenamiento y Empleo,
Educación e Ingresos, Tamaño de la Clase y Nivel Educativo, Servicio
Militar e Ingresos.
Denir claramente tratamiento y resultados.
1 / 25
Resultados Potenciales y Causalidad
Ejemplo
Supongamos que el gobierno establece un programa de entrenamiento
para desempleados de larga duración
¾Es razonable evaluar si la política fue exitosa mirando los niveles de
desempleo de quienes recibieron entrenamiento una vez terminado el
programa?
Para quienes recibieron el entrenamiento
observamos los efectos de participar, pero no observamos los efectos
de no participar
Para quienes no recibieron el entrenamiento
no observamos los efectos de participar, sino que observamos los
efectos de no participar
2 / 25
Resultados Potenciales y Causalidad
Deniciones
Resultados potenciales
y0 :
resultado sin tratamiento (situación laboral no habiendo recibido
entrenamiento, o estado de salud de un individuo que no fue al
hospital)
y1 :
resultado con tratamiento (situación laboral luego del
entrenamiento, o estado de salud luego de ir al hospital)
Nos gustaría conocer
y1 − y0 :
el efecto del tratamiento para cada individuo,
pero:
un individuo no puede existir en ambos estados: los participantes no
pueden ser simultáneamente no participantes!
no observamos a la vez
y1
e
y0
3 / 25
Resultados Potenciales y Causalidad
Más deniciones
Participación
D=
1
si recibe tratamiento
0
si no recibe tratamiento
Resultados observados
y=
y1
y0
si D=1
si D=0
⇒ y = y1 D + y0 (1 − D )
4 / 25
Efectos del tratamiento
Efectos del tratamiento
No es posible calcular el efecto causal individual: ningún individuo
puede estar en dos estados de participación al mismo tiempo
Sin embargo, es posible estimar
El efecto medio del tratamiento esperado para un individuo tomado al
azar de la población de participantes y no participantes (Efecto
Promedio del Tratamiento o Average Treatment Eect: ATE)
El efecto medio del tratamiento para el grupo de participantes (Efecto
Promedio del Tratamiento en los Tratados o Average Eect of
Treatment on the Treated: ATT)
5 / 25
Efectos del tratamiento
Efecto Promedio del Tratamiento (ATE)
αATE = E [y1 ] − E [y0 ]:
αATE
efecto promedio en la población
nos dice el efecto del programa para un individuo sacado al azar
de la población
puede interpretarse como efecto causal en el sentido de que es el
mejor predictor del resultado del programa sin tener más información
el verdadero efecto del programa para ciertos individuos puede en
realidad ser muy diferente del efecto medio en la población
6 / 25
Efectos del tratamiento
Efecto Promedio del Tratamiento en los Tratados (ATT)
Efecto Promedio del Tratamiento en los Tratados
αATT = E [y1 |D = 1 ] − E [y0 |D = 1 ]
podemos querer conocer el efecto medio en aquellos individuos que
recibieron el tratamiento (por ejemplo aquéllos que tomaron los cursos
de entrenamiento)
necesitamos conocer
y
en ausencia de tratamiento
7 / 25
El Estimador de Diferencias
El Estimador de Diferencias
Estimador de diferencias
d̂ = Ê [y |D = 1 ] − Ê [y |D = 0 ]
donde:
Ê [y |D = 1 ] = N1 ∑ yi : Resultado medio de los tratados
D =1
Ê [y |D = 0 ] = N10 ∑ yi : Resultado medio de los no tratados
1
D =0
¾Resulta útil la simple comparación de promedios para tratados y no
tratados?
Por ejemplo comparar las tasas de desempleo promedio para
entrenados y no entrenados, o el estado de salud promedio para
hospitalizados y no hospitalizados.
8 / 25
El Estimador de Diferencias
Propiedades Asintóticas
Ley de Grandes Números
plim(d̂ ) = E [y |D = 1 ] − E [y |D = 0 ] = d
Teorema Central del Límite
1
a
N 2 d̂ − d → N (0, AsyVar )
9 / 25
El Estimador de Diferencias
El Estimador de Diferencias y ATE
¾Es el Estimador de Diferencias un buen estimador de αATE ?
¾Bajo qué condiciones el estimador
d̂
es un estimador consistente de
αATE ?
Intuición
si las dos poblaciones, los tratados y los no tratados, son similares en
términos de resultados, entonces la comparación de medias parece
adecuada
si los tratados son esencialmente diferentes de los no tratados en
relación a los resultados, tendremos
sesgo de selección
por ejemplo, si los participantes en el programa de entrenamiento
asisten porque son quienes más se beneciarán del programa, entonces
d̂
probablemente sobreestimará los efectos positivos de los programas
de entrenamiento
10 / 25
El Estimador de Diferencias
El Estimador de Diferencias en Medias y ATT
¾Es el Estimador de Diferencias en Medias un buen
estimador de αATT ?
¾Bajo qué condiciones
d̂
es un estimador consistente de
αATT ?
Intuición
si tratados y no tratados son similares en relación a los resultados en
ausencia de tratamiento, entonces los resultados promedio de los no
tratados serán una buena estimación del (inobservable) resultado
promedio en los tratados en ausencia de tratamiento.
sin embargo, si el tratamiento resulta de decisiones individuales, puede
sueceder que individuos con bajo
y0
elijan el tratamiento con mayor
probabilidad que aquellos individuos con alto
y0
(individuos con mala
salud es más probable que se hospitalicen que individuos con buena
salud).
11 / 25
El Estimador de Diferencias
d
El Estimador de Diferencias en Medias y ATT
y αATT
d = E [y |D = 1 ] − E [y |D = 0 ]
= E [y1 |D = 1 ] + {−E [y0 |D = 1 ] + E [y0 |D = 1 ]} − E [y0 |D = 0 ]
= {E [y1 |D = 1 ] − E [y0 |D = 1 ]} + E [y0 |D = 1 ] − E [y0 |D = 0 ]
por lo tanto:
d = αATT + E [y0 |D = 1 ] − E [y0 |D = 0 ]
La diferencia observada en el resultado promedio entre tratados y no
tratados (d) se compone de dos términos: el efecto del tratamiento en los
tratados y un sesgo de selección.
12 / 25
El Estimador de Diferencias
El Estimador de Diferencias en Medias y ATT
d = αATT + E [y |D = 1 ] − E [y |D = 0 ]
0
0
E [y0 |D = 1 ] = E [y0 |D = 0 ] ⇒ plim(d̂ ) = αATT
tratados y no tratados son similares en ausencia de tratamiento
por ejemplo, implicaría que hospitalizados y no hospitalizados tienen
estados de salud similares antes de ir al hospital
E [y0 |D = 1 ] 6= E [y0 |D = 0 ] ⇒ plim(d̂ ) 6= αATT
esto sucede si tratados son diferentes respecto a
y
en ausencia de
tratamiento
por ejemplo, si las tasas de desempleo de los tratados son más altas
sin tratamiento,
d̂
probablemente subestimará los efectos positivos del
programa en los tratados
13 / 25
El Estimador de Diferencias
El Estimador de Diferencias en Medias y ATT
Un Modelo Simple
y1 = E [y1 ] + v1
y0 = E [y0 ] + v0
v1 :
ganancias personales de recibir tratamiento (desviación respecto a
la media)
v0 :
ganancias personales de no recibir tratamiento
y1 − y0 = E [y1 ] − E [y0 ] + v1 − v0
= αATE + v1 − v0
donde
v1 − v0
es la ganancia personal de recibir tratamiento
14 / 25
El Estimador de Diferencias
d
El Estimador de Diferencias en Medias y ATT
y αATT
Condicionando la ecuación anterior para
D =1
obtenemos
E [y1 − y0 |D = 1] = αATE + E [v1 − v0 |D = 1]
αATT = αATE + E [v1 − v0 |D = 1]
Si los individuos pueden elegir si participar del tratamiento, es de esperar
que las personas con expectativas de mayores ganancias participen más y
por tanto
E [v1 − v0 |D = 1] > 0
15 / 25
Exogeneidad
Asignación Aleatoria (1/3)
En un experimento controlado, el tratamiento es asignado
aleatoriamente en la población
En ese caso,
y1
e
y0
son independientes de la participación
D
E [y1 |D = 1] = E [y1 |D = 0] = E [y1 ]
E [y0 |D = 1] = E [y0 |D = 0] = E [y0 ]
Entonces, la simple diferencia de medias
d
d = E [y |D = 1] − E [y |D = 0] = E [y1 ] − E [y0 ] = αATE
un estimador consistente de
αATE
es la diferencia entre los resultados
promedio de tratados y no tratados:
ȳ1 − ȳ0
16 / 25
Exogeneidad
Asignación Aleatoria (2/3)
de manera similar puede probarse que
d = αATT
Recordemos que:
d = αATT + E [y0 |D = 1] − E [y0 |D = 0]
Dado que con asignación aleatoria,
E [y0 |D = 1] = E [y0 |D = 0]
⇒ d = αATT
Por tanto,
la asignación aleatoria elimina el sesgo de selección
plim(d̂ ) = d = αATE = αATT
17 / 25
Exogeneidad
Asignación Aleatoria (3/3)
Si la asignación es aleatoria, los individuos no eligen si reciben el
tratamiento
Parece entonces razonable pensar que
Por lo tanto de nuevo
E [v 1 − v 0|D = 1] = 0
αATE = αATT
18 / 25
Exogeneidad
Experimentos Aleatorios 1/2
denir la población de interés (elegible)
necesitamos un contrafactual (grupo de comparación, no tratado, de
control...), que nos indique qué hubiera pasado en ausencia del
programa (o política o intervención)
entonces, del grupo de individuos elegibles, podemos asignar
aleatoriamente quienes participan en el programa (excluidos)
los excluidos serán en promedio, un adecuado grupo de control para
comparar con los participantes
19 / 25
Exogeneidad
Experimentos Aleatorios 2/2
idealmente la única diferencia entre ambos grupos es la participación
en el programa
en esos casos podremos estimar
d
via MCO, sin necesidad de controlar
por ninguna otra variable que no sea la del tratamiento
ya que si encontramos resultados diferentes para ambos grupos,
podemos suponer que las diferencias se deben al programa.
Recordar el caso de un modelo con una variable articial
D:
Y = β0 + β1 D + u
E (Y |D = 0) = β0
E (Y |D = 1) = β0 + β1
20 / 25
Exogeneidad
Un buen contrafactual 1/2
Queremos saber si ciertos insumos (fertilizantes) utilizados mejoran la
producción.
Podríamos comparar granjeros que utilizan fertilizantes con los que no.
Entonces si encontramos que los primeros tienen mayor rendimiento,
¾Podemos concluir que el uso de fertilizantes incrementa la
producción?
¾Son los grupos similares? ¾Son los granjeros que no usan fertilizantes
un buen contrafactual?
21 / 25
Exogeneidad
Un buen contrafactual 2/2
¾Son los individuos que no participan del programa de entrenamiento
un buen contrafactual?
¾Es el mismo individuo después del programa un buen contrafactual?
Para saber el efecto del tamaño de la clase en el rendimiento escolar
¾Son los niños que acuden a colegios con clases de pocos alumnos por
clase un buen contrafactual de los que acuden a colegios con muchos
alumnos por clase?
22 / 25
Ejemplo
Ejemplo - NSW 1/3
El programa NSW fue diseñado en los EEUU a mitad de los 70 para
proveer entrenamiento a mujeres con problemas de empleo.
El programa garantizaba 12 meses de empleo. Para ser elegibles las
mujeres debían haber estado desempleadas al menos 3 de los últimos 6
meses, haber recibido ayuda de la seguridad social en los últimos 3
años y no tener niños menores de 6 años.
Las mujeres que aplicaron al programa(todas elegibles), fueron
asignadas aleatoriamente a un grupo de tratamiento o de control.
Todas las mujeres que aplicaron, tratadas o no, fueron entrevistadas al
inicio y después de implantado el programa cada nueve meses.
23 / 25
Ejemplo
Ejemplo - NSW 2/3
La gura, tomada de Ham y LaLonde (1996) en Econometrica,
muestra los efectos del programa.
Gracias a la randomización, una simple comparación de medias en las
tasas de empleo de ambos grupos fue suciente para estimar los
efectos del programa.
24 / 25
Ejemplo
Ejemplo - NSW 3/3
El archivo ex_NSW contiene información sobre el programa NSW. La
variable
treat
es el indicador del tratamiento. La variable
re78
representa
los ingresos en 1978, nuestra variable de interés.
Estime el efecto medio del tratamiento en los ingresos en 1978.
Contrastar la hipótesis nula de que el efecto del tratamiento es cero.
Tenemos información sobre la edad de las personas. ¾Qué esperaría
observar si considerara la variable edad como resultado de interés y
estimara el efecto del tratamiento en la edad? Contrastar la hipótesis
nula de que el efecto del tratamiento es cero.
25 / 25
Descargar