Especificar un modelo de diferencia en diferencias con múltiples períodos de tiempo

20

Cuando calculo un modelo de diferencia en diferencias con dos períodos de tiempo, el modelo de regresión equivalente sería

a. Yist=α+γsTreatment+λdt+δ(Treatmentdt)+ϵist

  • donde el es un maniquí que es igual a 1 si la observación es del grupo de tratamientoTreatment
  • y es un maniquí que es igual a 1 en el período de tiempo después del tratamiento se produjod

Así, la ecuación toma los siguientes valores.

  • Grupo control, antes del tratamiento:α
  • Grupo control, después del tratamiento:α+λ
  • Grupo de tratamiento, antes del tratamiento:α+γ
  • Grupo de tratamiento, después del tratamiento: α+γ+λ+δ

Por lo tanto, en un modelo de dos períodos, la diferencia en la estimación de diferencias es .δ

Pero, ¿qué sucede con si tengo más de un período de tratamiento previo y posterior? ¿Todavía uso un maniquí que indique si un año es antes o después del tratamiento?dt

¿O agrego dummies anuales en su lugar sin especificar si cada año pertenece al período anterior o posterior al tratamiento? Me gusta esto:

si. Yist=α+γsTreatment+yeardummy+δ(Treatmentdt)+ϵist

¿O puedo incluir ambos (es decir, )?yeardummy+λdt

C. Yist=α+γsTreatment+yeardummy+λdt+δ(Treatmentdt)+ϵist

En conclusión, ¿cómo especifico un modelo de diferencia en diferencias con múltiples períodos de tiempo (a, boc)?

Tom
fuente
1
Generalmente usa el modelo b. Observe que en el modelo c, será perfectamente colineal con las variables ficticias anuales, por lo que ese modelo no puede estimarse. dt
standard_error
Sería genial si pudieras explicar por qué se usa generalmente b. Tal vez dar algunas referencias, o simplemente dar una explicación de 2 oraciones.
mpiktas
y en el modelo b. ¿podría agregar una variable continua por año en lugar de tontos? ¿Cómo diferiría la interpretación de los coeficientes en esos casos?

Respuestas:

19

La forma típica de estimar un modelo de diferencia en diferencias con más de dos períodos de tiempo es su solución propuesta b). Manteniendo su notación, retrocedería donde D tTratamiento sd t es una variable ficticia que es igual a uno para unidades de tratamiento de s

Yist=α+γs(Treatments)+λ(year dummyt)+δDst+ϵist
DtTreatmentsdtsen el período posterior al tratamiento ( ) y de lo contrario es cero. Tenga en cuenta que esta es una formulación más general de la diferencia en la regresión de diferencias que permite diferentes tiempos de tratamiento para diferentes unidades tratadas.dt=1

Como se señaló correctamente en los comentarios, su solución propuesta c) no funciona debido a la colinealidad con los dummies de tiempo y el dummy para el período posterior al tratamiento. Sin embargo, una ligera variante de esto resulta ser una verificación de robustez. Supongamos que y γ s 1 sean dos conjuntos de variables ficticias para cada unidad de control s 0 y cada unidad tratada s 1 , respectivamente, y luego interaccionen los dummies para las unidades tratadas con la variable de tiempo t y regresen Y i s t = γ s 0 + γ s 1 tγs0γs1s0s1t incluye una tendencia de tiempo específica de la unidad γ s 1 t . Cuando incluye estas tendencias de tiempo específicas de la unidad y la diferencia en el coeficiente de diferencia δ no cambia significativamente, puede estar más seguro de sus resultados. De lo contrario, podría preguntarse si el efecto de su tratamiento ha absorbido las diferencias entre las unidades tratadas debido a una tendencia temporal subyacente (puede ocurrir cuando las políticas entran en vigencia en diferentes momentos).

Yist=γs0+γs1t+λ(year dummyt)+δDst+ϵist
γs1tδ

Un ejemplo citado en Angrist y Pischke (2009) Econometría en su mayoría inofensivo es un estudio de política del mercado laboral de Besley y Burgess (2004) . En su artículo, sucede que la inclusión de tendencias temporales específicas del estado mata el efecto estimado del tratamiento. Sin embargo, tenga en cuenta que para esta verificación de robustez necesita más de 3 períodos de tiempo.

Andy
fuente
Un seguimiento ya que estoy tratando de decidir si implementar esto con algunos datos administrativos es apropiado: ¿Diría que un enfoque DD es más válido que un diseño CITS si solo hay 4 puntos de tiempo (2 pre y 2 post) en un modelo? Además, si tengo varias cohortes dentro de oleadas de datos, ¿deberían examinarse por separado o en un modelo unificado? Gracias.
bfoste01
@Andy: ¿Puedes explicar, qué quieres decir con s0, s1 y tendencia de tiempo específica de la unidad? Suponiendo que tengo dos periódicos (WPT y NYT) y WPT es mi grupo de tratamiento, ¿cuál de ellos sería s0 y s1?
user3683131
1
¿Estoy en lo cierto al pensar que este análisis compara el promedio antes y después del tratamiento y no tiene en cuenta las tendencias seculares? es decir, si d_t = 0 para todos los períodos de tiempo anteriores al punto de conmutación, y d_t = 1 para todos los períodos de tiempo posteriores, entonces este análisis es esencialmente el mismo que el de los dos períodos de tiempo uno, excepto que se toma el promedio de todo el tiempo anterior / posterior períodos. ¿Se ignoran las tendencias en el resultado antes / después del cambio de tratamiento? Estoy tratando de decidir si un modelo DiD es correcto para un análisis que planeo llevar a cabo.
AP30
0

γ1s

Angrist y Pischke (2009) recomiendan este enfoque en la página 238 en Econometría mayormente inofensiva . Las diferencias en la notación pueden causar confusión. Reproducción de la especificación 5.2.7:

yist=γ0s+γ1st+λt+δDst+Xistβ+εist,

γ0ssγ1st

ys,t=sStates+tYeart+sStatesTimet+δDs,t+εs,t,

Ds,tstTimet

Las tendencias de tiempo lineal específicas de la unidad también se abordan en otra publicación (ver abajo):

¿Cómo dar cuenta de la colocación del programa endógeno?

En resumen, desea interactuar con todos los dummies de unidades (grupos) con una variable de tendencia de tiempo continua.

El documento de Justin Wolfers se encuentra a continuación para su referencia:

https://users.nber.org/~jwolfers/papers/Divorce(AER).pdf

Tom
fuente