Diferencia en diferencias en regresión 2SLS

10

Por lo general, cuando hacemos una estimación de diferencia en diferencias, lo hacemos en una forma reducida de MCO de la siguiente manera:

Yit=αAftert+γTreatmenti+δAfterTreatmenti,t+Xitβ+ϵi,t
Sin embargo, me preguntaba, si el grupo es endógeno (por ejemplo, la auto-seleccionados), pero podemos definir un grupo de "elegible" para el tratamiento, si sería más preciso para estimar una diff -in-diff en una forma OLS / 2SLS como: T r e a t m e n t i , t = c o n s t a n t + α A f t e r t + γ E l i gTreatment obtenemos ^ T r e a t m e n t i , t , entonces
Treatmenti,t=constant+αAftert+γEligiblei+δAfterEligiblei,t+ϵi,t
Treatmenti,t^

Yi,t=Xitβ+δTreatmenti,t^+ϵi,t

¿Cómo debemos entender el diff-in-diff en un formulario OLS / 2SLS? ¿Hay algún documento que utilice esta estrategia de identificación particular que pueda echar un vistazo?

¡Muchas gracias por adelantado!

Wright
fuente
Esto es borroso. Por favor revise el papel restud.
user24970

Respuestas:

6

Bueno, si cree que el tratamiento es endógeno (que depende del problema que se está tratando aquí y no es una característica inherente del modelo), entonces usar la elegibilidad como una variable instrumental lo ayudará a deshacerse de los sesgos debido a la selección segura en tratamiento. (Por cierto, DID tiene la intención de hacer lo mismo, pero no hará un trabajo tan bueno como un instrumento bien elegido, por lo que hay algunas dudas sobre si aplicar ambos es mejor que recurrir a uno solo). Sin embargo, depende de usted decidir si la elegibilidad es exógena, como bien puede ser, que aquellos que esperan un mayor retorno al tratamiento se aseguren de ser elegibles.

Teniendo en cuenta que creemos que hay algunos sesgos que el DID no elimina y que la elegibilidad puede ayudarnos, todavía hay consideraciones de eficiencia. En muchos casos, la elegibilidad puede ser un instrumento débil y, a continuación, la reducción del sesgo tendrá un costo de pérdida de eficiencia significativa.

Y echando un vistazo a la especificación particular que has sugerido, no parece muy razonable en general. Puede elegir cuando cree que la elegibilidad está cambiando rápidamente, o el término de interacción en la segunda ecuación generalmente no será útil. Inclusión de tiempo Después en esa ecuación puede tener consecuencias aún más drásticas, ya que es probable que sea endógeno y debilite el efecto de reducción de sesgo. Si no es endógeno, es probable que sea insignificante, así como la interacción, a menos que el tratamiento cambie rápidamente por sí solo.

Entonces, en este caso, recomendaría dejar solo la elegibilidad como instrumento en la primera ecuación y especificar la tercera en un formulario DID.

Con respecto a la interpretación, mi especificación no permite una buena interpretación de la diferencia en los cambios en dos subgrupos y debe interpretarse como una diferencia en los cambios en dos subgrupos hipotéticos donde cada persona se divide entre ellos con algunos pesos.

Sin embargo, su especificación pierde toda interpretación como DID, porque no utiliza el coeficiente de interacción resultante, sino que solo emplea más variables como instrumentos para el tratamiento.

Desafortunadamente, probablemente debido a las razones antes mencionadas, no pude recordar ni encontrar ningún documento apropiado, lo siento.

Nikita Toropov
fuente
3

La cuestión de la selección en el tratamiento basada en alguna variable observable que no entra en la ecuación de resultado se resuelve con un enfoque de índice latente o un método de 2 pasos de Heckman. Una dificultad con Heckman de 2 pasos es el requisito de encontrar un instrumento válido, pero si ya tiene uno, resolverá su problema de tratamiento endógeno.

gannawag
fuente