¿Por qué usar variables de control en diferencias en diferencias?

10

Tengo una pregunta sobre el enfoque de diferencias en diferencias con la siguiente ecuación estándar: donde treat es una variable ficticia para el grupo tratado y la publicación.

y = a + b_{1} treat + b_{2} post + b_{3} treat \cdot post + u

$y= a + b_1\text{treat}+ b_2\text{post} + b_3\text{treat}\cdot\text{post} + u$

Ahora, mi pregunta es simple: ¿por qué la mayoría de los documentos todavía usan variables de control adicionales? Pensé que si la suposición de tendencia paralela es correcta, entonces no deberíamos tener que preocuparnos por controles adicionales. Solo podía pensar en 2 posibles razones de por qué usar variables de control:

sin ellos, las tendencias no serían paralelas
debido a que la especificación DnD atribuye cualquier diferencia en las tendencias entre el tratamiento y el grupo de control en el momento del tratamiento a la intervención (es decir, el término de interacción tratar * después) - cuando no controlamos otras variables, el coeficiente de la interacción puede ser mayor - / discreto

¿Alguien podría arrojar algo de luz sobre este tema? ¿Mis razones 1) o 2) tienen sentido? No entiendo completamente el uso de variables de control en DnD.

regression multiple-regression causality sachin
fuente

La necesidad de variables de control adicionales puede depender de si el grupo de tratamiento se seleccionó al azar de un grupo más grande con el resto convirtiéndose en controles, o (como suele ser el caso en el análisis post-hoc) debido a algunas características específicas.

Henry

5

sin ellas [es decir, variables adicionales], las tendencias no serían paralelas

Si, eso es correcto. Puede haber tendencias específicas de la unidad que no está contando a menos que agregue variables que varíen en el tiempo al modelo.

Incluso si el supuesto de tendencias paralelas se cumple sin variables adicionales, agregar variables adicionales puede aumentar la precisión de sus estimaciones, al igual que en otras regresiones. Creo que esto es parte de lo que Michael Chernick tiene en mente.

En su mayoría Econometría inofensiva tiene una buena discusión que puede ser útil. Ver especialmente las páginas 236-37.

usuario697473
fuente

1

A veces, cuando observamos un efecto del tratamiento calculando la diferencia en la respuesta después del tratamiento o el pretratamiento, decimos que el paciente actúa como su propio control. El propósito de proporcionar un grupo de control es dar cuenta del llamado efecto placebo. A veces puede haber un cambio positivo incluso si el tratamiento no se aplica. Entonces, el efecto que queremos determinar es el aumento promedio por encima del "efecto placebo".

Michael R. Chernick
fuente

Hola Michael, gracias por tu respuesta. Creo que entiendo por qué necesitamos grupos de control. El grupo de control está incorporado en mi ecuación de regresión como aquellos que no tienen tratamiento = 1. Entonces esa no es realmente la pregunta aquí. La pregunta es por qué algunos documentos usan variables de control adicionales además de la ecuación indicada anteriormente. Sería genial si pudieras responder a eso o tal vez a alguien más. ¡Gracias chicos!

sachin

¿Por qué llama a las variables adicionales variables de control? La única razón por la que pude ver la inclusión de variables adicionales en el modelo sería que las variables pueden explicar parte de la variación en la respuesta que no fue explicada por las otras variables en el modelo.

Michael R. Chernick

Bueno, esa es básicamente mi pregunta: ¿por qué incluir estas variables (es decir, variables de control que se incluyen porque, como usted dice, podrían explicar algo que afirmamos que explica el tratamiento) cuando se supone que se cumple el supuesto de tendencia paralela? Solo podría suponer que incluir más controles significa relajar esa suposición, es decir, ver cuánto puede explicar el tratamiento, incluso cuando se controlan otras variables. Esto podría ser una consecuencia de no poder probar completamente el supuesto de tendencia paralela y podría convencer al lector más sobre el efecto del tratamiento. Pero no estoy seguro de eso

sachin

El efecto sobre la respuesta no tiene que venir únicamente del tratamiento. Estoy diciendo que otras variables podrían explicar la variación en la respuesta que son independientes del tratamiento. No tiene que tener nada que ver con el tratamiento que interactúa con nada.

Michael R. Chernick

1

Sí, ambos puntos tienen sentido. Para ver una derivación de dos sabores diferentes de modelos diff-in-diff, puede ver mis diapositivas sobre el tema .

Charlie
fuente

1

Continuando con la respuesta de Michael, desea proporcionar tanta evidencia como sea posible de que E [u | treat] = 0. Esa es una suposición y nunca verificable directamente, pero desea brindar tanta confianza a los lectores que haya pensado por qué podra celebrar. Agregar controles efectivamente comienza a descomponerse u. Y, algunos controles pueden no obtener todo lo que desea, pero pueden darle una idea del tipo de cosas de las que puede no tener que preocuparse. Por ejemplo, si tenía un control para el coeficiente intelectual, eso podría ayudar a calmar las preocupaciones de las variables omitidas en la capacidad.

usuario1690130
fuente

¿Por qué usar variables de control en diferencias en diferencias?

Respuestas: