¿Cuál es la forma correcta de especificar un modelo de diferencia en diferencia con datos de panel de nivel individual?
Aquí está la configuración: suponga que tengo datos de panel de nivel individual incrustados en ciudades durante varios años y el tratamiento varía según el nivel de año de la ciudad. Formalmente, vamos será el resultado para el individuo en la ciudad de y el año y sea un maniquí de si la afectada ciudad de intervención en el año . Un estimador DiD típico como el descrito en Bertrand et al (2004, p. 250) se basa en un modelo OLS simple con términos de efectos fijos para ciudad y año: i s t D s t s t
¿Pero ese estimador ignora la estructura del panel de nivel individual (es decir, múltiples observaciones para cada individuo dentro de las ciudades)? ¿Tiene sentido ampliar este modelo con un término de efecto fijo de nivel individual ? Muchas aplicaciones DiD usan datos de sección transversal repetidos sin los datos del panel de nivel individual.
Bertrand, Marianne, Esther Duflo y Sendhil Mullainathan. 2004. "¿Cuánto debemos confiar en las estimaciones de diferencias en diferencias?" Quarterly Journal of Economics 119 (1): 249–75.
Respuestas:
Una buena característica de la diferencia en diferencias (DiD) es que realmente no necesita datos del panel para ello. Dado que el tratamiento ocurre en algún tipo de nivel de agregación (en las ciudades de su caso), solo necesita tomar muestras de individuos al azar de las ciudades antes y después del tratamiento. Esto le permite estimar y obtener el efecto causal del tratamiento como la diferencia de resultado post-pre esperada para el tratado menos la diferencia de resultado post-pre esperada para el control.
Hay un caso en el que las personas usan efectos fijos individuales en lugar de un indicador de tratamiento y es cuando no tenemos un nivel de agregación bien definido en el que se produce el tratamiento. En ese caso, usted estimaría donde es un indicador del período posterior al tratamiento para las personas que recibió el tratamiento (por ejemplo, un programa de mercado laboral que ocurre en todo el lugar). Para obtener más información sobre esto, vea estas notas de la conferencia de Steve Pischke.
En su entorno, agregar efectos fijos individuales no debería cambiar nada con respecto a las estimaciones puntuales. El indicador de tratamiento solo será absorbido por los efectos fijos individuales. Sin embargo, estos efectos fijos pueden absorber parte de la varianza residual y, por lo tanto, reducir potencialmente el error estándar de su coeficiente DiD.Ag
Aquí hay un ejemplo de código que muestra que este es el caso. Yo uso Stata pero puedes replicar esto en el paquete estadístico que elijas. Los "individuos" aquí son en realidad países, pero todavía están agrupados de acuerdo con algún indicador de tratamiento.
Entonces, verá que el coeficiente DiD permanece igual cuando se incluyen los efectos fijos individuales (
areg
es uno de los comandos de estimación de efectos fijos disponibles en Stata). Los errores estándar son ligeramente más estrictos y nuestro indicador de tratamiento original fue absorbido por los efectos fijos individuales y, por lo tanto, disminuyó en la regresión.En respuesta al comentario
, mencioné el ejemplo de Pischke para mostrar cuándo las personas usan efectos fijos individuales en lugar de un indicador de grupo de tratamiento. Su configuración tiene una estructura de grupo bien definida, por lo que la forma en que ha escrito su modelo está perfectamente bien. Los errores estándar deben agruparse a nivel de ciudad, es decir, el nivel de agregación en el que se produce el tratamiento (no lo he hecho en el código de ejemplo, pero en la configuración de DiD los errores estándar deben corregirse como lo demuestra el artículo de Bertrand et al. )
En cuanto a los motores, no tienen mucho que jugar aquí. El indicador de tratamiento es igual a 1 para las personas que viven en una ciudad tratada en el período posterior al tratamiento . Para calcular el coeficiente DiD, en realidad solo necesitamos calcular cuatro expectativas condicionales, a saber,Dst s t
Entonces, si tiene 4 períodos de postratamiento para una persona que vive en una ciudad tratada durante los primeros dos, y luego se muda a una ciudad de control durante los dos períodos restantes, las primeras dos de esas observaciones se usarán en el cálculo de y los dos últimos en . Para aclarar por qué la identificación proviene de las diferencias de grupo a lo largo del tiempo y no de los motores, puede visualizar esto con un gráfico simple. Suponga que el cambio en el resultado es realmente solo por el tratamiento y que tiene un efecto contemporáneo. Si tenemos un individuo que vive en una ciudad tratada después de que comienza el tratamiento pero luego se muda a una ciudad de control, su resultado debería volver a ser lo que era antes de que fueran tratados. Esto se muestra en el gráfico estilizado a continuación.E ( y i s t | s = 0 , t = 1 )E(yist|s=1,t=1) E(yist|s=0,t=1)
Sin embargo, es posible que aún desee pensar en los motores por otras razones. Por ejemplo, si el tratamiento tiene un efecto duradero (es decir, aún afecta el resultado aunque el individuo se haya movido)
fuente
La respuesta corta es que el uso del efecto fijo en la unidad o en el nivel del grupo tratado no cambia la estimación, solo la inferencia. Por lo general, el uso del efecto fijo de la unidad absorberá más variación y, por lo tanto, tendrá errores estándar más pequeños.
Si las unidades están en el mismo grupo agregado no cambia este resultado (solo cambia la forma en que define el nivel de grupo tratado y el hecho de que necesita un panel en lugar de secciones transversales repetidas).
Sin embargo, tenga en cuenta que la equivalencia solo se cumple cuando no hay una covariable X. Tan pronto como tenga X, los resultados son diferentes si usa efectos fijos de unidad o de grupo.
El siguiente ejemplo compara los 3 estimadores, en dos casos, con y sin X. Los estimadores son:
Código:
fuente