¿Cuándo es necesario incluir el retraso de la variable dependiente en un modelo de regresión y qué retraso?

14

Los datos que queremos usar como variable dependiente se ven así (son datos de recuento). Tememos que, dado que tiene un componente cíclico y una estructura de tendencia, la regresión se ve sesgada de alguna manera.

ingrese la descripción de la imagen aquí

Usaremos una regresión binomial negativa en caso de que ayude. Los datos son un panel equilibrado, un ficticio por individuo (estados). La imagen que se muestra muestra la suma de la variable dependiente para todos los estados, pero solo la mayoría de los estados tienen un comportamiento similar. Estamos considerando un modelo de efectos fijos. Las variables dependientes no están muy fuertemente correlacionadas, parte de la investigación es encontrar una relación inesperada entre estas variables, por lo que una relación débil es realmente algo bueno.

  1. ¿Cuáles son los peligros exactos de no incluir una variable de retraso de la variable dependiente?
  2. Si es necesario incluir uno, ¿hay alguna prueba para saber cuál (es)?

La implementación se está haciendo en R.

Nota : leí esta publicación pero no ayudó a nuestro problema.

Mauricio G Tec
fuente

Respuestas:

14

Un modelo de panel dinámico podría tener sentido si tiene un modelo de represalia ojo por ojo por homicidios. Por ejemplo, si la tasa de homicidios se debió en gran medida a las disputas entre pandillas, los asesinatos en el momento bien podrían ser una función de las muertes en t - 1tt1 u otros retrasos.

Voy a responder sus preguntas fuera de servicio. Supongamos que el DGP es

yit=δyit1+xitβ+μi+vit,

donde los errores y v son independientes entre sí y entre sí. Está interesado en realizar la prueba de si δ = 0 (pregunta 2).μvδ=0

Si usa OLS, es fácil ver que y la primera parte del error están correlacionados, lo que hace que OLS sea parcial e inconsistente, incluso cuando no hay correlación serial en v . Necesitamos algo más complicado para hacer la prueba.yit1v

Lo siguiente que puede probar es el estimador de efectos fijos con la transformación interna, donde transforma los datos restando el promedio de cada unidad , ˉ y i , de cada observación. Esto borra μ , pero este estimador sufre de sesgo de Nickell , que sesgo no desaparece como el número de observaciones N crece, por lo que es incompatible para gran N y pequeñas T paneles. Sin embargo, a medida que crece T , obtienes consistencia de δ y β . Judson y Owen (1999) hacen algunas simulaciones con N = 20yy¯iμNNTTδβ y T = 5 , 10 , 20 , 30 y conocer el sesgo estar aumentando en δ y decreciente en T . Sin embargo, incluso para T = 30 , el sesgo podría ser de hasta el 20 % del valor del coeficiente verdadero. ¡Esas son malas noticias! Entonces, dependiendo de las dimensiones de su panel, es posible que desee evitar el estimador FE interno. Si δ > 0 , el sesgo es negativo, por lo quese subestimala persistencia de y . Si los regresores están correlacionados con el retraso, la β también estará sesgada.N=20,100T=5,10,20,30δTT=3020%δ>0yβ

Otro enfoque simple de FE es diferenciar primero los datos para eliminar el efecto fijo, y usar para instrumentar para Δ y i t - 1 = y i t - 1 - y i t - 2 . También utiliza x i t - x i t - 1 como instrumento por sí mismo. Anderson y Hsiao (1981) es la referencia canónica. Este estimador es consistente (siempre que el X explicativoyit2Δyit1=yit1yit2xitxit1X estén predeterminadas y el originales lugar.los términos de error no están correlacionados en serie), pero no son completamente eficientes ya que no utiliza todas las condiciones de momento disponibles y no utiliza el hecho de que el término de error ahora está diferenciado. Probablemente esta sea mi primera opción. Si cree que sigue un proceso AR (1), puede usar el tercer y cuarto retraso de yvy

Arellano y Bond (1991) derivan un estimador de método generalizado de momentos (GMM) más eficiente, que se ha extendido desde entonces, relajando algunos de los supuestos. Capítulo 8 del libro del panel de Baltagi es una buena encuesta de esta literatura, aunque no se trata de la selección de retraso hasta donde puedo decir. Esta es una métrica de vanguardia, pero técnicamente más exigente.

Creo que el plmpaquete en R tiene algunos de estos integrados. Los modelos de panel dinámico han estado en Stata desde la versión 10 , y SAS tiene la versión GMM al menos. Ninguno de estos son modelos de datos de conteo, pero eso puede no ser un gran problema dependiendo de sus datos. Sin embargo, aquí hay un ejemplo de un modelo de panel de Poisson dinámico GMM en Stata.

yβ

revs Dimitriy V. Masterov
fuente
¿Entonces usas los niveles como un instrumento cuando tienes una serie diferenciada y las diferencias cuando tienes una serie en niveles ?
Andy W
iΔyt2=yt2yt3yt2Δyt1=yt1yt2 . Arellano (1989) muestra que el primer enfoque tiene un punto de singularidad y grandes variaciones para un amplio rango de valores de parámetros. El instrumento de niveles no tiene ninguno, por eso lo recomendé