¿Por qué es válido reducir las series temporales con regresión?

14

Puede ser una pregunta extraña, pero como novato en el tema, me pregunto por qué usamos la regresión para detener una serie de tiempo si una de las suposiciones de la regresión es que los datos deberían aplicarse, mientras que los datos en los que se aplica la regresión son no iid?

FarrukhJ
fuente
66
En general, no es cierto que supongamos que los "datos" son iid
Christoph Hanck
3
¿Qué quieres decir exactamente con tendencia ?
Matthew Gunn
66
No tengo tiempo para escribir una respuesta / documento adecuado, pero en general la correlación serial no sesga los resultados de una regresión lineal (altera el cálculo apropiado de los errores estándar, los intervalos de confianza, etc.). Esto hace que el enfoque clásico de dos etapas (tendencia, luego analizar la correlación) sea sensible. (p. ej., algunas búsquedas en Google de "correlación serial de regresión lineal imparcial conducen a fmwww.bc.edu/ec-c/f2010/228/EC228.f2010.nn12.pdf )
Ben Bolker
2
Tal vez lo más importante, el estimador MCO del coeficiente en una tendencia lineal converge todo un orden de magnitud más rápido (a una tasa ) a su verdadero valor que para los regresores fijos ( n - 1 / 2 ), lo que significa que usted puede estimar constantemente la tendencia incluso si descuida las variables estacionarias. Esto contrasta con la estimación de los efectos de las variables estacionarias una por una, donde pierde coherencia si omite variables. n3/2n1/2
Richard Hardy

Respuestas:

15

Eres astuto al sentir que puede haber conflicto entre los supuestos clásicos de la regresión lineal de mínimos cuadrados ordinarios y la dependencia serial que se encuentra comúnmente en la configuración de series de tiempo.

Considere la Asunción 1.2 (Exogeneidad estricta) de la Econometría de Fumio Hayashi .

E[ϵiX]=0

Esto a su vez implica , que cualquier residuo ϵ i es ortogonal a cualquier regresor x j . Como señala Hayashi, esta suposición se viola en el modelo autorregresivo más simple . [1] Considere el proceso AR (1):E[ϵixj]=0ϵixj

yt=βyt1+ϵt

Podemos ver que será un regresor para y t + 1 , pero ϵ t no es ortogonal a y t (es decir, E [ ϵ t y t ] 0 ).ytyt+1ϵtytE[ϵtyt]0

Como se viola el supuesto estricto de exogeneidad, ¡ninguno de los argumentos que se basan en ese supuesto se puede aplicar a este modelo AR (1) simple!

¿Entonces tenemos un problema insoluble?

No, nosotros no! La estimación de modelos AR (1) con mínimos cuadrados ordinarios es un comportamiento estándar completamente válido. ¿Por qué todavía puede estar bien?

Muestra grande, los argumentos asintóticos no necesitan una exogenitud estricta. Una suposición suficiente (que se puede usar en lugar de una exogeneidad estricta) es que los regresores están predeterminados , que los regresores son ortogonales al término de error contemporáneo. Vea el Capítulo 2 de Hayashi para una discusión completa.

Referencias

[1] Fumio Hayashi, Econometría (2000), p. 35

[2] ibíd., P. 134

Matthew Gunn
fuente
6

Los métodos básicos de regresión del tipo de mínimos cuadrados no suponen que los valores de y son iid. Suponen que los residuos (es decir, el valor de y menos la tendencia verdadera) son iid

Existen otros métodos de regresión que hacen suposiciones diferentes, pero eso probablemente complicaría demasiado esta respuesta.

Geoffrey Brent
fuente
55
Supuesto que también es claramente falso: solo piense en una serie temporal con una tendencia lineal y estacionalidad. Los residuos restantes de la regresión lineal están claramente correlacionados, por lo tanto, no iid.
DeltaIV
3

Es una buena pregunta! El problema ni siquiera se menciona en mis libros de series de tiempo (probablemente necesito mejores libros :) En primer lugar, tenga en cuenta que no está obligado a usar la regresión lineal para reducir la tendencia de una serie de tiempo, si la serie tiene una tendencia estocástica (raíz unitaria )- podrías simplemente tomar la primera diferencia. Pero debe usar la regresión lineal, si la serie tiene una tendencia determinista. En este caso, es cierto que los residuos no son iid, como usted dice. Solo piense en una serie que tenga una tendencia lineal, componentes estacionales, componentes cíclicos, etc., todos juntos: después de la regresión lineal, los residuos son casi independientes. El punto es que no estás usando regresión lineal para hacer predicciones o para formar intervalos de predicción. Es solo una parte de su procedimiento de inferencia: aún necesita aplicar otros métodos para llegar a residuos no correlacionados. Entonces, mientras que la regresión lineal per se no es un procedimiento de inferencia válido (no es el modelo estadístico correcto) para la mayoría de las series de tiempo, un procedimiento que incluye regresión lineal ya que uno de sus pasos puede ser un modelo válido, si el modelo que asume corresponde al proceso de generación de datos para el series de tiempo.

DeltaIV
fuente
3
No diferencie si tiene una tendencia determinista: la diferenciación solo es apropiada para las tendencias estocásticas (raíces unitarias). Si diferencia una serie sin una raíz unitaria, introducirá un tipo de error de promedio móvil integrado en el modelo, y eso es desagradable.
Richard Hardy
1
Creo que quieres decir diferencia, no diferenciar.
Hong Ooi
@RichardHardy interesante. ¿Qué quieres decir con "tendencia estocástica"? ¿Te refieres a los ciclos? haríayt=β0 0+β1yt-1+ϵt¿Tiene una tendencia estocástica o determinista según su definición?
DeltaIV
1
@HongOoi, sí, mi mal, quise diferenciar, no diferenciar. DeltaIV, se dice que una serie temporal tiene una tendencia estocástica si la serie temporal es un proceso integrado (= raíz unitaria). Este es un término estándar en la literatura de raíz unitaria y cointegración. Me pregunto si tiene diferentes significados en otros hilos de la literatura. En cualquier caso, la sobrediferenciación (= diferenciar una serie de tiempo que no tiene una raíz unitaria) es un fenómeno notorio y debe evitarse.
Richard Hardy
@ RichardHardy ok, gracias. Trataré de documentarme sobre la definición de proceso integrado y raíces de unidad. Para empezar, ¿puede decirme si la serie que propuse está integrada o no? ¿Son las raíces a las que te refieres, las raíces del polinomio?y=β0 0+simitun1X1?
DeltaIV