¿Hay alguna diferencia entre una serie temporal autocorrelacionada y errores autocorrelacionados en serie?

9

Estoy bastante seguro de que me falta algo obvio aquí, pero estoy bastante confundido con diferentes términos en el campo de series de tiempo. Si lo entiendo correctamente, los errores autocorrelacionados en serie son un problema en los modelos de regresión (ver, por ejemplo, aquí ). Mi pregunta ahora es ¿qué define exactamente un error autocorrelacionado? Conozco la definición de autocorrelación y puedo aplicar las fórmulas, pero esto es más un problema de comprensión con series de tiempo en regresiones.

Por ejemplo, tomemos la serie temporal de temperaturas diarias: si hoy es un día caluroso (¡horario de verano!), Probablemente también haga calor mañana, y viceversa. Creo que tengo un problema para llamar a este fenómeno un fenómeno de "errores autocorrelacionados en serie" porque simplemente no me parece un error, sino algo esperado.

Más formalmente, supongamos una configuración de regresión con una variable dependiente y una variable independiente y el modelo.ytxt

yt=α+βxt+ϵt

¿Es posible que esté autocorrelacionado, mientras que es iid? Si es así, ¿qué significa eso para todos los métodos que ajustan los errores estándar para la autocorrelación? ¿Todavía tiene que hacer eso o solo se aplican a errores autocorrelacionados? ¿O siempre modelaría la autocorrelación en tal configuración en el término de error, por lo que básicamente no hace una diferencia si está autocorrelacionado o ?xtϵtxtet

Esta es mi primera pregunta aquí. Espero que no sea demasiado confuso y espero no haber pasado por alto nada obvio ... También intenté buscarlo en Google y encontré algunos enlaces interesantes (por ejemplo, aquí en SA ), pero nada realmente me ayudó.

Christoph_J
fuente

Respuestas:

7

Me parece que te estás obsesionando con la diferencia entre la autorregresión (la temperatura de hoy está influenciada por la temperatura de ayer, o mi consumo de heroína hoy depende de mi uso anterior de drogas) y los errores autocorrelacionados (que tienen que ver con la falta de diagonal términos en términos de varianza-covarianza paraϵser distinto de cero Siguiendo con su ejemplo del clima, suponga que modela la temperatura en función del tiempo, pero también está influenciada por cosas como las erupciones volcánicas, que dejó fuera de su modelo. El volcán envía nubes de polvo, que bloquean el sol, bajando la temperatura. Esta perturbación aleatoria persistirá durante más de un período. Esto hará que su tendencia temporal parezca menos pronunciada de lo que debería ser. Para ser justos, es probable que tanto la autorregresión como los errores autocorrelacionados sean un problema con la temperatura.

Los errores autocorrelacionados también pueden surgir en datos espaciales transversales, donde un shock aleatorio que afecta la actividad económica en una región se extenderá a otras áreas porque tienen vínculos económicos. Un shock que mata las uvas en California también reducirá las ventas de carne de res de Montana. También puede inducir perturbaciones autocorrelacionadas si omite una variable independiente relevante y autocorrelacionada de su modelo de serie temporal.

Dimitriy V. Masterov
fuente
Muchas gracias, Dimitriy. Lo entendiste bien: me confundí acerca de la diferencia entre la autorregresión y los errores autocorrelacionados. Sin embargo, solo para asegurarme: en mi ejemplo, como una serie temporal autorregresiva (abstracción de erupciones volcánicas, etc.) debido a los tiempos de verano e invierno y luego no tendría que lidiar con errores autocorrelacionados. xt
Christoph_J
1
@ Christoph_J Idealmente, desea retroceder una o más demoras para el patrón estacional y la actividad volcánica. Si en cambio ignoramos la causa de los errores autocorrelacionados, un modelo de promedio móvil puede ayudar. En este caso sería un modelo ARIMA.
Robert Kubrick
1
@ Christoph_J No estoy seguro de entender tu pregunta. ¿Querías escribir?yt¿encima? También debe contarnos más sobre el problema real con el que está lidiando. Mi ejemplo de temperatura fue solo un modelo de juguete para resaltar los problemas. Hay varias soluciones para tratar con AR, la más fácil de las cuales es la especificación de retraso distribuido de Koyck, que se reduce a estimar una ecuación simple con unMA(1)término de error. Sin embargo, aún debe realizar algún tipo de prueba de autocorrelación, como el Durbin-Watson, aunque eso puede darle un falso positivo si no obtiene la especificación correcta.
Dimitriy V. Masterov
Gracias a los dos. @ DimitriyV.Masterov En este momento, no tengo un problema real. Esa es la razón por la que traté de enmarcar mi problema de la manera más general posible. Creo que solo lucho con las series de tiempo por un lado y las regresiones por otro lado. A veces parecen ser dos cuestiones completamente diferentes; si lo entiendo bien, hay casos en los que simplemente intentas modelar una serie temporal (¿cuántos retrasos tiene? ¿Es estacionaria? etc.). En el otro extremo, a veces pareces retroceder una serie de tiempo en el otro, sin prestar mucha atención al hecho de que es un TS.
Christoph_J
Y a veces tengo algunos problemas, ¿cuál es la mejor manera de avanzar? ¿Tengo que modelar el proceso autorregresivo primero o puedo corregir la autocorrelación en los términos de error? Sin embargo, en lo que respecta a mi pregunta, su respuesta y la de Robert ayudaron mucho y creo que en mi campo (modelos de factores en finanzas) debería tratar los errores autocorrelacionados en serie, no con la autorregresión. Si surge otra pregunta, haría una nueva pregunta.
Christoph_J
4

Solo para agregar a Dimitriy una muy buena respuesta: la autocorrelación de errores plantea problemas para el cálculo del coeficiente de error estándar y, por lo tanto, los niveles de significancia o valor p, lo que hace que la selección de IV sea menos sencilla. R2 y el valor F también se ven afectados.

De todos los supuestos en la regresión lineal (homocedasticidad, independencia de los residuos, linealidad de la relación IVs -> DV, normalidad de los residuos), la linealidad y la independencia de los residuos son los que impactan los resultados más seriamente si se violan.

Robert Kubrick
fuente