¿Relación y diferencia entre series de tiempo y regresión?

12

¿Qué relación y diferencia hay entre series de tiempo y regresión?

Para modelos y supuestos , ¿es correcto que los modelos de regresión asuman independencia entre las variables de salida para diferentes valores de la variable de entrada, mientras que el modelo de serie temporal no lo hace? ¿Cuáles son algunas otras diferencias?

Para métodos , de un sitio web de Darlington

Existen varios enfoques para el análisis de series temporales, pero los dos más conocidos son el método de regresión y el método Box-Jenkins (1976) o ARIMA (promedio móvil integrado autorregresivo). Este documento presenta el método de regresión. Considero que el método de regresión es muy superior al ARIMA por tres razones principales.

No entiendo muy bien cuál es el "método de regresión" para las series temporales en el sitio web, y cómo es diferente del método Box-Jenkins o ARIMA. Agradezco si alguien puede dar algunas ideas sobre esas preguntas.

¡Gracias y saludos!

Tim
fuente
2
La mayoría de las respuestas y comentarios aquí se centran en la pregunta más específica hacia el final. Esto es solo una señal de que el análisis de series temporales es mucho, mucho más que Box-Jenkins o ARIMA. Los campos completos de análisis de series temporales tienen un enfoque bastante diferente (o al menos más general). Los modelos de componentes no observados son solo uno de varios ejemplos.
Nick Cox

Respuestas:

17

Realmente creo que esta es una buena pregunta y merece una respuesta. El enlace provisto está escrito por un psicólogo que afirma que algún método de elaboración casera es una mejor manera de hacer análisis de series de tiempo que Box-Jenkins. Espero que mi intento de respuesta aliente a otros, que tienen más conocimientos sobre series de tiempo, a contribuir.

Desde su introducción, parece que Darlington está defendiendo el enfoque de simplemente ajustar un modelo AR por mínimos cuadrados. Es decir, si desea ajustar el modelo a la serie temporal , simplemente puede hacer una regresión de la serie en la serie con retraso , retraso , y así sucesivamente hasta el retraso , usando una regresión múltiple ordinaria. Esto ciertamente está permitido; en R, es incluso una opción en la función. Lo probé y tiende a dar respuestas similares al método predeterminado para ajustar un modelo AR en R.

zt=α1zt-1++αkzt-k+εt
ztzt12kar

También aboga por hacer retroceder en cosas como o poderes de para encontrar tendencias. De nuevo, esto está absolutamente bien. Muchos libros de series de tiempo discuten esto, por ejemplo Shumway-Stoffer y Cowpertwait-Metcalfe. Por lo general, un análisis de series de tiempo podría proceder en las siguientes líneas: encuentra una tendencia, la elimina y luego ajusta un modelo a los residuos.zttt

Pero parece que también está abogando por un ajuste excesivo y luego usa la reducción del error cuadrático medio entre la serie ajustada y los datos como evidencia de que su método es mejor. Por ejemplo:

Siento que los correlogramas ahora son obsoletos. Su propósito principal era permitir a los trabajadores adivinar qué modelos se ajustan mejor a los datos, pero la velocidad de las computadoras modernas (al menos en regresión, si no en el ajuste de modelos de series de tiempo) permite a un trabajador simplemente ajustar varios modelos y ver exactamente cómo cada uno se ajusta según lo medido por el error cuadrático medio. [El tema de la capitalización del azar no es relevante para esta elección, ya que los dos métodos son igualmente susceptibles a este problema.]

Esta no es una buena idea porque se supone que la prueba de un modelo es qué tan bien puede pronosticar, no qué tan bien se ajusta a los datos existentes. En sus tres ejemplos, utiliza el "error cuadrático medio ajustado de raíz" como criterio para la calidad del ajuste. Por supuesto, el ajuste excesivo de un modelo hará que una estimación de error en la muestra sea más pequeña, por lo que su afirmación de que sus modelos son "mejores" porque tienen un RMSE más pequeño está mal.

En pocas palabras, dado que está utilizando el criterio incorrecto para evaluar qué tan bueno es un modelo, llega a conclusiones erróneas sobre la regresión frente a ARIMA. Apostaría a que, si hubiera probado la capacidad predictiva de los modelos, ARIMA habría salido adelante. Quizás alguien pueda intentarlo si tiene acceso a los libros que menciona aquí .

[Complementario: para obtener más información sobre la idea de regresión, es posible que desee consultar los libros de series de tiempo más antiguos que se escribieron antes de que ARIMA se convirtiera en el más popular. Por ejemplo, Kendall, Time-Series , 1973, Capítulo 11 tiene un capítulo completo sobre este método y comparaciones con ARIMA.]

Flounderer
fuente
La pregunta es ¿cuáles son las diferencias (inherentes)?
hbaghishani
Por lo que puedo decir, el autor nunca describió su método de elaboración casera en una publicación revisada por pares y las referencias a y desde la literatura estadística parecen mínimas y sus principales publicaciones sobre temas metodológicos datan de los años 70. Hablando estrictamente, nada de esto "prueba" nada, pero sin suficiente tiempo o experiencia para evaluar las afirmaciones por mí mismo, sería extremadamente reacio a utilizarlo.
Gala
@hbaghishani la diferencia sustancial es que los datos autocorrelacionados, es decir, dentro de cada serie distorsionan la interpretación de correlación cruzada. Además, las violaciones de Gauss, por ejemplo, la media constante de los errores, la variación constante en el tiempo, los parámetros constantes en el tiempo deben considerarse / rectificarse.
IrishStat
@flounderer La gente escribe libros de texto para venderlos y cosechar recompensas. A veces incluyen métodos anacrónicos que se enseñan incorrectamente porque en una fecha anterior se pensaba que eran correctos. Para aumentar las ventas, el editor a menudo exige (desde mi experiencia personal) una metodología desactualizada pero incorrecta porque estos métodos están en el programa de estudios.
IrishStat
El modelado @IrishStat de datos autocorrelacionados podría realizarse mediante modelos de regresión dinámica. Además, otros modelos, como los modelos mixtos, podrían usarse para dichos datos. Entonces, no creo que esta característica sea la diferencia sustancial.
hbaghishani
7

El profesor E. Parzen, tal vez algo envidioso de no haber propuesto los métodos innovadores de Box y Jenkins, sugirió este enfoque de ajuste excesivo y luego renunciar. Falla por muchas razones (muchas de las cuales Flounderer ha resumido muy bien), incluyendo no identificar y remediar Pulsos, Cambios de nivel, Pulsos estacionales y Tendencias de hora local. Además, los cambios en los parámetros a lo largo del tiempo o los cambios en la varianza del error a lo largo del tiempo deben considerarse.

Escribí un artículo que podría interesarle. Se llama "Regresión contra Box-Jenkins" y está disponible en http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting / doc_download / 24-regression-vs-box-jenkins

Un comentario sobre el procedimiento de Darlington que refleja el tiempo, tiempo * tiempo, tiempo * tiempo * tiempo * tiempo como predictores. En ausencia de la detección de intervención que conduzca al aislamiento de los efectos atípicos, es muy posible (¡e incorrecto!) Concluir para obtener mayores poderes de tiempo. Tenga cuidado con los no estadísticos que realizan análisis estadísticos, ya que desconfiaría de los estadísticos que realizan cirugía cerebral. Para ser justos, también se debe tener cuidado con los estadísticos / matemáticos que no son series de tiempo que intentan realizar análisis de series de tiempo con capacitación limitada en análisis de series de tiempo.

Otros carteles (particularmente whuber) en esta lista han advertido repetidamente contra el uso de este "enfoque apropiado", principalmente en un entorno univariante. Esta advertencia también se aplica a los modelos causales.

Espero que esto ayude.

IrishStat
fuente