¿Qué relación y diferencia hay entre series de tiempo y regresión?
Para modelos y supuestos , ¿es correcto que los modelos de regresión asuman independencia entre las variables de salida para diferentes valores de la variable de entrada, mientras que el modelo de serie temporal no lo hace? ¿Cuáles son algunas otras diferencias?
Para métodos , de un sitio web de Darlington
Existen varios enfoques para el análisis de series temporales, pero los dos más conocidos son el método de regresión y el método Box-Jenkins (1976) o ARIMA (promedio móvil integrado autorregresivo). Este documento presenta el método de regresión. Considero que el método de regresión es muy superior al ARIMA por tres razones principales.
No entiendo muy bien cuál es el "método de regresión" para las series temporales en el sitio web, y cómo es diferente del método Box-Jenkins o ARIMA. Agradezco si alguien puede dar algunas ideas sobre esas preguntas.
¡Gracias y saludos!
Respuestas:
Realmente creo que esta es una buena pregunta y merece una respuesta. El enlace provisto está escrito por un psicólogo que afirma que algún método de elaboración casera es una mejor manera de hacer análisis de series de tiempo que Box-Jenkins. Espero que mi intento de respuesta aliente a otros, que tienen más conocimientos sobre series de tiempo, a contribuir.
Desde su introducción, parece que Darlington está defendiendo el enfoque de simplemente ajustar un modelo AR por mínimos cuadrados. Es decir, si desea ajustar el modelo a la serie temporal , simplemente puede hacer una regresión de la serie en la serie con retraso , retraso , y así sucesivamente hasta el retraso , usando una regresión múltiple ordinaria. Esto ciertamente está permitido; en R, es incluso una opción en la función. Lo probé y tiende a dar respuestas similares al método predeterminado para ajustar un modelo AR en R.
ar
También aboga por hacer retroceder en cosas como o poderes de para encontrar tendencias. De nuevo, esto está absolutamente bien. Muchos libros de series de tiempo discuten esto, por ejemplo Shumway-Stoffer y Cowpertwait-Metcalfe. Por lo general, un análisis de series de tiempo podría proceder en las siguientes líneas: encuentra una tendencia, la elimina y luego ajusta un modelo a los residuos.zt t t
Pero parece que también está abogando por un ajuste excesivo y luego usa la reducción del error cuadrático medio entre la serie ajustada y los datos como evidencia de que su método es mejor. Por ejemplo:
Esta no es una buena idea porque se supone que la prueba de un modelo es qué tan bien puede pronosticar, no qué tan bien se ajusta a los datos existentes. En sus tres ejemplos, utiliza el "error cuadrático medio ajustado de raíz" como criterio para la calidad del ajuste. Por supuesto, el ajuste excesivo de un modelo hará que una estimación de error en la muestra sea más pequeña, por lo que su afirmación de que sus modelos son "mejores" porque tienen un RMSE más pequeño está mal.
En pocas palabras, dado que está utilizando el criterio incorrecto para evaluar qué tan bueno es un modelo, llega a conclusiones erróneas sobre la regresión frente a ARIMA. Apostaría a que, si hubiera probado la capacidad predictiva de los modelos, ARIMA habría salido adelante. Quizás alguien pueda intentarlo si tiene acceso a los libros que menciona aquí .
[Complementario: para obtener más información sobre la idea de regresión, es posible que desee consultar los libros de series de tiempo más antiguos que se escribieron antes de que ARIMA se convirtiera en el más popular. Por ejemplo, Kendall, Time-Series , 1973, Capítulo 11 tiene un capítulo completo sobre este método y comparaciones con ARIMA.]
fuente
El profesor E. Parzen, tal vez algo envidioso de no haber propuesto los métodos innovadores de Box y Jenkins, sugirió este enfoque de ajuste excesivo y luego renunciar. Falla por muchas razones (muchas de las cuales Flounderer ha resumido muy bien), incluyendo no identificar y remediar Pulsos, Cambios de nivel, Pulsos estacionales y Tendencias de hora local. Además, los cambios en los parámetros a lo largo del tiempo o los cambios en la varianza del error a lo largo del tiempo deben considerarse.
Escribí un artículo que podría interesarle. Se llama "Regresión contra Box-Jenkins" y está disponible en http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting / doc_download / 24-regression-vs-box-jenkins
Un comentario sobre el procedimiento de Darlington que refleja el tiempo, tiempo * tiempo, tiempo * tiempo * tiempo * tiempo como predictores. En ausencia de la detección de intervención que conduzca al aislamiento de los efectos atípicos, es muy posible (¡e incorrecto!) Concluir para obtener mayores poderes de tiempo. Tenga cuidado con los no estadísticos que realizan análisis estadísticos, ya que desconfiaría de los estadísticos que realizan cirugía cerebral. Para ser justos, también se debe tener cuidado con los estadísticos / matemáticos que no son series de tiempo que intentan realizar análisis de series de tiempo con capacitación limitada en análisis de series de tiempo.
Otros carteles (particularmente whuber) en esta lista han advertido repetidamente contra el uso de este "enfoque apropiado", principalmente en un entorno univariante. Esta advertencia también se aplica a los modelos causales.
Espero que esto ayude.
fuente