Previsión de series de tiempo de Arima (auto.arima) con múltiples variables exógenas en R

14

Me gustaría realizar un pronóstico basado en un modelo ARIMA de series de tiempo múltiples con múltiples variables exógenas. Como no soy tan hábil con respecto a las estadísticas ni a RI que quiero mantener, es lo más simple posible (el pronóstico de tendencia para 3 meses es suficiente).

Tengo 1 serie temporal dependiente y 3-5 series temporales predictivas, todos los datos mensuales, sin brechas, "horizonte" al mismo tiempo.

Encontré la función auto.arima y me pregunté si sería una solución adecuada para mi problema. Tengo diferentes precios de productos básicos y precios de productos hechos a partir de ellos. Todos los datos sin procesar no son estacionarios, pero a través de la diferenciación de primer orden, todos se convierten en datos estacionarios. ADF, KPSS indican esto. (Esto significa que he probado la integración, ¿verdad?).

Mi pregunta ahora es: ¿Cómo aplico esto con la función auto.arima Y es ARIMA el enfoque correcto de todos modos? Algunas personas ya me aconsejaron usar VAR, pero ¿es posible también con ARIMA?

La siguiente tabla son mis datos. En realidad, el conjunto de datos aumenta hasta 105 observaciones, pero los primeros 50 lo harán. La tendencia y la estacionalidad obviamente son de interés aquí.

ingrese la descripción de la imagen aquí

Gracias por cualquier consejo y ayuda! Georg

Jorge
fuente
publique sus datos para que puedan descargarse. usar excel. Esto podría ser simplemente una tarea para identificar series de entrada innecesarias (posiblemente significativamente correlacionadas). Me Don; t piensa que es necesario o VAR Componentes Principio útil para este problema
IrishStat

Respuestas:

10

Si sus regresores externos son causales para , pero no al revés y no se causan entre sí, entonces ARIMA es definitivamente apropiado. VAR tiene sentido si sus diferentes series de tiempo dependen unas de otras.y

Para auto.arima()trabajar con regresores externos, recopile sus regresores en una matriz X, que usted ingresa en el xregparámetro auto.arima(). (Por supuesto, Xdebe tener el mismo número de filas que la serie de tiempo yque está modelando).

Para el pronóstico, necesitará los valores futuros de sus regresores, que luego volverá a introducir en el xregparámetro forecast.

Las páginas de ayuda son ?auto.arimay ?forecast.Arima(tenga en cuenta la A mayúscula, esto no es un error tipográfico. No me pregunte ...).

Stephan Kolassa
fuente
1
(+1) Podrías elaborar un poco más sobre la idea de causalidad y cómo probarla. Puede ser útil para completar su respuesta, ya que usted menciona que la decisión de usar ARIMA está determinada por la dirección de causalidad entre las variables. ¿Está pensando, por ejemplo, en la prueba de causalidad de Granger o la prueba de Hausman ? Gracias.
javlacalle
3
@javlacalle: No soy un gran admirador de las pruebas estadísticas de causalidad (de las cuales la prueba de Granger es la más conocida). Prefiero decidir sobre la "causalidad probable" basada en el tema. Por ejemplo, no usaría una prueba de Granger para evaluar si una reducción de precio aumenta las ventas de supermercados o al revés. Tampoco si el PIB, los tipos de cambio y la creación de empleo son mutuamente causales. En ambos casos, el asunto parece bastante obvio, y una prueba en línea con la teoría no nos enseñará nada, mientras que una prueba que contradiga la teoría solo será confusa (y probablemente no sea más que ruido).
Stephan Kolassa
1
... Sé que me estoy abriendo fuego con mi último comentario ;-)
Stephan Kolassa
@ Stephan: Gracias por tu aporte. Aunque mi y es definitivamente causada por mis regresores y no al revés, mis regresores definitivamente se correlacionan entre sí y también deberían tener impactos más o menos directos entre sí. Según su comentario, esto significa que debería usar VAR en lugar de arima, ya que esto evitará problemas (?). Estoy usando un paquete de productos / precios de productos aquí, que básicamente todos están relacionados entre sí hasta cierto punto. La "materia prima" es mi Y, mis productos de la cadena de valor, así como los productos secundarios, etc. son mis predictores.
George
1
Conocer el contexto de los datos siempre es útil y los resultados de cualquier análisis deben compararse con nuestro conocimiento a priori . No obstante, se recomienda cierta precaución. La intuición a veces falla y las teorías que a veces se dan por sentadas se basan en suposiciones que no están respaldadas por hechos. Pero entiendo lo que quieres decir y estoy de acuerdo en general.
javlacalle