Predicción de series de tiempo usando ARIMA vs LSTM

9

El problema con el que estoy lidiando es predecir valores de series de tiempo. Estoy mirando una serie de tiempo a la vez y, por ejemplo, en base al 15% de los datos de entrada, me gustaría predecir sus valores futuros. Hasta ahora me he encontrado con dos modelos:

  • LSTM (memoria a largo plazo; una clase de redes neuronales recurrentes)
  • ARIMA

He probado ambos y leí algunos artículos sobre ellos. Ahora estoy tratando de tener una mejor idea de cómo comparar los dos. Lo que he encontrado hasta ahora:

  1. LSTM funciona mejor si se trata de una gran cantidad de datos y hay suficientes datos de capacitación disponibles, mientras que ARIMA es mejor para conjuntos de datos más pequeños (¿es esto correcto?)
  2. ARIMA requiere una serie de parámetros (p,q,d)que deben calcularse en función de los datos, mientras que LSTM no requiere establecer dichos parámetros. Sin embargo, hay algunos hiperparámetros que necesitamos ajustar para LSTM.

Aparte de las propiedades mencionadas anteriormente, no pude encontrar ningún otro punto o hecho que pudiera ayudarme a seleccionar el mejor modelo. Estaría realmente agradecido si alguien pudiera ayudarme a encontrar artículos, documentos u otras cosas (hasta ahora no tuve suerte, solo algunas opiniones generales aquí y allá y nada basado en experimentos).

Debo mencionar que originalmente estoy tratando con datos de transmisión, sin embargo, por ahora estoy usando conjuntos de datos NAB que incluyen 50 conjuntos de datos con el tamaño máximo de 20k puntos de datos.

ahajib
fuente
1
¿Por qué no pruebas los dos modelos en parte de tus datos, ves cuál es mejor para pronosticar y los eliges? O use ambos modelos y combine sus pronósticos. Las combinaciones de pronósticos a menudo superan a los pronósticos individuales.
Richard Hardy
@RichardHardy Ya lo he hecho y soy consciente de su rendimiento en mis conjuntos de datos. Estoy tratando de comprender mejor ambos, especialmente sus inconvenientes para ver cuál podría ser el mejor candidato para manejar las próximas muestras de datos.
ahajib
Lea el centro de ayuda , en particular el último párrafo que dice " Tenga en cuenta, sin embargo, que no se recomienda la publicación cruzada en los sitios de SE. Elija la mejor ubicación para publicar su pregunta. Más tarde, si resulta más adecuado en otro sitio, se puede migrar. "
Glen_b -Reinstate Monica

Respuestas:

2

Una comparación de la red neuronal artificial y los modelos de series de tiempo para pronosticar los precios de los productos básicos compara el desempeño de ANN y ARIMA en la predicción de series de tiempo financieras. Creo que es un buen punto de partida para su revisión de la literatura.

En muchos casos, las redes neuronales tienden a superar a los modelos basados ​​en AR. Sin embargo, creo que un inconveniente importante (que no se discute tanto en la literatura académica) con métodos de aprendizaje automático más avanzados es que usan cajas negras. Este es un gran problema si tuviera que explicar cómo funciona el modelo a alguien que no conoce mucho de estos modelos (por ejemplo, en una corporación). Pero si está haciendo este análisis solo como un trabajo escolar, no creo que esto sea un problema.

Pero, como dijo el comentarista anterior, generalmente la mejor manera es formar un estimador de conjunto en el que combine dos o más modelos.

Juha
fuente
77
La referencia que citó trata de redes neuronales simples de retroalimentación y es demasiado antigua para ser útil (la década de 1990 es hace un siglo). La pregunta OP se refiere a la red neuronal recurrente con la arquitectura LSTM y este documento no cubre eso.
horaceT
1
Como @horaceT mencionó, este documento está un poco desactualizado y si pudiera sugerir un documento más reciente que incluya información sobre LSTM sería increíble. Gracias
ahajib