El problema con el que estoy lidiando es predecir valores de series de tiempo. Estoy mirando una serie de tiempo a la vez y, por ejemplo, en base al 15% de los datos de entrada, me gustaría predecir sus valores futuros. Hasta ahora me he encontrado con dos modelos:
He probado ambos y leí algunos artículos sobre ellos. Ahora estoy tratando de tener una mejor idea de cómo comparar los dos. Lo que he encontrado hasta ahora:
- LSTM funciona mejor si se trata de una gran cantidad de datos y hay suficientes datos de capacitación disponibles, mientras que ARIMA es mejor para conjuntos de datos más pequeños (¿es esto correcto?)
- ARIMA requiere una serie de parámetros
(p,q,d)
que deben calcularse en función de los datos, mientras que LSTM no requiere establecer dichos parámetros. Sin embargo, hay algunos hiperparámetros que necesitamos ajustar para LSTM.
Aparte de las propiedades mencionadas anteriormente, no pude encontrar ningún otro punto o hecho que pudiera ayudarme a seleccionar el mejor modelo. Estaría realmente agradecido si alguien pudiera ayudarme a encontrar artículos, documentos u otras cosas (hasta ahora no tuve suerte, solo algunas opiniones generales aquí y allá y nada basado en experimentos).
Debo mencionar que originalmente estoy tratando con datos de transmisión, sin embargo, por ahora estoy usando conjuntos de datos NAB que incluyen 50 conjuntos de datos con el tamaño máximo de 20k puntos de datos.
fuente
Respuestas:
Una comparación de la red neuronal artificial y los modelos de series de tiempo para pronosticar los precios de los productos básicos compara el desempeño de ANN y ARIMA en la predicción de series de tiempo financieras. Creo que es un buen punto de partida para su revisión de la literatura.
En muchos casos, las redes neuronales tienden a superar a los modelos basados en AR. Sin embargo, creo que un inconveniente importante (que no se discute tanto en la literatura académica) con métodos de aprendizaje automático más avanzados es que usan cajas negras. Este es un gran problema si tuviera que explicar cómo funciona el modelo a alguien que no conoce mucho de estos modelos (por ejemplo, en una corporación). Pero si está haciendo este análisis solo como un trabajo escolar, no creo que esto sea un problema.
Pero, como dijo el comentarista anterior, generalmente la mejor manera es formar un estimador de conjunto en el que combine dos o más modelos.
fuente