Solo una pregunta general. Si tiene datos de series de tiempo, ¿cuándo es mejor usar técnicas de series de tiempo (aka, ARCH, GARCH, etc.) sobre técnicas de aprendizaje automático / estadístico (KNN, regresión)? Si hay una pregunta similar que existe en la validación cruzada, por favor apúnteme hacia ella: busqué y no pude encontrar una.
10
Respuestas:
Los métodos típicos de aprendizaje automático suponen que sus datos son independientes e idénticamente distribuidos, lo que no es cierto para los datos de series temporales. Por lo tanto, están en desventaja en comparación con las técnicas de series temporales, en términos de precisión. Para ver ejemplos de esto, consulte las preguntas anteriores Ordenamiento de series de tiempo para aprendizaje automático y bosque aleatorio está sobreajustado .
fuente
Francis Diebold publicó recientemente "ML and Metrics VI: A Key Difference Between ML and TS Econometrics" en su blog. Estoy proporcionando una versión abreviada, por lo que todo el crédito va para él. (El énfasis en negrita es mío).
Así, la conclusión es:
Recomiendo leer toda la publicación original aquí .
fuente
Como señaló @Tom Minka, la mayoría de las técnicas de ML asumen entradas iid. Sin embargo, hay algunas soluciones:
Se pueden usar todas las muestras de series de tiempo pasadas dentro de la 'Memoria' del sistema como un vector de características, es decir: x = [x (t-1), x (t-2), ... x (tM)]. Sin embargo, esto tiene 2 problemas: 1) dependiendo de su binning, puede tener un gran vector de características 2- algunos métodos requieren que las características dentro del vector de características sean independientes, lo cual no es el caso aquí.
Existen muchas técnicas de ML que están específicamente diseñadas para tales datos de series temporales, por ejemplo, modelos ocultos de Markov, que se han utilizado con mucho éxito para la detección de ataques, el procesamiento del habla, etc.
Finalmente, un enfoque que he tomado es usar técnicas de 'extracción de características' para convertir un problema de regresión dinámica (que tiene el elemento del tiempo) en uno estático. Por ejemplo, el enfoque del modo de dinámica principal (PDM) asigna el vector de características pasado de entrada ([x (t-1), x (t-2), ... x (tM)]) en uno estático ([v ( 1), v (2), .. v (L)]) convolucionando el pasado con un banco de filtros lineal específico del sistema (PDM), ver Marmarelis, libro de 2004 o Marmarelis, Vasilis Z. "Metodología de modelado para sistemas fisiológicos no lineales ". Anales de ingeniería biomédica 25.2 (1997): 239-251 ...
fuente