Después de leer uno de los "Consejos de investigación" de RJ Hyndman sobre validación cruzada y series de tiempo, volví a una vieja pregunta mía que trataré de formular aquí. La idea es que en los problemas de clasificación o regresión, el orden de los datos no es importante y, por lo tanto, se puede usar la validación cruzada de k- pliegues. Por otro lado, en series de tiempo, el orden de los datos es obviamente de gran importancia.
Sin embargo, cuando se utiliza un modelo de máquina de la serie de tiempo de predicción de aprendizaje, es una estrategia común para formar de nuevo la serie en un conjunto de "vectores de entrada-salida", que, durante un tiempo t , tienen la forma ( y t - n + 1 , . . . , Y t - 1 , y t ; y t + 1 ) .
Ahora, una vez realizada esta remodelación, ¿podemos considerar que no es necesario ordenar el conjunto resultante de "vectores de entrada-salida"? Si usamos, por ejemplo, una red neuronal de avance con n entradas para "aprender" estos datos, llegaríamos a los mismos resultados sin importar el orden en que mostramos los vectores al modelo. Y, por lo tanto, ¿podríamos usar la validación cruzada k-fold de la manera estándar, sin la necesidad de ajustar el modelo cada vez?