¿Cuál es la mejor manera de dividir los datos de series temporales en conjuntos de tren / prueba / validación, donde el conjunto de validación se usaría para el ajuste de hiperparámetros?
Tenemos 3 años de datos de ventas diarias, y nuestro plan es usar 2015-2016 como datos de capacitación, luego muestrear al azar 10 semanas de los datos de 2017 para usar como conjunto de validación, y otras 10 semanas de datos de 2017 para El conjunto de prueba. Luego haremos un avance en cada uno de los días en el conjunto de prueba y validación.
fuente