Cálculo del error de pronóstico con validación cruzada de series temporales

13

Tengo un modelo de pronóstico para una serie temporal y quiero calcular su error de predicción fuera de la muestra. Por el momento, la estrategia que estoy siguiendo es la sugerida en el blog de Rob Hyndman (cerca de la parte inferior de la página) que es así (suponiendo una serie temporal un conjunto de entrenamiento de tamaño k )y1,...,ynortek

  1. Ajustar el modelo a los datos y deje y t + k sea el pronóstico para la siguiente observación.yt,...,yt+k-1y^t+k
  2. Calcular el error de pronóstico como .mit=y^t+k-yt+k
  3. Repita para t=1,...,norte-k
  4. Calcule el error cuadrático medio como MSE=1norte-kt=1norte-kmit2

metroy^t+k,...,y^t+k+metro-1mit,1,...,mit,metro

metro

Agradecería una explicación aquí o enlaces a algún lugar donde pueda encontrar resultados teóricos sobre los intervalos de confianza alrededor del MSE (u otras medidas de error).

Chris Taylor
fuente

Respuestas:

11

Parece que podría estar más interesado en estimar errores utilizando la rutina de arranque de máxima entropía , en lugar de la validación cruzada. Esto le permitirá generar múltiples bootstraps de sus datos, que luego puede dividir en tantos conjuntos de trenes / pruebas como desee para calcular los intervalos de confianza para sus pronósticos.

Rob Hyndman tiene más discusión sobre la validación cruzada de series temporales en su blog , donde implementa varios métodos diferentes de "balanceo" y pronóstico, pero se centra principalmente en la implementación. Tengo algunas implementaciones adicionales en mi blog también. Quizás el enfoque más simple sería promediar su error en todas las ventanas de tiempo y, por lo tanto, ignorar las posibles correlaciones en los errores.

Por lo que puedo decir, el estado teórico de validación cruzada para datos de series temporales está algo por detrás del estado teórico de validación cruzada general. Intuitivamente, espero que el error aumente a medida que aumenta el horizonte, lo que sugiere que debe esperar errores correlacionados en varios horizontes de pronóstico. ¿Por qué te preocupa esto?

Zach
fuente