Chris Chatfield, cuyos muchos libros y documentos de calidad que disfruté leyendo, en (1) da el siguiente consejo:
Por ejemplo, la elección entre los modelos de series temporales ARIMA con valores bajos y aproximadamente iguales del AIC probablemente debería hacerse, no en lo que da el AIC mínimo, sino en lo que da los mejores pronósticos de los datos del año más reciente.
¿Cuál es la razón de este consejo? Si es correcto, ¿por qué Forecast :: auto.arima y otras rutinas de pronóstico no lo siguen? ¿Aún no se ha implementado? Ya se ha discutido aquí que buscar modelos que acaban de dar el AIC mínimo probablemente no sea una buena idea. ¿Por qué la opción de tener modelos ARIMA con valores bajos pero aproximadamente iguales (por ejemplo, dentro de 1 o 2 valores del AIC mínimo) no es un valor predeterminado en gran parte del software de pronóstico de series temporales?
(1) Chatfield, C. (1991). Evitar dificultades estadísticas. Ciencia estadística, 6 (3), 240-252. Disponible en línea, URL: https://projecteuclid.org/euclid.ss/1177011686 .
fuente
Respuestas:
Es cierto que si tiene múltiples valores AIC aproximadamente iguales, seleccionar el valor más bajo puede no ser la mejor opción. Una alternativa sensata sería realizar un promedio de modelos. De esta manera, puede utilizar no solo el mejor modelo para la inferencia, sino un conjunto de modelos "más compatibles", cada uno ponderado de acuerdo con su valor AIC.
Tienes una breve introducción de Vincent Calcagno aquí
fuente