La metodología Box-Jenkins es una estrategia o procedimiento que se puede utilizar para construir un modelo ARIMA. La metodología se describe en el libro Time Series Analysis: Forecasting and Control de George EP Box y Gwilym M. Jenkins, publicado originalmente en 1970; existen ediciones más recientes.
Al abrir SAS, llamar a proc ARIMA y proporcionar números para p, d y q, simplemente ha estimado un modelo ARIMA. Hacer esto a ciegas, es decir, al no utilizar ninguna metodología reconocida en particular para identificar el modelo ARIMA en sí, es un poco como jugar con fósforos: ¡los peligros del software!
Si sigue repitiendo este proceso, estimando montones y montones de modelos ARIMA, eventualmente podrá seleccionar un modelo con el criterio más bajo de información de Akaike (del conjunto de modelos que ha estimado). En este contexto, un enfoque más sistemático sería utilizar un algoritmo basado en la comparación de los valores de AIC para una variedad de modelos diferentes para seleccionar automáticamente un modelo ARIMA para usted, como el que proporciona el paquete de pronóstico en R: el nombre de la función relevante es auto.arima()
.
En cualquier caso, el procedimiento que describió implicó la selección de un modelo ARIMA basado en minimizar algunos criterios de información (en este caso, AIC, pero hay otras medidas). Esta es una metodología en particular, pero no es la metodología de Box-Jenkins; una alternativa.
La metodología de Box-Jenkins comprende cinco etapas (aunque a veces se dice que involucra solo tres etapas):
- Verificar la estacionariedad o no estacionaria y transformar los datos, si es necesario;
- Identificación de un modelo ARMA adecuado;
- Estimación de los parámetros del modelo elegido;
- Comprobación diagnóstica de adecuación del modelo; y
- Pronóstico o repetición de los pasos dos a cinco.
Notablemente, es un proceso iterativo que involucra al constructor de modelos ejerciendo un cierto juicio, y este es un aspecto de la metodología que se ha considerado una deficiencia. La parte de juicio entra en juego particularmente cuando se interpretan dos herramientas; a saber, la función de autocorrelación (estimada) (ACF) y la función de autocorrelación parcial (PACF).
Si desea convertirse en un profesional de la metodología de Box-Jenkins, le recomiendo consultar el texto original (¡se sorprendería de lo que omiten los libros de texto modernos!) Junto con las variaciones modernas que pueda encontrar. Alan Pankratz tiene un par de excelentes libros de texto, que también recomiendo; por ejemplo, Pronósticos con modelos univariados de Box-Jenkins: conceptos y casos .
La experiencia me sugiere que el término "metodología de Box-Jenkins" se usa de manera flexible porque he oído que algunas personas lo usan simplemente para referirse a la construcción de modelos ARIMA en general, y no al proceso real involucrado en la construcción de un modelo ARIMA - mientras que otros lo usan para referirse a una versión modificada de lo que se publicó en 1970. Como ha señalado @Glen_b, "actualmente hay numerosos documentos que describen la metodología de Box-Jenkins que incluirían el uso de AIC o cantidades similares" .
P: ¿Se supone que debe utilizar la metodología Box-Jenkins para obtener estimaciones iniciales de p, d, q?
Como ya se mencionó, existen diferentes estrategias de selección de modelos, por lo que la respuesta es no; no es necesariamente el caso de que necesite emplear la metodología Box-Jenkins, pero podría hacerlo si quisiera.
P: ¿SAS lo usó internamente de alguna manera?
¡Muy poco probable a menos que ese software ofrezca una función bastante sofisticada! Consulte la documentación oficial de SAS para obtener detalles sobre lo que el software hace o es capaz de hacer. Si fuera R, podría mirar el código fuente, pero dudo que sea una opción con SAS.