El procedimiento de selección del modelo de Box-Jenkins en el análisis de series de tiempo comienza observando las funciones de autocorrelación y autocorrelación parcial de la serie. Estas gráficas pueden sugerir la y q apropiadas en un modelo ARMA ( p , q ) . El procedimiento continúa solicitando al usuario que aplique los criterios AIC / BIC para seleccionar el modelo más parsimonioso entre los que producen un modelo con un término de error de ruido blanco.
Me preguntaba cómo estos pasos de inspección visual y selección de modelos basados en criterios impactan los errores estándar estimados del modelo final. Sé que muchos procedimientos de búsqueda en un dominio transversal pueden sesgar los errores estándar hacia abajo, por ejemplo.
En el primer paso, ¿cómo afecta la selección de la cantidad adecuada de retrasos al observar los datos (ACF / PACF) los errores estándar para los modelos de series temporales?
Supongo que seleccionar el modelo basado en los puntajes de AIC / BIC tendría un impacto análogo al de los métodos transversales. De hecho, tampoco sé mucho sobre esta área, por lo que cualquier comentario sería apreciado también sobre este punto.
Por último, si anota el criterio preciso utilizado para cada paso, ¿podría iniciar todo el proceso para estimar los errores estándar y eliminar estas preocupaciones?
Respuestas:
Cualquier procedimiento de selección de modelo afectará los errores estándar y esto casi nunca se tiene en cuenta. Por ejemplo, los intervalos de predicción se calculan condicionalmente en el modelo estimado y la estimación de parámetros y la selección del modelo generalmente se ignoran.
Debería ser posible iniciar todo el procedimiento para estimar el efecto del proceso de selección del modelo. Pero recuerde que el bootstrapping de series temporales es más complicado que el bootstrapping normal porque debe preservar la correlación serial. El arranque de bloque es un enfoque posible, aunque pierde cierta correlación en serie debido a la estructura de bloque.
fuente
En mi opinión, seleccionar el número apropiado de retrasos no es diferente a seleccionar el número de series de entrada en un procedimiento de regresión progresiva. La importancia incremental de los retrasos o una serie de entrada específica es la base para la especificación tentativa del modelo.
Dado que usted ha afirmado que acf / pacf es la única base para la selección del modelo Box-Jenkins, permítame decirle lo que me ha enseñado alguna experiencia. Si una serie exhibe un acf que no decae, el enfoque de Box-Jenkins (circa 1965) sugiere diferenciar los datos. Pero si una serie tiene un cambio de nivel, como los datos del Nilo , entonces la no estacionariedad "visualmente aparente" es un síntoma de la estructura necesaria, pero la diferencia no es el remedio. Este conjunto de datos del Nilo se puede modelar sin diferenciar simplemente identificando primero la necesidad de un cambio de nivel. De manera similar, se nos enseña usando conceptos de 1960 que si el acf exhibe una estructura estacional ( es decir,valores significativos en rezagos de s, 2s, 3s, ...) entonces deberíamos incorporar un componente ARIMA estacional. Para propósitos de discusión, considere una serie que es estacionaria alrededor de una media y a intervalos fijos, digamos que cada junio hay un "alto valor". Esta serie se trata adecuadamente mediante la incorporación de una serie ficticia "pasada de moda" de 0 y 1 (en junio) para tratar la estructura estacional. Un modelo ARIMA estacional usaría incorrectamente la memoria en lugar de una variable X no especificada pero en espera de ser encontrada. Estos dos conceptos de identificación / incorporación de estructura determinista no especificada son aplicaciones directas del trabajo de I. Chang, William Bell, George Tiao, R.Tay , Chen et al (a partir de 1978) bajo el concepto general de Detección de intervención.
Incluso hoy en día, algunos analistas realizan estrategias de maximización de memoria sin pensar, llamándolos ARIMA automático, sin reconocer que el "modelado de memoria sin sentido" supone que la estructura determinista como pulsos, cambios de nivel, pulsos estacionales y tendencias de tiempo local son inexistentes o peor aún, no juegan papel en la identificación del modelo. Esto es similar a poner la cabeza en la arena, en mi humilde opinión.
fuente