Selección de modelo Box-Jenkins

El procedimiento de selección del modelo de Box-Jenkins en el análisis de series de tiempo comienza observando las funciones de autocorrelación y autocorrelación parcial de la serie. Estas gráficas pueden sugerir la y apropiadas en un modelo ARMA . El procedimiento continúa solicitando al usuario que aplique los criterios AIC / BIC para seleccionar el modelo más parsimonioso entre los que producen un modelo con un término de error de ruido blanco. $p$ $q$ $(p,q)$

Me preguntaba cómo estos pasos de inspección visual y selección de modelos basados en criterios impactan los errores estándar estimados del modelo final. Sé que muchos procedimientos de búsqueda en un dominio transversal pueden sesgar los errores estándar hacia abajo, por ejemplo.

En el primer paso, ¿cómo afecta la selección de la cantidad adecuada de retrasos al observar los datos (ACF / PACF) los errores estándar para los modelos de series temporales?

Supongo que seleccionar el modelo basado en los puntajes de AIC / BIC tendría un impacto análogo al de los métodos transversales. De hecho, tampoco sé mucho sobre esta área, por lo que cualquier comentario sería apreciado también sobre este punto.

Por último, si anota el criterio preciso utilizado para cada paso, ¿podría iniciar todo el proceso para estimar los errores estándar y eliminar estas preocupaciones?

regression time-series arima model-selection box-jenkins Charlie
fuente

¿Es tan importante el sesgo en los errores estándar (de los parámetros?) en los modelos ARMA a-teóricos? Los modelos ARMA ASFAIK se utilizan principalmente para pronósticos de corto plazo. Los problemas con la interpretación de los parámetros y sus propiedades son menos (¿menos?) Importantes. Por supuesto, si no quiere decir las características de un proceso de innovación (término de error), planear para producir intervalos de predicción relevantes.

Dmitrij Celov

@Dmitrij, hay dos razones principales por las que me preocupa el sesgo en los errores estándar de los coeficientes. La primera, como aludiste, es la creación de intervalos de predicción. El segundo es la prueba de roturas estructurales en el modelo, una pregunta común que un economista estaría interesado en responder. Los errores estándar generados mediante un procedimiento de selección deben ser demasiado pequeños, dar intervalos de predicción demasiado estrechos y estadísticas de prueba demasiado grandes.

Charlie

pero en los modelos a-teóricos (lo que significa que no hay teoría ni estructura), las rupturas estructurales tienen poco que ver con los parámetros, serían algunas pruebas generales, con respecto al comportamiento de los residuos del modelo. Bueno, en este caso, las estimaciones imparciales de los parámetros de los modelos son menos importantes, ARMA simplemente no tiene interpretación de modelos estructurales. Por lo tanto, los modelos parsimoniosos son mejores predictores, ya que equilibran bien las propiedades generalmente pobres de los estimadores de muestras pequeñas y la precisión de la predicción.

Dmitrij Celov

Tenga en cuenta que incluso si conoce el proceso de generación de datos que tiene muchos parámetros, en muestras pequeñas, el modelo más simple probablemente hará mejores predicciones, pero en el contexto estructural, los parámetros de dicho modelo serán muy sesgados (sesgo variable omitido).

Dmitrij Celov

Respuestas:

Cualquier procedimiento de selección de modelo afectará los errores estándar y esto casi nunca se tiene en cuenta. Por ejemplo, los intervalos de predicción se calculan condicionalmente en el modelo estimado y la estimación de parámetros y la selección del modelo generalmente se ignoran.

Debería ser posible iniciar todo el procedimiento para estimar el efecto del proceso de selección del modelo. Pero recuerde que el bootstrapping de series temporales es más complicado que el bootstrapping normal porque debe preservar la correlación serial. El arranque de bloque es un enfoque posible, aunque pierde cierta correlación en serie debido a la estructura de bloque.

Rob Hyndman
fuente

En mi opinión, seleccionar el número apropiado de retrasos no es diferente a seleccionar el número de series de entrada en un procedimiento de regresión progresiva. La importancia incremental de los retrasos o una serie de entrada específica es la base para la especificación tentativa del modelo.

Dado que usted ha afirmado que acf / pacf es la única base para la selección del modelo Box-Jenkins, permítame decirle lo que me ha enseñado alguna experiencia. Si una serie exhibe un acf que no decae, el enfoque de Box-Jenkins (circa 1965) sugiere diferenciar los datos. Pero si una serie tiene un cambio de nivel, como los datos del Nilo , entonces la no estacionariedad "visualmente aparente" es un síntoma de la estructura necesaria, pero la diferencia no es el remedio. Este conjunto de datos del Nilo se puede modelar sin diferenciar simplemente identificando primero la necesidad de un cambio de nivel. De manera similar, se nos enseña usando conceptos de 1960 que si el acf exhibe una estructura estacional ( es decir,valores significativos en rezagos de s, 2s, 3s, ...) entonces deberíamos incorporar un componente ARIMA estacional. Para propósitos de discusión, considere una serie que es estacionaria alrededor de una media y a intervalos fijos, digamos que cada junio hay un "alto valor". Esta serie se trata adecuadamente mediante la incorporación de una serie ficticia "pasada de moda" de 0 y 1 (en junio) para tratar la estructura estacional. Un modelo ARIMA estacional usaría incorrectamente la memoria en lugar de una variable X no especificada pero en espera de ser encontrada. Estos dos conceptos de identificación / incorporación de estructura determinista no especificada son aplicaciones directas del trabajo de I. Chang, William Bell, George Tiao, R.Tay , Chen et al (a partir de 1978) bajo el concepto general de Detección de intervención.

Incluso hoy en día, algunos analistas realizan estrategias de maximización de memoria sin pensar, llamándolos ARIMA automático, sin reconocer que el "modelado de memoria sin sentido" supone que la estructura determinista como pulsos, cambios de nivel, pulsos estacionales y tendencias de tiempo local son inexistentes o peor aún, no juegan papel en la identificación del modelo. Esto es similar a poner la cabeza en la arena, en mi humilde opinión.

IrishStat
fuente

Gracias por los excelentes consejos sobre la selección del modelo, pero estaba interesado en cómo este proceso impacta nuestra inferencia después.

Charlie

Charlie: No creo que los diagnósticos de datos iniciales como la revisión de autocorrelaciones o correlaciones cruzadas o cualquier otro procedimiento de identificación del modelo, como las presentaciones gráficas, tengan algún efecto sobre la importancia estadística de los parámetros estimados. Esa es mi opinión y "aquí estoy, no puedo hacer otra". Gracias por las felicitaciones y si puedo ayudar al joven Charlie de alguna manera, póngase en contacto conmigo, ya que me encanta ser incluido como un recurso de apoyo (¡no pagado!) En disertaciones de doctorado.

IrishStat