Tengo una pregunta / confusión sobre las series estacionarias requeridas para modelar con ARIMA (X). Estoy pensando en esto más en términos de inferencia (efecto de una intervención), pero me gustaría saber si el pronóstico versus la inferencia hace alguna diferencia en la respuesta.
Pregunta:
Todos los recursos introductorios que he leído afirman que la serie debe ser estacionaria, lo que tiene sentido para mí y ahí es donde entra el "yo" en arima (diferencia).
Lo que me confunde es el uso de tendencias y desviaciones en ARIMA (X) e implicaciones (si las hay) para los requisitos estacionarios.
¿El uso de un término constante / deriva y / o una variable de tendencia como una variable exógena (es decir, agregando 't' como regresor) niega el requisito de que la serie sea estacionaria? ¿La respuesta es diferente dependiendo de si la serie tiene una raíz unitaria (por ejemplo, prueba adf) o tiene una tendencia determinista pero no una raíz unitaria?
O
¿Una serie siempre tiene que ser estacionaria, hecha a través de la diferenciación y / o la reducción de tendencia antes de usar ARIMA (X)?
fuente
Recuerde que hay diferentes tipos de no estacionariedad y diferentes formas de tratarlos. Cuatro comunes son:
1) Tendencias deterministas o tendencia estacionaria. Si su serie es de este tipo, elimínela o incluya una tendencia temporal en la regresión / modelo. Es posible que desee consultar el teorema de Frisch-Waugh-Lovell en este caso.
2) Desplazamientos de nivel y roturas estructurales. Si este es el caso, debe incluir una variable ficticia para cada descanso o si su muestra es lo suficientemente larga para modelar cada régimen por separado.
3) Cambio de varianza. Modele las muestras por separado o modele la variación cambiante utilizando la clase de modelado ARCH o GARCH.
4) Si su serie contiene una raíz unitaria. En general, debe verificar las relaciones de cointegración entre las variables, pero dado que le preocupa el pronóstico univariado, debe diferenciarlo una o dos veces según el orden de integración.
Para modelar una serie temporal utilizando la clase de modelado ARIMA, los siguientes pasos deberían ser apropiados:
1) Mire el ACF y el PACF junto con un diagrama de series de tiempo para ver si la serie es estacionaria o no estacionaria.
2) Probar la serie para una raíz unitaria. Esto se puede hacer con una amplia gama de pruebas, algunas de las más comunes son la prueba ADF, la prueba Phillips-Perron (PP), la prueba KPSS que tiene la nula estacionariedad o la prueba DF-GLS, que es la más eficiente de las pruebas antes mencionadas. ¡NOTA! Que en caso de que su serie contenga una ruptura estructural, estas pruebas están sesgadas para no rechazar el valor nulo de una raíz unitaria. En caso de que desee probar la robustez de estas pruebas y si sospecha que hay una o más roturas estructurales, debe usar pruebas endógenas de rotura estructural. Dos comunes son la prueba de Zivot-Andrews que permite una ruptura estructural endógena y la Clemente-Montañés-Reyes que permite dos rupturas estructurales. Este último permite dos modelos diferentes.
3) Si hay una raíz unitaria en la serie, entonces debe diferenciar la serie. Luego, debe ejecutar el análisis de ACF, PACF y el diagrama de series de tiempo y, probablemente, verificar que una segunda unidad raíz esté en el lado seguro. El ACF y el PACF lo ayudarán a decidir cuántos términos de AR y MA debe incluir.
4) Si la serie no contiene una raíz unitaria, pero el diagrama de la serie de tiempo y el ACF muestran que la serie tiene una tendencia determinista, debe agregar una tendencia al ajustar el modelo. Algunas personas argumentan que es completamente válido simplemente diferenciar la serie cuando contiene una tendencia determinista, aunque se puede perder información en el proceso. Sin embargo, es una buena idea diferenciarlo para ver que tiene muchos términos AR y / o MA que deberá incluir. Pero una tendencia temporal es válida.
5) Ajuste los diferentes modelos y realice la comprobación de diagnóstico habitual, es posible que desee utilizar un criterio de información o el MSE para seleccionar el mejor modelo dada la muestra en la que se ajusta.
6) Realice un pronóstico de muestra en los modelos mejor ajustados y calcule las funciones de pérdida como MSE, MAPE, MAD para ver cuál de ellos funciona mejor cuando los usa para pronosticar, ¡porque eso es lo que queremos hacer!
7) ¡Realice su pronóstico fuera de la muestra como un jefe y esté satisfecho con sus resultados!
fuente
Determinar si la tendencia (u otro componente como la estacionalidad) es determinista o estocástico es parte del rompecabezas en el análisis de series de tiempo. Agregaré un par de puntos a lo que se ha dicho.
1) La distinción entre tendencias deterministas y estocásticas es importante porque si una raíz unitaria está presente en los datos (por ejemplo, una caminata aleatoria), las estadísticas de prueba utilizadas para la inferencia no siguen la distribución tradicional. Vea esta publicación para algunos detalles y referencias.
Podemos simular una caminata aleatoria (tendencia estocástica donde se deben tomar las primeras diferencias), comprobar la importancia de la tendencia determinista y ver el porcentaje de casos en los que se rechaza la tendencia determinista nula. En R, podemos hacer:
Al nivel de significancia del 5%, esperaríamos rechazar el valor nulo en el 95% de los casos, sin embargo, en este experimento se rechazó solo en ~ 89% de los casos de 10,000 caminatas aleatorias simuladas.
Podemos aplicar pruebas de raíz unitaria para probar si hay una raíz unitaria presente. Pero debemos ser conscientes de que una tendencia lineal a su vez puede conducir a la incapacidad de rechazar el valor nulo de una raíz unitaria. Para lidiar con esto, la prueba KPSS considera la nula de estacionariedad en torno a una tendencia lineal.
2) Otro tema es la interpretación de los componentes deterministas en un proceso en niveles o primeras diferencias. El efecto de una intersección no es el mismo en un modelo con una tendencia lineal que en una caminata aleatoria. Vea esta publicación para ilustración.
Llegamos a:
Si la representación gráfica de una serie muestra una tendencia lineal relativamente clara, no podemos estar seguros de si se debe a la presencia de una tendencia lineal determinista o a una deriva en un proceso de recorrido aleatorio. Se deben aplicar gráficos complementarios y estadísticas de pruebas.
Hay algunas advertencias a tener en cuenta ya que un análisis basado en la raíz unitaria y otras estadísticas de prueba no es infalible. Algunas de estas pruebas pueden verse afectadas por la presencia de observaciones externas o cambios de nivel y requieren la selección de un orden de retraso que no siempre es sencillo.
Como solución a este rompecabezas, creo que la práctica común es tomar las diferencias de los datos hasta que la serie se vea estacionaria (por ejemplo, mirando la función de autocorrelación, que debería ir a cero rápidamente) y luego elegir un modelo ARMA.
fuente
Pregunta muy interesante, también me gustaría saber lo que otros tienen que decir. Soy un ingeniero de formación y no un estadístico, por lo que alguien puede verificar mi lógica. Como ingenieros, nos gustaría simular y experimentar, así que me sentí motivado para simular y probar su pregunta.
Como se muestra empíricamente a continuación, el uso de una variable de tendencia en ARIMAX negó la necesidad de diferenciar y hace que la tendencia de la serie sea estacionaria. Aquí está la lógica que solía verificar.
A continuación se muestra el código R y las parcelas:
AR (1) Parcela simulada
AR (1) con tendencia determinista
ARIMAX Residual PACF con tendencia como exógena. Los residuos son aleatorios, sin patrón.
Como se puede ver arriba, modelar la tendencia determinista como una variable exógena en el modelo ARIMAX niega la necesidad de diferenciar. Al menos en el caso determinista funcionó. Me pregunto cómo se comportaría esto con la tendencia estocástica, que es muy difícil de predecir o modelar.
Para responder a su segunda pregunta, SÍ, todos los ARIMA, incluido ARIMAX, deben hacerse estacionarios. Al menos eso dicen los libros de texto.
Además, como se comentó, vea este artículo . Explicación muy clara sobre la tendencia determinista frente a la tendencia estocástica y cómo eliminarlos para hacerla tendencia estacionaria y también una muy buena encuesta de literatura sobre este tema. Lo usan en el contexto de la red neuronal, pero es útil para problemas generales de series de tiempo. Su recomendación final es cuando se identifica claramente como tendencia determinista, la tendencia lineal, de lo contrario, se aplica la diferencia para hacer estacionarias las series temporales. El jurado todavía está allí, pero la mayoría de los investigadores citados en este artículo recomiendan diferenciar en lugar de tendencia lineal.
Editar:
A continuación se muestra una caminata aleatoria con un proceso estocástico de deriva, usando variables exógenas y arima de diferencia. Ambos parecen dar la misma respuesta y, en esencia, son lo mismo.
¡Espero que esto ayude!
fuente