Estime los coeficientes ARMA a través de la inspección ACF y PACF
16
¿Cómo estima el modelo de pronóstico apropiado para una serie de tiempo mediante inspección visual de las parcelas ACF y PACF? ¿Cuál (es decir, ACF o PACF) le dice al AR o al MA (o ambos)? ¿Qué parte de los gráficos le dice la parte estacional y no estacional para un ARIMA estacional?
Considere las funciones ACF y PCF que se muestran a continuación. Son de una serie transformada de registro que se ha diferenciado dos veces, una diferencia simple y una estacional ( datos originales , datos transformados de registro ). ¿Cómo caracterizarías la serie? ¿Qué modelo le queda mejor?
Mi respuesta es realmente una abreviatura de la de javlacelle, pero es demasiado larga para un simple comentario, pero no demasiado corta para ser inútil.
Si bien la respuesta de jvlacelle es técnicamente correcta en un nivel, "simplifica demasiado" ya que establece ciertas "cosas" que normalmente nunca son ciertas. Se supone que no se requiere una estructura determinista, como una o más tendencias temporales O uno o más cambios de nivel o uno o más pulsos estacionales o uno o más pulsos únicos. Además, se supone que los parámetros del modelo identificado son invariables con el tiempo y el proceso de error subyacente al modelo identificado tentativamente también es invariable con el tiempo. Ignorar cualquiera de los anteriores es a menudo (¡siempre en mi opinión!) Una receta para el desastre o, más precisamente, un "modelo mal identificado". Un caso clásico de esto es la transformación logarítmica innecesaria propuesta para la serie de la aerolínea y para la serie que el OP presenta en su pregunta revisada. No hay necesidad de ninguna transformación logarítmica para sus datos, ya que solo hay unos pocos valores "inusuales" en los períodos 198,207,218,219 y 256 que no se trataron crean la falsa impresión de que hay una mayor varianza de error con niveles más altos. Tenga en cuenta que los "valores inusuales" se identifican teniendo en cuenta cualquier estructura ARIMA necesaria que a menudo escapa al ojo humano. Las transformaciones son necesarias cuando la varianza del error no es constante a lo largo del tiempo NO cuando la varianza de la Y observada no es constante a lo largo del tiempo . Los procedimientos primitivos siguen cometiendo el error táctico de seleccionar una transformación prematuramente antes de cualquiera de los remedios antes mencionados. Hay que recordar que la estrategia de identificación del modelo ARIMA de mente simple se desarrolló a principios de los años 60, PERO se han producido muchas mejoras / desarrollos desde entonces. 219 y 256 que no se trataron crean la falsa impresión de que hay una mayor varianza de error con niveles más altos. Tenga en cuenta que los "valores inusuales" se identifican teniendo en cuenta cualquier estructura ARIMA necesaria que a menudo escapa al ojo humano. Las transformaciones son necesarias cuando la varianza del error no es constante a lo largo del tiempo NO cuando la varianza de la Y observada no es constante a lo largo del tiempo . Los procedimientos primitivos siguen cometiendo el error táctico de seleccionar una transformación prematuramente antes de cualquiera de los remedios antes mencionados. Hay que recordar que la estrategia de identificación del modelo ARIMA de mente simple se desarrolló a principios de los años 60, PERO se han producido muchas mejoras / desarrollos desde entonces. 219 y 256 que no se trataron crean la falsa impresión de que hay una mayor varianza de error con niveles más altos. Tenga en cuenta que los "valores inusuales" se identifican teniendo en cuenta cualquier estructura ARIMA necesaria que a menudo escapa al ojo humano. Las transformaciones son necesarias cuando la varianza del error no es constante a lo largo del tiempo NO cuando la varianza de la Y observada no es constante a lo largo del tiempo . Los procedimientos primitivos siguen cometiendo el error táctico de seleccionar una transformación prematuramente antes de cualquiera de los remedios antes mencionados. Hay que recordar que la estrategia de identificación del modelo ARIMA de mente simple se desarrolló a principios de los años 60, PERO se han producido muchas mejoras / desarrollos desde entonces. se identifican teniendo en cuenta cualquier estructura ARIMA necesaria que a menudo se escapa del ojo humano. Las transformaciones son necesarias cuando la varianza del error no es constante a lo largo del tiempo NO cuando la varianza de la Y observada no es constante a lo largo del tiempo. Los procedimientos primitivos siguen cometiendo el error táctico de seleccionar una transformación prematuramente antes de cualquiera de los remedios antes mencionados. Hay que recordar que la estrategia de identificación del modelo ARIMA de mente simple se desarrolló a principios de los años 60, PERO se han producido muchas mejoras / desarrollos desde entonces. se identifican teniendo en cuenta cualquier estructura ARIMA necesaria que a menudo se escapa del ojo humano. Las transformaciones son necesarias cuando la varianza del error no es constante a lo largo del tiempo NO cuando la varianza de la Y observada no es constante a lo largo del tiempo. Los procedimientos primitivos siguen cometiendo el error táctico de seleccionar una transformación prematuramente antes de cualquiera de los remedios antes mencionados. Hay que recordar que la estrategia de identificación del modelo ARIMA de mente simple se desarrolló a principios de los años 60, PERO se han producido muchas mejoras / desarrollos desde entonces. Los procedimientos primitivos siguen cometiendo el error táctico de seleccionar una transformación prematuramente antes de cualquiera de los remedios antes mencionados. Hay que recordar que la estrategia de identificación del modelo ARIMA de mente simple se desarrolló a principios de los años 60, PERO se han producido muchas mejoras / desarrollos desde entonces. Los procedimientos primitivos siguen cometiendo el error táctico de seleccionar una transformación prematuramente antes de cualquiera de los remedios antes mencionados. Hay que recordar que la estrategia de identificación del modelo ARIMA de mente simple se desarrolló a principios de los años 60, PERO se han producido muchas mejoras / desarrollos desde entonces.
Editado después de que se publicaron los datos:
Se identificó un modelo razonable utilizando http://www.autobox.com/cms/, que es una pieza de software que incorpora algunas de mis ideas antes mencionadas a medida que ayudé a desarrollarlo. La prueba de Chow para la constancia de los parámetros sugirió que los datos se segmentaran y que las últimas 94 observaciones se usaran como parámetros del modelo que habían cambiado con el tiempo. Estos últimos 94 valores arrojaron una ecuación con todos los coeficientes significativos. . La gráfica de los residuos sugiere una dispersión razonable con el siguiente ACF que sugiere aleatoriedad . El gráfico real y limpio es esclarecedor, ya que muestra los valores atípicos PERO significativos. . Finalmente, una trama de real, ajuste y pronóstico resume nuestro trabajo TODO SIN TOMAR LOGARITMOS. Es bien sabido, pero a menudo olvidado, que las transformaciones de poder son como las drogas ... el uso injustificado puede dañarlo. Finalmente observe que el modelo tiene una estructura AR (2) PERO no una estructura AR (1).
¿Por qué no podemos tomar la transformación de registro? Consulte el conjunto de datos de AirPassengers en R, que tiene estacionalidad multiplicativa. Al tomar el registro, lo transforma en estacionalidad aditiva. Además, si no tomamos registros, el conjunto de datos tendrá una variación creciente, es decir, no será estacionario. ¿Cómo puedo lidiar con tal conjunto de datos sin tomar la transformación de registro? ¿Puede usted explicar por favor?
user2338823
"No hay necesidad de ninguna transformación logarítmica para sus datos, ya que solo hay unos pocos valores" inusuales "en los períodos que no se tratan crean la falsa impresión de que hay una mayor varianza de error con niveles más altos". La suposición de estacionariedad de la constancia de la varianza se trata de la varianza del error, no de la varianza de la serie original. El software R no permite identificar e incorporar anomalías automáticamente. ver autobox.com/cms/index.php/blog discusión sobre la serie. Y autobox.com/pdfs/vegas_ibf_09a.pdf
IrishStat el
La prueba de Box-Cox para una transformación de potencia NO ASUME valores atípicos, por lo tanto, puede vincular falsa / inadvertidamente la variación cambiante con el valor esperado, lo que sugiere incorrectamente la necesidad de una transformación. Vea el artículo de Tsay docplayer.net/… de uno de los estudiantes de Box como introducción para tratar con la estructura determinista latente no tratada. Adiós si no puede / no puede lidiar con una violación del primer momento en el que luego puede ajustarse incorrectamente El cambio de varianza a través de una transformación de potencia o GLS como señala Tsay.
IrishStat el
14
Solo para aclarar conceptos, mediante la inspección visual del ACF o PACF puede elegir (no estimar) un modelo ARMA tentativo. Una vez que se selecciona un modelo, puede estimar el modelo maximizando la función de probabilidad, minimizando la suma de cuadrados o, en el caso del modelo AR, por medio del método de momentos.
Se puede elegir un modelo ARMA tras la inspección de ACF y PACF. Este enfoque se basa en los siguientes hechos: 1) el ACF de un proceso AR estacionario de orden p va a cero a una tasa exponencial, mientras que el PACF se vuelve cero después del retraso p. 2) Para un proceso MA de orden q, el ACF teórico y el PACF exhiben el comportamiento inverso (el ACF se trunca después del retraso q y el PACF pasa a cero relativamente rápido).
Por lo general, está claro detectar el orden de un modelo AR o MA. Sin embargo, con los procesos que incluyen tanto una parte AR como una MA, el retraso en el que se truncan puede ser borroso porque tanto el ACF como el PACF decaerán a cero.
Una forma de proceder es ajustar primero un modelo AR o MA (el que parece más claro en el ACF y el PACF) de bajo orden. Luego, si hay alguna estructura adicional, aparecerá en los residuos, por lo que se verifica el ACF y el PACF de los residuos para determinar si son necesarios términos adicionales de AR o MA.
Por lo general, deberá probar y diagnosticar más de un modelo. También puede compararlos mirando el AIC.
El ACF y el PACF que publicó primero sugirieron un ARMA (2,0,0) (0,0,1), es decir, un AR regular (2) y un MA estacional (1). La parte estacional del modelo se determina de manera similar a la parte regular, pero observando los retrasos del orden estacional (por ejemplo, 12, 24, 36, ... en datos mensuales). Si está utilizando R se recomienda aumentar el número predeterminado de retardos que se muestran, acf(x, lag.max = 60).
La trama que muestra ahora revela una correlación negativa sospechosa. Si esta gráfica se basa en la misma que la gráfica anterior, es posible que haya tomado demasiadas diferencias. Ver también esta publicación .
Tienes razón. Puede que haya tomado una diferencia demasiadas. Sin embargo, tengo una duda. Hice una diferencia simple ( i.imgur.com/1MjLzlX.png ) y una estacional (12) ( i.imgur.com/E64Sd7p.png ) en los datos de registro. ¿Qué debo hacer, el de temporada correcto?
4aprendizaje
1
@ 4everlearning Correcto, después de tomar las diferencias estacionales, el ACF y el PACF se acercan más a lo que podríamos esperar para un proceso estacionario. Puede comenzar ajustando un ARIMA (2,0,0) (0,1,1), en R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1))), y mostrando el ACF y el PACF de los residuos. También tenga en cuenta las cuestiones adicionales planteadas por IrishStat que le deberían interesar en el análisis.
javlacalle
Thanks. How would i go about finding those AR and MA orders? Plus, the Akaike Information Criterion yields a negative value for my model. I understand that this is not important although i'm not really sure how to compare it to other models, say AIC=-797.74 and AIC=-800.00. Which is preferable?
4everlearning
Puede determinar las órdenes siguiendo la idea dada en la respuesta anterior. Si ve que el ACF va a cero relativamente rápido y el PACF se trunca después del retraso 2, entonces es probable que haya una estructura AR (2) en los datos. La idea inversa se aplica para detectar una MA. Como recomendación general, comience con un modelo de bajo orden e inspeccione los residuos buscando estructuras AR o MA que se agregarán al modelo inicial.
javlacalle
Como regla general, cuanto menor sea el AIC, mejor será el modelo (suponiendo que esté utilizando los datos en la misma escala en ambos modelos, es decir, la serie debe estar en niveles o registros en todos los modelos que está comparando )
Solo para aclarar conceptos, mediante la inspección visual del ACF o PACF puede elegir (no estimar) un modelo ARMA tentativo. Una vez que se selecciona un modelo, puede estimar el modelo maximizando la función de probabilidad, minimizando la suma de cuadrados o, en el caso del modelo AR, por medio del método de momentos.
Se puede elegir un modelo ARMA tras la inspección de ACF y PACF. Este enfoque se basa en los siguientes hechos: 1) el ACF de un proceso AR estacionario de orden p va a cero a una tasa exponencial, mientras que el PACF se vuelve cero después del retraso p. 2) Para un proceso MA de orden q, el ACF teórico y el PACF exhiben el comportamiento inverso (el ACF se trunca después del retraso q y el PACF pasa a cero relativamente rápido).
Por lo general, está claro detectar el orden de un modelo AR o MA. Sin embargo, con los procesos que incluyen tanto una parte AR como una MA, el retraso en el que se truncan puede ser borroso porque tanto el ACF como el PACF decaerán a cero.
Una forma de proceder es ajustar primero un modelo AR o MA (el que parece más claro en el ACF y el PACF) de bajo orden. Luego, si hay alguna estructura adicional, aparecerá en los residuos, por lo que se verifica el ACF y el PACF de los residuos para determinar si son necesarios términos adicionales de AR o MA.
Por lo general, deberá probar y diagnosticar más de un modelo. También puede compararlos mirando el AIC.
El ACF y el PACF que publicó primero sugirieron un ARMA (2,0,0) (0,0,1), es decir, un AR regular (2) y un MA estacional (1). La parte estacional del modelo se determina de manera similar a la parte regular, pero observando los retrasos del orden estacional (por ejemplo, 12, 24, 36, ... en datos mensuales). Si está utilizando R se recomienda aumentar el número predeterminado de retardos que se muestran,
acf(x, lag.max = 60)
.La trama que muestra ahora revela una correlación negativa sospechosa. Si esta gráfica se basa en la misma que la gráfica anterior, es posible que haya tomado demasiadas diferencias. Ver también esta publicación .
Puede obtener más detalles, entre otras fuentes, aquí: Capítulo 3 de la serie temporal: Teoría y métodos de Peter J. Brockwell y Richard A. Davis y aquí .
fuente
arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))
, y mostrando el ACF y el PACF de los residuos. También tenga en cuenta las cuestiones adicionales planteadas por IrishStat que le deberían interesar en el análisis.