Cómo interpretar estas tramas acf y pacf

20

Los siguientes son gráficos acf y pacf de una serie de datos mensual. El segundo gráfico es acf con ci.type = 'ma':

ingrese la descripción de la imagen aquí

La persistencia de valores altos en la gráfica acf probablemente representa una tendencia positiva a largo plazo. La pregunta es si esto representa una variación estacional.

Traté de ver diferentes sitios sobre este tema, pero no estoy seguro de si estas tramas muestran estacionalidad.

Análisis de parcela ACF y PACF

Ayuda a interpretar diagramas ACF y PACF

Ayuda a comprender la siguiente imagen de ACF

Autocorrelación e interpretación parcial de autocorrelación

Editar: el siguiente es el gráfico para el retraso hasta 60:

ingrese la descripción de la imagen aquí

Los siguientes son gráficos de diff (my_series):

ingrese la descripción de la imagen aquí

Y hasta el retraso 60:

ingrese la descripción de la imagen aquí

Editar: Estos datos provienen de: ¿Es este un método apropiado para evaluar los efectos estacionales en los datos de recuento de suicidios? Aquí los contribuyentes no consideraron la trama acf y pacf de series originales o diferenciadas que vale la pena mencionar (por lo que no debe ser importante). Solo se hizo referencia a parcelas acf / pacf de residuos en un par de lugares.

rnso
fuente
1
¿Puedes agregar algo sobre tus datos (por ejemplo, un diagrama básico)? ¿Intentaste algo así stl()?
gung - Restablece a Monica
Estoy tratando de entender cómo determinar la estacionalidad de las parcelas acf y pacf. ¿Es necesaria la revisión de la trama básica o stl para esto? ¿No podemos determinar algo de estas parcelas?
rnso
1
Eso estaría bien. Para mayor claridad, su pregunta no es realmente sobre lo que está sucediendo con sus datos, sino sobre lo que se puede entender de estas parcelas de forma aislada, ¿no es así?
gung - Restablece a Monica
1
Sí. A menudo necesito determinar si la estacionalidad está presente en mis datos, por lo que quiero entender qué información puedo obtener de los gráficos acf y pacf. Los gráficos de la función stl son razonablemente fáciles de entender, pero no estos gráficos.
rnso
Sus datos sí tienen cierta estacionalidad. Por favor, vea mi respuesta a @javlacalle.
IrishStat

Respuestas:

9

mirar las parcelas para tratar de encasillar los datos en un modelo arima adivinado funciona bien cuando 1: no hay valores atípicos / pulsos / cambios de nivel, tendencias de tiempo local y no pulsos deterministas estacionales en los datos Y 2) cuando el modelo arima tiene parámetros constantes en el tiempo Y 3) cuando la varianza del error del modelo arima tiene una varianza constante en el tiempo. ¿Cuándo se cumplen estas tres cosas ... en la mayoría de los conjuntos de datos de libros de texto que presentan la facilidad del modelado de arima. Cuando 1 o más de los 3 no se mantienen ... en todos los conjuntos de datos del mundo real que he visto. La respuesta simple a su pregunta requiere acceso a los hechos originales (los datos históricos) no a la información descriptiva secundaria en sus parcelas. ¡Pero esta es solo mi opinión!

EDITADO DESPUÉS DEL RECIBO DE DATOS:

Estaba de vacaciones en Grecia (en realidad estaba haciendo algo más que el análisis de series de tiempo) y no pude analizar los DATOS DEL SUICIDIO, pero en conjunto con esta publicación. Ahora es apropiado y correcto presentar un análisis para hacer un seguimiento / probar, por ejemplo, mis comentarios sobre estrategias de identificación de modelos de etapas múltiples y las fallas del análisis visual simple de tramas de correlación simples como "la prueba está en el budín".

Aquí está el ACF de los datos originales ingrese la descripción de la imagen aquíEl PACF de la serie original ingrese la descripción de la imagen aquí. AUTOBOX http://www.autobox.com/cms/ un software que he ayudado a desarrollar utiliza la heurística para identificar un modelo inicial. En este caso, se descubrió que el modelo inicialmente identificado era ingrese la descripción de la imagen aquí. La verificación diagnóstica de los residuos de este modelo sugirió un aumento del modelo utilizando un cambio de nivel, pulsos y un pulso estacional. Tenga en cuenta que el cambio de nivel se detecta en o alrededor del período 164, que es casi idéntico a una conclusión anterior sobre el período 176 de @forecaster. ¡Todos los caminos no conducen a Roma, pero algunos pueden acercarte!ingrese la descripción de la imagen aquí. La prueba de constancia de parámetros rechazó los cambios de parámetros a lo largo del tiempo La comprobación de los cambios deterministas en la varianza del error concluyó que no se detectaron cambios deterministas en la varianza del error. ingrese la descripción de la imagen aquí. La prueba de Box-Cox para la necesidad de una transformación de potencia fue positiva con la conclusión de que era necesaria una transformación logarítmica. ingrese la descripción de la imagen aquí. El modelo final está aquí ingrese la descripción de la imagen aquí. Los residuos del modelo final parecen estar libres de cualquier autocorrelación ingrese la descripción de la imagen aquí. La trama de los residuos de los modelos finales parece estar libre de cualquier violación gaussiana ingrese la descripción de la imagen aquí. El gráfico de Actual / Fit / Forecasts está aquí ingrese la descripción de la imagen aquícon pronósticos aquíingrese la descripción de la imagen aquí

IrishStat
fuente
Gracias por tu respuesta. ¿Son estos supuestos tan importantes y siempre se burlan en los datos del mundo real que las tramas acf y pacf casi nunca se pueden interpretar de forma aislada?
rnso
Odio decir nunca, PERO las suposiciones que expuse complicarían gravemente el proceso de identificación visual si se violaran. Su conjunto de datos claramente (a mis viejos ojos) es un ejemplo de esto. La identificación de un modelo inicial, la estimación y la reidentificación basada en diagnósticos residuales es un proceso de varias etapas, no uno, y se realiza EXCEPTO en casos triviales.
IrishStat
Para reiterar siguiendo a mi amigo stats.stackexchange.com/users/48766/javlacalle : También es necesario verificar la presencia de pulsos y cambios de nivel Y pulsos estacionales Y tendencias de tiempo local Y constancia de varianza de error.
IrishStat
(+1) Buen análisis de los datos. Sin embargo, ¿qué pasa con la pregunta original? ¿Se puede identificar la estacionalidad en los datos? Tal vez se puede inferir de la salida que muestra, pero no pude resolverlo.
javlacalle
la estacionalidad está presente en el término AR (12) en el modelo ARIMA y en el pulso estacional a partir del período 98 (2003/2)
IrishStat
10

Interpretación de ACF y PACF

La lenta disminución de la función de autocorrelación sugiere que los datos siguen un proceso de memoria prolongada. La duración de los shocks es relativamente persistente e influye en los datos de varias observaciones por delante. Esto probablemente se refleja en un patrón de tendencia suave en los datos.

El ACF y el PACF de orden 12 están más allá de las bandas de confianza significativas. Sin embargo, esto no significa necesariamente la presencia de un patrón estacional identificable. El ACF y el PACF de otros pedidos estacionales (24, 36, 48, 60) están dentro de las bandas de confianza. A partir del gráfico, no es posible concluir si la importancia del ACF y el PACF del orden 12 se debe a la estacionalidad o fluctuaciones transitorias.

La persistencia del ACF mencionado anteriormente sugiere que pueden ser necesarias primeras diferencias para hacer que los datos sean estacionarios. Sin embargo, el ACF / PACF de las series diferenciadas parece sospechoso, la correlación negativa puede haber sido inducida por el filtro de diferenciación y puede no ser realmente apropiada. Vea esta publicación para algunos detalles.

Determinar si la estacionalidad está presente

El análisis de ACF y PACF debe complementarse con otras herramientas, por ejemplo:

  • Spectrum (una vista del ACF en el dominio de frecuencia), puede revelar la periodicidad de los ciclos que explican la mayor parte de la variabilidad en los datos.
  • Ajuste el modelo de serie temporal estructural básico y compruebe si la varianza del componente estacional es cercana a cero en relación con los otros parámetros (en función R stats::StructTSy paquete stsm ).
  • Pruebas de estacionalidad, basadas en maniquíes estacionales, ciclos estacionales o aquellos descritos e implementados en X-12 .
  • También es necesario verificar la presencia de pulsos y cambios de nivel como lo menciona IrishStat, ya que pueden distorsionar las conclusiones de los métodos anteriores (en R, los paquetes tsoutliers pueden ser útiles para este fin).
javlacalle
fuente
He agregado la trama hasta el retraso 60. ¿Cuál sería el comando R para obtener "series diferenciadas"? Agregaré parcelas para diff (my_series).
rnso
@mso He agregado cambios importantes a mi respuesta anterior. El comando para la serie diferenciada es la función diffque utilizó.
javlacalle
javlacalle: había dos párrafos muy similares y @rnso intentó ayudar eliminando uno. He eliminado lo que creo que es el que querías reemplazar. ¿Podría verificar que se eliminó el párrafo correcto?
Glen_b -Reinstalar a Mónica el
@Glen_b gracias por la edición, he realizado algunos cambios.
javlacalle
@ javlacalle, @IrishStat: vea la edición en mi pregunta sobre los datos originales.
rnso