auto.arima no reconoce el patrón estacional

8

Tengo un conjunto de datos meteorológicos diarios, que tiene, como era de esperar, un efecto estacional muy fuerte.

ingrese la descripción de la imagen aquí

Adapté un modelo ARIMA a este conjunto de datos usando la función auto.arima del paquete de pronóstico. Para mi sorpresa, la función no aplica ninguna operación estacional: diferenciación estacional, componentes estacionales ar o ma. Aquí está el modelo que estimó:

library(forecast)
data<-ts(data,frequency=365)
auto.arima(Berlin)

Series: data
ARIMA(3,0,1) with non-zero mean 

Coefficients:
         ar1      ar2     ar3      ma1  intercept
      1.7722  -0.9166  0.1412  -0.8487   283.0378
s.e.  0.0260   0.0326  0.0177   0.0214     1.7990

sigma^2 estimated as 5.56:  log likelihood=-8313.74
AIC=16639.49   AICc=16639.51   BIC=16676.7

Y también las previsiones que utilizan este modelo no son realmente satisfactorias. Aquí está la trama del pronóstico: ingrese la descripción de la imagen aquí

¿Alguien puede darme una pista de lo que está mal aquí?

Minero de datos
fuente
¿Puedes publicar el código (o ejemplo similar) que usaste para obtener la salida?
rbatt
Hola rbat, publiqué el código que usé. Los datos sin procesar se guardan en 'datos'. Primero lo convertí en objeto ts
DatamineR
Su coeficiente MA (1) (-.84) es sospechosamente cercano a -1 el límite de invertabilidad sugiriendo (para mí) que ha impuesto una especificación de modelo incorrecta en los datos desprevenidos. Proporcione un enlace a los datos sin procesar reales y trataré de ayudarlo a utilizar un enfoque más sofisticado que el que tiene acceso actual. Podría arrojar luz sobre su solución requerida.
IrishStat el
Gracias IrishStat por la oferta! Estoy confundido por qué 'auto.arima' no estima aquí un modelo estacional, aunque la estacionalidad es obvia. Si tuviera que estimar un modelo aquí, probablemente eliminaría la estacionalidad con el método de Fourier o solo la diferencia estacional (en este caso con retraso = 365) de los datos. ¿Pero no debería 'auto.arima' hacer la diferenciación adecuada? Traté de adjuntar los datos, pero no encontré la posibilidad de hacerlo. ¿Cómo se pueden insertar los datos en la pregunta?
DatamineR
Si lo desea, puede enviarme un correo electrónico. Adjunte un archivo de Excel con información de la fecha de inicio y lo publicaré en el grupo. Mire mi información de contacto para obtener mi dirección de correo electrónico.
IrishStat

Respuestas:

11

R no se ajustará a un modelo ARIMA con una estacionalidad superior a 350. Consulte http://robjhyndman.com/hyndsight/longseasonality/ para obtener una discusión sobre este tema. La solución es utilizar términos de Fourier para la estacionalidad y errores ARMA para la dinámica a corto plazo.

Rob Hyndman
fuente
7

La solución a su problema es, como señala Rob, es combinar efectos deterministas (semana del año) y efectos estocásticos (estructura ARIMA) mientras se aíslan los días inusuales y se detecta la posible presencia de uno o más cambios de nivel y / o uno o más locales. tendencias de tiempo. AUTOBOX, el software utilizado para el análisis fue desarrollado en parte por mí para proporcionar automáticamente modelos sólidos para conjuntos de datos como este.

He colocado sus datos en http://www.autobox.com/weather/weather.txt .

El acf de los datos originales es lo ingrese la descripción de la imagen aquíque conduce a una selección automática del modelo del formulario ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí ingrese la descripción de la imagen aquí. Las estadísticas del modelo tienen ingrese la descripción de la imagen aquíun gráfico residual de ingrese la descripción de la imagen aquíEl gráfico de los pronósticos para los próximos 60 días se presenta aquí. ingrese la descripción de la imagen aquí El gráfico Actual / Ajuste / Pronóstico se muestra aquí.ingrese la descripción de la imagen aquí

Puede ser interesante para otros seguir los consejos del profesor Hyndaman e informar su modelo final con verificaciones de diagnóstico con respecto a diagnósticos residuales y pruebas de parámetros de importancia.

Personalmente, me siento incómodo con la sugerencia de realizar primero un análisis de Fourier (posiblemente / probablemente afectado por anomalías) y luego hacer ARIMA en los residuos es inaceptable, ya que no es una solución simultánea que conduce a 1 ecuación, sino más bien una secuencia presunta. Mi ecuación usa la semana del mes y también incluye un AR (1) y remedios para los puntos de datos inusuales.

Todo el software tiene limitaciones y es bueno conocerlas. Una vez más, reitero por qué alguien no intenta implementar las sugerencias de Rob y mostrar los resultados completos.

IrishStat
fuente