Tengo un conjunto de datos meteorológicos diarios, que tiene, como era de esperar, un efecto estacional muy fuerte.
Adapté un modelo ARIMA a este conjunto de datos usando la función auto.arima del paquete de pronóstico. Para mi sorpresa, la función no aplica ninguna operación estacional: diferenciación estacional, componentes estacionales ar o ma. Aquí está el modelo que estimó:
library(forecast)
data<-ts(data,frequency=365)
auto.arima(Berlin)
Series: data
ARIMA(3,0,1) with non-zero mean
Coefficients:
ar1 ar2 ar3 ma1 intercept
1.7722 -0.9166 0.1412 -0.8487 283.0378
s.e. 0.0260 0.0326 0.0177 0.0214 1.7990
sigma^2 estimated as 5.56: log likelihood=-8313.74
AIC=16639.49 AICc=16639.51 BIC=16676.7
Y también las previsiones que utilizan este modelo no son realmente satisfactorias. Aquí está la trama del pronóstico:
¿Alguien puede darme una pista de lo que está mal aquí?
r
time-series
forecasting
arima
arma
Minero de datos
fuente
fuente
Respuestas:
R no se ajustará a un modelo ARIMA con una estacionalidad superior a 350. Consulte http://robjhyndman.com/hyndsight/longseasonality/ para obtener una discusión sobre este tema. La solución es utilizar términos de Fourier para la estacionalidad y errores ARMA para la dinámica a corto plazo.
fuente
La solución a su problema es, como señala Rob, es combinar efectos deterministas (semana del año) y efectos estocásticos (estructura ARIMA) mientras se aíslan los días inusuales y se detecta la posible presencia de uno o más cambios de nivel y / o uno o más locales. tendencias de tiempo. AUTOBOX, el software utilizado para el análisis fue desarrollado en parte por mí para proporcionar automáticamente modelos sólidos para conjuntos de datos como este.
He colocado sus datos en http://www.autobox.com/weather/weather.txt .
El acf de los datos originales es lo que conduce a una selección automática del modelo del formulario . Las estadísticas del modelo tienen un gráfico residual de El gráfico de los pronósticos para los próximos 60 días se presenta aquí. El gráfico Actual / Ajuste / Pronóstico se muestra aquí.
Puede ser interesante para otros seguir los consejos del profesor Hyndaman e informar su modelo final con verificaciones de diagnóstico con respecto a diagnósticos residuales y pruebas de parámetros de importancia.
Personalmente, me siento incómodo con la sugerencia de realizar primero un análisis de Fourier (posiblemente / probablemente afectado por anomalías) y luego hacer ARIMA en los residuos es inaceptable, ya que no es una solución simultánea que conduce a 1 ecuación, sino más bien una secuencia presunta. Mi ecuación usa la semana del mes y también incluye un AR (1) y remedios para los puntos de datos inusuales.
Todo el software tiene limitaciones y es bueno conocerlas. Una vez más, reitero por qué alguien no intenta implementar las sugerencias de Rob y mostrar los resultados completos.
fuente