Estoy trabajando en un conjunto de datos. Después de usar algunas técnicas de identificación de modelos, obtuve un modelo ARIMA (0,2,1).
Utilicé la detectIO
función en el paquete TSA
en R para detectar un valor atípico innovador (IO) en la observación número 48 de mi conjunto de datos original.
¿Cómo incorporo este valor atípico en mi modelo para poder usarlo con fines de pronóstico? No quiero usar el modelo ARIMAX, ya que es posible que no pueda hacer ninguna predicción a partir de eso en R. ¿Hay alguna otra forma de hacerlo?
Aquí están mis valores en orden:
VALUE <- scan()
4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4
5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 9.6 9.8 10.0
9.9 9.9 9.8 9.8 9.9 9.9 9.6 9.4 9.5 9.5 9.5 9.5 9.8 9.3 9.1 9.0 8.9
9.0 9.0 9.1 9.0 9.0 9.0 8.9 8.6 8.5 8.3 8.3 8.2 8.1 8.2 8.2 8.2 8.1
7.8 7.9 7.8 7.8
Esa es en realidad mi información. Son tasas de desempleo durante un período de 6 años. Hay 72 observaciones entonces. Cada valor es como máximo un decimal
r
time-series
arima
outliers
hypergeometric
fishers-exact
r
time-series
intraclass-correlation
r
logistic
glmm
clogit
mixed-model
spss
repeated-measures
ancova
machine-learning
python
scikit-learn
distributions
data-transformation
stochastic-processes
web
standard-deviation
r
machine-learning
spatial
similarities
spatio-temporal
binomial
sparse
poisson-process
r
regression
nonparametric
r
regression
logistic
simulation
power-analysis
r
svm
random-forest
anova
repeated-measures
manova
regression
statistical-significance
cross-validation
group-differences
model-comparison
r
spatial
model-evaluation
parallel-computing
generalized-least-squares
r
stata
fitting
mixture
hypothesis-testing
categorical-data
hypothesis-testing
anova
statistical-significance
repeated-measures
likert
wilcoxon-mann-whitney
boxplot
statistical-significance
confidence-interval
forecasting
prediction-interval
regression
categorical-data
stata
least-squares
experiment-design
skewness
reliability
cronbachs-alpha
r
regression
splines
maximum-likelihood
modeling
likelihood-ratio
profile-likelihood
nested-models
b2amen
fuente
fuente
Respuestas:
De esta manera, puede ver que el impacto de la anomalía no solo es instantáneo sino que tiene memoria.
Cada vez que incorporas memoria, ya sea como resultado de un operador de diferenciación o una estructura ARMA, es una admisión tácita de ignorancia debido a la serie causal omitida. Esto también es cierto respecto de la necesidad de incorporar series deterministas de intervención, como pulsos / cambios de nivel, pulsos estacionales o tendencias de tiempo local. Estas variables ficticias son un proxy de neede para las variables causales especificadas por el usuario deterministas omitidas. A menudo, todo lo que tiene es la serie de interés y, dado los calificadores que he explicado, puede pronosticar el futuro basándose en el pasado en total ignorancia de la naturaleza exacta de los datos que se analizan. El único problema es que está utilizando la ventana trasera para predecir el camino por delante ... algo realmente peligroso.
después de que se publicaron los datos ...
Un modelo razonable es un (1,1,0) y las anomalías AO se identificaron en los períodos 39,41,47,21 y 69 (no en el período 48). Los residuos de este modelo parecen estar libres de estructura evidente. Y El precio AO valora una representación óptima de la actividad reflejada por la actividad que no está en la historia de la serie temporal. Creo que el ACF del modelo sobrediferenciado del OP reflejaría la insuficiencia del modelo. Aquí está el modelo. Una vez más, no se entrega ningún código R ya que el problema u oportunidad se encuentra en el ámbito de la identificación / revisión / validación del modelo. Finalmente, una trama de la serie real / ajustada y pronosticada. [Ingrese la descripción de la imagen aquí] [6]
fuente