Actualmente estoy trabajando en un proyecto para hacer pronósticos de datos de series temporales (datos mensuales). Estoy usando R para hacer el pronóstico. Tengo 1 variable dependiente (y) y 3 variables independientes (x1, x2, x3). La variable y tiene 73 observaciones, al igual que las otras 3 variables (alos 73). De enero de 2009 a enero de 2015. He comprobado las correlaciones y el valor p, y es muy importante ponerlo en un modelo. Mi pregunta es: ¿cómo puedo hacer una buena predicción usando todas las variables independientes? No tengo valores futuros para estas variables. Digamos que me gustaría predecir cuál es mi variable y en más de 2 años (en 2017). ¿Cómo puedo hacer esto?
Intenté el siguiente código:
model = arima(y, order(0,2,0), xreg = externaldata)
¿Puedo hacer una predicción del valor y durante 2 años con este código?
También probé un código de regresión:
reg = lm(y ~ x1 + x2 + x3)
Pero, ¿cómo me tomo el tiempo en este código? ¿Cómo puedo pronosticar cuál será mi valor y por encima de digamos 2 años? Soy nuevo en estadísticas y pronósticos. He leído y levantado el valor de retraso, pero ¿cómo puedo usar un valor de retraso en el modelo para hacer pronósticos?
En realidad, mi pregunta general es ¿cómo puedo pronosticar datos de series de tiempo con variables externas sin valor futuro?
Respuestas:
Si ajusta un modelo utilizando variables externas y desea pronosticar a partir de este modelo, necesitará (pronosticado) valores futuros de las variables externas, simples y simples. No hay forma de evitar esto.
Por supuesto, hay diferentes formas de pronosticar sus variables explicativas. Puede usar el último valor observado (el pronóstico de "caminata aleatoria ingenua") o la media general. Simplemente puede establecerlos en cero si este es un valor útil para ellos (por ejemplo, eventos especiales que ocurrieron en el pasado como un terremoto, que no anticipa que se repitan). O podría ajustar y pronosticar un modelo de serie temporal a estas variables explicativas, por ejemplo, utilizando
auto.arima
.xreg
Recomiendo este libro de texto de pronóstico gratuito en línea , especialmente esta sección sobre regresión múltiple (desafortunadamente, no hay nada sobre ARIMAX allí), así como la publicación del blog de Rob Hyndman "El embrollo del modelo ARIMAX" .
fuente
Como dijo Yogi Berra, "Es difícil hacer predicciones, especialmente sobre el futuro".
Muchos módulos de software de estadísticas generarán pronósticos basados en el flujo univariado de series de tiempo en ausencia de información futura, por ejemplo, Pronóstico de proceso en SAS o cualquier número de módulos ARIMA disponibles. Estas previsiones son proyecciones basadas en el comportamiento histórico de sus datos.
Usted nos dice que sus datos son mensuales, pero no nos dice cuántos períodos tiene disponibles. Otro enfoque es configurar sus tres IV de nuevo 24 meses en relación con el DV para que el período que predicen sea t + 24. Esto supone que tiene una cantidad de fecha suficiente para inicializar el modelo y calibrar cualquier estacionalidad relevante, según corresponda.
fuente
Tal como lo veo, tienes tres opciones:
Cada enfoque tiene sus propias fortalezas y debilidades, por lo que lo mejor depende del contexto específico.
fuente