Estoy tratando de entender un documento sobre el pronóstico de la carga eléctrica, pero estoy luchando con los conceptos internos, especialmente el modelo SARIMAX . Este modelo se usa para predecir la carga y utiliza muchos conceptos estadísticos que no entiendo (soy un estudiante universitario de ciencias de la computación; puede considerarme un laico en estadística). No es necesario que comprenda completamente cómo funciona, pero al menos me gustaría entender intuitivamente lo que está sucediendo.
He estado tratando de dividir SARIMAX en piezas más pequeñas y tratando de entender cada una de estas piezas por separado y luego juntarlas. ¿Pueden ayudarme chicos? Esto es lo que tengo hasta ahora.
Empecé con AR y MA.
AR : autorregresivo . Aprendí qué es una regresión y, según tengo entendido, simplemente responde a la pregunta: dado un conjunto de valores / puntos, ¿cómo puedo encontrar un modelo que explique estos valores? Entonces tenemos, por ejemplo, la regresión lineal, que trata de encontrar una línea que pueda explicar todos estos puntos. Una autorregresión es una regresión que intenta explicar los valores utilizando sus valores anteriores.
MA : Media móvil . En realidad estoy bastante perdido aquí. Sé lo que es un promedio móvil, pero el modelo de promedio móvil no parece tener nada que ver con el promedio móvil "normal". La fórmula para el modelo parece extrañamente similar a AR y parece que no puedo entender ninguno de los conceptos que encuentro en Internet. ¿Cuál es el propósito de MA? ¿Cuál es la diferencia entre MA y AR?
Entonces ahora tenemos ARMA. El I a continuación viene de Integrated , que por lo que he entendido, simplemente sirve para el propósito de permitir que el modelo ARMA para tener una tendencia, ya sea aumentando o disminuyendo. (¿Es esto equivalente a decir que ARIMA le permite ser no estacionario?)
Ahora viene el S de temporada , que agrega periodicidad a ARIMA, que básicamente dice, por ejemplo, en el caso del pronóstico de carga, que la carga se ve muy similar todos los días a las 6 PM.
Finalmente, la X , de variables exógenas , que básicamente permite que las variables externas sean consideradas en el modelo, como las predicciones meteorológicas.
¡Así que finalmente tenemos SARIMAX! ¿Están bien mis explicaciones? Reconozca que no se requiere que estas explicaciones sean rigurosamente correctas. ¿Alguien puede explicarme qué hace MA de forma intuitiva?
Respuestas:
Como notó, (1) un modelo AR relaciona el valor de una observación en el tiempo t con los valores anteriores, con algún error: x t = ϕ x t - 1 + ε t Sustituyamos en x t - 1 , y luego x t - 2 : x tX t
Habiendo visto eso, reformulemos nuestra definición (1) ahora. Un proceso AR relaciona el valor de una observación en el tiempo t con una secuencia infinita de choques de error en descomposición ε de períodos de tiempo anteriores (que no observamos directamente).X t ε
fuente