Realmente tengo problemas para descubrir cómo comparar ARIMA y los modelos de regresión. Entiendo cómo evaluar los modelos ARIMA entre sí y los diferentes tipos de modelos de regresión (es decir: regresión vs regresión dinámica con errores AR) entre sí, sin embargo, no puedo ver muchos puntos en común entre el modelo ARIMA y las métricas de evaluación del modelo de regresión.
Las dos únicas métricas que comparten son el SBC y el AIC. La salida de ARIMA no produce ni una figura MSE raíz ni una estadística r ^ 2. No estoy muy seguro de si la estimación de error estándar de un modelo ARIMA es directamente equivalente (o comparable) a cualquier cosa dentro de los resultados de regresión.
Si alguien pudiera señalarme en la dirección correcta, sería genial, ya que estoy realmente confundido aquí. Siento que estoy tratando de comparar manzanas con naranjas.
Por cierto, estoy usando SAS para realizar este análisis.
Puede usar el MSE / AIC / BIC del modelo arima y compararlo con el MSE / AIC / BIC del modelo de regresión. Solo asegúrese de que el número de valores ajustados sea el mismo; de lo contrario, podría estar cometiendo un error. Por ejemplo, si el modelo ARIMA tiene una estructura de retraso de digamos sp + p (una diferencia estacional de orden sp y una estructura autorregresiva de orden p, pierde los primeros puntos de datos sp + p y solo los valores NOB-SP-P se ajustan realmente. Si el modelo de regresión no tiene retrasos, entonces tiene puntos NOB ajustados o menos dependiendo de su especificación de los valores rezagados para las entradas. Por lo tanto, uno tiene que darse cuenta de que los MSE pueden no estar en los mismos valores reales históricos. Un enfoque sería calcule el MSE del modelo de regresión en los últimos valores NOB-SP-P para poner los modelos en igualdad de condiciones. Es posible que desee GOOGLE " En el cierre, uno nunca encajaría normalmente en un modelo de regresión con series de tiempo, ya que puede ser información en los retrasos de las causas y los retrasos de la variable dependiente que justifica el STEP-UP de la regresión a un modelo de función de transferencia, también conocido como modelo ARMAX. Si no hiciste STEP-UP, uno o más de los supuestos gauusianos quedarían anulados, lo que haría que tus pruebas de F / T carecieran de sentido y fueran irreverentes. Además, puede haber violaciones de la constancia del término de error que requiere la incorporación de cambios de nivel / tendencias de tiempo local y pulso o variable de pulso estacional para hacer que el proceso de error tenga una "media de 0.0 en todas partes" En el cierre, uno nunca encajaría normalmente en un modelo de regresión con series de tiempo, ya que puede ser información en los retrasos de las causas y los retrasos de la variable dependiente que justifica el STEP-UP de la regresión a un modelo de función de transferencia, también conocido como modelo ARMAX. Si no hiciste STEP-UP, uno o más de los supuestos gauusianos quedarían anulados, lo que haría que tus pruebas de F / T carecieran de sentido y fueran irreverentes. Además, puede haber violaciones de la constancia del término de error que requiere la incorporación de cambios de nivel / tendencias de tiempo local y pulso o variable de pulso estacional para hacer que el proceso de error tenga una "media de 0.0 en todas partes" t STEP-UP entonces uno o más de los Supuestos Gauusianos se anularían haciendo que sus pruebas de F / T carezcan de sentido y sean irreverentes. Además, puede haber violaciones de la constancia del término de error que requiere la incorporación de cambios de nivel / tendencias de tiempo local y pulso o variable de pulso estacional para hacer que el proceso de error tenga una "media de 0.0 en todas partes" t STEP-UP entonces uno o más de los Supuestos Gauusianos se anularían haciendo que sus pruebas de F / T carezcan de sentido y sean irreverentes. Además, puede haber violaciones de la constancia del término de error que requiere la incorporación de cambios de nivel / tendencias de tiempo local y pulso o variable de pulso estacional para hacer que el proceso de error tenga una "media de 0.0 en todas partes"
fuente
La validación cruzada probablemente sería buena aquí. Para hacer esto, divide su conjunto de datos en 2 partes. Utiliza la primera parte para ajustar ambos modelos y luego usa el modelo ajustado para predecir la segunda parte. Esto puede justificarse como una aproximación a un enfoque totalmente bayesiano para la selección de modelos. Tenemos la probabilidad de un modeloMi
Que puede verse heurísticamente como una secuencia de predicciones, y luego de aprender de los errores. Usted predice el primer punto de datos sin entrenamiento. Luego predice el segundo punto de datos después de conocer el modelo con el primero. Luego predice el tercer punto de datos después de usar los dos primeros para aprender sobre el modelo, y así sucesivamente. Ahora, si tiene un conjunto de datos suficientemente grande, entonces los parámetros del modelo estarán bien determinados más allá de una cierta cantidad de datos, y tendremos, por algún valork :
El modelo no puede "aprender" más acerca de los parámetros, y básicamente solo predice según el primerk observaciones Entonces elegiríak (el tamaño del primer grupo) para ser lo suficientemente grande como para que pueda ajustarse con precisión al modelo, 20 -30 Los puntos de datos por parámetro son probablemente suficientes. También quieres elegirk lo suficientemente grande como para que la dependencia en el rek + 1. . .renorte lo que se ignora no hace que la aproximación sea inútil.
Luego, simplemente evaluaría las probabilidades de cada predicción y tomaría su razón, interpretada como una razón de probabilidad. Si la relación es aproximadamente1 , entonces ninguno de los dos modelos es particularmente mejor que el otro. Si está lejos de1 entonces esto indica que uno de los modelos está superando al otro. una relación de menos de 5 es débil, 10 es fuerte, 20 muy fuerte y 100, decisiva (correspondiente recíproco para números pequeños).
fuente