MAD = Desviación absoluta media MSE = Error cuadrado medio
He visto sugerencias de varios lugares sobre el uso de MSE a pesar de algunas cualidades indeseables (por ejemplo , http://www.stat.nus.edu.sg/~staxyc/T12.pdf , que establece en p8 "Se cree comúnmente que MAD es un criterio mejor que MSE. Sin embargo, matemáticamente MSE es más conveniente que MAD ".
¿Hay algo más que eso? ¿Existe un documento que analice a fondo las situaciones en las que varios métodos para medir el error de pronóstico son más / menos apropiados? Mis búsquedas en Google no han revelado nada.
Una pregunta similar a esta se hizo en /programming/13391376/how-to-decide-the-forecasting-method-from-the-me-mad-mse-sde , y se le pidió al usuario que publique en stats.stackexchange.com, pero no creo que lo hayan hecho nunca.
fuente
Respuestas:
Para decidir qué medida de error de pronóstico puntual usar, debemos dar un paso atrás. Tenga en cuenta que no conocemos el resultado futuro a la perfección, ni lo sabremos nunca. Entonces, el resultado futuro sigue una distribución de probabilidad . Algunos métodos de pronóstico generan explícitamente una distribución tan completa, y otros no, pero siempre está ahí, aunque sea de manera implícita.
Ahora, queremos tener una buena medida de error para un pronóstico puntual . Tal pronóstico puntualFt es nuestro intento de resumir lo que sabemos sobre la distribución futura (es decir, la distribución predictiva) en el tiempo t usando un solo número, un llamado funcional de la densidad futura. La medida de error es una forma de evaluar la calidad de este resumen de un solo número.
Por lo tanto, debe elegir una medida de error que recompense "buenos" resúmenes de un número de densidades futuras (desconocidas, posiblemente pronosticadas, pero posiblemente solo implícitas).
El desafío es que las diferentes medidas de error son minimizadas por diferentes funcionales. El MSE esperado se minimiza por el valor esperado de la distribución futura. El MAD esperado se minimiza por la mediana de la distribución futura. Por lo tanto, si calibra sus pronósticos para minimizar el MAE, su pronóstico puntual será la mediana futura, no el valor esperado futuro, y sus pronósticos serán sesgados si su distribución futura no es simétrica.
Esto es más relevante para los datos de conteo, que generalmente están sesgados. En casos extremos (por ejemplo, Poisson distribuyó ventas con una media por debajo delog2≈0.69 ), su MAE será más bajo para un pronóstico de cero plano. Ver aquí o aquí o aquí para más detalles.
Doy más información y una ilustración en ¿Cuáles son las deficiencias del error de porcentaje absoluto medio (MAPE)? Ese hilo considera el mape , pero también otras medidas de error, y contiene enlaces a otros hilos relacionados.
Al final, qué medida de error usar realmente depende de su costo de error de pronóstico, es decir, qué tipo de error es más doloroso. Sin mirar las implicaciones reales de los errores de pronóstico, cualquier discusión sobre "mejores criterios" básicamente no tiene sentido.
Las medidas de precisión del pronóstico fueron un gran tema en la comunidad de pronósticos hace algunos años, y todavía aparecen de vez en cuando. Un artículo muy bueno para mirar es Hyndman & Koehler "Otra mirada a las medidas de precisión de pronóstico" (2006).
Finalmente, una alternativa es calcular las densidades predictivas completas y evaluarlas utilizando reglas de puntuación adecuadas .
fuente
Las ventajas de usar MAE en lugar de MSE se explican en Davydenko y Fildes (2016) , consulte la Sección 3.1:
Referencias
Davydenko, A. y Fildes, R. (2016). Medidas de error de pronóstico: revisión crítica y recomendaciones prácticas. En previsión empresarial: problemas prácticos y soluciones. John Wiley & Sons
fuente
¿Por qué no compararRMSE=MSE−−−−−√ MAE=MAD
Realmente,
Si el RMSE está cerca del MAE, tiene muchas pequeñas desviaciones, si está cerca de su límite superior, hay pocas predicciones muy erróneas.
fuente