Estoy evaluando un modelo físico y me gustaría saber cuál de los métodos debería usar aquí (entre RMSE y Coefficient of Determination R2)
El problema es el siguiente: tengo una función que genera predicciones para el valor de entrada x, . También tengo la observación real para ese valor que llamo .
Mi pregunta es cuáles son los pros y los contras de RMSE o . Los he visto a ambos ser utilizados en documentos para el problema en el que estoy trabajando.
This value shows how well future outcomes can be predicted by the model
- Esto es extremadamente engañoso y se inclina simplemente hacia el mal . No hay garantía de que un alto coeficiente de determinación en un modelo dado se relacione con qué tan bien se pronosticarán los resultados futuros.No importa qué medida de error administre, considere dar su vector de resultados completo en un apéndice. Las personas a las que les gusta comparar con su método pero prefieren otra medición de error pueden derivar dicho valor de su tabla.
No refleja errores sistemáticos. Imagine que mide diámetros en lugar de radios de objetos circulares. Tiene una sobreestimación esperada del 100%, pero puede alcanzar un cercano a 1.R2
No estoy de acuerdo con los comentarios anteriores de que es difícil de entender. Cuanto mayor sea el valor, más preciso será su modelo, pero puede incluir errores sistemáticos.R2
Puede expresarse mediante la fórmula fácil de entender en la que construye la razón de la suma de los residuos al cuadrado y se divide por la media:
Puede alcanzar un bajo solo si tiene una alta precisión (los valores atípicos simples pero grandes castigan fuertemente) y ningún error sistemático. Entonces, en cierto modo, un bajo mejor calidad que un alto .R MSmi R MSmi R2
Este número tiene una unidad y no es fácil de interpretar para personas que no están familiarizadas con sus datos. Se puede dividir, por ejemplo, con la media de los datos para producir un . Tenga cuidado, esta no es la única definición de . Algunas personas prefieren dividir por el rango de sus datos en lugar de dividir por la media.r e l . R MSmi r e l . R MSmi
Como otras personas mencionaron, la elección podría depender de su campo y estado del arte. ¿Existe un método ampliamente aceptado para comparar también? Use la misma medida que ellos y podrá vincular directamente los beneficios de sus métodos fácilmente en la discusión.
fuente
Tanto el Root-Mean-Square-Error (RMSE) como el coeficiente de determinación ( )R2 ofrecen información diferente, pero complementaria, que debe evaluarse al evaluar su modelo físico. Ninguno de los dos es "mejor", pero algunos informes podrían centrarse más en una métrica dependiendo de la aplicación en particular.
Usaría lo siguiente como una guía muy general para comprender la diferencia entre ambas métricas:
El RMSE le da una idea de cuán cerca (o lejos) están sus valores pronosticados de los datos reales que está intentando modelar. Esto es útil en una variedad de aplicaciones en las que desea comprender la precisión y precisión de las predicciones de su modelo (por ejemplo, modelar la altura del árbol).
Pros
Contras
El coeficiente de determinación ( )R2 es útil cuando intenta comprender qué tan bien las variables independientes seleccionadas explican la variabilidad en sus variables dependientes. Esto es útil cuando intenta explicar qué factores podrían estar impulsando el proceso subyacente de interés (por ejemplo, variables climáticas y condiciones del suelo relacionadas con la altura de los árboles).
Pros
Contras
Por supuesto, lo anterior estará sujeto al tamaño de la muestra y al diseño de la muestra, y a un entendimiento general de que la correlación no implica causalidad.
fuente
También hay MAE, error absoluto medio. A diferencia de RMSE, no es demasiado sensible a los grandes errores. Por lo que he leído, algunos campos prefieren RMSE, otros MAE. Me gusta usar ambos.
fuente
En realidad, para que los científicos estadísticos conozcan el mejor ajuste del modelo, entonces RMSE es muy importante para esas personas en su sólida investigación. Si RMSE está muy cerca de cero, entonces el modelo se ajusta mejor.
El coeficiente de determinación es bueno para otros científicos como la agricultura y otros campos. Es un valor entre 0 y 1. Si es 1, el 100% de los valores coinciden con los conjuntos de datos observados. Si es 0, entonces los datos son completamente heterogéneos. Dr.SK.Khadar Babu, Universidad VIT, Vellore, Tamil Nadu, India.
fuente
Si se agrega algún número a cada elemento de uno de los vectores, RMSE cambia. Lo mismo si todos los elementos en uno o ambos vectores se multiplican por un número. El código R sigue;
fuente
En última instancia, la diferencia es solo la estandarización, ya que ambos conducen a la elección del mismo modelo, porque RMSE multiplicado por el número de observaciones está en el numerador o R al cuadrado, y el denominador de este último es constante en todos los modelos (solo trace una medida contra el otro para 10 modelos diferentes).
fuente