RMSE vs Desviación estándar en población

12

RMSE (error cuadrático medio) y SD (desviación estándar) tienen fórmulas similares.

Este enlace dice

La única diferencia es que divide entre y no ya que no resta la media de la muestra aquí. El RMSE correspondería a . Por lo tanto, el RMSE de la población es y desea un CI para eso.nn1σσ

Así que quiero saber si RMSE y SD son iguales. Además, quiero referencia al respecto.

JH.Kim
fuente

Respuestas:

9

TLDR; Si bien las fórmulas pueden ser similares, RMSE y la desviación estándar tienen un uso diferente.

Tiene razón en que tanto la desviación estándar como el RMSE son similares porque son raíces cuadradas de diferencias cuadradas entre algunos valores. Sin embargo, no son lo mismo. La desviación estándar se usa para medir la dispersión de datos alrededor de la media, mientras que RMSE se usa para medir la distancia entre algunos valores y la predicción de esos valores. RMSE se usa generalmente para medir el error de predicción, es decir, en qué medida las predicciones que hizo difieren de los datos pronosticados. Si usa mean como su predicción para todos los casos, entonces RMSE y SD serán exactamente iguales.

Como nota al margen, puede observar que la media es un valor que minimiza la distancia al cuadrado a todos los valores de la muestra. Esta es la razón por la que usamos la desviación estándar, ¡son especies relacionadas!

Tim
fuente
1
@ Chill2Macht no se trata de la dispersión frente a la distancia, sino de la distribución de una sola variable frente a la distancia entre los valores predichos y verdaderos.
Tim
Eso tiene mucho sentido en realidad. Si consideramos que la distancia entre los valores predichos y verdaderos es una variable en sí misma, ¿sería apropiado en su opinión decir que el RMSE también es una medida de la propagación de esa variable? "Extensión de la distancia"?
Chill2Macht
2
@ Chill2Macht pero entonces se estará calculando la desviación estándar.
Tim
44
@ Chill2Macht RMSE no es sd de errores. Sd (errores) = media ((errores - media (errores)) ^ 2) mientras que rmse = media (errores ^ 2)
Tim
1
Vale la pena señalar que a medida que el error medio se acerca a 0 yn se acerca al infinito sd y rmse convergen.
Morgan Ball