¿Pueden RMSE y MAE tener el mismo valor?

9

Estoy implementando validación cruzada y calculando métricas de error como RMSE, R2 , MAE, MSE, etc.

¿Pueden RMSE y MAE tener el mismo valor?

Perl
fuente
1
Si. Por qué no? Deje que sea ​​siempre 0 y un predictor para X sea ​​siempre 1 . Ahí lo tienesX0 0X1
David

Respuestas:

17

Si, en teoria. El caso más simple que puedo imaginar es un conjunto de datos donde todos los errores de predicción (es decir, los residuos) son exactamente ± 1. RMSE y MAE devolverán valores idénticos de 1. También se pueden construir otros escenarios, pero ninguno parece muy probable.

EDITAR: Gracias a @DilipSarwate por señalar (explicado por @ user20160 en su excelente respuesta) que este resultado es posible si y solo si los valores absolutos de todos los errores de predicción son idénticos. No hay nada especial sobre el valor ± 1 en mi ejemplo, en otras palabras; cualquier otro número funcionaría en lugar de 1.

mkt - Restablecer a Monica
fuente
1
¿Podría dar un ejemplo de los otros escenarios que imagina? Me refiero a un ejemplo que no sea un múltiplo escalar (cuando todos los residuos son lugar de ± 1 ) del ejemplo anterior. ±σ±1
Dilip Sarwate
@DilipSarwate Estaba reflexionando sobre esto cuando user20160 agregó una respuesta mucho mejor que lo cubre con más detalle de lo que podría.
mkt - Restablecer Monica
1
@mkt Gracias por las amables palabras. Su respuesta es correcta y concisa (+1)
user20160
@DilipSarwate Gracias por el aporte
mkt - Reinstale a Monica el
1
Un par de adornos adicionales a su respuesta: (i) debe ser par (digamos n = 2 k ) y (ii) exactamente k residuos deben tener valor + σ y exactamente k residuos deben tener valor - σ , lo que por supuesto significa que todos los residuos tienen un valor absoluto σ como usted dice, pero (ii) asegura que los residuos sumen 0 como deben. Los residuales son las desviaciones de la media y, por lo tanto, deben sumar cero. nortenorte=2kk+σk-σσ0 0
Dilip Sarwate
23

El error absoluto medio (MAE) puede ser igual al error cuadrático medio (MSE) o al error cuadrático medio raíz (RMSE) bajo ciertas condiciones, que mostraré a continuación. Es poco probable que estas condiciones ocurran en la práctica.

Preliminares

Sea ryo=El |yyo-y^yoEl |denotar el valor absoluto de la residual para el yo ésimo punto de datos, y dejar que r=[ryo,...,rnorte]T sea un vector que contiene los residuos absolutos para todos los norte puntos en el conjunto de datos. Dejar 1 denotar un vector norte×1 de unos, el MAE, el MSE y el RMSE se pueden escribir como:

(1)METROUNAmi=1norte1TrMETROSmi=1norterTrRMETROSmi=1norterTr

MSE

Establecer el MSE igual al MAE y reorganizar da:

(2)(r-1)Tr=0 0

El MSE y el MAE son iguales para todos los conjuntos de datos donde los residuos absolutos resuelven la ecuación anterior. Dos soluciones obvias son: r=0 0 (hay cero error) y r=1 (los residuales son todos ±1 , como se menciona mkt). Pero, hay infinitas soluciones.

Podemos interpretar la ecuación (2) geométricamente de la siguiente manera: El LHS es el producto escalar de r-1 y r . El producto de punto cero implica ortogonalidad. Entonces, el MSE y el MAE son iguales si restando 1 de cada residuo absoluto da un vector que es ortogonal a los residuos absolutos originales.

Además, al completar el cuadrado, la ecuación (2) puede reescribirse como:

(3)(r-121)T(r-121)=norte4 4

Esta ecuación describe una esfera norte dimensional centrada en [12,...,12]Tcon radio12norte . El MSE y el MAE son iguales si y solo si los residuos absolutos se encuentran en la superficie de esta hiperesfera.

RMSE

Establecer el RMSE igual al MAE y reorganizar da:

(4)rTUNAr=0 0

UNA=(norteyo-11T)

donde yo es la matriz de identidad. El conjunto de soluciones es el espacio nulo de UNA ; es decir, el conjunto de todos r tal que UNAr=0 0 . Para encontrar el espacio nulo, tenga en cuenta queUNA es unamatriznorte×norte con elementos diagonales iguales anorte-1 y todos los demás elementos iguales a-1 . El enunciadoUNAr=0 0 corresponde al sistema de ecuaciones:

(5)(norte-1)ryo-jyorj=0 0yo

O, reorganizando cosas:

(6)ryo=1norte-1jyorjyo

Es decir, cada elemento ryo debe ser igual a la media de los otros elementos. La única forma de satisfacer este requisito es que todos los elementos sean iguales (este resultado también puede obtenerse considerando la descomposición propia de UNA ). Por lo tanto, el conjunto de soluciones consta de todos los vectores no negativos con entradas idénticas:

{rr=C1C0 0}

Por lo tanto, RMSE y MAE son iguales si y solo si los valores absolutos de los residuos son iguales para todos los puntos de datos.

usuario20160
fuente
1
+1. Sentí la necesidad de verificar que la mayor parte de esta hiperesfera se encuentra en la región donde todos los componentes de no son negativos, lo cual es un requisito de residuos absolutos: eso me convenció de que realmente hay muchas soluciones (no triviales). r
Whuber
+1 Gran respuesta!
mkt - Restablecer Monica
1
En realidad, la pregunta era si RMSE y MAE pueden ser iguales y no si MSE y MAE pueden ser iguales. ¿Quizás la respuesta de @ mkt (o la versión generalizada que sugerí en un comentario) es la única respuesta a la pregunta RMSE = MAE?
Dilip Sarwate
@DilipSarwate, sí, me di cuenta después de publicar esto que me había saltado la parte 'R'. He editado para incluir RMSE ahora. Creo que la versión que sugirió es la única respuesta posible en este caso.
user20160
2
@Hiyam Si solo hay 1 valor, entonces RMSE por definición debe ser igual a MAE. Debido a que solo hay 1 error, cuadrarlo y tomar la raíz solo devuelve el valor absoluto del error original.
mkt - Restablecer Monica