Estoy implementando validación cruzada y calculando métricas de error como RMSE, , MAE, MSE, etc.
¿Pueden RMSE y MAE tener el mismo valor?
cross-validation
rms
mae
Perl
fuente
fuente
Respuestas:
Si, en teoria. El caso más simple que puedo imaginar es un conjunto de datos donde todos los errores de predicción (es decir, los residuos) son exactamente± 1. RMSE y MAE devolverán valores idénticos de 1. También se pueden construir otros escenarios, pero ninguno parece muy probable.
EDITAR: Gracias a @DilipSarwate por señalar (explicado por @ user20160 en su excelente respuesta) que este resultado es posible si y solo si los valores absolutos de todos los errores de predicción son idénticos. No hay nada especial sobre el valor± 1 en mi ejemplo, en otras palabras; cualquier otro número funcionaría en lugar de 1.
fuente
El error absoluto medio (MAE) puede ser igual al error cuadrático medio (MSE) o al error cuadrático medio raíz (RMSE) bajo ciertas condiciones, que mostraré a continuación. Es poco probable que estas condiciones ocurran en la práctica.
Preliminares
Searyo= | yyo- y^yoEl | denotar el valor absoluto de la residual para el yo ésimo punto de datos, y dejar que r = [ ryo, ... , rnorte]T sea un vector que contiene los residuos absolutos para todos los norte puntos en el conjunto de datos. Dejar 1⃗ denotar un vector n × 1 de unos, el MAE, el MSE y el RMSE se pueden escribir como:
MSE
Establecer el MSE igual al MAE y reorganizar da:
El MSE y el MAE son iguales para todos los conjuntos de datos donde los residuos absolutos resuelven la ecuación anterior. Dos soluciones obvias son:r = 0⃗ (hay cero error) y r = 1⃗ (los residuales son todos ± 1 , como se menciona mkt). Pero, hay infinitas soluciones.
Podemos interpretar la ecuación( 2 ) geométricamente de la siguiente manera: El LHS es el producto escalar de r - 1⃗ y r . El producto de punto cero implica ortogonalidad. Entonces, el MSE y el MAE son iguales si restando 1 de cada residuo absoluto da un vector que es ortogonal a los residuos absolutos originales.
Además, al completar el cuadrado, la ecuación( 2 ) puede reescribirse como:
Esta ecuación describe una esferanorte dimensional centrada en [ 12, ... , 12]T con radio12norte--√ . El MSE y el MAE son iguales si y solo si los residuos absolutos se encuentran en la superficie de esta hiperesfera.
RMSE
Establecer el RMSE igual al MAE y reorganizar da:
dondeyo es la matriz de identidad. El conjunto de soluciones es el espacio nulo de UNA ; es decir, el conjunto de todos r tal que A r = 0⃗ . Para encontrar el espacio nulo, tenga en cuenta queUNA es unamatrizn × n con elementos diagonales iguales an - 1 y todos los demás elementos iguales a- 1 . El enunciadoA r = 0⃗ corresponde al sistema de ecuaciones:
O, reorganizando cosas:
Es decir, cada elementoryo debe ser igual a la media de los otros elementos. La única forma de satisfacer este requisito es que todos los elementos sean iguales (este resultado también puede obtenerse considerando la descomposición propia de UNA ). Por lo tanto, el conjunto de soluciones consta de todos los vectores no negativos con entradas idénticas:
Por lo tanto, RMSE y MAE son iguales si y solo si los valores absolutos de los residuos son iguales para todos los puntos de datos.
fuente