¿Cómo interpretar las medidas de error?

41

Estoy ejecutando la clasificación en Weka para un determinado conjunto de datos y he notado que si estoy tratando de predecir un valor nominal, la salida muestra específicamente los valores predichos de forma correcta e incorrecta. Sin embargo, ahora lo estoy ejecutando para un atributo numérico y el resultado es:

Correlation coefficient                 0.3305
Mean absolute error                     11.6268
Root mean squared error                 46.8547
Relative absolute error                 89.2645 %
Root relative squared error             94.3886 %
Total Number of Instances               36441 

¿Cómo interpreto esto? He intentado buscar en Google cada noción, pero no entiendo mucho ya que las estadísticas no están en mi campo de especialización. Agradecería mucho un tipo de respuesta ELI5 en términos de estadísticas.

FloIancu
fuente

Respuestas:

52

Vamos a denotan el verdadero valor de interés como y el valor estimado utilizando algún algoritmo como θ .θθ^

Correlación le indica la cantidad y θ están relacionados. Se da valores entre - 1 y 1 , donde 0 es ninguna relación, 1 es muy fuerte, relación lineal y - 1 es una inversa lineal relación (es decir, valores más grandes de θ indican valores más pequeños de θ , o viceversa). A continuación encontrará un ejemplo ilustrado de correlación.θθ^11011θθ^

Ejemplo de correlación

(fuente: http://www.mathsisfun.com/data/correlation.html )

El error absoluto medio es:

MAE=1Ni=1N|θ^iθi|

El error cuadrático medio es:

RMETROSmi=1norteyo=1norte(θ^yo-θyo)2

Error absoluto relativo :

RAE=i=1N|θ^iθi|i=1N|θ¯θi|

donde es un valor medio deθ¯ .θ

Error al cuadrado relativo de la raíz:

RRSE=i=1N(θ^iθi)2i=1N(θ¯θi)2

Como puede ver, todas las estadísticas comparan los valores verdaderos con sus estimaciones, pero lo hacen de una manera ligeramente diferente. Todos te dicen "a qué distancia" están tus valores estimados del verdadero valor de . Algunas veces se usan raíces cuadradas y otras veces valores absolutos; esto se debe a que al usar raíces cuadradas los valores extremos tienen más influencia en el resultado (vea ¿Por qué cuadrar la diferencia en lugar de tomar el valor absoluto en la desviación estándar?θ O en Mathoverflow ).

En y R M S E simplemente observa la "diferencia promedio" entre esos dos valores, por lo que los interpreta en comparación con la escala de su valor, (es decir, M S E de 1 punto es una diferencia de 1 punto de θ entre θ yMAERMSEMSEθθ^ ).θ

En y R R S E se dividen esas diferencias por la variación de θ para que tengan una escala de 0 a 1 y si multiplica este valor por 100 obtendrá similitud en la escala de 0-100 (es decir, porcentaje). Los valores de ( ¯ θ - θ i ) 2 o | ¯ θ - θ i | decirle cuánto θ difiere de su valor medio, por lo que podría decir que se trata de cuánto θ difiere de sí mismo (compárese con la varianzaRAERRSEθ(θ¯θi)2|θ¯θi|θθ) Debido a eso, las medidas se denominan "relativas": le dan resultados relacionados con la escala deθ

Verifique también esas diapositivas .

Tim
fuente
¡Gracias por su explicación! Estoy tratando de evaluar el rendimiento de varios algoritmos. Entonces, por ejemplo, si obtengo este otro resultado (Correlación: 0.3044, MAE: 10.832, MSE: 47.2971, RAE: 83.163%, RSE: 95.2797%) y trato de compararlo con el primero, ¿cuál podría decir que se realizó? ¿mejor?
FloIancu
55
Debe elegir el modelo con mayor correlación y estimaciones de error más pequeñas. Como puede ver, existen múltiples medidas del rendimiento del modelo (y esas son solo unas pocas) y, a veces, dan respuestas diferentes. Casi nunca es el tipo de respuesta "sí / no" que obtienes. La tarea de selección de modelo sería más fácil si se pone al día con la teoría, puede consultar, por ejemplo, esas conferencias .
Tim
¡Muchas gracias! ¡Seguí y marqué tu respuesta como la respuesta porque me has ayudado mucho!
FloIancu
1
@Tim El error absoluto medio probablemente debería abreviarse como MAE :)
Antoine
1
@MewX ¿Qué tipo de referencias estás buscando? Básicamente es un RMSE reescalado. No hay mucho que decir al respecto ...
Tim