Me preguntaba si alguien podría explicar la diferencia entre la precisión equilibrada que es
b_acc = (sensitivity + specificity)/2
y puntaje f1 que es:
f1 = 2*precision*recall/(precision + recall)
fuente
Me preguntaba si alguien podría explicar la diferencia entre la precisión equilibrada que es
b_acc = (sensitivity + specificity)/2
y puntaje f1 que es:
f1 = 2*precision*recall/(precision + recall)
Matemáticamente, b_acc es la media aritmética de recordar_P y recordar_N y f1 es la media armónica de recordar_P y precisión_P.
Tanto F1 como b_acc son métricas para la evaluación del clasificador, que (en cierta medida) manejan el desequilibrio de clase. Dependiendo de cuál de las dos clases (N o P) supera en número a la otra, cada métrica supera a la otra.
1) Si N >> P, f1 es mejor.
2) Si P >> N, b_acc es mejor.
Claramente, si puede cambiar de etiqueta, ambas métricas se pueden usar en cualquiera de los dos casos de desequilibrio anteriores. De lo contrario, dependiendo del desequilibrio en los datos de entrenamiento, puede seleccionar la métrica adecuada.