Entiendo que la medida f (basada en la precisión y el recuerdo) es una estimación de la precisión de un clasificador. Además, la medida f se ve favorecida sobre la precisión cuando tenemos un conjunto de datos desequilibrado. Tengo una pregunta simple (que trata más sobre el uso de la terminología correcta que sobre la tecnología). Tengo un conjunto de datos desequilibrado y uso f-measure en mis experimentos. Estoy a punto de escribir un artículo que NO es para una conferencia de aprendizaje automático / minería de datos. Por lo tanto, ¿puedo referirme a f-measure como sinónimo de precisión en este contexto? Por ejemplo, tengo una medida f de 0.82, entonces ¿puedo decir que mi clasificador logra 82% de predicciones precisas?
10
Respuestas:
En primer lugar, encuentro que la "precisión" a veces es un poco engañosa, ya que se refiere a cosas distintas:
El término precisión en general para evaluar sistemas o métodos (soy químico analítico) se refiere al sesgo de las predicciones, es decir, responde a la pregunta de qué tan buenas son las predicciones en promedio.
El puntaje F a menudo se introduce como media armónica de precisión y recuerdo (o valor predictivo positivo y sensibilidad). Para su pregunta, creo que es útil explicarlo un poco más y simplificarlo:
La última expresión no es una fracción de nada que pueda pensar como un cierto grupo de casos de prueba. En particular, se espera una superposición (fuerte) entre los casos VERDADERO y POSITIVO. Esto me impediría expresar un puntaje F como porcentaje, ya que ese tipo implica una proporción de casos. En realidad, creo que advertiría al lector que el puntaje F no tiene esa interpretación.
fuente
Respuesta rápida:
No, la
F-measure
fórmula no consta deTN
factor y es útil para recuperar problemas (doc) .Por lo tanto, es (
F-measure
) el enfoque correcto para evaluar los conjuntos de datos desequilibrados o en el caso de problemas de recuperación en lugar deaccuracy
yROC
.[ NOTA ]:
fuente