¿Por qué no recordar tener en cuenta los verdaderos negativos?

10

¿Por qué no recordar tener en cuenta los verdaderos negativos? En experimentos donde los verdaderos negativos son tan importantes como los verdaderos positivos, ¿es una métrica comparable que lo tenga en cuenta?

Raffi Khatchadourian
fuente
2
Creo que la Tasa Negativa Verdadera (también llamada especificidad en otros entornos) es lo que está buscando, pero vea en.wikipedia.org/wiki/Precision_and_recall .
chl

Respuestas:

7

La recuperación (en combinación con la precisión) generalmente se usa en áreas donde uno está principalmente interesado en encontrar los positivos. Un ejemplo para tal área es, por ejemplo, Performance Marketing o (como ya lo sugirió el enlace ch'ls) el área de Recuperación de información.

Entonces:

Si está interesado principalmente en encontrar los negativos, la "Tasa Negativa Verdadera" (como ya sugirió chl) es el camino a seguir. Pero no olvide mirar una métrica de "precisión para centrarse en los negativos" (es decir, , porque de lo contrario la "Tasa negativa verdadera" puede optimizarse configurando la predicción como "Negativa" para todos los puntos de datos).TNTN+FN

Si está interesado en optimizar el recuerdo tanto para negativos como para positivos, debe mirar "Precisión" (vea nuevamente el enlace de chl). Pero tenga cuidado con el sesgo de clase (es decir, tiene muchos más aspectos positivos que negativos o viceversa ... en este caso se puede "optimizar" la precisión al establecer la predicción en la clase principal para todos los puntos de datos).

steffen
fuente
Gracias por la respuesta a mi pregunta. De hecho, estoy interesado en optimizar tanto para negativos como para positivos. En este caso, parece que la precisión es el camino a seguir, ya que considera tp, fp, tn y fn. Sin embargo, como mencionó anteriormente, debo ser consciente del sesgo de clase. Por lo tanto, ¿debería presentar precisión junto con otra métrica para contrarrestar esto? ¡Gracias de nuevo!
Raffi Khatchadourian
@ Raffi: podría agregar la proporción de ejemplos correctamente clasificados de la clase menor (es decir, precisión o tasa negativa verdadera, respectivamente). Sin embargo, creo que debería ser suficiente que declares tu conocimiento de este problema y que verifiques que el modelo no solo predice la clase principal. Pero esta es solo mi opinión.
steffen
¡Gracias! Creo que seguiré ese camino, es decir, la precisión actual y que el modelo no predice solo la clase principal.
Raffi Khatchadourian