Comparación de dos modelos cuando las curvas ROC se cruzan

Una curva ROC visualiza TPR y FPR para todos los umbrales posibles .

Si traza dos curvas ROC 'A' y 'B' y no se cruzan entre sí, entonces uno de sus clasificadores claramente se desempeña mejor, porque para todos los valores FPR posibles obtiene un TPR más alto. Obviamente, el área bajo el ROC también será mayor.
Ahora, si se cruzan , entonces hay un punto donde FPR y TPR son iguales para ambas curvas 'A' y 'B' . Ya no puede decir que una curva ROC funciona mejor, ya que ahora depende de la compensación que prefiera. ¿Desea alta precisión / baja recuperación o baja precisión / alta recuperación ?

Ejemplo: si un clasificador se desempeña mucho mejor en un FPR de 0.2, pero es importante alcanzar un alto Recall , entonces funciona bien en un umbral que no le interesa.

Acerca de las curvas ROC en su gráfico: puede decir fácilmente que 'A' funciona mucho mejor, sin siquiera saber lo que quiere lograr. Tan pronto como la curva violeta cruza las otras, las cruza nuevamente. Probablemente no esté interesado en esa pequeña parte , donde 'B' y 'C' funcionan ligeramente mejor .

En el siguiente gráfico puede ver dos curvas ROC, que también se cruzan. Aquí, no se puede saber cuál es mejor, ya que se complementan entre sí .

Tenga en cuenta que, al final del día, está interesado en elegir un umbral para su clasificación y el AUC solo le da una estimación de qué tan bien funciona un modelo en general .

Laksan Nathan
fuente

Solo para confirmar, en mi ejemplo, si elijo un valor de corte muy alto, donde la precisión es grande, ¿el modelo A superaría a B y C por un buen margen?

Edu

¿Cómo sabes dónde es grande la precisión? Esta es una ROC, no una curva de Precisión-Recuperación. Para Precisión, verifica la probabilidad de Verdadero Positivo, dado que su clasificador dijo Positivo.

Laksan Nathan

Comparación de dos modelos cuando las curvas ROC se cruzan

Respuestas: