fuente
fuente
¡No, no es un ejemplo de sobreajuste! Sería excesivo si la pérdida válida comenzara a aumentar mientras que la pérdida de entrenamiento disminuye.
Editar: la respuesta para la segunda pregunta Vale la pena considerar cómo se calcula el auc. Tenemos las probabilidades de que cada instancia pertenezca a la clase positiva. Luego clasificamos estas probabilidades. Si todas las instancias positivas aparecen en la primera parte de la lista ordenada y todas las negativas están en la segunda, entonces auc es 1 (el "rendimiento perfecto" según la observación de auc).
Ahora consideremos el cálculo de pérdidas. Por ejemplo, entropía cruzada binaria. La fórmula es donde - etiqueta verdadera, - probabilidad de que pertenezca a la clase positiva. Podemos predecir para cada observación negativa, que la probabilidad es 0.998, luego la pérdida será enorme. Pero si las probabilidades pronosticadas para las observaciones positivas son 0.999 (más altas que para las negativas), entonces en términos de AUC tendremos un rendimiento perfecto.
Por eso supongo que tenemos que evaluar la pérdida.
No, esto no es demasiado ajustado.
En primer lugar, el AUC es exactamente el mismo entre el tren y los conjuntos de validación. Las pérdidas pueden tener una brecha, pero dado que la pérdida de validación sigue disminuyendo (aunque sea lentamente), está bien.
fuente
¿Qué hay de este? En ese caso, la pérdida de validación está aumentando, pero AUC no sigue el mismo patrón, ¿cuál cree que es la pérdida o el rendimiento?
fuente