Estoy tratando de comprender cuál es el propósito de la función de pérdida y no puedo entenderlo.
Entonces, hasta donde yo entiendo, la función de pérdida es para introducir algún tipo de métrica con la que podamos medir el "costo" de una decisión incorrecta.
Digamos que tengo un conjunto de datos de 30 objetos, los dividí en conjuntos de entrenamiento / prueba como 20/10. Usaré la función de pérdida 0-1, así que digamos que mi conjunto de etiquetas de clase es M y la función se ve así :
Así que construí un modelo en mis datos de entrenamiento, digamos que estoy usando el clasificador Naive Bayes, y este modelo clasificó 7 objetos correctamente (les asignó las etiquetas de clase correctas) y 3 objetos fueron clasificados incorrectamente.
Entonces, mi función de pérdida devolvería "0" 7 veces y "1" 3 veces. ¿Qué tipo de información puedo obtener de eso? ¿Que mi modelo clasificó el 30% de los objetos incorrectamente? ¿O hay más?
Si hay algún error en mi forma de pensar, lo siento mucho, solo estoy tratando de aprender. Si el ejemplo que proporcioné es "demasiado abstracto", hágamelo saber, intentaré ser más específico. Si intenta explicar el concepto con un ejemplo diferente, utilice la función de pérdida 0-1.
fuente
Sí, esto es básicamente: cuenta el número de elementos mal clasificados. No hay nada más detrás, es una función de pérdida muy básica. Lo que sigue, la pérdida 0-1 conduce al modo de estimación de la distribución objetivo (en comparaciónL1 pérdida para estimar la mediana y L2 pérdida para estimar la media).
fuente
Creo que su confusión no está diferenciando la pérdida de un punto de datos frente a la pérdida de todo el conjunto de datos.
Específicamente, suL ( y, y^) es la pérdida de un punto de datos (estoy cambiando un poco la notación). Y la pérdida para todo el conjunto de datos, es decir, la precisión de la clasificación, necesita sumar todos los puntos de datos.
fuente