La pérdida de bisagra se puede definir usando y la pérdida de registro se puede definir como
Tengo las siguientes preguntas:
¿Hay alguna desventaja en la pérdida de la bisagra (por ejemplo, sensible a los valores atípicos como se menciona en http://www.unc.edu/~yfliu/papers/rsvm.pdf )?
¿Cuáles son las diferencias, ventajas y desventajas de uno en comparación con el otro?
fuente
@Firebug tuvo una buena respuesta (+1). De hecho, tuve una pregunta similar aquí.
¿Cuáles son los impactos de elegir diferentes funciones de pérdida en la clasificación para aproximar la pérdida 0-1?
Solo quiero agregar más sobre otras grandes ventajas de la pérdida logística: la interpretación probabilística. Un ejemplo, se puede encontrar aquí
Específicamente, la regresión logística es un modelo clásico en la literatura estadística. (Ver, ¿Qué significa el nombre "Regresión logística"? Para nombrar). Existen muchos conceptos importantes relacionados con la pérdida logística, como maximizar la estimación de probabilidad de registro, pruebas de razón de probabilidad, así como suposiciones sobre binomio. Aquí hay algunas discusiones relacionadas.
Prueba de razón de probabilidad en R
¿Por qué la regresión logística no se llama clasificación logística?
¿Existe alguna suposición sobre regresión logística?
Diferencia entre modelos logit y probit
fuente
Como @ hxd1011 agregó una ventaja de la entropía cruzada, agregaré un inconveniente.
El error de entropía cruzada es una de las muchas medidas de distancia entre las distribuciones de probabilidad, pero un inconveniente es que las distribuciones con colas largas se pueden modelar mal con demasiado peso dado a los eventos poco probables.
fuente