Tenemos muchas buenas discusiones sobre la separación perfecta en la regresión logística. Tal como, la regresión logística en R resultó en una separación perfecta (fenómeno de Hauck-Donner). ¿Ahora que? y el modelo de regresión logística no converge .
Personalmente, todavía siento que no es intuitivo por qué será un problema y por qué agregar la regularización lo solucionará. Hice algunas animaciones y creo que será útil. Así que publique su pregunta y responda yo solo para compartir con la comunidad.
Respuestas:
Se utilizará una demostración en 2D con datos de juguetes para explicar lo que estaba sucediendo para una separación perfecta en la regresión logística con y sin regularización. Los experimentos comenzaron con un conjunto de datos superpuestos y gradualmente separamos dos clases. La función objetivo de contorno y optima (pérdida logística) se mostrará en la figura a la derecha. Los datos y el límite de decisión lineal se trazan en la figura secundaria izquierda.
Primero intentamos la regresión logística sin regularización.
A continuación, intentamos la regresión logística con la regularización de L2 (L1 es similar).
Con la misma configuración, agregar una regularización L2 muy pequeña cambiará los cambios de la función objetivo con respecto a la separación de los datos.
En este caso, siempre tendremos el objetivo "convexo". No importa cuánta separación tengan los datos.
código (también uso el mismo código para esta respuesta: métodos de regularización para la regresión logística )
fuente