Soy un ingeniero de software que aprende el aprendizaje automático, particularmente a través de los cursos de aprendizaje automático de Andrew Ng . Mientras estudiaba la regresión lineal con la regularización , encontré términos que son confusos:
- Regresión con regularización L1 o regularización L2
- LAZO
- Regresión de cresta
Entonces mis preguntas:
¿La regresión con la regularización L1 es exactamente igual a LASSO?
¿Es la regresión con regularización L2 exactamente igual a la Regresión de cresta?
¿Cómo se usa "LASSO" en la escritura? ¿Debería ser la "regresión de LASSO"? He visto el uso como " el lazo es más apropiado ".
Si la respuesta es "sí" para 1 y 2 anteriores, ¿por qué hay diferentes nombres para estos dos términos? ¿"L1" y "L2" provienen de informática / matemáticas, y "LASSO" y "Ridge" de estadísticas?
El uso de estos términos es confuso cuando veo publicaciones como:
" ¿Cuál es la diferencia entre la regularización L1 y L2? " (Quora.com)
"¿ Cuándo debo usar lazo frente a cresta? " (Stats.stackexchange.com)
fuente
Respuestas:
Sí.
Sí.
LASSO es en realidad un acrónimo (operador de selección y contracción menos absoluta), por lo que debe escribirse en mayúscula, pero la escritura moderna es el equivalente léxico de Mad Max . Por otro lado, Amoeba escribe que incluso los estadísticos que acuñaron el término LASSO ahora usan la representación en minúsculas (Hastie, Tibshirani y Wainwright, Statistical Learning with Sparsity ). Uno solo puede especular sobre la motivación para el cambio. Si estás escribiendo para una prensa académica, generalmente tienen una guía de estilo para este tipo de cosas. Si está escribiendo en este foro, está bien, y dudo que a alguien le importe.
No estoy seguro de cuándo se realizó la conexión entre Ridge y LASSO.
En cuanto a por qué hay varios nombres, es solo una cuestión de que estos métodos se desarrollaron en diferentes lugares en diferentes momentos. Un tema común en estadística es que los conceptos a menudo tienen múltiples nombres, uno para cada subcampo en el que se descubrió de forma independiente (funciones del núcleo frente a funciones de covarianza, regresión del proceso gaussiano frente a Kriging, AUC frente a estadística). La regresión de la cresta probablemente debería llamarse regularización de Tikhonov, ya que creo que tiene el primer reclamo del método. Mientras tanto, LASSO se introdujo en 1996, ¡mucho más tarde que el método de "cresta" de Tikhonov!c
fuente