¿Por qué el “lazo relajado” es diferente del lazo estándar?

16

Si comenzamos con un conjunto de datos , le aplicamos Lasso y obtenemos una solución β L , podemos volver a aplicar Lasso al conjunto de datos ( X S , Y ) , donde S es el conjunto de valores distintos de cero. índices de β L , para obtener una solución, β R L , llamada solución 'LASSO relajada' (¡corríjame si me equivoco!). La solución β L debe satisfacer las condiciones de Karush – Kuhn – Tucker (KKT) para ( X , Y )(X,Y)βL(XS,Y)SβLβRLβL(X,Y)pero, dada la forma de las condiciones KKT para , ¿no las satisface también? Si es así, ¿qué sentido tiene hacer LASSO por segunda vez?(XS,Y)

Esta pregunta es un seguimiento de: ¿ Ventajas de hacer "doble lazo" o realizar el lazo dos veces?

Coca
fuente

Respuestas:

10

De la definición 1 de Meinshausen (2007) , hay dos parámetros que controlan la solución del lazo relajado.

λϕϕ=1ϕ<1

Esta formulación en realidad corresponde a resolver dos problemas:

  1. λ
  2. XS, cual es X reducido a variables seleccionadas por 1, con un parámetro de penalización λϕ.
Tonio Bonnef
fuente