La pregunta ¿Qué concluir de este diagrama de lazo (glmnet) demuestra caminos de solución para el estimador de lazo que no son monótonos? Es decir, algunos de los cofficientes crecen en valor absoluto antes de reducirse.
He aplicado estos modelos a varios tipos diferentes de conjuntos de datos y nunca he visto este comportamiento "en la naturaleza", y hasta hoy había asumido que siempre eran monótonos.
¿Existe un conjunto claro de condiciones bajo las cuales se garantiza que las rutas de solución sean monótonas? ¿Afecta la interpretación de los resultados si las rutas cambian de dirección?
lasso
ridge-regression
elastic-net
Shadowtalker
fuente
fuente
Respuestas:
Te puedo dar una suficiente condición para la ruta a ser monótona: un diseño ortonormal deX .
Supongamos una matriz de diseño ortonormal, es decir, con variables en , tenemos que . Con un diseño ortonormal, los coeficientes de regresión de OLS son simplemente .p X X′Xn=Ip β^ols=X′yn
Las condiciones de Karush-Khun-Tucker para LASSO se simplifican así a:
Donde es el subdegradado. Por lo tanto, para cada tenemos que , y nosotros tener una solución de forma cerrada para las estimaciones de lazo:s j∈{1,…,p} β^olsj=β^lassoj+λsj
Lo cual es monótono en . Si bien esto no es una condición necesaria, vemos que la no monotonicidad debe venir de la correlación de las covariables en .λ X
fuente