¿Puede aumentar cuando

11

Si β=argminβyXβ22+λβ1 , puede β2 aumentar cuando λ aumenta?

Creo que esto es posible. Aunque β1 no aumenta cuando λ aumenta (mi prueba ), β2 puede aumentar. La siguiente figura muestra una posibilidad. Cuando λ aumenta, si β viaja (linealmente) de P a Q , entonces β2 aumenta mientras que β1 disminuye. Pero no sé cómo construir un ejemplo concreto (es decir, construir X e y ), de modo que el perfil de β demuestre este comportamiento. ¿Algunas ideas? Gracias.

ingrese la descripción de la imagen aquí

ziyuang
fuente

Respuestas:

10

La respuesta es sí, y tiene una prueba gráfica en allí mismo.2

Busque la definición de equivalencia de las normas vectoriales. Encontrará que donde es la dimensión del vector . Por lo tanto, hay un margen de para la norma , en comparación con la norma .

x2x1nx2,
nx21

De hecho, el problema que desea resolver puede expresarse como:

Encuentre tal que mientras que al mismo tiempo d

x+d2>x2
x+d1<x1.

Al cuadrado la primera desigualdad, expanda y vea que y que, suponiendo que y , obtenemos de la segunda desigualdad que debemos tener Cualquier que cumpla con estas restricciones aumentará la norma mientras disminuye la norma .

2ixidi>idi2
xi0xi+di0
idi<0.
d21

En su ejemplo, , y y d[0.4,0.3]Tx:=P[0.5,0.6]T

idi0.1<0,
2iPidi0.04>0.25idi2.
Tommy L
fuente
Pero, ¿cómo se relaciona con la construcción de e ? Xy
ziyuang
3

Gracias por la respuesta de @ TommyL, pero su respuesta no es directa sobre la construcción de e . De alguna manera "resuelvo" esto yo mismo. Primero, cuando aumenta, no aumentará cuando cada disminuya monotónicamente. Esto sucede cuando es ortonormal, en el que tenemosXyλβ2βiX

βi=sign(βiLS)(βiLSλ)+

Geométricamente, en esta situación, mueve perpendicularmente al contorno de la norma , por lo que no puede aumentar.β1β2

En realidad, Hastie et al. mencionado en el artículo La regresión progresiva por etapas y el lazo monótono , una condición necesaria y suficiente de la monotonicidad de las rutas de perfil:

ingrese la descripción de la imagen aquí

En la Sección 6 del artículo, construyeron un conjunto de datos artificiales basado en funciones de base lineal por partes que viola la condición anterior, mostrando la no monotonicidad. Pero si tenemos suerte, también podemos crear un conjunto de datos aleatorios que demuestren un comportamiento similar pero de una manera más simple. Aquí está mi código R:

library(glmnet)
set.seed(0)
N <- 10
p <- 15
x1 <- rnorm(N)
X <- mat.or.vec(N, p)
X[, 1] <- x1
for (i in 2:p) {X[, i] <- x1 + rnorm(N, sd=0.2)}
beta <- rnorm(p, sd=10)
y <- X %*% beta + rnorm(N, sd=0.01)
model <- glmnet(X, y, family="gaussian", alpha=1, intercept=FALSE)

Deliberadamente dejé que las columnas de estuvieran altamente correlacionadas (lejos del caso ortonormal), y el verdadero tiene grandes entradas positivas y negativas. Aquí está el perfil de (no es sorprendente que solo se activen 5 variables):Xββ

ingrese la descripción de la imagen aquí

y la relación entre y :λβ2

ingrese la descripción de la imagen aquí

Entonces podemos ver que durante algún intervalo de , aumenta a medida que aumenta.λβ2λ

ziyuang
fuente