Red elástica grupal

8

El lazo y la red elástica no pueden manejar variables con más de dos categorías y, por lo tanto, es necesaria una división de variables categóricas en dummies para la aplicación de estos métodos. Esto puede dar lugar a varios problemas y, por lo tanto, existen extensiones para el lazo al grupo o al grupo disperso .

Sin embargo, me pregunto si tales extensiones también existen para la red elástica. Desafortunadamente, no pude encontrar ninguna literatura estadística sobre el tema.

Pregunta: ¿Existe una red elástica grupal?

JSP
fuente
1
Mira el paquete glmnet de R ...
kjetil b halvorsen
1
Sí, creo que eso es correcto.
kjetil b halvorsen
1
En un sentido muy real, esta "red elástica grupal" es solo una versión del "lazo de grupo" donde los grupos pueden superponerse. Por ejemplo, si es su conjunto de grupos, ejecute el lazo de grupo en , donde consideramos que hay características . Esto será equivalente a la red elástica del grupo hasta una nueva parametrización del parámetro de ajuste que controla . GG{{1,,p}}p{1,,p}
user795305
2
El conjunto ya no es una partición, a diferencia de sí. (Este es el comentario superpuesto.) La parte sobre la diferente parametrización solo se relaciona con la función objetivo que discuto como una reparametrización de la que probablemente esté discutiendo. Este comentario puede ser ignorado en gran medida. Además, el procedimiento que recomienda @kjetilbhalvorsen no parece ser correcto. La agrupación discutida allí es para cuando hay una respuesta multivariada. Eso es diferente. Sin embargo, puede, por ejemplo, usar el paquete para hacer esto. G{{1,,p}}Ggglasso
user795305
2
(Nota: no ponga un espacio después de la "@", de lo contrario el usuario no
será

Respuestas:

6

Deje que sea ​​la agrupación que le interesa; es decir, dejemos que sea ​​una partición de , donde consideramos que hay características . Con la respuesta matriz de diseño , el estimador de lazo de grupo esAplicando otra penalización al cuadrado para inducir una contracción general, obtendríamos el estimadorGG{1,,p}pyRnXRn×p

argminβRp12nyXβ22+λgG|G|1/2βg2.
2
argminβRp12nyXβ22+λgG|G|1/2βg2+μβ22.
Podríamos llamar a esto la "red elástica de grupo". Por la dualidad lagrangiana, podemos escribir
argminβRp12nyXβ22+λgG|G|1/2βg2+μβ22=argminβRp:β22C12nyXβ22+λgG|G|1/2βg2=argminβRp:β2C12nyXβ22+λgG|G|1/2βg2=argminβRp12nyXβ22+λgG|G|1/2βg2+μ~β2=argminβRp12nyXβ22+(λgG|G|1/2βg2+μ~p1/2β2),
donde es la variable dual correspondiente y . Como podemos ver, esta última expresión es un lazo de grupo con grupos "superpuestos", ya que ya no es una partición. Además, el grupo tiene una variable dual (o variable de ajuste) que es distinta de la variable dual para los otros grupos.μ~μ~=p1/2μ~G{1,,p}{1,,p}μ~λ

Este puede ser un problema de optimización que se puede resolver utilizando el paquete gglasso. La lectura de la sección en la página 9 de la documentación aquí le informará sobre la gglassofunción, que debe usarse. Tenga en cuenta que el argumento pmaxdeberá proporcionarse manualmente con un último componente que servirá como parámetro de ajuste.

usuario795305
fuente