R glm y glmnet usan diferentes algoritmos.
Noto diferencias no triviales entre los coeficientes estimados cuando uso ambos.
Me interesa saber cuándo uno es más preciso que otro, y el momento de resolver / precisión se compensa.
Específicamente me refiero al caso en el que uno establece lambda = 0 en glmnet st, está estimando lo mismo que glm.
r
generalized-linear-model
glmnet
Will Beauchamp
fuente
fuente
Respuestas:
Glmnet es para regresión neta elástica. Esto penaliza el tamaño de los coeficientes estimados (a través de una combinación de penalizaciones L1 y L2). Intenta explicar tanta variación en los datos a través del modelo como sea posible, manteniendo los coeficientes del modelo pequeños. Encontré estas diapositivas útiles para entenderlo.
Glm no usa un término de penalización.
El efecto, según tengo entendido, es que con una red elástica puede estar aceptando algún sesgo a cambio de una reducción en la varianza del estimador. Entonces, cuál es el mejor debe depender de cómo defina 'mejor' en términos de sesgo y varianza. (Por ejemplo, sé que glmnet tiene ventajas cuando tiene muchas características en comparación con las observaciones)
fuente