Actualmente estoy trabajando en la construcción de un modelo predictivo para un resultado binario en un conjunto de datos con ~ 300 variables y 800 observaciones. He leído mucho en este sitio sobre los problemas asociados con la regresión gradual y por qué no usarlo.
He estado leyendo sobre la regresión de LASSO y su capacidad para la selección de características y he tenido éxito en su implementación con el uso del paquete "caret" y "glmnet".
Soy capaz de extraer el coeficiente del modelo con el óptimo lambda
y alpha
de "caret"; Sin embargo, no estoy familiarizado con la forma de interpretar los coeficientes.
- ¿Se interpretan los coeficientes LASSO en el mismo método que la regresión logística?
- ¿Sería apropiado usar las características seleccionadas de LASSO en la regresión logística?
EDITAR
Interpretación de los coeficientes, como en los coeficientes exponenciados de la regresión LASSO como las probabilidades de log para un cambio de 1 unidad en el coeficiente mientras se mantienen constantes todos los demás coeficientes.
Respuestas:
Permítanme reformular: ¿se interpretan los coeficientes LASSO de la misma manera que, por ejemplo, los coeficientes de máxima verosimilitud de
OLSen una regresión logística?LASSO (un método de estimación penalizado) tiene como objetivo estimar las mismas cantidades (coeficientes del modelo) que, por ejemplo, la probabilidad máxima de
MCO(un método no normalizado). El modelo es el mismo y la interpretación sigue siendo la misma. Los valores numéricos de LASSO normalmente diferirán de los de la probabilidad máxima deOLS: algunos estarán más cerca de cero, otros serán exactamente cero. Si se ha aplicado una cantidad razonable de penalización, las estimaciones de LASSO estarán más cerca de los valores verdaderos que las estimaciones de probabilidad máxima deMCO, lo cual es un resultado deseable.No hay ningún problema inherente con eso, pero podría usar LASSO no solo para la selección de características sino también para la estimación de coeficientes. Como mencioné anteriormente, las estimaciones de LASSO pueden ser más precisas que, por ejemplo, las estimaciones de probabilidad máxima de
MCO.fuente