Estoy retrocediendo un predictor continuo en más de 60 variables (tanto continuas como categóricas) usando LASSO (glmnet).
Al examinar el gráfico de traza variable, noto que a medida que aumenta el registro lambda, una de las variables clave tiene un coeficiente que en realidad aumenta. Luego, después de cierto punto, comienza a disminuir como cabría esperar.
Para asegurarme de que esto no fue una casualidad, ejecuté 10 modelos con bootstraps y obtuve resultados muy similares.
¿Es esto posible o hay un problema con los datos? Si es legítimo, ¿qué nos dice esta tendencia en el coeficiente de la variable sobre la variable y la relación con la respuesta?
fuente