He leído en varios lugares que R Squared no es una medida ideal cuando un modelo se ajusta usando LASSO. Sin embargo, no tengo claro exactamente por qué es eso.
Además, ¿podría recomendar la mejor alternativa?
He leído en varios lugares que R Squared no es una medida ideal cuando un modelo se ajusta usando LASSO. Sin embargo, no tengo claro exactamente por qué es eso.
Además, ¿podría recomendar la mejor alternativa?
El objetivo de usar LASSO es obtener una representación dispersa (de una cantidad predicha) en el sentido de no tener muchas covariables. La comparación de modelos con tiende a favorecer modelos con muchas covariables: de hecho, agregar covariables no relacionadas con el resultado nunca disminuirá y casi siempre aumenta al menos un poco. El modelo LASSO identificará el modelo con la probabilidad logarítmica penalizada óptima (una probabilidad logarítmica sin potencializar está relacionada monotónicamente con el ). Las estadísticas de validación que se utilizan más ampliamente para comparar modelos LASSO con otros tipos de modelos son, por ejemplo, el BIC o validación cruzada .