¿Cómo interpretar el diagrama cv.glmnet ()?

Realicé el lazo y luego dejé una validación cruzada

cv<-cv.glmnet(df, df$Price, nfolds = 1500)

Cuando trazo cv me sale lo siguiente:

También noté que obtengo 2 lambdas diferentes: lambda.minylambda.1se

¿Cuál es la diferencia entre estas lambdas?
¿Qué puedo entender de la gráfica anterior en general (de qué se tratan estos intervalos de confianza, cuáles son las dos líneas punteadas, etc.)?

Si cambio a nfolds=10realizar una validación de 10 veces, obtengo lambda.1secoeficientes diferentes y diferentes para esta lambda. ¿De acuerdo con qué criterio puedo elegir el mejor para mí?

r cross-validation interpretation lasso Jazmín
fuente

¿Has intentado buscar aquí: web.stanford.edu/~hastie/glmnet/glmnet_alpha.html

ilanman

@ilanman Eso es genial, ¡gracias! Pero aún así, ¿qué lambda debería preferir? Mi intuición diría lambda.min pero veo que lambda.1se generalmente se sugiere ...

Jasmine

Respuestas:

No se trata realmente de estadísticas, solo de leer la documentación.

Los dos valores diferentes de reflejan dos opciones comunes para . La es la que minimiza la pérdida fuera de la muestra en CV. El es el que es el valor más grande dentro de 1 error estándar de . Una línea de razonamiento sugiere usar porque contra el sobreajuste al seleccionar un valor mayor que el mínimo. La mejor opción depende del contexto. $\lambda$ $\lambda$ $\lambda_{\min}$ $\lambda_{1se}$ $\lambda$ $\lambda_{\min}$ $\lambda_{1se}$ $\lambda$
Los intervalos de confianza representan estimaciones de error para la métrica de pérdida (puntos rojos). Se calculan utilizando CV. Las líneas verticales muestran las ubicaciones de y . Los números en la parte superior son el número de estimaciones de coeficientes distintos de cero. $\lambda_{\min}$ $\lambda_{1se}$

Sycorax dice reinstalar a Mónica
fuente