¿Cómo interpretar el diagrama cv.glmnet ()?

8

Realicé el lazo y luego dejé una validación cruzada

cv<-cv.glmnet(df, df$Price, nfolds = 1500) 

Cuando trazo cv me sale lo siguiente: ingrese la descripción de la imagen aquí

También noté que obtengo 2 lambdas diferentes: lambda.minylambda.1se

  • ¿Cuál es la diferencia entre estas lambdas?
  • ¿Qué puedo entender de la gráfica anterior en general (de qué se tratan estos intervalos de confianza, cuáles son las dos líneas punteadas, etc.)?

Si cambio a nfolds=10realizar una validación de 10 veces, obtengo lambda.1secoeficientes diferentes y diferentes para esta lambda. ¿De acuerdo con qué criterio puedo elegir el mejor para mí?

Jazmín
fuente
2
¿Has intentado buscar aquí: web.stanford.edu/~hastie/glmnet/glmnet_alpha.html
ilanman
@ilanman Eso es genial, ¡gracias! Pero aún así, ¿qué lambda debería preferir? Mi intuición diría lambda.min pero veo que lambda.1se generalmente se sugiere ...
Jasmine

Respuestas:

16

No se trata realmente de estadísticas, solo de leer la documentación.

  • Los dos valores diferentes de reflejan dos opciones comunes para . La es la que minimiza la pérdida fuera de la muestra en CV. El es el que es el valor más grande dentro de 1 error estándar de . Una línea de razonamiento sugiere usar porque contra el sobreajuste al seleccionar un valor mayor que el mínimo. La mejor opción depende del contexto.λλλminλ1seλλminλ1seλ
  • Los intervalos de confianza representan estimaciones de error para la métrica de pérdida (puntos rojos). Se calculan utilizando CV. Las líneas verticales muestran las ubicaciones de y . Los números en la parte superior son el número de estimaciones de coeficientes distintos de cero.λminλ1se
Sycorax dice reinstalar a Mónica
fuente