Tengo una pregunta sobre la optimización de parámetros cuando uso la validación cruzada 10 veces.
Quiero preguntar si los parámetros deberían arreglarse o no durante el entrenamiento del modelo de cada pliegue, es decir (1) seleccionar un conjunto de parámetros optimizados para la precisión promedio de cada pliegue.
o
(2) ¿Debería encontrar el parámetro optimizado para cada pliegue y luego cada pliegue utiliza diferentes parámetros optimizados para entrenar su modelo y luego probar en los datos de prueba del pliegue respectivamente, y finalmente promediar la precisión de cada pliegue como resultado?
¿Cuál es el método correcto para la validación cruzada? Muchas gracias.
Respuestas:
Primero, distingamos entre dos conjuntos de parámetros: parámetros del modelo (por ejemplo, ponderaciones para características en regresión) y parámetros para el algoritmo de aprendizaje (e hiperparámetros). El propósito de la validación cruzada es identificar parámetros de aprendizaje que se generalicen bien en las muestras de población de las que aprendemos en cada pliegue.
Más específicamente: buscamos globalmente en el espacio los parámetros de aprendizaje, pero dentro de cada pliegue, arreglamos los parámetros de aprendizaje y aprendemos los parámetros del modelo. El resultado debe ser aprender parámetros que produzcan en promedio el mejor rendimiento en todos los pliegues. Luego podemos usarlos para entrenar un modelo en todo el conjunto de datos.
fuente
Creo que la respuesta actualmente aceptada es incompleta de una manera desafortunada. No estoy de acuerdo con la frase
De hecho, esta es una aplicación muy importante de la validación cruzada, pero no la única. Por lo general, quieres hacer dos cosas:
Ahora, para completar el objetivo 1 dependiendo de su algoritmo, es posible que necesite ajustar algunos hiperparámetros y esto a menudo se hace mediante validación cruzada. Pero esto aún no lo ayuda con el objetivo 2. Para esto, básicamente necesita anidar la validación cruzada, de esta manera:
Para construir un buen modelo solo necesita la validación cruzada interna. Aún deberá hacerlo para obtener un buen modelo. Pero para obtener una buena estimación del rendimiento de su modelo, debe realizar todo el proceso de construcción del modelo dentro de un esquema de validación cruzada. Esto también incluye pasos como la imputación, etc.
fuente