Con la validación cruzada k-fold, ¿promedia todos los modelos para construir el modelo final?

13

Al realizar la validación cruzada k-fold, entiendo que obtienes las métricas de precisión apuntando todos los pliegues excepto uno en ese pliegue y haces predicciones, y luego repites este proceso veces. Luego puede ejecutar métricas de precisión en todas sus instancias (precisión, recuperación,% clasificado correctamente), que debería ser el mismo que si las calculara cada vez y luego promediara el resultado (corríjame si me equivoco).k

El resultado final que desea es un modelo final.

¿Promedia los modelos obtenidos para hacer su conjunto de predicciones para terminar con el modelo que tiene las métricas de precisión obtenidas por el método anterior?k

Morsa el gato
fuente

Respuestas:

15

k

Los resultados de un experimento de validación cruzada podrían decirle que Support Vector Machines supera a Naive Bayes en sus datos, o que los hiperparámetros del clasificador deben establecerse en c para este conjunto de datos en particular. Armado con este conocimiento, luego entrena un clasificador de "producción" con TODOS los datos disponibles y lo aplica a su problema.

En muchos casos, ni siquiera está claro cómo harías para promediar varios modelos. Por ejemplo, ¿cuál es el promedio de tres árboles de decisión o clasificadores vecinos más cercanos?

Es importante tener en cuenta que los resultados de la validación cruzada son estimaciones, no garantías, y estas estimaciones son más válidas si el clasificador de producción está capacitado con una calidad (y cantidad) de datos similar. Se ha trabajado bastante en el desarrollo de formas de utilizar estas estimaciones para realizar inferencias; es decir, de una manera estadísticamente sólida, que el método A es generalmente superior al método B en estos datos.

Matt Krause
fuente
2
¿Cuál es una buena referencia sobre el uso de estimaciones de validación cruzada k-fold para inferencia? Me encantaría leer sobre eso si tienes una buena participación.
tentaclenorm
1
Un lugar decente para comenzar podría ser iro.umontreal.ca/~lisa/bib/pub_subject/finance/pointeurs/… pero hay un montón de enfoques diferentes.
Matt Krause
1
Una cosa más para aclarar: cuando entrenamos al clasificador de "producción" usando todos los datos, ¿cómo entendemos cuándo parar?
Anton