A menudo me encuentro entrenando varios modelos predictivos diferentes usando caret
en R. Los entrenaré a todos en los mismos pliegues de validación cruzada, usando caret::: createFolds
, luego elegiré el mejor modelo basado en un error de validación cruzada.
Sin embargo, la predicción mediana de varios modelos a menudo supera al mejor modelo individual en un conjunto de pruebas independiente. Estoy pensando en escribir algunas funciones para apilar / armar modelos de caretas que se entrenaron con los mismos pliegues de validación cruzada, por ejemplo, tomando predicciones medianas de cada modelo en cada pliegue, o entrenando un "metamodelo".
Por supuesto, esto podría requerir un bucle externo de validación cruzada. ¿Alguien sabe de algún paquete existente / código fuente abierto para ensamblar modelos de caret (y posiblemente validar de forma cruzada esos conjuntos)?
Lo que está buscando se llama "ensamblaje de modelos". Puede encontrar un tutorial introductorio simple con código R aquí: http://viksalgorithms.blogspot.jp/2012/01/intro-to-ensemble-learning-in-r.html
fuente
No estoy muy seguro de lo que está buscando, pero esto podría ayudar: http://www.jstatsoft.org/v28/i05/paper
Es cómo usar múltiples modelos en caret. La parte que le puede interesar es la sección 5 en la pág. 13)
fuente