Entiendo teóricamente (más o menos) cómo funcionarían, pero no estoy seguro de cómo hacerlo utilizando un método de conjunto (como votación, mezclas ponderadas, etc.).
- ¿Cuáles son buenos recursos para implementar métodos de conjunto?
- ¿Hay algún recurso en particular con respecto a la implementación en Python?
EDITAR:
Para aclarar algunos basados en la discusión de los comentarios, no estoy buscando algoritmos de conjunto como randomForest, etc. En cambio, me pregunto cómo puedes combinar diferentes clasificaciones de diferentes algoritmos.
Por ejemplo, supongamos que alguien usa regresión logística, SVM y algunos otros métodos para predecir la clase de una observación determinada. ¿Cuál es la mejor manera de capturar la mejor estimación de la clase basada en estas predicciones?
fuente
'Métodos de conjunto en la minería de datos: mejora de la precisión mediante la combinación de predicciones', Seni y Elder: excelente referencia sobre la teoría e implementación prácticas de conjuntos, pero el código adjunto se basa en R.
'Machine Learning: An Algorithmic Perspective', S. Marsland: excelente texto práctico basado en Python, pero no tan dedicado a los conceptos de conjunto puro como la primera referencia.
fuente
La respuesta de Stumpy Joe Pete fue perfecta, pero como usted mencionó la implementación de Python, quería mencionar el proyecto de preparación de la Universidad Federal de Pernambuco.
https://github.com/viisar/brew
En este punto, tienen generación de conjunto, combinación, poda y selección dinámica.
Limitaciones: solo clasificación; sin apilamiento en la versión pública actual; No mucha documentación.
fuente
Salford Systems tiene un paquete de software llamado Random Forests que implementa esto para conjuntos de árboles de clasificación y regresión. No tengo ningún paquete R gratuito para ofrecer. Me imagino que tienen un manual de usuario que explicará su implementación. Por analogía, probablemente podría descubrir cómo hacerlo para otros métodos de conjunto.
fuente
Encontré este tutorial que fue extremadamente útil. No responde todas las piezas, pero creo que es un gran comienzo para la discusión: http://vikparuchuri.com/blog/intro-to-ensemble-learning-in-r/
fuente
La guía de ensamblaje Scikit-learn proporciona embolsadoras y potenciadoras de metaclasificadores y regresores. Además, la biblioteca mlxtend proporciona implementaciones de metaclasificadores y regresores de apilamiento .
fuente