¿Cuáles son las similitudes y diferencias entre estos 3 métodos: Harpillera, Impulso ¿Apilado? Cuál es el mejor? ¿Y por qué? ¿Me puede dar un ejemplo para cada
En el aprendizaje automático, los métodos de conjunto combinan múltiples algoritmos para hacer una predicción. El embolsado, el refuerzo y el apilamiento son algunos ejemplos.
¿Cuáles son las similitudes y diferencias entre estos 3 métodos: Harpillera, Impulso ¿Apilado? Cuál es el mejor? ¿Y por qué? ¿Me puede dar un ejemplo para cada
El impulso del árbol de gradiente propuesto por Friedman utiliza árboles de decisión como aprendices básicos. Me pregunto si deberíamos hacer que el árbol de decisión base sea lo más complejo posible (completamente desarrollado) o más simple. ¿Hay alguna explicación para la elección? Random Forest...
Primero fue Brexit , ahora las elecciones estadounidenses. Muchas predicciones de modelos se cumplieron por un amplio margen, y ¿hay lecciones que aprender aquí? Hasta las 4 pm PST de ayer, los mercados de apuestas seguían favoreciendo a Hillary 4 a 1. Supongo que los mercados de apuestas, con...
Mientras aprendía sobre el Gradient Boosting, no escuché ninguna restricción con respecto a las propiedades de un "clasificador débil" que el método usa para construir y ensamblar modelos. Sin embargo, no podía imaginar una aplicación de un GB que utilizara la regresión lineal y, de hecho, cuando...
En mi opinión, las variables altamente correlacionadas no causarán problemas de multicolinealidad en el modelo de bosque aleatorio (corríjame si me equivoco). Sin embargo, por otro lado, si tengo demasiadas variables que contienen información similar, ¿el modelo pesará demasiado en este conjunto en...
Cerrado. Esta pregunta está fuera de tema . Actualmente no está aceptando respuestas. ¿Quieres mejorar esta pregunta? Actualice la pregunta para que esté en el tema de Cross Validated. Cerrado hace 2 años . Estoy usando caret para ejecutar un bosque...
Estoy tratando de resolver la tarea de regresión. Descubrí que 3 modelos funcionan bien para diferentes subconjuntos de datos: LassoLARS, SVR y Gradient Tree Boosting. Me di cuenta de que cuando hago predicciones usando todos estos 3 modelos y luego hago una tabla de 'salida real' y salidas de mis...
Tengo varias preguntas estrechamente relacionadas con los alumnos débiles en el aprendizaje conjunto (por ejemplo, impulsar). Esto puede sonar tonto, pero ¿cuáles son los beneficios de usar estudiantes débiles en lugar de fuertes? (por ejemplo, ¿por qué no impulsar con métodos de aprendizaje...
A menudo me encuentro entrenando varios modelos predictivos diferentes usando careten R. Los entrenaré a todos en los mismos pliegues de validación cruzada, usando caret::: createFolds, luego elegiré el mejor modelo basado en un error de validación cruzada. Sin embargo, la predicción mediana de...
Hace poco, estaba trabajando en el aprendizaje de algoritmos de refuerzo, como adaboost, aumento de gradiente, y he sabido que el árbol de aprendizaje débil más utilizado es el árbol. Realmente quiero saber si hay algunos ejemplos recientes exitosos (me refiero a algunos artículos o artículos) para...
Soy un poco nuevo en minería de datos / aprendizaje automático / etc. y he estado leyendo sobre un par de formas de combinar múltiples modelos y ejecuciones del mismo modelo para mejorar las predicciones. Mi impresión al leer un par de documentos (que a menudo son interesantes y geniales en...
Estoy confundido acerca de cómo dividir los datos para la validación cruzada k-fold del aprendizaje en conjunto. Suponiendo que tengo un marco de aprendizaje conjunto para la clasificación. Mi primera capa contiene los modelos de clasificación, por ejemplo, svm, árboles de decisión. Mi segunda...
En general, en un problema de clasificación donde el objetivo es predecir con precisión la pertenencia a una clase fuera de la muestra, ¿cuándo no debo usar un clasificador de conjunto? Esta pregunta está estrechamente relacionada con ¿Por qué no usar siempre el aprendizaje conjunto? . Esa...
Estoy un poco confundido sobre el aprendizaje conjunto. En pocas palabras, ejecuta k modelos y obtiene el promedio de estos k modelos. ¿Cómo se puede garantizar que el promedio de los k modelos sea mejor que cualquiera de los modelos por sí mismos? Entiendo que el sesgo está "extendido" o...
Los bosques aleatorios funcionan creando un conjunto de árboles de decisión donde cada árbol se crea utilizando una muestra de arranque de los datos de entrenamiento originales (muestra de variables de entrada y observaciones). ¿Se puede aplicar un proceso similar para la regresión lineal? Cree k...
Me gustaría crear un bosque aleatorio usando el siguiente proceso: Construya un árbol en muestras aleatorias de los datos y características usando la ganancia de información para determinar divisiones Termine un nodo de hoja si excede una profundidad predefinida O cualquier división daría como...
La estructura de esta pregunta es la siguiente: al principio, proporciono el concepto de aprendizaje en conjunto , luego proporciono una lista de tareas de reconocimiento de patrones , luego doy ejemplos de algoritmos de aprendizaje en conjunto y, finalmente, presento mi pregunta. Aquellos que no...
Me parece que el aprendizaje conjunto siempre dará un mejor rendimiento predictivo que con una sola hipótesis de aprendizaje. Entonces, ¿por qué no los usamos todo el tiempo? ¿Mi conjetura es quizás debido a limitaciones computacionales? (incluso entonces, usamos predictores débiles, así que no...
Quiero construir un modelo de regresión que sea un promedio de múltiples modelos OLS, cada uno basado en un subconjunto de datos completos. La idea detrás de esto se basa en este documento . Creo k pliegues y construyo k modelos OLS, cada uno con datos sin uno de los pliegues. Luego promedio los...
Necesito automatizar el pronóstico de series temporales, y no sé de antemano las características de esas series (estacionalidad, tendencia, ruido, etc.). Mi objetivo no es obtener el mejor modelo posible para cada serie, sino evitar modelos bastante malos. En otras palabras, obtener pequeños...