Preguntas etiquetadas con boosting

20
Discusión sobre overfit en xgboost

Mi configuración es la siguiente: Estoy siguiendo las pautas en "Modelado predictivo aplicado". Por lo tanto, he filtrado características correlacionadas y termino con lo siguiente: 4900 puntos de datos en el conjunto de entrenamiento y 1600 puntos de datos en el conjunto de prueba. Tengo 26...

19
Calibrar un clasificador potenciado multiclase

He leído el artículo de Alexandru Niculescu-Mizil y Rich Caruana " Obtención de probabilidades calibradas del aumento " y la discusión en este hilo. Sin embargo, todavía tengo problemas para comprender e implementar la logística o el escalado de Platt para calibrar la salida de mi clasificador de...

19
¿Es un tocón de decisión un modelo lineal?

El tocón de decisión es un árbol de decisión con una sola división. También se puede escribir como una función por partes. Por ejemplo, suponga que es un vector, y es el primer componente de , en la configuración de regresión, se puede usar un tocón de decisiónx 1 xXxxX1x1x_1Xxx F( x ) = { 35...

17
Impulso y embolsado de árboles (XGBoost, LightGBM)

Hay muchas publicaciones de blog, videos de YouTube, etc. sobre las ideas de embolsar o impulsar árboles. Mi comprensión general es que el pseudocódigo para cada uno es: Harpillera: Tome N muestras aleatorias de x% de las muestras y y% de las características Ajuste su modelo (p. Ej., Árbol de...

15
La precisión de la máquina de aumento de gradiente disminuye a medida que aumenta el número de iteraciones

Estoy experimentando con el algoritmo de la máquina de aumento de gradiente a través del caretpaquete en R. Usando un pequeño conjunto de datos de admisión a la universidad, ejecuté el siguiente código: library(caret) ### Load admissions dataset. ### mydata <-

14
¿Cuándo querría usar AdaBoost?

Como he oído hablar del clasificador AdaBoost que se menciona repetidamente en el trabajo, quería tener una mejor idea de cómo funciona y cuándo uno podría usarlo. Continué y leí una serie de documentos y tutoriales que encontré en Google, pero hay aspectos del clasificador que todavía tengo...

13
¿Por qué no usar siempre el aprendizaje conjunto?

Me parece que el aprendizaje conjunto siempre dará un mejor rendimiento predictivo que con una sola hipótesis de aprendizaje. Entonces, ¿por qué no los usamos todo el tiempo? ¿Mi conjetura es quizás debido a limitaciones computacionales? (incluso entonces, usamos predictores débiles, así que no...