La documentación establece que R gbm with distribution = "adaboost" se puede usar para problemas de clasificación 0-1. Considere el siguiente fragmento de código:
gbm_algorithm <- gbm(y ~ ., data = train_dataset, distribution = "adaboost", n.trees = 5000)
gbm_predicted <- predict(gbm_algorithm, test_dataset, n.trees = 5000)
Se puede encontrar en la documentación que predic.gbm
Devuelve un vector de predicciones. Por defecto, las predicciones están en la escala de f (x).
Sin embargo, la escala particular no está clara para el caso de distribución = "adaboost".
¿Alguien podría ayudar con la interpretación de predic.gbm valores de retorno y proporcionar una idea de conversión a la salida 0-1?
Respuestas:
El método adaboost da las predicciones en escala logit. Puede convertirlo a la salida 0-1:
tenga en cuenta el 2 * dentro del logis
fuente
También puede obtener directamente las probabilidades de la
predict.gbm
función;fuente
La función de enlace adaboost se describe aquí . Este ejemplo proporciona una descripción detallada del cálculo:
fuente