expertos! Tal vez, ¿sabes cómo calcular el intervalo de confianza para xgboost? La fórmula clásica con distribución t no puede ayudar, porque mis datos no se distribuyen normalmente. O no importa?
Si sugiere algo de literatura, será muy útil, pero los enfoques en R y Python (en el contexto de la biblioteca xgb) también son buenos.
Tal vez, parece que esta , sino cómo se calculan? Y encontré esto , ¿es correcto o no?
PD: No puedo agregar algunas imágenes relacionadas con mis datos (límite de enlaces), lo siento.
confidence-interval
xgboost
Lu Wao
fuente
fuente
Respuestas:
Entonces, esta es la respuesta! ( espejo )
Para construir límites de confianza para datos distribuidos anormalmente, primero necesita construir una regresión cuantil, en lugar de una regresión lineal, como lo hace por defecto. Para esto es necesario, utilizando los derivados derivados del artículo o simplemente copiando el código en el pitón, para personalizar la variable 'objetivo'. También es necesario cambiar la función de gradiente y la función gaussiana. Después de que todo esté programado, cree una regresión cuantil para el quincuagésimo cuantil (esta será la regresión inicial), y luego dos regresiones cuantil para los dos límites del intervalo (por ejemplo, 95 y 5). Como resultado, obtiene no solo un modelo más preciso para la regresión inicial, sino también los intervalos deseados.
fuente