¿Se puede entrenar un bosque aleatorio para predecir adecuadamente los datos de conteo? ¿Cómo procedería esto? Tengo una amplia gama de valores, por lo que la clasificación realmente no tiene sentido. Si usara la regresión, ¿simplemente truncaría los resultados? Estoy bastante perdido aquí. ¿Algunas ideas?
r
regression
random-forest
prediction
count-data
JEquihua
fuente
fuente
Respuestas:
Hay un paquete R llamado
mobForest
que puede adaptarse a un bosque aleatorio real para los datos de conteo. Se basa enmod()
(partición recursiva basada en modelos) en elparty
paquete. Realiza la regresión de Poisson si elfamily
argumento se especifica comopoisson()
. El paquete ya no está en el repositorio de CRAN, pero las versiones disponibles anteriormente se pueden obtener del archivo.Si no está restringido a bosque / embolsado aleatorio, también está disponible una versión de refuerzo para los datos de conteo. Es decir,
gbm
(modelos de regresión potenciados generalizados). También puede adaptarse a un modelo de Poisson.fuente
Veo algunas posibilidades.
fuente
Bueno, no es un bosque aleatorio, pero CatBoost admite una función de pérdida de Poisson que podría usarse para la regresión de conteo con árboles potenciados:
https://tech.yandex.com/catboost/doc/dg/concepts/loss-functions-docpage/
fuente