¿Se puede entrenar un bosque aleatorio para predecir adecuadamente los datos de conteo? ¿Cómo procedería esto? Tengo una amplia gama de valores, por lo que la clasificación realmente no tiene sentido. Si usara la regresión, ¿simplemente truncaría los resultados? Estoy bastante perdido aquí. ¿Algunas ideas?
                    
                        r
                                regression
                                random-forest
                                prediction
                                count-data
                                
                    
                    
                        JEquihua
fuente
                
                fuente

Respuestas:
Hay un paquete R llamado
mobForestque puede adaptarse a un bosque aleatorio real para los datos de conteo. Se basa enmod()(partición recursiva basada en modelos) en elpartypaquete. Realiza la regresión de Poisson si elfamilyargumento se especifica comopoisson(). El paquete ya no está en el repositorio de CRAN, pero las versiones disponibles anteriormente se pueden obtener del archivo.Si no está restringido a bosque / embolsado aleatorio, también está disponible una versión de refuerzo para los datos de conteo. Es decir,
gbm(modelos de regresión potenciados generalizados). También puede adaptarse a un modelo de Poisson.fuente
Veo algunas posibilidades.
fuente
Bueno, no es un bosque aleatorio, pero CatBoost admite una función de pérdida de Poisson que podría usarse para la regresión de conteo con árboles potenciados:
https://tech.yandex.com/catboost/doc/dg/concepts/loss-functions-docpage/
fuente