Los métodos de conjunto basados en árboles como el Bosque aleatorio y las derivadas posteriores (por ejemplo, bosque condicional), todos pretenden ser útiles en los llamados problemas " n pequeña , p grande ", para identificar la importancia variable relativa. De hecho, este parece ser el caso, pero mi pregunta es ¿hasta dónde puede llevarse esta habilidad? ¿Se pueden tener, por ejemplo, 30 observaciones y 100 variables? ¿Cuál es el punto de ruptura de este enfoque? ¿Existen reglas generales decentes que existan? Prefiero y aceptaré respuestas respaldadas por enlaces a evidencia real (no conjetura), utilizando conjuntos de datos simulados o reales. No he encontrado mucho en este último ( aquí y aquí), por lo que sus ideas / consejos / (sobre el tema) sugerencias de referencia son bienvenidas.
fuente