Los bosques aleatorios tienen una reputación entre los profesionales de estar entre las técnicas de clasificación más efectivas. Sin embargo, no los encontramos mucho en la literatura teórica del aprendizaje, de la cual deduzco una ausencia de resultados teóricos profundos. Si uno quisiera profundizar en esta teoría, ¿por dónde empezaría?
9
Respuestas:
Después de la respuesta de Simone, Gerard Biau tiene varios documentos muy buenos que analizan la convergencia y la consistencia de bosques aleatorios. Los análisis son para versiones ligeramente simplificadas del algoritmo en comparación con Breiman 2001, pero menos simplificadas que los resultados anteriores.
Los documentos de Biau (junto con sus colaboradores) están disponibles en su sitio web:
http://www.lsta.upmc.fr/BIAU/publications.html
Uno que es particularmente relevante es un trabajo "en prensa" sobre consistencia: http://www.lsta.upmc.fr/BIAU/sbv.pdf
Hay otros 2-3 documentos con contenido forestal aleatorio. Me acabo de unir a cstheory, por lo que no puedo publicar más de dos enlaces, pero el sitio de publicaciones anterior los tiene todos.
Espero que esto sea de ayuda. Parece que hay una explosión de actividad reciente desde 2008, después de un período de uso en gran medida empírico del método. Y la buena noticia es que las investigaciones teóricas parecen mostrar que el método es robusto y tiene buenas propiedades.
fuente
Supongo que ya echaste un vistazo al artículo de 2001 de Breiman sobre RF. Solo puedo señalar algunas otras referencias:
Comparaciones empíricas de diferentes simplificaciones de RF que permiten probar teoremas: Reduciendo la brecha: bosques aleatorios en teoría y en práctica
Esta es la referencia más nueva que puedo proporcionar. En este documento también puede encontrar algunas citas de los documentos de Biau sobre el trabajo inicial sobre resultados teóricos para RF.
Si le interesan los resultados teóricos sobre la importancia variable en RF: comprender las importancias variables en los bosques de árboles aleatorizados
En realidad, me acabo de enterar de que el autor del último artículo (Gilles Louppe) acaba de publicar en arxiv su tesis doctoral (v2): Comprender los bosques aleatorios: de la teoría a la práctica
fuente