Como he oído hablar del clasificador AdaBoost que se menciona repetidamente en el trabajo, quería tener una mejor idea de cómo funciona y cuándo uno podría usarlo. Continué y leí una serie de documentos y tutoriales que encontré en Google, pero hay aspectos del clasificador que todavía tengo problemas para entender:
La mayoría de los tutoriales que he visto hablan de AdaBoost como encontrar la mejor combinación ponderada de muchos clasificadores. Esto tiene sentido para mí. Lo que no tiene sentido son las implementaciones (es decir, MALLET) donde AdaBoost parece aceptar solo un alumno débil. ¿Como tiene sentido eso? Si solo se proporciona un clasificador a AdaBoost, ¿no debería devolver ese mismo clasificador con un peso de 1? ¿Cómo produce nuevos clasificadores a partir del primer clasificador?
¿Cuándo se querría usar AdaBoost? He leído que se supone que es uno de los mejores clasificadores listos para usar, pero cuando trato de impulsar un clasificador MaxEnt obtenía f-puntuaciones de 70% +, AdaBoost lo asesina y me da f- puntajes de algo así como 15% con muy alta recuperación y muy baja precisión en su lugar. Entonces ahora estoy confundido. ¿Cuándo querría usar AdaBoost? Estoy buscando una respuesta más intuitiva en lugar de estrictamente estadística, si es posible.
fuente