Como todos saben, la ingeniería de características es extremadamente importante para el aprendizaje automático, sin embargo, encontré pocos materiales asociados con esta área. Participé en varias competiciones en Kaggle y creo que las buenas características pueden ser incluso más importantes que un buen clasificador en algunos casos. ¿Alguien sabe algún tutorial sobre ingeniería de características, o es esta una experiencia pura?
19
Respuestas:
Yo diría que la experiencia: las ideas básicas son:
fuente
Hay un libro de O'Reilly llamado " Feature Engineering for Machine Learning " de Zheng et al.
Leí el libro y cubre diferentes tipos de datos (p. Ej., Categórico, texto ...) y describe diferentes aspectos de la ingeniería de características que lo acompañan. Esto incluye cosas como la normalización de datos, selección de características, tf-idf en el texto.
fuente