Supongo que te refieres a la selección de características como ingeniería de características . El proceso que suelo seguir y veo que algunas personas hacen es
- Ingeniería de características
Pruebe algunos algoritmos, generalmente de alto rendimiento, como RandomForest, Gradient Boosted Trees, Neutral Networks o SVM en las características.
2.1 Realice ajustes sencillos de parámetros, como la búsqueda de cuadrícula en un pequeño rango de parámetros
Si el resultado del paso 2 no es satisfactorio, regrese al paso 1 para generar más funciones, o elimine las funciones redundantes y conserve las mejores, la gente generalmente llama a esta selección de funciones . Si se le acaban las ideas para nuevas funciones, pruebe con más algoritmos.
Si el resultado es correcto o cercano a lo que desea, vaya al paso 3
- Amplia sintonización de parámetros
La razón para hacerlo es que la clasificación tiene que ver con la ingeniería de características y, a menos que conozca algún clasificador increíblemente poderoso, como el aprendizaje profundo personalizado para un problema particular, como la visión por computadora. Generar buenas características es la clave. Elegir un clasificador es importante pero no crucial. Todos los clasificadores mencionados anteriormente son bastante comparables en términos de rendimiento, y la mayoría de las veces, el mejor clasificador resulta ser uno de ellos.
El ajuste de parámetros puede aumentar el rendimiento, en algunos casos, bastante. Pero sin buenas características, el ajuste no ayuda mucho. Tenga en cuenta que siempre tiene tiempo para ajustar los parámetros. Además, no tiene sentido ajustar los parámetros de forma exhaustiva, luego descubre una nueva característica y rehace todo el proceso.