Estoy usando SVM para la clasificación y estoy tratando de determinar los parámetros óptimos para los núcleos lineales y RBF. Para el núcleo lineal utilizo la selección de parámetros con validación cruzada para determinar C y para el núcleo RBF utilizo la búsqueda de cuadrícula para determinar C y gamma.
Tengo 20 características (numéricas) y 70 ejemplos de entrenamiento que deberían clasificarse en 7 clases.
¿Qué rango de búsqueda debo usar para determinar los valores óptimos para los parámetros C y gamma?
fuente
Consulte la sección 2.3.2 de este documento por Chapelle y Zien. Tienen una buena heurística para seleccionar un buen rango de búsqueda para del kernel RBF y C para el SVM. Yo citoσ do
Posteriormente, utilizan múltiplos (por ejemplo, para k ∈ { - 2 , . . . , 2 } ) del valor predeterminado como rango de búsqueda en una cuadrícula de búsqueda usando la validación cruzada. Eso siempre funcionó muy bien para mí.2k k ∈ { - 2 , . . . , 2 }
Por supuesto, @ciri dijimos, normalizar los datos, etc. siempre es una buena idea.
fuente