Cuando se utiliza la máquina de vectores de soporte, ¿existen pautas para elegir un núcleo lineal frente a un núcleo no lineal, como RBF? Una vez escuché que el kernel no lineal tiende a no funcionar bien una vez que el número de características es grande. ¿Hay alguna referencia sobre este tema?
45
Respuestas:
Por lo general, la decisión es si usar un núcleo lineal o un núcleo RBF (también conocido como gaussiano). Hay dos factores principales a considerar:
Se ha demostrado que el núcleo lineal es una versión degenerada de RBF , por lo tanto, el núcleo lineal nunca es más preciso que un núcleo RBF sintonizado correctamente. Citando el resumen del artículo que vinculé:
Una regla general básica se trata brevemente en la guía práctica de NTU para apoyar la clasificación de vectores (Apéndice C).
Su conclusión es más o menos correcta pero tiene el argumento al revés. En la práctica, el núcleo lineal tiende a funcionar muy bien cuando el número de características es grande (por ejemplo, no es necesario asignar un espacio de características dimensionales aún mayor). Un ejemplo típico de esto es la clasificación de documentos, con miles de dimensiones en el espacio de entrada.
En esos casos, los núcleos no lineales no son necesariamente significativamente más precisos que los lineales. Esto básicamente significa que los núcleos no lineales pierden su atractivo: requieren mucho más recursos para entrenar con poco o ningún aumento en el rendimiento predictivo, entonces, ¿por qué molestarse?
TL; DR
Siempre intente lineal primero, ya que es mucho más rápido entrenar (prueba AND). Si la precisión es suficiente, felicítese por un trabajo bien hecho y continúe con el siguiente problema. Si no, intente con un núcleo no lineal.
fuente
Andrew Ng da una buena explicación general en este video que comienza a las 14:46, aunque vale la pena ver todo el video.
Puntos clave
fuente