¿Puede alguien decirme la diferencia entre los núcleos en SVM:
- Lineal
- Polinomio
- Gaussiano (RBF)
- Sigmoideo
Porque, como sabemos, ese kernel se utiliza para asignar nuestro espacio de entrada al espacio de características de alta dimensionalidad. Y en ese espacio de características, encontramos el límite linealmente separable.
¿Cuándo se usan (bajo qué condiciones) y por qué?
fuente
Confiar en el conocimiento básico del lector sobre los núcleos.
Núcleo polinomial:K(X,Y)=(γ⋅XTY+r)d,γ>0
Función de base radial (RBF) Kernel: que en forma simple se puede escribir comoK(X,Y)=exp(∥X−Y∥2/2σ2) exp(−γ⋅∥X−Y∥2),γ>0
Kernel sigmoide: que es similar a la función sigmoide en la regresión logística.K(X,Y)=tanh(γ⋅XTY+r)
Aquí , y son parámetros del núcleo.r d γ
fuente
Esta pregunta puede responderse desde un punto de vista teórico y práctico. Según el teorema según el teorema del almuerzo sin almuerzo, no hay garantías de que un núcleo funcione mejor que el otro. Eso es a priori, nunca se sabe ni se puede averiguar qué núcleo funcionará mejor.
Desde el punto de vista práctico, consulte la siguiente página:
¿Cómo seleccionar el núcleo para SVM?
fuente
Al reflexionar sobre para qué sirve un núcleo "bueno" o cuándo debe usarse, no existen reglas estrictas y rápidas.
Si su clasificador / regresor está funcionando bien con un núcleo dado, es apropiado, si no, considere cambiar a otro.
Puede obtener información sobre cómo puede funcionar su kernel, específicamente si es un modelo de clasificación, al revisar algunos ejemplos de visualización, por ejemplo, https://gist.github.com/WittmannF/60680723ed8dd0cb993051a7448f7805
fuente