¿Por qué es deseable tener separabilidad lineal en SVM?

8

ingrese la descripción de la imagen aquí

Refiérase a la imagen de arriba, claramente un círculo puede separar las dos clases (imagen de la izquierda). ¿Por qué entonces tomar tanto dolor mapearlo a una función para hacerlo linealmente separable (imagen derecha)?

¿Alguien puede explicar? Realmente no pude encontrar nada en la web o conferencias de youtube sobre el por qué

vinita
fuente

Respuestas:

5

Bueno, ¡esa es toda la idea detrás de las máquinas de vectores de soporte! svm está buscando un hiperplano que separe las clases (por qué el nombre), y eso, por supuesto, se puede hacer de manera más efectiva si los puntos son linealmente separables (ese no es un punto profundo, es un resumen de la idea completa). En el ejemplo que muestra, el punto se encuentra en anillos anulares concéntricos, que no se pueden separar por ningún plano, pero al introducir una nueva variable RADIO --- distancia desde el centro --- se obtiene una separación lineal completa.

kjetil b halvorsen
fuente
¿Quiere decir que la seperabilidad lineal de las clases es mejor / más fácil que la seperabilidad no lineal?
vinita
1
Las clases pueden ser no linealmente separables en un número infinito de formas, así que sí, ¡la separación lineal es claramente más fácil de manejar! Y, esa es la idea detrás de SVM completa, para que funcionen mejor para los datos que se ajusten a las asumptions hay detrás del sistema casi no debería ser una sorpresa ...
b kjetil Halvorsen
@kjetilbhalvorsen Creo que la idea clave detrás de SVM es el truco del kernel para ahorrar tiempo para la computación. Pero no "utilizando la expansión de base polinómica".
Haitao Du
1
@ hdx1101: el truco del kernel hace que muchas cosas sean factibles, computacionalmente, pero eso es una gran bendición para la implementación, no la idea detrás del método en sí.
jbowman
2

¿Por qué es deseable tener separabilidad lineal en SVM?

Los SVC son inherentemente una técnica lineal. Encuentran límites lineales que separan (lo mejor posible) diferentes clases. Si no hay un límite lineal natural para el problema, las opciones son usar una técnica diferente o usar SVC con características transformadas en un espacio donde de hecho hay un límite lineal.

Refiérase a la imagen de arriba, claramente un círculo puede separar las dos clases (imagen de la izquierda). ¿Por qué entonces tomar tanto dolor mapearlo a una función para hacerlo linealmente separable (imagen derecha)?

Este es un ejemplo clásico. Las clases de datos están separadas por un círculo, pero un SVC no puede encontrar círculos directamente. Sin embargo, si los datos se transforman utilizando una función de base radial , en el espacio resultante, las clases están separadas por un límite lineal.

Ami Tavory
fuente
0

No responde directamente a su pregunta pero,

Es importante tener en cuenta la diferencia entre la expansión de base y el método Kernel / SVM .

  • Podemos "expandir datos" utilizando la expansión de base de diferentes maneras. Por ejemplo, expansión polinómica, splines, series de Fourier, etc. Estas expansiones básicas tienen poco que ver con SVM, truco del núcleo.

  • SVM con núcleo polinomial proporciona el uso de un "efecto computacional" para hacer una expansión de base polinómica. Busca el truco del kernel para más detalles.

Haitao Du
fuente
-1

Estás en lo correcto. Cuando el campo dice "linealmente separable", significa que los datos deben ser "diferenciables": que existe alguna función de filtrado que puede superponerse en el conjunto de datos para crear dos o más agrupaciones distintas (con una pequeña tolerancia a errores).

Eso es todo. Pero debe indicar a los académicos que limpien su lenguaje.

Marcos
fuente