Refiérase a la imagen de arriba, claramente un círculo puede separar las dos clases (imagen de la izquierda). ¿Por qué entonces tomar tanto dolor mapearlo a una función para hacerlo linealmente separable (imagen derecha)?
¿Alguien puede explicar? Realmente no pude encontrar nada en la web o conferencias de youtube sobre el por qué
Los SVC son inherentemente una técnica lineal. Encuentran límites lineales que separan (lo mejor posible) diferentes clases. Si no hay un límite lineal natural para el problema, las opciones son usar una técnica diferente o usar SVC con características transformadas en un espacio donde de hecho hay un límite lineal.
Este es un ejemplo clásico. Las clases de datos están separadas por un círculo, pero un SVC no puede encontrar círculos directamente. Sin embargo, si los datos se transforman utilizando una función de base radial , en el espacio resultante, las clases están separadas por un límite lineal.
fuente
No responde directamente a su pregunta pero,
Es importante tener en cuenta la diferencia entre la expansión de base y el método Kernel / SVM .
Podemos "expandir datos" utilizando la expansión de base de diferentes maneras. Por ejemplo, expansión polinómica, splines, series de Fourier, etc. Estas expansiones básicas tienen poco que ver con SVM, truco del núcleo.
SVM con núcleo polinomial proporciona el uso de un "efecto computacional" para hacer una expansión de base polinómica. Busca el truco del kernel para más detalles.
fuente
Estás en lo correcto. Cuando el campo dice "linealmente separable", significa que los datos deben ser "diferenciables": que existe alguna función de filtrado que puede superponerse en el conjunto de datos para crear dos o más agrupaciones distintas (con una pequeña tolerancia a errores).
Eso es todo. Pero debe indicar a los académicos que limpien su lenguaje.
fuente