¿Por qué los multiplicadores de Lagrange son escasos para SVM?

8

He leído que para el SVM del clasificador de margen máximo, después de resolver el problema dual, la mayoría de los multiplicadores de lagrange resultan ser ceros. Solo los que corresponden a los vectores de soporte resultan ser positivos.

¿Porqué es eso?

Michael Litvin
fuente
1
El artículo de Wikipedia sobre Support Vector Machines responde esto señalando que los multiplicadores de Lagrange distintos de cero corresponden a puntos en el margen, de los cuales normalmente habría muy pocos.
whuber

Respuestas:

4

Los multiplicadores de Lagrange en el contexto de SVM se denotan típicamente αyo. El hecho de que a menudo se observa que la mayoríaαyo=0 0es una consecuencia directa de las condiciones de doble complementariedad de Karush-Kuhn-Tucker (KKT) :

ingrese la descripción de la imagen aquí

Ya que yyo(wTXyo+si)=1 iff Xyo está en el límite de decisión SVM, es decir, es un vector de soporte asumiendo Xyo está en el conjunto de entrenamiento y, en la mayoría de los casos, pocos vectores de entrenamiento son vectores de soporte, como señaló Whuber en los comentarios, significa que la mayoría αyo son 0 o C.


Las notas de la conferencia CS229 de Andrew Ng sobre SVM introducen las condiciones de complementariedad dual de Karush-Kuhn-Tucker (KKT):

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Tenga en cuenta que podemos crear algún caso en el que todos los vectores en el conjunto de entrenamiento sean vectores de soporte: por ejemplo, vea esta Pregunta de máquina de vectores de soporte .

Franck Dernoncourt
fuente