Selección a priori de pesos de clase SVM

8

Recuerdo haber visto / leído en alguna parte que para SVM multiclase con datos no balanceados, había una manera de determinar los pesos de clase a partir de los datos de entrenamiento (en lugar de la validación X). ¿Alguien sabe cuál es el método o de qué papel proviene?

Gracias

tomas
fuente
¿Encontró una buena solución para svm multiclase?
Vam

Respuestas:

7

Para SVM que minimiza la función objetivo

12||w||2+C1ξi:yi=1lξi+C2ξi:yi=1lξi
puedes elegir constantes C1 y C2inversamente proporcional a los tamaños de clase. Es decir, si tienesl1 muestras de entrenamiento en clase 1 y l2 - en la clase 2, tome C1 y C2 tal que C1/C2 = l2/l1. Es posible que deba ajustarlos ligeramente más adelante en sus experimentos, pero esta es una buena regla general.

Si está utilizando el paquete LIBSVM, puede especificar C1 y C2 usando las banderas '' -w-1 '' y "-w1".

PD: Acabo de notar que preguntaste sobre un problema multiclase. Bueno, tal vez aún encuentres útil esta respuesta.

León
fuente