En -SVR, el parámetro ν se usa para determinar la proporción del número de vectores de soporte que desea mantener en su solución con respecto al número total de muestras en el conjunto de datos. En ν -SVR, el parámetro ϵ se introduce en la formulación del problema de optimización y se estima automáticamente (de manera óptima) para usted.νννϵ
Sin embargo, en -SVR no tiene control sobre cuántos vectores de datos del conjunto de datos se convierten en vectores de soporte, podrían ser algunos, podrían ser muchos. No obstante, tendrá control total de la cantidad de error que permitirá que tenga su modelo, y cualquier cosa más allá del ϵ especificado será penalizado en proporción a C , que es el parámetro de regularización.ϵϵC
Dependiendo de lo que quiero, elijo entre los dos. Si estoy realmente desesperado por una solución pequeña (menos vectores de soporte), elijo -SVR y espero obtener un modelo decente. Pero si realmente quiero controlar la cantidad de error en mi modelo y obtener el mejor rendimiento, elijo ϵ -SVR y espero que el modelo no sea demasiado complejo (muchos vectores de soporte).νϵ
Me gustan las respuestas de Pablo y Marc. Un punto adicional:
En el artículo citado por Marc hay escrito (sección 4)
[...]
¿Qué piensas?
fuente