¿Cuáles son las características o propiedades que indican que se puede abordar un determinado problema de aprendizaje utilizando máquinas de vectores de soporte?
En otras palabras, ¿qué es lo que, cuando ves un problema de aprendizaje, te hace decir "oh, definitivamente debería usar SVM para esto" en lugar de redes neuronales o árboles de decisión o cualquier otra cosa?
supervised learning
etiqueta, ya que los SVM también se pueden usar en problemas de aprendizaje sin supervisión .exception
, quieres decir que es solo un ajuste y no la convención, ¿verdad?Respuestas:
SVM puede usarse para clasificación (distinguir entre varios grupos o clases) y regresión (obtener un modelo matemático para predecir algo). Se pueden aplicar a problemas tanto lineales como no lineales.
Hasta 2006 eran el mejor algoritmo de propósito general para el aprendizaje automático. Estaba tratando de encontrar un documento que comparara muchas implementaciones de los algoritmos más conocidos: svm, redes neuronales, árboles, etc. No pude encontrarlo, lo siento (tendrás que creerme, algo malo). En el documento, el algoritmo que obtuvo el mejor rendimiento fue svm, con la biblioteca libsvm.
En 2006, a Hinton se le ocurrió el aprendizaje profundo y las redes neuronales. Mejoró el estado actual de la técnica en al menos un 30%, lo cual es un gran avance. Sin embargo, el aprendizaje profundo solo obtiene un buen rendimiento para grandes conjuntos de entrenamiento. Si tiene un pequeño conjunto de entrenamiento, sugeriría usar svm.
Además, puede encontrar aquí una infografía útil sobre cuándo utilizar diferentes algoritmos de aprendizaje automático de scikit-learn. Sin embargo, que yo sepa, no existe un acuerdo entre la comunidad científica sobre si un problema tiene características X, Y y Z, entonces es mejor usar svm. Sugeriría probar diferentes métodos. Además, no olvide que svm o redes neuronales es solo un método para calcular un modelo. También es muy importante las características que utiliza.
fuente
Asumamos que estamos en una configuración de clasificación.
Para la
svm
ingeniería de características es la piedra angular:svm
rendimiento sufre a medida que aumentamos el número de dimensiones más rápido que otras metodologías (conjunto de árbol). Esto se debe al problema de optimización restringida que respaldasvm
s. A veces la reducción de características es factible, a veces no, y esto es cuando realmente no podemos allanar el camino para un uso efectivo desvm
svm
Es probable que tenga dificultades con un conjunto de datos donde el número de características es mucho mayor que el número de observaciones. Esto, nuevamente, puede entenderse observando el problema de optimización restringido.svm
algoritmo no maneja las variables categóricas fuera de la caja .fuente