Múltiples métodos de aprendizaje del núcleo tienen como objetivo construir un modelo de núcleo donde el núcleo es una combinación lineal de núcleos de base fija. Aprender el núcleo consiste en aprender los coeficientes de ponderación para cada núcleo base, en lugar de optimizar los parámetros del núcleo de un solo núcleo.
Las desventajas del aprendizaje de múltiples núcleos parecen ser que son menos interpretables y computacionalmente costosas (para evaluar el resultado del modelo es necesario evaluar todos los núcleos base). Entonces, si se puede lograr un rendimiento similar simplemente optimizando un solo núcleo, ¿cuáles son las ventajas de MKL?
machine-learning
svm
kernel-trick
Dikran Marsupial
fuente
fuente
Respuestas:
Hay dos ventajas (o más bien dos casos de uso):
Para cada aplicación de SVM, un usuario tiene que elegir qué kernel usar y, a veces, incluso tiene que diseñar sus propias matrices de kernel. ¿Es posible aliviar la elección de núcleos o diseños de núcleos especializados? MKL fue un paso hacia eso.
El segundo caso en mi humilde opinión es, con mucho, un caso más convincente. Considere que su entrada de datos es un video de datos + cc. La representación de características de cada video consta de características de video, características de audio y características de texto. Tales datos se conocen como datos multimodales. Cada conjunto de estas características puede requerir una noción diferente de similitud (un núcleo diferente). En lugar de construir un núcleo especializado para tales aplicaciones, ¿es posible definir el núcleo para cada uno de estos modos y combinarlos linealmente?
fuente