Cómo demostrar que la función de base radial es un núcleo? Por lo que yo entiendo, para probar esto tenemos que probar cualquiera de los siguientes:
Para cualquier conjunto de vectores de la matriz = es semidefinida positiva.
Un mapeo puede ser presentado como = .
¿Alguna ayuda?
svm
kernel-trick
León
fuente
fuente
Respuestas:
Zen utilizó el método 1. Aquí está el método 2: Mapeex a una distribución gaussiana esféricamente simétrica centrada en x en el espacio de Hilbert L2 . La desviación estándar y un factor constante tienen que ajustarse para que esto funcione exactamente. Por ejemplo, en una dimensión,
Entonces, use una desviación estándar de y la escala de la distribución de Gauss para obtenerk(x,y)=⟨Φ(x),Φ(y)⟩. Este último cambio de escala se produce porque lanormaL2de una distribución normal no es1en general.σ/2–√ k(x,y)=⟨Φ(x),Φ(y)⟩ L2 1
fuente
Usaré el método 1. Verifique la respuesta de Douglas Zare para una prueba usando el método 2.
Voy a probar el caso cuando son números reales, por lo que k ( x , y ) = exp ( - ( x - y ) 2 / 2 σ 2 ) . El caso general sigue mutatis mutandis del mismo argumento, y vale la pena hacerlo.x,y k(x,y)=exp(−(x−y)2/2σ2)
Para comprender este resultado con mayor generalidad, consulte el Teorema de Bochner: http://en.wikipedia.org/wiki/Positive-definite_function
fuente
Prueba: Para cada y cada tenemos que . Tomar el límite como da la misma propiedad para .m,n≥1 {(xi,ci)}mi=1⊆X×R ∑mi=1ciκn(xi,xj)cj≥0 n→∞ κ
Productos: Si y son núcleos pd, también lo es .κ1 κ2 g(x,y)=κ1(x,y)κ2(x,y)
Prueba: se deduce inmediatamente del teorema del producto Schur , pero Schölkopf y Smola (2002) dan la siguiente prueba agradable y elemental. Deje sea independiente. Así, Las matrices de covarianza deben ser psd, por lo que considerar la matriz de covarianza de prueba.
Potencias: si es un núcleo pd, también lo es para cualquier entero positivo .κ κn(x,y):=κ(x,y)n n
Prueba: inmediata de la propiedad "productos".
Exponentes: Si es un núcleo pd, también lo es .κ eκ(x,y):=exp(κ(x,y))
Prueba: tenemos ; use las propiedades "poderes", "escalas", "sumas" y "límites".eκ(x,y)=limN→∞∑Nn=01n!κ(x,y)n
Funciones: Si es un núcleo pd , es.κ f:X→R g(x,y):=f(x)κ(x,y)f(y)
Prueba: utilice el mapa de funciones .x↦f(x)φ(x)
Ahora, tenga en cuenta que Comience con el núcleo lineal , aplique "scalings" con , aplique "exponentes" y aplique "funciones" con .
fuente