¿Cómo demostrar que la función de base radial es un núcleo?

35

Cómo demostrar que la función de base radial k(x,y)=exp(||xy||2)2σ2)es un núcleo? Por lo que yo entiendo, para probar esto tenemos que probar cualquiera de los siguientes:

  1. Para cualquier conjunto de vectores x1,x2,...,xn de la matriz K(x1,x2,...,xn) = (k(xi,xj))n×n es semidefinida positiva.

  2. Un mapeo Φ puede ser presentado como k(x,y) = Φ(x),Φ(y) .

¿Alguna ayuda?

León
fuente
1
Solo para vincularlo más obviamente: el mapa de características también se discute en esta pregunta , particularmente la respuesta de Marc Claesen basada en la serie de Taylor y la mía que discute tanto la RKHS como la versión general de la inclusión L2 dada por Douglas a continuación.
Dougal

Respuestas:

26

Zen utilizó el método 1. Aquí está el método 2: Mapee x a una distribución gaussiana esféricamente simétrica centrada en x en el espacio de Hilbert L2 . La desviación estándar y un factor constante tienen que ajustarse para que esto funcione exactamente. Por ejemplo, en una dimensión,

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

Entonces, use una desviación estándar de y la escala de la distribución de Gauss para obtenerk(x,y)=Φ(x),Φ(y). Este último cambio de escala se produce porque lanormaL2de una distribución normal no es1en general.σ/2k(x,y)=Φ(x),Φ(y)L21

Douglas Zare
fuente
2
@ Zen, Douglas Zare: gracias por sus excelentes respuestas. ¿Cómo se supone que debo seleccionar la respuesta oficial ahora?
Leo
23

Usaré el método 1. Verifique la respuesta de Douglas Zare para una prueba usando el método 2.

Voy a probar el caso cuando son números reales, por lo que k ( x , y ) = exp ( - ( x - y ) 2 / 2 σ 2 ) . El caso general sigue mutatis mutandis del mismo argumento, y vale la pena hacerlo.x,yk(x,y)=exp((xy)2/2σ2)

σ2=1

k(x,y)=h(xy)

h(t)=exp(t22)=E[eitZ]
ZN(0,1)

x1,,xna1,,an

j,k=1najakh(xjxk)=j,k=1najakE[ei(xjxk)Z]=E[j,k=1najeixjZakeixkZ]=E[|j=1najeixjZ|2]0,
k

Para comprender este resultado con mayor generalidad, consulte el Teorema de Bochner: http://en.wikipedia.org/wiki/Positive-definite_function

zen
fuente
2
h(t)xy
1
Tks! Tengo prisa aquí. :-)
Zen
1
h
23

Xφ

  • κγκγ>0

    φκγφγκ

  • κ1κ2κ1+κ2

    φ1φ2x[φ1(x)φ2(x)]

  • κ1,κ2,κ(x,y):=limnκn(x,y)x,yκ

    Prueba: Para cada y cada tenemos que . Tomar el límite como da la misma propiedad para .m,n1{(xi,ci)}i=1mX×Ri=1mciκn(xi,xj)cj0nκ

  • Productos: Si y son núcleos pd, también lo es .κ1κ2g(x,y)=κ1(x,y)κ2(x,y)

    Prueba: se deduce inmediatamente del teorema del producto Schur , pero Schölkopf y Smola (2002) dan la siguiente prueba agradable y elemental. Deje sea ​​independiente. Así, Las matrices de covarianza deben ser psd, por lo que considerar la matriz de covarianza de prueba.

    (V1,,Vm)N(0,[κ1(xi,xj)]ij)(W1,,Wm)N(0,[κ2(xi,xj)]ij)
    Cov(ViWi,VjWj)=Cov(Vi,Vj)Cov(Wi,Wj)=κ1(xi,xj)κ2(xi,xj).
    (V1W1,,VnWn)
  • Potencias: si es un núcleo pd, también lo es para cualquier entero positivo .κκn(x,y):=κ(x,y)nn

    Prueba: inmediata de la propiedad "productos".

  • Exponentes: Si es un núcleo pd, también lo es .κeκ(x,y):=exp(κ(x,y))

    Prueba: tenemos ; use las propiedades "poderes", "escalas", "sumas" y "límites".eκ(x,y)=limNn=0N1n!κ(x,y)n

  • Funciones: Si es un núcleo pd , es.κf:XRg(x,y):=f(x)κ(x,y)f(y)

    Prueba: utilice el mapa de funciones .xf(x)φ(x)

Ahora, tenga en cuenta que Comience con el núcleo lineal , aplique "scalings" con , aplique "exponentes" y aplique "funciones" con .

k(x,y)=exp(12σ2xy2)=exp(12σ2x2)exp(1σ2xTy)exp(12σ2y2).
κ(x,y)=xTy1σ2xexp(12σ2x2)
Dougal
fuente