Uso la función de kernel RBF para implementar un algoritmo de aprendizaje automático basado en kernel (KLPP), la matriz de kernel resultante está extremadamente mal condicionado. El número de condición de la norma L2 viene 1017-1064
¿Hay alguna manera de hacerlo bien acondicionado? Supongo que el parámetro necesita ser ajustado, pero no sé exactamente cómo.
¡Gracias!
Respuestas:
Reducir el ancho del núcleoσm generalmente reducirá el número de condición.
Sin embargo, las matrices de kernel pueden volverse singulares, o casi singulares, para cualquier función base o distribución de puntos, siempre que las funciones básicas se superpongan. La razón de esto es bastante simple:
Ahora imagine elegir dos puntos y y lentamente para que cambien de lugar. Al hacer esto, el determinante de cambiará de signo, convirtiéndose en cero en algún punto intermedio. En este punto, es, por definición, singular.x j K KXyo Xj K K
fuente
Un par de sugerencias:
Elija la distancia promedio | aleatorio - más cercano . (A aproximación baratas para puntos distribuidos de manera uniforme en el cubo unidad en R d , d 2 . . 5 , es de 0,5 / N 1 / d .) Queremos φ ( | x - x ix x i N x i x xσ∼ X Xyo norte Rre, d 2 . . 5 5 norte1 / d ϕ ( | x - xyoEl | ) Xyo X X
a ser grande paracerca de, pequeño para ruido de fondo; trazar eso por unos pocosazar.
Desplace lejos de 0, , o menos; es decir, regularizar.K → K + λ I λ ∼ 10 - 6K K→ K+ λ I λ ∼ 10- 6
Mire los pesos de la resolución . Si algunos siguen siendo enormes (independientemente del número de condición), eso tendería a confirmar a Boyd (abajo) que el RBF gaussiano es fundamentalmente débil.( K+ λI) w = f
(Una alternativa a RBF es la ponderación de distancia inversa, IDW. Tiene la ventaja de autoescalar, lo mismo para las distancias más cercanas 1 2 3...
que para 100 200 300
También encuentro la opción explícita del usuario de , el número de vecinos cercanos a considerar, más claro que la búsqueda de cuadrícula en .)... norten e a r σ, λ
John P. Boyd, La inutilidad de la Transformada rápida de Gauss para sumar series de funciones de base radial gaussianas , dice
Espero que esto ayude; Por favor comparte tu experiencia.
fuente