En el agrupamiento espectral, es una práctica estándar resolver el problema del vector propio
donde es el gráfico laplaciano, es el vector propio relacionado con el valor propio .
Mi pregunta: ¿por qué molestarse en tomar el gráfico laplaciano? ¿No podría resolver el problema del vector propio para el gráfico (matriz de afinidad) en sí, como lo hizo el tipo en este video ?
PD: Hice esta misma pregunta en CrossValidated, pero creo que este es un canal más apropiado. Perdóname si me equivoco.
machine-learning
clustering
graphs
felipeduque
fuente
fuente
Respuestas:
El concepto es el mismo, pero el tipo de datos te confunde. Agrupación espectral como Ng et al. explicar se trata de agrupar datos estándar, mientras que la matriz laplaciana es una matriz derivada de gráficos utilizada en la teoría de gráficos algebraicos.
Entonces, el punto es que siempre que codifique la similitud de sus objetos en una matriz, esta matriz podría usarse para la agrupación espectral.
Si tiene datos estándar, es decir, una matriz de características de muestra, puede encontrar la proximidad o afinidad o lo que quiera llamarlo como matriz y aplicar la agrupación espectral.
Si tiene un gráfico, esta afinidad sería algo así como matriz de adyacencia, matriz de distancia o matriz de Laplacialn y resolver la función propia de dicha matriz le da el resultado correspondiente.
El punto sobre el uso de Laplacian en lugar de adyacencia es mantener la llamada matriz de afinidad positiva semi-definida (y la matriz Laplacian normalizada es una mejor opción ya que le da valores propios normalizados entre 0 y 2 y revela la estructura del gráfico mucho mejor).
En resumen, siempre que tenga una matriz que contenga la afinidad de sus datos, puede usar el agrupamiento espectral en general. La diferencia está en los detalles (por ejemplo, la propiedad del laplaciano normalizado que acabo de mencionar)
fuente