He tenido dificultades para interpretar los grupos resultantes de una matriz de adyacencia. Tengo 200 matrices relativamente grandes que representan sujetos que contienen correlaciones parciales (puntajes z) de series de tiempo (datos neuronales). El objetivo es agrupar esas 210 matrices y detectar cualquier comunidad potencial no descubierta. Entonces hice otros cálculos de correlación parcial que resultaron en una matriz de adyacencia de 200x200. Cada vez que ejecuto un algoritmo de detección de comunidad (por ejemplo, el de Newmann) aparece con comunidades difícilmente interpretables.
La pregunta es qué tipo de pruebas estadísticas dirán si estas comunidades o grupos son significativos en absoluto. y si es así, ¿hay formas sistemáticas de resolver la interpretación?
fuente
Respuestas:
He realizado algunos trabajos en el pasado sobre el agrupamiento espectral que podría ser útil aquí. La idea básica es que uno puede usar la matriz de adyacencia para formar la llamada matriz laplaciana:
Puedes comprobar por ti mismo que el valor propio más bajo del Laplaciano es cero. El primer valor propio distinto de cero a menudo se llama conectividad algebraica, y el vector generador correspondiente tendrá una parte positiva y una parte negativa correspondiente a dos particiones del gráfico subyacente. En términos generales, la magnitud del primer valor propio distinto de cero es una medida de la fuerza de las conexiones entre las dos particiones. Tal vez podría emplear este enfoque de forma recursiva o considerar los primeros valores de signo distintos de cero del Laplaciano. El siguiente artículo de Wikipedia sobre la agrupación espectral es un buen comienzo.(si1,si2)
fuente
Estoy viendo el mismo problema en este momento. Según una revisión rápida, parece que la agrupación espectral es la forma más "natural" de analizar una matriz de adyacencia. Vea esta publicación de blog para más detalles.
fuente
Alternativamente ... Los datos neuronales (reales o artificiales) a menudo son una representación de datos altamente comprimida, lo que significa que los datos son muy aleatorios, lo que significa que no encontrará ninguna correlación. ¡¡El que tienes!! ¡Felicidades! :)
fuente