Detección de anomalías de enlace en la red temporal

32

Me encontré con este documento que usa la detección de anomalías de enlaces para predecir temas de tendencias, y lo encontré increíblemente intrigante: el documento es "Descubriendo temas emergentes en las corrientes sociales a través de la detección de anomalías de enlaces" .

Me encantaría replicarlo en un conjunto de datos diferente, pero no estoy lo suficientemente familiarizado con los métodos para saber cómo usarlos. Digamos que tengo una serie de instantáneas de la red de nodos en un período de seis meses. Los nodos tienen una distribución de grados de cola larga, y la mayoría tiene solo unas pocas conexiones, pero algunas tienen muchas. Nuevos nodos aparecen dentro de este período de tiempo.

¿Cómo podría implementar cálculos de probabilidad máxima normalizados con descuento secuencial utilizados en el documento para detectar enlaces anómalos que creo que podrían ser precursores de una explosión? ¿Hay otros métodos que serían más apropiados?

Pregunto tanto teórica como prácticamente. Si alguien pudiera señalarme una forma de implementar esto en Python o R, sería muy útil.

¿Nadie? Sé que ustedes, los inteligentes, tienen algunas ideas iniciales para una respuesta,

Olga Mu
fuente
1
Si no le importa relajar la preferencia de R / python, ¿puede ayudarme este trabajo mío? goo.gl/l7SLlB Algunas de las ventajas de este método son que no necesita preocuparse por los tipos de características, normalizaciones y más.
arielf
1
A menos que malinterprete la pregunta, debe poder implementar el método del documento de la misma manera que los autores del documento implementaron el método. Si el método no es reproducible desde el documento, entonces debe contactar a los autores. Los autores también pueden estar dispuestos a proporcionar su código. Si tiene preguntas teóricas específicas o preguntas de programación, entonces deben hacerse por separado.
Nat

Respuestas:

0

Primero debe llegar a su definición de puntaje de anomalía para un nuevo nodo (ver sección 3.1, 3.2). Afortunadamente, la correspondencia entre una nueva publicación (en su caso) y un nuevo nodo (en su caso) es casi uno a uno, ya que solo estamos interesados ​​en el conjunto de nodos (usuarios) que es el nodo (publicación) relacionado con.

γ

Pregunte más, si tiene dificultades para seguir los pasos descritos en la subsección 3.4., Donde se aplica SDNML.

sdd
fuente