Me encontré con este documento que usa la detección de anomalías de enlaces para predecir temas de tendencias, y lo encontré increíblemente intrigante: el documento es "Descubriendo temas emergentes en las corrientes sociales a través de la detección de anomalías de enlaces" .
Me encantaría replicarlo en un conjunto de datos diferente, pero no estoy lo suficientemente familiarizado con los métodos para saber cómo usarlos. Digamos que tengo una serie de instantáneas de la red de nodos en un período de seis meses. Los nodos tienen una distribución de grados de cola larga, y la mayoría tiene solo unas pocas conexiones, pero algunas tienen muchas. Nuevos nodos aparecen dentro de este período de tiempo.
¿Cómo podría implementar cálculos de probabilidad máxima normalizados con descuento secuencial utilizados en el documento para detectar enlaces anómalos que creo que podrían ser precursores de una explosión? ¿Hay otros métodos que serían más apropiados?
Pregunto tanto teórica como prácticamente. Si alguien pudiera señalarme una forma de implementar esto en Python o R, sería muy útil.
¿Nadie? Sé que ustedes, los inteligentes, tienen algunas ideas iniciales para una respuesta,
Respuestas:
Primero debe llegar a su definición de puntaje de anomalía para un nuevo nodo (ver sección 3.1, 3.2). Afortunadamente, la correspondencia entre una nueva publicación (en su caso) y un nuevo nodo (en su caso) es casi uno a uno, ya que solo estamos interesados en el conjunto de nodos (usuarios) que es el nodo (publicación) relacionado con.
Pregunte más, si tiene dificultades para seguir los pasos descritos en la subsección 3.4., Donde se aplica SDNML.
fuente