Estoy buscando conjuntos de datos de redes sociales (twitter, friendfeed, facebook, lastfm, etc.) para tareas de clasificación, preferiblemente en formato arff.
Mis búsquedas a través de UCI y Google no tuvieron éxito hasta ahora ... ¿alguna sugerencia?
fuente
Acabo de encontrar esto: 476 millones de tweets de Twitter (a través de @yarapavan ).
fuente
Hemos seleccionado un conjunto de datos de Twitter para amigos de los usuarios en 2009 y luego en 2009. Puede encontrar más información aquí: http://strict.dista.uninsubria.it/?p=364
fuente
Echa un vistazo a kaggle.com, tienen algunos concursos sobre redes sociales y dan conjuntos de datos.
Además, el SNAP de Stanford es un gran recurso. Y tiene trabajos de investigación para arrancar.
fuente
Gráfico social de Facebook, instalaciones de aplicaciones y usuarios de Last.fm, eventos, grupos en http://odysseas.calit2.uci.edu/research/
Dos conjuntos de datos (recopilados entre abril y mayo de 2009) que contienen muestras representativas de ~ 1 millón de usuarios en todo Facebook, con algunas propiedades anotadas: para cada usuario de la muestra, se incluyen la lista de amigos, la configuración de privacidad y la membresía de la red. Un tercer conjunto de datos (recopilado en febrero de 2008) incluye un gráfico bipartito que representa las instalaciones de aplicaciones de los usuarios de Facebook. Un cuarto conjunto de datos con usuarios activos diarios e instalaciones de aplicaciones durante 6 meses (recopilado entre septiembre de 2007 y febrero de 2008). Un quinto conjunto de datos que incluye una muestra representativa de usuarios de Last.fm obtenida mediante muestreo multigráfico (recopilado en julio de 2010).
fuente
Un buen recurso para encontrar conjuntos de datos es:
/ r / conjuntos de datos en Reddit.
Un vistazo rápido a esa página revela esta fuente , que puede contener algo útil para usted.
fuente
Este documento utiliza un conjunto de datos de Facebook que está disponible aquí. Aquí está la descripción de los autores:
fuente