Conjuntos de datos de referencia para el filtrado colaborativo

9

Me gustaría probar un nuevo algoritmo para el filtrado colaborativo . Un caso de uso típico es recomendar películas basadas en las preferencias de los usuarios similares al usuario específico.

¿Cuáles son algunos conjuntos de datos de referencia comunes que los investigadores suelen utilizar para probar sus algoritmos? Sé que dentro de Computer Vision las personas a menudo usan MNIST o CIFAR, pero no he encontrado conjuntos de datos similares para el filtrado colaborativo.

pir
fuente
1
¿Le echó un vistazo al conjunto de datos de premios de Netflix? Sí, la competencia terminó hace mucho tiempo y se retiró del sitio web oficial debido a algunas razones de privacidad. Todavía puede intentar encontrarlo en otros lugares.
Vladislavs Dovgalecs
Kaggle.com tiene un montón. Simplemente busque 'recomendación en: conjunto de datos' o 'recomendación en: competencia'.
ran8

Respuestas:

8

La respuesta obvia sería el conjunto de datos de premios de Netflix, hay mucha investigación al respecto y la mayoría de los algoritmos de FQ tienen puntajes conocidos.

Hay otros conjuntos de datos disponibles que generalmente se usan como puntos de referencia:

João Almeida
fuente
1

Tengo un repositorio que podría ayudarte.

https://github.com/ArthurFortes/Datasets-for-Recommneder-Systems/

Arthur Fortes
fuente
3
No publique respuestas de solo enlace, las respuestas deben ser independientes. Recomiendo editar su respuesta para agregar al menos algunas de las informaciones que proporciona el enlace, y luego proporcionar el enlace para una mayor exploración.
Mephy