Convertir una lista de clasificaciones parciales en una clasificación global

13

Estoy trabajando en algo como el siguiente problema. Tengo un montón de usuarios y N libros. Cada usuario crea una clasificación ordenada de todos los libros que ha leído (que probablemente sea un subconjunto de los N libros), por ejemplo, Libro 1> Libro 40> Libro 25.

Ahora quiero convertir estas clasificaciones de usuarios individuales en una clasificación ordenada única de todos los libros.

¿Hay algún enfoque bueno o estándar para probar? Hasta ahora, estoy pensando en los modelos de Bradley-Terry aplicados a las comparaciones por pares, pero me pregunto si hay algo más.

raegtin
fuente
2
Creo que te encontrarás con muchos problemas de escasez, a menos que los usuarios (por alguna razón) lean libros similares. Pero dado n personas, y dado que la mayoría de las personas leen relativamente pocos libros, la gran mayoría de las parejas solo tendrá una persona haciendo la comparación. (El número medio fue de 6 por persona por año, ver Pew
Peter Flom - Restablecer a Monica
2
(+1) raegtin, preguntas bonitas e interesantes. Soy aficionado a los modelos BT, pero parece un poco forzado aquí. ¿Está familiarizado con la literatura de filtrado colaborativo? No es el mismo problema, pero algunos conceptos y técnicas podrían ser prestados. Una pregunta que no se ha abordado aquí es por qué uno debería creer que los libros pueden recibir una clasificación inequívoca y bien definida en primer lugar. (¿Cómo manejaría el caso de dos usuarios y dos libros, por ejemplo?)
cardenal
@ Peter Flom: Correcto, la mayoría de los pares no tienen comparaciones. Pero espero que esté bien, ya que si sabes que A> B y B> C, incluso si A y C no se comparan directamente, puedes inferir A> C.
raegtin
@cardinal: Sí, los modelos BT parecen forzados aquí, pero es lo único en lo que puedo pensar en este momento. Estoy familiarizado con la literatura de filtrado colaborativo, pero no estoy seguro de cómo se aplica aquí, ya que quiero clasificaciones, no similitudes. Es cierto que una clasificación global única no necesariamente tiene sentido (por ejemplo, ¿tiene sentido comparar libros para niños contra libros para adultos? ¿Ficción versus no ficción?), Pero en la práctica, sigue siendo útil. Las listas de libros "Lo mejor de" aparecen todo el tiempo :)
raegtin
Además, no me importan demasiado los pedidos cercanos (p. Ej., Si el libro clasificado # 1 es realmente mejor que el libro # 2), sino más bien los pedidos en conjunto (p. Ej., Quiero que el 10% de los libros principales en mi pedido ser mejor que el 10% inferior o el 10% medio).
raegtin

Respuestas:

2

Si está interesado en el uso (más que en el desarrollo), debe probar rankade , nuestro sistema de clasificación.

Rankade es gratuito y fácil de usar, y es diferente del modelo de Bradley-Terry y el sistema de clasificación Elo (aquí hay una comparación ) porque puede administrar partidos con más de 2 facciones (es decir, libros, en su escenario). Al insertar las clasificaciones ordenadas por el usuario (como coincidencias entre dos o más libros, con clasificaciones finales detalladas, incluidos empates) obtendrá la clasificación ordenada única de todos los libros que está buscando. Además, Rankade te da la oportunidad de verificar la evolución del tiempo para la clasificación de libros, y las estadísticas de emparejamientos de libros, y más.

Tomaso Neri
fuente
1
Debería describir su algoritmo, al menos en general, como enfoque. Y enlace a un documento donde se describe en su totalidad. De lo contrario, su respuesta podría considerarse simplemente como un anuncio.
ttnphns
1
Agregué un enlace para una comparación simple entre ree y el sistema de clasificación más conocido. La primera declaración dice que si está interesado en el uso (más que en el desarrollo) , por lo que se propone como una solución para el problema (rankade presenta una GUI, mientras que Bradley-Terry y Plackett-Luce necesitan una implementación para usarse), más que un ruta para llegar a la solución solicitada.
Tomaso Neri
1

Los modelos de clasificación de Plackett-Luce abordan este problema y son una técnica basada en la probabilidad donde la probabilidad se maximiza usando una rutina de maximización de la mayorización, que es similar a la maximización de la expectativa, en el sentido de que usan una función objetivo auxiliar sobre la función de probabilidad que es optimizado para garantizar la maximización monotónica iterativa de la función de probabilidad. (Ver algoritmos MM para los modelos de clasificación Plackett-Luce de David Hunter). Él proporciona código también.

Desde una perspectiva de clasificación, son una extensión de los modelos de Bradley-Terry que mencionas en tu publicación. Los modelos de Bradley-Terry estiman una clasificación global a partir de una muestra de clasificaciones por pares. Los modelos Plackett-Luce extienden esto a clasificaciones de longitud> = 2. También permiten que cada muestra sea una clasificación de una longitud diferente.

Esto se adapta perfectamente a su conjunto de datos:

Libro 1> Libro 40> Libro 25

Libro 40> Libro 30

Libro 25> Libro 17> Libro 11> Libro 3, etc.

coche fúnebre
fuente