" Cómo no ordenar por calificación promedio " de Evan Miller propone utilizar el límite inferior de un intervalo de confianza para obtener un "puntaje" agregado razonable para los elementos calificados. Sin embargo, está funcionando con un modelo de Bernoulli: las calificaciones son pulgares hacia arriba o hacia abajo.
¿Qué es un intervalo de confianza razonable para usar para un modelo de calificación que asigna una puntuación discreta de a estrellas, suponiendo que el número de calificaciones para un artículo puede ser pequeño?k
Creo que puedo ver cómo adaptar el centro de los intervalos Wilson y Agresti-Coull como
donde o (probablemente mejor) es la calificación promedio de todos los artículos. Sin embargo, no estoy seguro de cómo adaptar el ancho del intervalo. Mi mejor conjetura (revisada) sería
con , pero no puedo justificarlo con más que agitarlo a mano como una analogía de Agresti-Coull, tomando eso como
¿Existen intervalos de confianza estándar que se aplican? (Tenga en cuenta que no tengo suscripciones a ninguna revista o acceso fácil a la biblioteca de una universidad; de todos modos, brinde las referencias adecuadas, ¡pero complemente con el resultado real!)
fuente
Respuestas:
Como dijo Karl Broman en su respuesta, un enfoque bayesiano probablemente sería mucho mejor que usar intervalos de confianza.
El problema con los intervalos de confianza
¿Por qué el uso de intervalos de confianza no funciona demasiado bien? Una razón es que si no tiene muchas clasificaciones para un artículo, su intervalo de confianza será muy amplio, por lo que el límite inferior del intervalo de confianza será pequeño. Por lo tanto, los elementos sin muchas calificaciones terminarán al final de su lista.
Intuitivamente, sin embargo, es probable que desee que los artículos sin muchas calificaciones estén cerca del artículo promedio, por lo que desea mover su calificación estimada del artículo hacia la calificación media sobre todos los artículos (es decir, desea empujar su calificación estimada hacia una anterior ) . Esto es exactamente lo que hace un enfoque bayesiano.
Enfoque bayesiano I: distribución normal sobre calificaciones
Una forma de mover la calificación estimada hacia un previo es, como en la respuesta de Karl, usar una estimación de la forma :w ∗ R + ( 1 - w ) ∗ C
De hecho, a esta estimación se le puede dar una interpretación bayesiana como la estimación posterior de la calificación media del elemento cuando las calificaciones individuales provienen de una distribución normal centrada alrededor de esa media.
Sin embargo, asumir que las calificaciones provienen de una distribución normal tiene dos problemas:
Enfoque bayesiano II: distribución multinomial sobre calificaciones
Entonces, en lugar de asumir una distribución normal para las calificaciones, supongamos una distribución multinomial . Es decir, dado un elemento específico, hay una probabilidad que un usuario aleatorio le otorgue 1 estrella, una probabilidad que un usuario aleatorio le otorgue 2 estrellas, y así sucesivamente.p 2pags1 pags2
Por supuesto, no tenemos idea de cuáles son estas probabilidades. A medida que obtengamos más y más calificaciones para este artículo, podemos suponer que está cerca de , donde es el número de usuarios que le dieron 1 estrella es el número total de usuarios que calificaron el artículo, pero cuando comenzamos, no tenemos nada. Entonces colocamos un Dirichlet antes de en estas probabilidades.n 1pags1 n1nDir(α1,…,αk)norte1norte norte1 norte D i r ( α1, ... , αk)
¿Qué es este Dirichlet anterior? Podemos pensar en cada parámetro como un "recuento virtual" de la cantidad de veces que una persona virtual le dio al elemento estrellas. Por ejemplo, si , , y todos los demás son iguales a 0, entonces podemos pensar que esto significa que dos personas virtuales le dieron el elemento 1 estrella y una persona virtual le dio el elemento 2 estrellas. Entonces, incluso antes de que tengamos usuarios reales, podemos usar esta distribución virtual para proporcionar una estimación de la calificación del artículo. i α 1 = 2 α 2 = 1 α iαyo yo α1= 2 α2=1 αi
[Una forma de elegir los parámetros sería establecer igual a la proporción general de votos de estrellas. (Tenga en cuenta que los parámetros no son necesariamente enteros).]α i i α iαi αi i αi
Luego, una vez que entran las calificaciones reales, simplemente agregue sus cuentas a las cuentas virtuales de su Dirichlet antes. Siempre que desee estimar la calificación de su artículo, simplemente tome la media sobre todas las calificaciones del artículo (tanto sus calificaciones virtuales como sus calificaciones reales).
fuente
Esta situación exige un enfoque bayesiano. Hay enfoques simples para las clasificaciones bayesianas de calificaciones aquí (preste especial atención a los comentarios, que son interesantes) y aquí , y luego un comentario adicional sobre estos aquí . Como señala uno de los comentarios en el primero de estos enlaces:
fuente