El sistema de calificación Elo utiliza un algoritmo de minimización de descenso de gradiente de la función de pérdida de entropía cruzada entre la probabilidad esperada y observada de un resultado en comparaciones pareadas. Podemos escribir las funciones de pérdida general como
donde la suma se realiza sobre todos los resultados y todos los oponentes . es la frecuencia observada del evento y q i la frecuencia esperada.n p i i
En el caso de solo dos posibles resultados (ganar o perder) y un oponente tenemos
Si es la clasificación del jugador i y π j es la clasificación del jugador j , podemos construir la probabilidad esperada como q i = e π i qj=e π j
donde y p i son la probabilidad esperada y observada de ganar del jugador i contra el jugador j . Estas son las reglas de actualización.two outcomes
En presencia de sorteos podemos generalizar el modelo anterior incluyendo un tercer resultado con probabilidad
qi(w)=eπi
Y podemos construir la función de pérdida como
win
loose
draw
win
loose
draw
three outcome
La pregunta es, ¿por qué el sistema de calificación Elo usa las two outcomes
reglas de actualización incluso en presencia de sorteos?
fuente