Tengo una hoja de cálculo de algunos puntajes del equipo. El primer equipo en ganar 10 puntos. Hay 2 jugadores en cada equipo. Los jugadores juegan con diferentes compañeros de equipo todo el tiempo, aunque no se eligen perfectamente al azar. No se mantienen puntajes individuales.
Básicamente, tenemos a Bill y Bob venciendo a Andy y Alice 10-4. Jake y Bill vencieron a Joe y John 10-8 ...
¿Es posible llegar a una clasificación para los jugadores individuales , en función de todos los datos de partidos disponibles? Básicamente, ¿para ver cuánto contribuye cada jugador a cada juego en términos de puntos o en relación con los otros jugadores?
ranking
games
bradley-terry-model
Bill Waterson
fuente
fuente
Respuestas:
A continuación hay un par de modelos muy simples . Ambos son deficientes en al menos una forma, pero tal vez proporcionen algo sobre lo que construir. El segundo modelo en realidad no aborda (del todo) el escenario del OP (ver comentarios a continuación), pero lo dejo en caso de que ayude de alguna manera.
Modelo 1 : una variante del modelo Bradley-Terry
Supongamos que estamos interesados principalmente en predecir si un equipo vencerá a otro en función de los jugadores de cada equipo. Simplemente podemos registrar si el Equipo 1 con jugadores vence al Equipo 2 con jugadores para cada juego, ignorando el puntaje final. Ciertamente, esto está arrojando algo de información, pero en muchos casos esto todavía proporciona mucha información.( k , ℓ )( i , j ) ( k , ℓ )
El modelo es entonces
Es decir, tenemos un parámetro de "afinidad" para cada jugador que afecta cuánto mejora la posibilidad de que su equipo gane. Define la "fuerza" del jugador mediante . Entonces, este modelo afirma que P (el equipo 1 vence al equipo 2 ) = s i s jsyo= eαyo
Aquí hay una simetría muy buena en que no importa cómo se codifica la respuesta siempre que sea coherente con los predictores. Es decir, también tenemos
Esto se puede ajustar fácilmente como una regresión logística con predictores que son indicadores (uno para cada jugador) que toman el valor si el jugador está en el Equipo 1 para el juego en cuestión, si está en el Equipo 2 y si no participar en ese juegoi - 1 0+ 1 yo - 1 0 0
De esto también tenemos un ranking natural para los jugadores. Cuanto mayor sea (o ), mayor será el jugador que mejorará las posibilidades de ganar de su equipo. Entonces, simplemente podemos clasificar a los jugadores de acuerdo con sus coeficientes estimados. (Tenga en cuenta que los parámetros de afinidad solo son identificables hasta un desplazamiento común. Por lo tanto, es típico corregir para que el modelo sea identificable).s α 1 = 0α s α1= 0
Modelo 2 : puntuación independiente
NB : Al volver a leer la pregunta del OP, es evidente que los siguientes modelos son inadecuados para su configuración. Específicamente, el OP está interesado en un juego que termina después de que un equipo u otro anoten un número fijo de puntos. Los siguientes modelos son más apropiados para juegos que tienen una duración fija en el tiempo. Se pueden hacer modificaciones para que se ajusten mejor al marco del OP, pero requeriría una respuesta por separado para desarrollarse.
Ahora queremos hacer un seguimiento de las puntuaciones. Supongamos que es una aproximación razonable que cada equipo obtenga puntos de forma independiente entre sí con el número de puntos anotados en cualquier intervalo, independientemente de cualquier intervalo disjunto. Luego, el número de puntos que obtiene cada equipo se puede modelar como una variable aleatoria de Poisson.
Por lo tanto, podemos configurar un GLM de Poisson de modo que la puntuación de algún equipo formado por jugadores y en un juego en particular sea j log ( μ ) = γ i + γ jyo j
Tenga en cuenta que este modelo ignora los enfrentamientos reales entre equipos, centrándose exclusivamente en la puntuación.
Se hace tener una conexión interesante para el modelo de Bradley-Terry modificado. Defina y suponga que se juega un juego de "muerte súbita" en el que gana el primer equipo que anota. Si el Equipo 1 tiene jugadores y el Equipo 2 tiene jugadores , entonces Por lo tanto, la tasa media de puntuación de los jugadores es equivalente a la formulación del parámetro "fuerza" del Modelo 1.σyo= eγyo ( i , j ) ( k , ℓ )
Podríamos considerar hacer este modelo más complejo teniendo una afinidad "ofensiva" y una afinidad de "defensa" para cada jugador, de modo que si el Equipo 1 con juega el Equipo 2 con , entonces y δ i ( i , j ) ( k , ℓ ) log ( μ 1 ) = ρ i + ρ j - δ k - δ ℓ log ( μ 2 ) = ρ k + ρ ℓ - δ i - δ jρyo δyo ( i , j ) ( k , ℓ )
La puntuación sigue siendo independiente en este modelo, pero ahora hay una interacción entre los jugadores de cada equipo que afecta la puntuación. Los jugadores también pueden clasificarse según sus estimaciones de coeficientes de afinidad.
El modelo 2 (y sus variantes) también permiten la predicción de una puntuación final.
Extensiones : Una forma útil de extender ambos modelos es incorporar un orden en el que los indicadores positivos correspondan al equipo "local" y los indicadores negativos al equipo "visitante". Agregar un término de intercepción a los modelos se puede interpretar como una "ventaja de campo local". Otras extensiones pueden incluir la incorporación de la posibilidad de vínculos en el Modelo 1 (en realidad, ya es una posibilidad en el Modelo 2).
Nota al margen : al menos una de las encuestas computarizadas ( Peter Wolfe ) utilizadas para la Bowl Championship Series en el fútbol americano universitario utiliza el modelo (estándar) Bradley-Terry para producir sus clasificaciones.
fuente
El algoritmo TrueSkill de Microsoft , como se usa para clasificar a los jugadores en XBox Live, puede lidiar con los partidos de equipo, pero no incorpora el margen de victoria. Todavía puede ser de alguna utilidad para usted.
fuente
Si.
Podrías mirar el registro de victorias / derrotas de cada jugador y el diferencial de puntos. Me doy cuenta de que es una respuesta simple, pero esas estadísticas aún serían significativas.
fuente
(Me gustaría agregar esto como un comentario para una respuesta anterior, pero mi reputación no era suficiente, por el momento)
Martin O'Leary vinculó el algoritmo TrueSkill , y es una buena opción. Si estás interesado en el uso (más que en el desarrollo), deberías probar rankade , nuestro sistema de clasificación. Al igual que TrueSkill, puede administrar dos facciones con más de un jugador cada una (futbolín 2 contra 2, tenis de mesa 2 contra 2, baloncesto 3 contra 3 y 5 contra 5, y más). Algunas diferencias notables, entre otras, son que rankade permite la construcción de facciones más estructuradas (1-contra-1, facción contra facción, multijugador, multifacción, juegos cooperativos, facciones asimétricas y más) y que es de uso gratuito.
Aquí hay una comparación entre los sistemas de clasificación más conocidos.
fuente