Medición de la efectividad del jugador individual en deportes de 2 jugadores por equipo

19

Tengo una hoja de cálculo de algunos puntajes del equipo. El primer equipo en ganar 10 puntos. Hay 2 jugadores en cada equipo. Los jugadores juegan con diferentes compañeros de equipo todo el tiempo, aunque no se eligen perfectamente al azar. No se mantienen puntajes individuales.

Básicamente, tenemos a Bill y Bob venciendo a Andy y Alice 10-4. Jake y Bill vencieron a Joe y John 10-8 ...

¿Es posible llegar a una clasificación para los jugadores individuales , en función de todos los datos de partidos disponibles? Básicamente, ¿para ver cuánto contribuye cada jugador a cada juego en términos de puntos o en relación con los otros jugadores?

Bill Waterson
fuente
1
Si algo de esto es útil y le interesaría ver un mayor desarrollo de la simple adaptación del modelo de "puntuación independiente" a su escenario, hágamelo saber y trataré de escribirlo (con suerte un poco más concisamente) como una respuesta separada. Salud.
Cardenal

Respuestas:

13

A continuación hay un par de modelos muy simples . Ambos son deficientes en al menos una forma, pero tal vez proporcionen algo sobre lo que construir. El segundo modelo en realidad no aborda (del todo) el escenario del OP (ver comentarios a continuación), pero lo dejo en caso de que ayude de alguna manera.

Modelo 1 : una variante del modelo Bradley-Terry

Supongamos que estamos interesados ​​principalmente en predecir si un equipo vencerá a otro en función de los jugadores de cada equipo. Simplemente podemos registrar si el Equipo 1 con jugadores vence al Equipo 2 con jugadores para cada juego, ignorando el puntaje final. Ciertamente, esto está arrojando algo de información, pero en muchos casos esto todavía proporciona mucha información.( k , )(i,j)(k,)

El modelo es entonces

logit(P(Team 1 beats Team 2))=αi+αjαkα.

Es decir, tenemos un parámetro de "afinidad" para cada jugador que afecta cuánto mejora la posibilidad de que su equipo gane. Define la "fuerza" del jugador mediante . Entonces, este modelo afirma que P (el equipo 1 vence al equipo 2 ) = s i s jsi=eαi

P(Team 1 beats Team 2)=sisjsisj+sks.

Aquí hay una simetría muy buena en que no importa cómo se codifica la respuesta siempre que sea coherente con los predictores. Es decir, también tenemos

logit(P(Team 2 beats Team 1))=αk+ααiαj.

Esto se puede ajustar fácilmente como una regresión logística con predictores que son indicadores (uno para cada jugador) que toman el valor si el jugador está en el Equipo 1 para el juego en cuestión, si está en el Equipo 2 y si no participar en ese juegoi - 1 0+1i10

De esto también tenemos un ranking natural para los jugadores. Cuanto mayor sea (o ), mayor será el jugador que mejorará las posibilidades de ganar de su equipo. Entonces, simplemente podemos clasificar a los jugadores de acuerdo con sus coeficientes estimados. (Tenga en cuenta que los parámetros de afinidad solo son identificables hasta un desplazamiento común. Por lo tanto, es típico corregir para que el modelo sea identificable).s α 1 = 0αsα1=0

Modelo 2 : puntuación independiente

NB : Al volver a leer la pregunta del OP, es evidente que los siguientes modelos son inadecuados para su configuración. Específicamente, el OP está interesado en un juego que termina después de que un equipo u otro anoten un número fijo de puntos. Los siguientes modelos son más apropiados para juegos que tienen una duración fija en el tiempo. Se pueden hacer modificaciones para que se ajusten mejor al marco del OP, pero requeriría una respuesta por separado para desarrollarse.

Ahora queremos hacer un seguimiento de las puntuaciones. Supongamos que es una aproximación razonable que cada equipo obtenga puntos de forma independiente entre sí con el número de puntos anotados en cualquier intervalo, independientemente de cualquier intervalo disjunto. Luego, el número de puntos que obtiene cada equipo se puede modelar como una variable aleatoria de Poisson.

Por lo tanto, podemos configurar un GLM de Poisson de modo que la puntuación de algún equipo formado por jugadores y en un juego en particular sea j log ( μ ) = γ i + γ jij

log(μ)=γi+γj

Tenga en cuenta que este modelo ignora los enfrentamientos reales entre equipos, centrándose exclusivamente en la puntuación.

Se hace tener una conexión interesante para el modelo de Bradley-Terry modificado. Defina y suponga que se juega un juego de "muerte súbita" en el que gana el primer equipo que anota. Si el Equipo 1 tiene jugadores y el Equipo 2 tiene jugadores , entonces Por lo tanto, la tasa media de puntuación de los jugadores es equivalente a la formulación del parámetro "fuerza" del Modelo 1.σi=eγi(i,j)(k,)

P(Team 1 beats Team 2 in sudden death)=σiσjσiσj+σkσ.

Podríamos considerar hacer este modelo más complejo teniendo una afinidad "ofensiva" y una afinidad de "defensa" para cada jugador, de modo que si el Equipo 1 con juega el Equipo 2 con , entonces y δ i ( i , j ) ( k , ) log ( μ 1 ) = ρ i + ρ j - δ k - δ log ( μ 2 ) = ρ k + ρ - δ i - δ jρiδi(i,j)(k,)

log(μ1)=ρi+ρjδkδ
log(μ2)=ρk+ρδiδj

La puntuación sigue siendo independiente en este modelo, pero ahora hay una interacción entre los jugadores de cada equipo que afecta la puntuación. Los jugadores también pueden clasificarse según sus estimaciones de coeficientes de afinidad.

El modelo 2 (y sus variantes) también permiten la predicción de una puntuación final.

Extensiones : Una forma útil de extender ambos modelos es incorporar un orden en el que los indicadores positivos correspondan al equipo "local" y los indicadores negativos al equipo "visitante". Agregar un término de intercepción a los modelos se puede interpretar como una "ventaja de campo local". Otras extensiones pueden incluir la incorporación de la posibilidad de vínculos en el Modelo 1 (en realidad, ya es una posibilidad en el Modelo 2).

Nota al margen : al menos una de las encuestas computarizadas ( Peter Wolfe ) utilizadas para la Bowl Championship Series en el fútbol americano universitario utiliza el modelo (estándar) Bradley-Terry para producir sus clasificaciones.

cardenal
fuente
7

El algoritmo TrueSkill de Microsoft , como se usa para clasificar a los jugadores en XBox Live, puede lidiar con los partidos de equipo, pero no incorpora el margen de victoria. Todavía puede ser de alguna utilidad para usted.

Martin O'Leary
fuente
1

Si.

Podrías mirar el registro de victorias / derrotas de cada jugador y el diferencial de puntos. Me doy cuenta de que es una respuesta simple, pero esas estadísticas aún serían significativas.

Adán
fuente
Quiero algo un poco más complejo que esto. Parece que, en promedio, un jugador aporta X número de puntos a un juego. Quería saber si podría resolver esto o una aproximación aproximada de alguna manera.
Bill Waterson
Me gustaría ver cómo Jeff Sagarin hace su clasificación de poder para el fútbol universitario y otros deportes. Supongo que guarda su fórmula, pero creo que lo hizo mientras era estudiante de maestría en el MIT. Sagarin tiene en cuenta cuánto vences a tus oponentes, qué tan buenos son tus oponentes y la fuerza de tu cronograma (que puede ser lo mismo que 'cuán buenos son tus oponentes). Creo que un compañero llamado Danny Sheridan tiene un sistema similar. Buena suerte.
Adam
1

(Me gustaría agregar esto como un comentario para una respuesta anterior, pero mi reputación no era suficiente, por el momento)

Martin O'Leary vinculó el algoritmo TrueSkill , y es una buena opción. Si estás interesado en el uso (más que en el desarrollo), deberías probar rankade , nuestro sistema de clasificación. Al igual que TrueSkill, puede administrar dos facciones con más de un jugador cada una (futbolín 2 contra 2, tenis de mesa 2 contra 2, baloncesto 3 contra 3 y 5 contra 5, y más). Algunas diferencias notables, entre otras, son que rankade permite la construcción de facciones más estructuradas (1-contra-1, facción contra facción, multijugador, multifacción, juegos cooperativos, facciones asimétricas y más) y que es de uso gratuito.

Aquí hay una comparación entre los sistemas de clasificación más conocidos.

Tomaso Neri
fuente