¿Cómo puedo predecir las probabilidades de que un equipo de dodgeball gane en función del historial de victorias de sus jugadores?

13

Imagina que hay 80 jugadores de dodgeball en el mundo. Cada uno de ellos ha jugado miles de juegos de dodgeball con los otros 79 jugadores en un orden más o menos aleatorio. Este es un mundo sin equipos (por ejemplo, cada jugador tiene la posibilidad de ser reclutado en cualquier equipo en cada juego). Sé la tasa de ganancias anterior de cada jugador (por ejemplo, uno ha ganado el 46% de todos los juegos anteriores, otro ha ganado el 56% de todos sus juegos anteriores). Digamos que hay un partido por venir y sé quién está jugando en cada equipo. También sé su tasa de victorias anterior.

¿Cuál es la mejor manera de calcular la probabilidad de que cada equipo gane en función de la composición del equipo?

Si requiere un cálculo relativamente avanzado (por ejemplo, regresión logística), hágame saber algunos de los detalles. Estoy bastante familiarizado con SPSS, pero prefiero no hacer una pregunta de seguimiento.

Además, ¿cómo exploraría la precisión de mi método utilizando datos de archivo? Sé que no será claro, ya que la mayoría de los jugadores rondan el 40-60%, pero aún así.

Para ser específicos, ¿cuáles son las probabilidades de que el equipo A gane?

A - compuesto por individuos con una tasa de ganancia previa del 52%, 54%, 56%, 58%, 60% B - compuesto por individuos con una tasa de ganancia previa del 48%, 55%, 56%, 58%, 60%

(este es solo un ejemplo aleatorio con fines ilustrativos. Dos equipos bastante buenos).

Editar: ¿Hay alguna manera de comenzar con un algoritmo muy simple y luego ver cómo funciona? Quizás podríamos simplemente sumar los porcentajes de cada equipo y predecir que ganará el que tenga el porcentaje más alto. Por supuesto, nuestra clasificación no sería precisa, pero en miles de juegos archivados podríamos ver si podemos predecir mejor que el azar.

Behacad
fuente
¿No es solo una simple división de los promedios? AvgTeam1WinP/ AvgTeam2WinP? Debería generar las probabilidades de team1ganar contra team2.
PascalVKooten

Respuestas:

2

Suena como un trabajo para ingenuo Bayes . No entiendo bien la teoría detrás de esto, así que desafortunadamente no puedo darle un ejemplo, pero Bayes trabaja con datos conocidos (de archivo) para hacer inferencias.

Creo que Bayes solo está disponible en Statistic Server de SPSS, por lo que si tiene acceso a uno de estos, tiene suerte. Alternativamente, puede usar Weka, que también incluye un montón de otros clasificadores, así que ¿tal vez ejecute su experimento y nos haga saber los resultados?

UNUNsiUN

rath
fuente
Gracias por tu comentario y por tu edición. Pensé que un enfoque bayesiano o de aprendizaje automático podría ser el mejor. Lamentablemente, estoy relativamente poco familiarizado con estos enfoques.
Behacad
2

¿Es correcto que tenga no solo esos porcentajes sino también todos los resultados individuales del juego? Entonces sugeriría el paquete r PlayerRatings. Este paquete no solo trata problemas como cómo calcular la fuerza del jugador (usando algoritmos como elo o glicko), sino que también ofrece funciones que pueden predecir los resultados futuros del juego.

Para ver ejemplos, consulte: http://cran.r-project.org/web/packages/PlayerRatings/vignettes/AFLRatings.pdf

rdatasculptor
fuente
0

¿No es solo una simple división de los promedios? AvgTeam1WinP/ AvgTeam2WinP? Debería generar las probabilidades de team1ganar contra team2.

Si considero lo siguiente:

Si player1jugaría player2en equipos de "1 hombre", estaría de acuerdo en que las probabilidades de que el jugador1 gane contra el jugador2 sería la probabilidad de que el jugador1 gane contra el azar dividido por la probabilidad de que el jugador2 gane al azar (esto por supuesto solo tiene en el caso de que haya considerado que el% de ganancia es exacto, como en su límite asintótico), simplemente:

OddsP1VsP2 = WinProbabilityP1 / WinProbabilityP2 

Si argumenta que no hay un efecto de interacción de que algunos jugadores sean terribles y, por lo tanto, influyan en el puntaje más negativamente de lo esperado *, o que algunos jugadores sean realmente buenos influyendo en el puntaje de manera más positiva de lo esperado **, entonces parece lógico que pueda solo tome la probabilidad promedio para cada jugador en cada equipo.

* Si la combinación de 60%, 60%, 60%, 60% se considera mejor que un equipo de 70%, 70%, 70%, 30%, donde un mal jugador resultaría en peores probabilidades para el equipo aunque Los promedios son los mismos. Sin hipótesis adicionales, esa pregunta en particular no se puede abordar.

** Del mismo modo, si 50,50,50,90 no se considera igual a 60,60,60,60, entonces se aplica lo mismo.

PascalVKooten
fuente