Tengo una apuesta con un compañero de trabajo de que de 50 juegos de ping pong (primero en ganar 21 puntos, ganar por 2), ganaré los 50. Hasta ahora hemos jugado 15 juegos y en promedio gano el 58% de los puntos, además he ganado todos los juegos hasta ahora. Entonces nos preguntamos si tengo un 58% de posibilidades de ganar un punto y él tiene un 42% de posibilidades de ganar un punto, ¿cuál es el porcentaje de posibilidades de que gane el juego? ¿Existe una fórmula que podamos conectar en% de probabilidad de diferencia?
Buscamos en Google por todas partes e incluso preguntamos a los científicos de datos de nuestra empresa, pero no pudimos encontrar una respuesta directa.
Editar: Wow, estoy impresionado por la minuciosidad de las respuestas. ¡¡¡Muchas gracias a todos!!! En caso de que la gente sienta curiosidad, tengo una actualización de cómo va mi apuesta: ahora he ganado 18 de 50 juegos, así que necesito ganar 32 juegos más. He ganado el 58.7% de todos los puntos y mi oponente ha ganado el 41.3% de los puntos. La desviación estándar para mi oponente es 3.52, su puntaje promedio es 14.83 y su puntaje promedio es 15.50. A continuación se muestra una captura de pantalla de la puntuación de cada juego hasta el momento. Puedo seguir actualizando a medida que avanza la apuesta, si la gente está interesada.
Edición n. ° 2 : Desafortunadamente solo hemos podido jugar algunos juegos más, a continuación se muestran los resultados. Voy a seguir reemplazando la imagen para no tener muchas capturas de pantalla de la partitura.
Actualización final : finalmente perdí contra mi compañero de trabajo en el juego # 28. Me ganó 21-13. ¡Gracias por toda tu ayuda!
fuente
Respuestas:
El análisis se complica por la posibilidad de que el juego entre en "tiempo extra" para ganar por un margen de al menos dos puntos. (De lo contrario, sería tan simple como la solución que se muestra en https://stats.stackexchange.com/a/327015/919 .) Mostraré cómo visualizar el problema y usarlo para dividirlo en contribuciones fácilmente calculadas para la respuesta. El resultado, aunque un poco desordenado, es manejable. Una simulación confirma su exactitud.
Sea su probabilidad de ganar un punto.p Suponga que todos los puntos son independientes. La posibilidad de que ganes un juego se puede dividir en eventos (sin solapamiento) según la cantidad de puntos que tenga tu oponente al final, suponiendo que no pases horas extras ( ) o que pases horas extras . En este último caso, es (o será) obvio que en algún momento el puntaje fue de 20-20.0,1,…,19
Hay una buena visualización. Deje que los puntajes durante el juego se tracen como puntos donde es su puntaje es el puntaje de su oponente. A medida que se desarrolla el juego, las puntuaciones se mueven a lo largo de la red de enteros en el primer cuadrante que comienza en , creando una ruta de juego . Termina la primera vez que uno de ustedes ha marcado al menos y tiene un margen de al menos . Dichos puntos ganadores forman dos conjuntos de puntos, el "límite absorbente" de este proceso, donde la ruta del juego debe terminar.x y ( 0 , 0 ) 21 2(x,y) x y (0,0) 21 2
Esta figura muestra parte del límite absorbente (se extiende infinitamente hacia arriba y hacia la derecha) junto con la ruta de un juego que entró en tiempo extra (con una pérdida para ti, por desgracia).
Contemos. El número de formas en que el juego puede terminar con puntos para tu oponente es el número de caminos distintos en la red entera de puntajes comienzan en el puntaje inicial y terminan en el penúltimo puntaje . Dichos caminos están determinados por cuál de los más de puntos en el juego que ganaste. Corresponden, por lo tanto, a los subconjuntos de tamaño de los números , y hay de ellos. Dado que en cada camino ganaste puntos (con probabilidades independientes cada vez, contando el punto final) y tu oponente ganóy (x,y) (0,0) (20,y) 20+y 20 1,2,…,20+y (20+y20) 21 p y puntos (con probabilidades independientes cada vez), las rutas asociadas con representan una probabilidad total de1−p y
Del mismo modo, hay formas de llegar a representan el empate 20-20. En esta situación no tienes una victoria definitiva. Podemos calcular la posibilidad de su victoria adoptando una convención común: olvide cuántos puntos se han anotado hasta ahora y comience a rastrear el diferencial de puntos. El juego está en un diferencial de y terminará cuando alcance por primera vez o , pasando necesariamente por en el camino. Deje que sea la oportunidad de ganar cuando el diferencial es .(20+2020) (20,20) 0 +2 −2 ±1 g(i) i∈{−1,0,1}
Como su posibilidad de ganar en cualquier situación es , tenemosp
La solución única a este sistema de ecuaciones lineales para el vector implica(g(−1),g(0),g(1))
Por lo tanto, esta es su oportunidad de ganar una vez que se alcanza (lo que ocurre con una probabilidad de ).(20,20) (20+2020)p20(1−p)20
En consecuencia, su posibilidad de ganar es la suma de todas estas posibilidades disjuntas, igual a
Lo que está dentro de los paréntesis a la derecha es un polinomio en . (Parece que su grado es , pero todos los términos principales se cancelan: su grado es ).21 20p 21 20
Cuando , la posibilidad de una victoria es cercana a0,855913992.p=0.58 0.855913992.
No debería tener problemas para generalizar este análisis a los juegos que terminan con cualquier número de puntos. Cuando el margen requerido es mayor que el resultado se vuelve más complicado pero es igual de sencillo.2
Por cierto , con estas posibilidades de ganar, tenías una posibilidades de ganar los primeros juegos. Eso no es inconsistente con lo que informa, lo que podría alentarnos a continuar suponiendo que los resultados de cada punto son independientes. Por lo tanto, proyectaríamos que tiene la posibilidad de15(0.8559…)15≈9.7% 15
de ganar todos los juegos restantes , suponiendo que procedan de acuerdo con todos estos supuestos. ¡No parece una buena apuesta a menos que la recompensa sea grande!35
Me gusta verificar trabajos como este con una simulación rápida. Aquí hay un
R
código para generar decenas de miles de juegos en un segundo. Asume que el juego terminará en 126 puntos (extremadamente pocos juegos necesitan continuar tanto tiempo, por lo que esta suposición no tiene un efecto material en los resultados).Cuando ejecuté esto, ganaste en 8,570 casos de las 10,000 iteraciones. Se puede calcular un puntaje Z (con aproximadamente una distribución Normal) para probar tales resultados:
El valor de en esta simulación es perfectamente consistente con el cálculo teórico anterior.0.31
Apéndice 1
A la luz de la actualización de la pregunta, que enumera los resultados de los primeros 18 juegos, aquí hay reconstrucciones de rutas de juego consistentes con estos datos. Puedes ver que dos o tres de los juegos fueron peligrosamente cercanos a las pérdidas. (Cualquier camino que termine en un cuadrado gris claro es una pérdida para usted).
Los usos potenciales de esta figura incluyen observar:
Los caminos se concentran alrededor de una pendiente dada por la proporción 267: 380 del puntaje total, equivalente aproximadamente al 58.7%.
La dispersión de los caminos alrededor de esa pendiente muestra la variación esperada cuando los puntos son independientes.
Si los puntos se hacen en rayas, entonces las rutas individuales tenderían a tener tramos largos verticales y horizontales.
En un conjunto más largo de juegos similares, espere ver caminos que tienden a permanecer dentro del rango de color, pero también espera que algunos se extiendan más allá.
La posibilidad de un juego o dos cuyo camino se encuentra generalmente por encima de esta extensión indica la posibilidad de que su oponente eventualmente gane un juego, probablemente más temprano que tarde.
Apéndice 2
Se solicitó el código para crear la figura. Aquí está (limpiado para producir un gráfico un poco más agradable).
fuente
r code
divulgación de implementación? Muchas gracias.Usar la distribución binomial y asumir que cada punto es independiente:
La probabilidad de que el jugador llegue a en los primeros puntos (teniendo en cuenta el hecho de que se debe ganar el último punto) es58% 21 40 ∑40n=21(n−120)0.58210.42n−21 =∑40k=21(40k)0.58k0.4240−k ≈0.80695
La probabilidad de que el jugador obtenga de puntos jugados es el binomio . Condicionado a eso, la probabilidad de que el jugador gane con el margen de dos puntos es58% 20 40 (4020)0.58200.4220≈0.074635 58% 0.5820.582+0.422≈0.656006
Entonces, la probabilidad general de que gane el jugador es aproximadamente58% 0.80695+0.074635×0.656006 ≈0.8559
La probabilidad de que el jugador del gane los primeros juegos es entonces de aproximadamente cual es bastante improbable. La probabilidad de que el jugador del gane los últimos juegos es de aproximadamente cual es muy poco probable.58% 15 0.8555915≈0.0969 58% 35 0.8555935≈0.0043
fuente
Fui con una respuesta computacional. Aquí hay una función R que simula un juego de ping-pong donde el ganador tiene que ganar por 2. El único argumento es la probabilidad de que ganes un punto. Devolverá el puntaje final de ese juego:
Primero, asegurémonos de que funciona simulando 10,000 juegos en los que tienes un 50% de posibilidades de ganar cada punto. Debemos observar que su porcentaje de victorias es aproximadamente del 50%:
Esto devuelve .4955, sobre lo que esperaríamos. Así que conectemos su 58%:
Esto devuelve .8606. Entonces tienes una probabilidad de 86.06% de ganar un juego.
Ahora podemos simular en 35 lotes de juegos y ver cuántas veces ganarías los 35:
Esto devuelve .0037, lo que significa que tienes alrededor de un 0,37% de posibilidades de ganar los próximos 35 juegos. Esto supone que todos los juegos y todos los puntos son independientes entre sí. Podrías programarlo explícitamente en la función anterior, si quisieras.
Nota: estoy haciendo esto sobre la marcha. Estoy seguro de que hay una manera más computacionalmente eficiente de programar esto.
fuente
pbetterwins <- pbinom(19,40,0.42) + dbinom(20,40,0.42) * 0.58^2/(0.58^2+0.42^2); pbetterwins; pbetterwins^35
un cálculo usando la distribución binomial. Lo suficientemente cerca de su simulación¿Debemos suponer que el 58% de posibilidades de ganar es fijo y que los puntos son independientes?
Creo que la respuesta de Whuber es buena , y está bellamente escrita y explicada, cuando se considera que cada punto es independiente del siguiente . Sin embargo, creo que, en la práctica, es solo un punto de partida interesante (teórico / idealizado). Me imagino que en realidad los puntos no son independientes entre sí, y esto podría hacer que sea más o menos probable que su oponente compañero de trabajo gane al menos una vez de 50.
Al principio, imaginé que la dependencia de los puntos sería un proceso aleatorio , es decir, no controlado por los jugadores (por ejemplo, cuando uno gana o pierde jugando de manera diferente), y esto debería crear una mayor dispersión de los resultados que beneficiaría al jugador menor para obtener este punto de cincuenta.
Sin embargo, un segundo pensamiento podría sugerir lo contrario : el hecho de que ya "haya logrado" algo con un 9.7% de probabilidad puede brindar algún beneficio (pero solo leve), desde un punto de vista bayesiano, a ideas sobre cómo favorecer mecanismos que lo lleven a gana más del 85% de probabilidad de ganar un juego (o al menos hace que sea menos probable que tu oponente tenga una probabilidad mucho mayor que el 15% como se argumenta en los dos párrafos anteriores). Por ejemplo, podría ser que su puntaje sea mejor cuando su posición es menos buena (no es extraño que las personas obtengan puntos mucho más diferentes en los puntos de partido, a favor o en contra, que en los puntos normales). Puede mejorar las estimaciones del 85% teniendo en cuenta estas dinámicas y posiblemente tenga más del 85% de probabilidad de ganar un juego.
De todos modos, podría ser muy incorrecto usar esta estadística de puntos simples para proporcionar una respuesta. Sí, puede hacerlo, pero no será correcto ya que las premisas (independencia de los puntos) no son necesariamente correctas e influyen mucho en la respuesta . La estadística 42/58 es más información, pero no sabemos muy bien cómo usarla (la corrección del modelo) y el uso de la información podría proporcionar respuestas con alta precisión que en realidad no tiene.
Ejemplo
Ejemplo: un modelo igualmente razonable con un resultado completamente diferente
Entonces, la pregunta hipotética (asumiendo puntos independientes y probabilidades conocidas, teóricas para estos puntos) es en sí misma interesante y puede ser respondida, pero solo para ser molesta y escéptica / cínica; Una respuesta al caso hipotético no se relaciona tanto con su problema subyacente / original, y podría ser la razón por la cual los estadísticos / científicos de datos de su empresa son reacios a proporcionar una respuesta directa.
Solo para dar un ejemplo alternativo (no necesariamente mejor) que proporciona una confusa (contra) declaración 'P: ¿cuál es la probabilidad de ganar el total de 50 juegos si ya gané 15?' Si no empezamos a pensar que "los puntajes de puntos 42/58 son relevantes o nos dan mejores predicciones", entonces comenzaríamos a hacer predicciones de su probabilidad de ganar el juego y predicciones para ganar otros 35 juegos únicamente en función de su ganado anteriormente 15 juegos:
lo que significa que no sería tan pesimista como la predicción directa de 0.432%. El hecho de que ya haya ganado 15 juegos debería aumentar la probabilidad de que gane los próximos 35 juegos.
Nota basada en los nuevos datos.
Según sus datos para los 18 juegos, intenté ajustar un modelo beta-binomial. Variando y y calculando las probabilidades de obtener un puntaje i, 21 (a través de i, 20) o un puntaje 20,20 y luego sumar sus registros a un puntaje de probabilidad de registro.α=μν β=(1−μ)ν
Muestra que un parámetro muy alto (poca dispersión en la distribución beta subyacente) tiene una mayor probabilidad y, por lo tanto, es probable que haya poca sobredispersión. Eso significa que los datos no sugieren que es mejor usar un parámetro variable para su probabilidad de ganar un punto, en lugar de su probabilidad fija de ganar del 58%. Estos nuevos datos proporcionan soporte adicional para el análisis de Whuber, que asume puntajes basados en una distribución binomial. Pero, por supuesto, esto todavía supone que el modelo es estático y que usted y su compañero de trabajo se comportan de acuerdo con un modelo aleatorio (en el que cada juego y cada punto son independientes).ν
Estimación de máxima verosimilitud para los parámetros de distribución beta en lugar de una probabilidad de ganar fija del 58%:
P: ¿cómo se lee el gráfico "LogLikelihood para parámetros mu y nu"?
UNA:
código / cálculo para el gráfico 1
código / cálculo para el gráfico 2
fuente
Se podría gastar mucho esfuerzo en un modelo perfecto. Pero a veces un mal modelo es mejor. Y nada dice mal modelo como el teorema del límite central: todo es una curva normal.
Ignoraremos el "tiempo extra". Modelaremos la suma de puntos individuales como una curva normal. Vamos a modelar jugando 38 rondas y el que tenga más puntos gana, en lugar de primero a 20. ¡Es un juego bastante similar!
Y, ciegamente, afirmaré que nos acercamos a la respuesta correcta.
Deje ser la distribución de un punto. tiene el valor 1 cuando obtienes un punto y 0 cuando no.X X
Entonces = ~ y = = ~ .E(X) 0.58 Var(X) E(X)∗(1−E(X)) 0.24
Si son puntos independientes, entonces son los puntos que obtienes después de jugar 38 rondas.Xi ∑38i=1Xi
y = = ~√SD(∑38i=1Xi) 3.0238∗Var(X))−−−−−−−−−−−√ 3.02
En nuestro modelo crudo, perdemos si y ganamos si .∑ 38 i = 1 X i > 19∑38i=1Xi<19 ∑38i=1Xi>19
1,0115,62%22.04−193.02 está a desviaciones estándar de la media, lo que se en un posibilidades de falla después de consultar una tabla de puntuación z .1.01 15.62%
Si comparamos con las respuestas más rigurosas, esto es aproximadamente descuento en el valor correcto.1%
En general, sería mejor examinar la confiabilidad de la probabilidad de victoria del lugar de un modelo más riguroso que asume una probabilidad del y lo modela perfectamente.58 %58% 58%
fuente
Según la simulación, parece que la probabilidad de ganar un juego determinado es de aproximadamente el 85.5%.
La probabilidad de ganar exactamente 2 (que es como leí el título, pero no parece ser lo que estás preguntando) es de aproximadamente 10.1%.
Ejecute el código a continuación.
fuente
dbinom(20,40,0.58)*0.58^2/(1-2*0.58+2*0.58^2)+dbinom(20,39,0.58)*0.58
dar 10.04%