Acabo de jugar un juego con mis hijos que básicamente se reduce a: quien gane cada número al menos una vez en un dado de 6 lados gana.
Finalmente gané, y los otros terminaron 1-2 turnos después. Ahora me pregunto: ¿cuál es la expectativa de la duración del juego?
Sé que la expectativa del número de lanzamientos hasta que llegue a un número específico es .
Sin embargo, tengo dos preguntas:
- ¿Cuántas veces tienes que tirar un dado de seis lados hasta que obtengas todos los números al menos una vez?
- Entre cuatro pruebas independientes (es decir, con cuatro jugadores), ¿cuál es la expectativa del número máximo de tiradas necesarias? [nota: es máximo, no mínimo, porque a su edad, se trata más de terminar que de llegar primero para mis hijos]
Puedo simular el resultado, pero me pregunto cómo haría para calcularlo analíticamente.
Aquí hay una simulación de Monte Carlo en Matlab
mx=zeros(1000000,1);
for i=1:1000000,
%# assume it's never going to take us >100 rolls
r=randi(6,100,1);
%# since R2013a, unique returns the first occurrence
%# for earlier versions, take the minimum of x
%# and subtract it from the total array length
[~,x]=unique(r);
mx(i,1)=max(x);
end
%# make sure we haven't violated an assumption
assert(numel(x)==6)
%# find the expected value for the coupon collector problem
expectationForOneRun = mean(mx)
%# find the expected number of rolls as a maximum of four independent players
maxExpectationForFourRuns = mean( max( reshape( mx, 4, []), [], 1) )
expectationForOneRun =
14.7014 (SEM 0.006)
maxExpectationForFourRuns =
21.4815 (SEM 0.01)
Respuestas:
Debido a que se ha solicitado un "enfoque completamente analítico", aquí hay una solución exacta. También proporciona un enfoque alternativo para resolver la pregunta en Probabilidad de dibujar una bola negra en un conjunto de bolas blancas y negras con condiciones de reemplazo mixtas .
El número de movimientos en el juego, , se puede modelar como la suma de seis realizaciones independientes de variables geométricas con probabilidades , cada uno de ellos desplazado por (porque una variable geométrica cuenta solo las tiradas que preceden a un éxito y también debemos contar las tiradas en las que se observaron éxitos). Al calcular con la distribución geométrica, obtendremos respuestas que son menos que las deseadas y, por lo tanto, debemos asegurarnos de agregar al final.X (p) p=1,5/6,4/6,3/6,2/6,1/6 1 6 66 6
La función generadora de probabilidad (pgf) de dicha variable geométrica con el parámetro esp
Por lo tanto, el pgf para la suma de estas seis variables es
(El producto se puede calcular en esta forma cerrada separándolo en cinco términos mediante fracciones parciales).
La función de distribución acumulativa (CDF) se obtiene de las sumas parciales de (como una serie de potencia en ), que equivale a sumar series geométricas, y está dada porg z
(He escrito esta expresión en una forma que sugiere una derivación alternativa a través del Principio de inclusión-exclusión).
De esto obtenemos el número esperado de movimientos en el juego (respondiendo la primera pregunta) como
El CDF del máximo de versiones independientes de es (y de esto podemos, en principio, responder cualquier pregunta de probabilidad sobre el máximo que nos gusta, como cuál es su varianza, cuál es su percentil 99 , y así). Con obtenemos una expectativa dem X F(z)m m=4
(El valor es una fracción racional que, en forma reducida, tiene un denominador de 71 dígitos). La desviación estándar es Aquí hay una gráfica de la función de masa de probabilidad del máximo para cuatro jugadores (ya ha sido desplazada por ):6.77108…. 6
Como cabría esperar, está positivamente sesgado. El modo es a rollos. Es raro que la última persona que termine tome más de rollos (es aproximadamente ).18 50 0.3%
fuente
ThePawn tiene la idea correcta de atacar el problema con una relación recurrente. Considere una cadena de Markov con estados correspondientes a la cuenta del número de tiradas de dados distintas que han sucedido. El estado 0 es el estado inicial y el estado 6 es el estado final. Entonces, la probabilidad de transición del estado a sí mismo es . La probabilidad de transición del estado al estado es . Por lo tanto, el tiempo de llegada del estado final es{0,…,6} i i6 i i+1 6−i6
Para el máximo de cuatro ensayos, considere los estados que son cuádruples. Desea encontrar el tiempo de golpe esperado para el estado objetivo . El tiempo de golpe esperado de cualquier estado es el promedio ponderado para cada estado fuente del tiempo de golpe esperado más el tiempo para ir de a , ponderado por , la probabilidad de llegar al estado y moverse a(6,6,6,6) j i Ti i j pipij i j . Puede descubrir los tiempos de golpe y las probabilidades mediante programación dinámica. No es tan difícil ya que hay un orden transversal para completar los tiempos de golpe y las probabilidades. Por ejemplo, para dos dados: primero calcule T y p para (0,0), luego para (1,0), luego (1, 1), (2, 0), luego (2, 1), etc.
En Python:
fuente
Estimación rápida y sucia de Monte Carlo en R de la duración de un juego para 1 jugador:
Resultados: , , por lo que un intervalo de confianza del 95% para la media es .μ^=14.684 σ^=6.24 [14.645,14.722]
Para determinar la duración de un juego de cuatro jugadores, podemos agrupar las muestras en cuatro y tomar la longitud mínima promedio sobre cada grupo (usted preguntó sobre el máximo, pero supongo que se refería al mínimo ya que, según lo leí, el el juego termina cuando alguien logra obtener todos los números):
Resultados: , , por lo que un intervalo de confianza del 95% para la media es .μ^=9.44 σ^=2.26 [9.411,9.468]
fuente
¿Qué tal una relación recursiva con respecto al número restante de lados que debes obtener para ganar?m
T m = 1 + 6 - m
Básicamente, la última relación dice que la cantidad de tiempo para rodar los números diferentes restantes es igual a más:m 1
La aplicación numérica de esta relación da .14.7
fuente
Una explicación simple e intuitiva a la primera pregunta:
Primero necesitas rodar cualquier número. Esto es fácil, siempre tomará exactamente 1 rollo.
Luego debe rodar cualquier número que no sea el primero. La probabilidad de que esto suceda es , por lo que tomará (1.2) rollos en promedio. 656 65
A continuación, debe rodar cualquier número que no sean los dos primeros. La posibilidad de que esto suceda es , por lo que tomará (1.5) rollos en promedio. 646 64
A continuación, debe rodar cualquier número que no sean los primeros tres. La probabilidad de que esto suceda es , por lo que tomará (2) tiradas en promedio. 636 63
Y así sucesivamente hasta completar con éxito nuestro sexto rollo:
Esta respuesta es similar a la respuesta de Neil G, solo, sin la cadena de Markov.
fuente
La función de densidad de probabilidad (o equivalente discreto) para obtener el siguiente número nuevo es:
f = suma (p * (1 - p) ^ (i - 1), i = 1 .. inf)
donde p es la probabilidad por tirada, 1 cuando no se han lanzado números, 5/6 después de 1, 4/6 .. hasta 1/6 para el último número
el valor esperado, mu = suma (i * p * (1 - p) ^ (i - 1), i = 1 .. inf) dejando n = i - 1, y llevando p fuera de la suma,
mu = p * suma ((n + 1) * (1 - p) ^ n, n = 0 .. inf)
mu = p * sum (n (1-p) ^ n, n = 0 .. inf) + p * sum ((1-p) ^ n, n = 0 .. inf) mu = p * (1-p ) / (1-p-1) ^ 2 + p * 1 / (1- (1-p))
mu = p * (1 - p) / p ^ 2 + p / p
mu = (1 - p) / p + p / p
mu = (1 - p + p) / p
mu = 1 / p
La suma de los valores esperados (mus) para ps de 1, 5/6, 4/6, 3/6, 2/6 y 1/6 es 14.7 como se informó anteriormente, pero 1 / p por número requerido es general independientemente del tamaño del dado
Del mismo modo, podemos calcular la desviación estándar analíticamente
sigma ^ 2 = suma ((i - mu) ^ 2 * p * (1 - p) ^ (i - 1), i = 1 .. inf)
Te ahorraré el álgebra aquí, pero sigma ^ 2 = (1-p) / p ^ 2
En el caso de 6, la suma de sigma ^ 2 para cada paso es 38.99 para una desviación estándar de aproximadamente 6.24, nuevamente, como se simula
fuente
La pregunta 1 fue:
¿Cuántas veces tienes que tirar un dado de seis lados hasta que obtengas todos los números al menos una vez?
Obviamente, la respuesta correcta debe ser 'infinita'.
fuente