Tira un dado de 6 caras hasta que el total . ¿Cantidad media por la cual se excede ?

11

Aquí está la pregunta:

Lanza un dado de 6 lados de forma iterativa hasta que la suma de los dados sea mayor o igual que M. ¿Cuál es la media y la desviación estándar de la suma menos M cuando M = 300?

¿Debo escribir un código para responder este tipo de preguntas?

Por favor, dame algunas pistas sobre eso. ¡Gracias!

eli
fuente
1
Agregue la [self-study]etiqueta y lea su wiki . Luego díganos qué ha entendido hasta ahora, qué ha intentado y dónde está atrapado. Le proporcionaremos sugerencias para ayudarlo a despegarse.
gung - Restablece a Monica
2
Sospecho que podría leerse como " muy grande ", ya que creo que o daría casi exactamente el mismo resultado. Lo que quiero hacer es encontrar la distribución de la suma menos . M=300MM=301M=999M
Henry

Respuestas:

13

Ciertamente puedes usar código, pero no simularía.

Voy a ignorar la parte "menos M" (puedes hacerlo fácilmente al final).

Puede calcular las probabilidades de manera recursiva muy fácilmente, pero la respuesta real (con un grado muy alto de precisión) puede calcularse a partir de un razonamiento simple.

Deje que los rollos sean . Deje .S t = t i = 1 X iX1,X2,...St=i=1tXi

Let sea el índice más pequeño donde .S τMτSτM

P(Sτ=M)=P(got to M6 at τ1 and rolled a 6)+P(got to M5 at τ1 and rolled a 5)++P(got to M1 at τ1 and rolled a 1)=16j=16P(Sτ1=Mj)

ingrese la descripción de la imagen aquí

similar

P(Sτ=M+1)=16j=15P(Sτ1=Mj)

P(Sτ=M+2)=16j=14P(Sτ1=Mj)

P(Sτ=M+3)=16j=13P(Sτ1=Mj)

P(Sτ=M+4)=16j=12P(Sτ1=Mj)

P(Sτ=M+5)=16P(Sτ1=M1)

Las ecuaciones similares a la primera de arriba podrían ejecutarse (al menos en principio) hasta que alcance cualquiera de las condiciones iniciales para obtener una relación algebraica entre las condiciones iniciales y las probabilidades que queremos (lo que sería tedioso y no especialmente esclarecedor) , o puede construir las ecuaciones hacia adelante correspondientes y ejecutarlas hacia adelante desde las condiciones iniciales, lo cual es fácil de hacer numéricamente (y así es como verifiqué mi respuesta). Sin embargo, podemos evitar todo eso.

Las probabilidades de los puntos son promedios ponderados de probabilidades anteriores; estos suavizarán (geométricamente rápidamente) cualquier variación en la probabilidad de la distribución inicial (todas las probabilidades en el punto cero en el caso de nuestro problema). los

Para una aproximación (muy precisa) podemos decir que a debería ser casi igualmente probable en el tiempo (muy cerca de él), y así, desde lo anterior, podemos anotar que las probabilidades estará muy cerca de estar en proporciones simples, y dado que deben normalizarse, podemos simplemente escribir las probabilidades.M6M1τ1

Es decir, podemos ver que si las probabilidades de comenzar de a fueran exactamente iguales, hay 6 formas igualmente probables de llegar a , 5 de llegar a , y así sucesivamente hasta 1 forma de llegar a .M6M1MM+1M+5

Es decir, las probabilidades están en la proporción 6: 5: 4: 3: 2: 1, y suman 1, por lo que son triviales para anotar.

Calcularlo exactamente (hasta los errores de redondeo numérico acumulados) ejecutando las recursiones de probabilidad hacia adelante desde cero (lo hice en R) da diferencias en el orden de .Machine$double.eps( en mi máquina) de la aproximación anterior (es decir, El razonamiento simple a lo largo de las líneas anteriores proporciona respuestas exactas con eficacia , ya que están tan cerca de las respuestas calculadas a partir de la recursión como esperaríamos que sean las respuestas exactas).2.22e-16

Aquí está mi código para eso (la mayor parte es solo inicializar las variables, el trabajo es todo en una línea). El código comienza después del primer lanzamiento (para salvarme de poner en una celda 0, que es una pequeña molestia para tratar en R); en cada paso toma la celda más baja que podría estar ocupada y avanza por una tirada de dados (distribuyendo la probabilidad de esa celda en las siguientes 6 celdas):

 p = array(data = 0, dim = 305)
 d6 = rep(1/6,6)
 i6 = 1:6
 p[i6] = d6
 for (i in 1:299) p[i+i6] = p[i+i6] + p[i]*d6

(podríamos usar rollapply(from zoo) para hacer esto de manera más eficiente, o una serie de otras funciones similares, pero será más fácil de traducir si lo mantengo explícito)

Tenga en cuenta que d6es una función de probabilidad discreta de 1 a 6, por lo que el código dentro del bucle en la última línea está construyendo promedios ponderados de valores anteriores. Es esta relación la que suaviza las probabilidades (hasta los últimos valores que nos interesan).

Así que aquí están los primeros 50 valores impares (los primeros 25 valores marcados con círculos). En cada , el valor en el eje y representa la probabilidad de que se acumule en la celda más posterior antes de que avancemos hacia las siguientes 6 celdas.t

ingrese la descripción de la imagen aquí

Como puede ver, se suaviza (a , el recíproco de la media del número de pasos que da cada tirada) bastante rápido y se mantiene constante.1/μ

Y una vez que llegamos a , esas probabilidades disminuyen (porque no estamos poniendo la probabilidad de valores en y más adelante a su vez)MM

ingrese la descripción de la imagen aquí

Por lo tanto, la idea de que los valores en a deberían ser igualmente probables porque las fluctuaciones de las condiciones iniciales se suavizarán se ve claramente como el caso.M1M6

Dado que el razonamiento no depende de nada más que de que es lo suficientemente grande como para que las condiciones iniciales desaparezcan de manera que a sean casi igualmente probables en el tiempo , la distribución será esencialmente la misma para cualquier grande , como Henry sugirió en los comentarios.MM1M6τ1M

En retrospectiva, la pista de Henry (que también está en su pregunta) para trabajar con la suma menos M ahorraría un poco de esfuerzo, pero el argumento seguiría líneas muy similares. Puede proceder dejando y escribiendo ecuaciones similares que relacionen con los valores anteriores, y así sucesivamente.Rt=StMR0

A partir de la distribución de probabilidad, la media y la varianza de las probabilidades son simples.

Editar: supongo que debería dar la media asintótica y la desviación estándar de la posición final menos :M

El exceso medio asintótico es y la desviación estándar es . En esto es exacto en un grado mucho mayor de lo que probablemente le interese.53253M=300

Glen_b -Reinstate a Monica
fuente
+1 No entendí completamente esta respuesta hasta que desarrollé la mía, que ahora parece ser superflua. Tal vez algunos lectores verán valor en los resultados de la ilustración y la simulación, así que mantendré mi respuesta abierta.
whuber
1
@whuber Mi respuesta es mucho menos concreta de lo que me hubiera gustado porque estaba operando bajo la suposición de que esto era tarea (así que evité hacer demasiada derivación o dar ningún código; era más un bosquejo). Me resultó difícil escribir una respuesta clara sobre este problema (es uno donde la concreción ayuda más de lo habitual). Dado que ha dado una respuesta que contiene los números y el código reales (que respuesta definitivamente creo que debería permanecer), siento que puedo hacer algunas cosas que espero que hagan que mi respuesta sea más fácil de entender (sea más explícito, proporcione mi propio código) .
Glen_b -Reinstate a Monica el
Escribí una explicación mucho mejor de este tipo de problema en algún lugar hace un par de años. Si puedo recordar / averiguar cómo fue, intentaré incluir algo aquí.
Glen_b -Reinstalar a Mónica el
@Glen_b entendió un poco las ecuaciones. Soy un novato ¿Cómo empezar a pensar así? ¿Hay algún libro que pueda recomendar para este propósito? Su respuesta sería de gran ayuda.
Sospechoso habitual
Sospechoso habitual: escribí las ecuaciones imaginando un tablero de juego como una pista larga y diciendo "¿de qué maneras podría llegar a este espacio de una manera que se ajuste a las condiciones del problema y con qué posibilidades?"; Lo hice para un espacio etiquetado como "M", luego para el espacio que sigue, y así sucesivamente. Escribí el cálculo similar en el futuro para el código imaginando estar cerca de la celda de inicio y diciendo "si estuviera aquí, ¿sería el próximo, con qué posibilidades?". Las ecuaciones son todas las respuestas a esas preguntas.
Glen_b -Reinstate a Monica el
8

Sea el conjunto de secuencias de sumas parciales de las tiradas de dados (con cada secuencia comenzando en ). Para cualquier número entero , sea el evento de que aparece en una secuencia; es decir,Ω0nEnn

En={ωΩ|nω}.

Definir para ser el primer valor de que es igual o superior . La pregunta pide propiedades de . Podemos obtener la distribución exacta de , y de ahí todo se deduce.XM(ω)ωMXMMXM

Primero, observe que . Al dividir el evento acuerdo con el valor inmediatamente anterior en , y dejando que sea ​​la probabilidad de observar la cara en una tirada del dado ( ), se deduce queX M - M = k ω p ( i ) = 1 / 6 i i = 1 , 2 , 3 , 4 , 5 , 6XM(ω)M{0,1,2,3,4,5}XMM=kωp(i)=1/6ii=1,2,3,4,5,6

Pr(XMM=k)=j=k6Pr(EM+kj)p(j)=16j=k6Pr(EM+kj).

En este punto, podríamos argumentar heurísticamente que, con una muy buena aproximación para todos menos el ,Esto se debe a que el valor esperado de una tirada es y su recíproco debe ser la frecuencia limitante y estable a largo plazo de cualquier valor particular en .M

Pr(Ei)2/7.
(1+2+3+4+5+6)/6=7/2ω

Una forma rigurosa de demostrar esto considera cómo podría ocurrir . O ocurre y la tirada posterior fue un ; o se produce y la tirada posterior fue un ; o ... o ocurre y la tirada posterior fue un . Esta es una partición exhaustiva de las posibilidades, de dondeEiEi11Ei22Ei66

Pr(Ei)=j=16Pr(Eij)p(j)=16j=16Pr(Eij).

Los valores iniciales de esta secuencia son

Pr(E0)=1;Pr(Ei)=0,i=1,2,3,.

Figura: diagrama de E_i

Esta gráfica de contra muestra la rapidez con que las posibilidades se asientan a un constante , que se muestra mediante la línea de puntos horizontal.Pr(Ei)i2/7

Existe una teoría estándar de tales secuencias recursivas. Puede desarrollarse mediante funciones generadoras, cadenas de Markov o incluso manipulación algebraica. El resultado general es que existe una fórmula de forma cerrada para . Pr(Ei) Será una combinación lineal de una constante y los poderes de las raíces del polinomioith

x6p(1)x5p(2)x4p(3)x3p(6)=x6(x5+x4+x3+x2+x+1)/6.

La mayor magnitud de estas raíces es aproximadamente . En una representación de coma flotante de doble precisión, es esencialmente cero. Por lo tanto, para , podemos ignorar completamente todos menos la constante. Esta constante es .exp(0.314368)exp(36.05)i36.05/0.314368=1152/7

En consecuencia, para , a todos los efectos prácticos, podemos tomar , de dondeM=300115EM+kj=2/7

Pr(XMM=(0,1,2,3,4,5))=(27)(16)(6,5,4,3,2,1).

Calcular la media y la varianza de esta distribución es sencillo y sencillo.


Aquí hay una Rsimulación para confirmar estas conclusiones. Genera casi 100,000 secuencias a través de , tabula los valores de y aplica una para evaluar si los resultados son consistentes con lo anterior. El valor p (en este caso) de es lo suficientemente grande como para indicar que son consistentes.M+5=305X300300χ20.1367

M <- 300
n.iter <- 1e5
set.seed(17)
n <- ceiling((2/7) * (M + 3*sqrt(M)))
dice <- matrix(ceiling(6*runif(n*n.iter)), n, n.iter)
omega <- apply(dice, 2, cumsum)
omega <- omega[, apply(omega, 2, max) >= M+5]
omega[omega < M] <- NA
x <- apply(omega, 2, min, na.rm=TRUE)
count <- tabulate(x)[0:5+M]
(cbind(count, expected=round((2/7) * (6:1)/6 * length(x), 1)))
chisq.test(count, p=(2/7) * (6:1)/6)
whuber
fuente