Aquí está la pregunta:
Lanza un dado de 6 lados de forma iterativa hasta que la suma de los dados sea mayor o igual que M. ¿Cuál es la media y la desviación estándar de la suma menos M cuando M = 300?
¿Debo escribir un código para responder este tipo de preguntas?
Por favor, dame algunas pistas sobre eso. ¡Gracias!
[self-study]
etiqueta y lea su wiki . Luego díganos qué ha entendido hasta ahora, qué ha intentado y dónde está atrapado. Le proporcionaremos sugerencias para ayudarlo a despegarse.Respuestas:
Ciertamente puedes usar código, pero no simularía.
Voy a ignorar la parte "menos M" (puedes hacerlo fácilmente al final).
Puede calcular las probabilidades de manera recursiva muy fácilmente, pero la respuesta real (con un grado muy alto de precisión) puede calcularse a partir de un razonamiento simple.
Deje que los rollos sean . Deje .S t = ∑ t i = 1 X iX1,X2,... St=∑ti=1Xi
Let sea el índice más pequeño donde .S τ ≥ Mτ Sτ≥M
similar
Las ecuaciones similares a la primera de arriba podrían ejecutarse (al menos en principio) hasta que alcance cualquiera de las condiciones iniciales para obtener una relación algebraica entre las condiciones iniciales y las probabilidades que queremos (lo que sería tedioso y no especialmente esclarecedor) , o puede construir las ecuaciones hacia adelante correspondientes y ejecutarlas hacia adelante desde las condiciones iniciales, lo cual es fácil de hacer numéricamente (y así es como verifiqué mi respuesta). Sin embargo, podemos evitar todo eso.
Las probabilidades de los puntos son promedios ponderados de probabilidades anteriores; estos suavizarán (geométricamente rápidamente) cualquier variación en la probabilidad de la distribución inicial (todas las probabilidades en el punto cero en el caso de nuestro problema). los
Para una aproximación (muy precisa) podemos decir que a debería ser casi igualmente probable en el tiempo (muy cerca de él), y así, desde lo anterior, podemos anotar que las probabilidades estará muy cerca de estar en proporciones simples, y dado que deben normalizarse, podemos simplemente escribir las probabilidades.M−6 M−1 τ−1
Es decir, podemos ver que si las probabilidades de comenzar de a fueran exactamente iguales, hay 6 formas igualmente probables de llegar a , 5 de llegar a , y así sucesivamente hasta 1 forma de llegar a .M−6 M−1 M M+1 M+5
Es decir, las probabilidades están en la proporción 6: 5: 4: 3: 2: 1, y suman 1, por lo que son triviales para anotar.
Calcularlo exactamente (hasta los errores de redondeo numérico acumulados) ejecutando las recursiones de probabilidad hacia adelante desde cero (lo hice en R) da diferencias en el orden de≈
.Machine$double.eps
( en mi máquina) de la aproximación anterior (es decir, El razonamiento simple a lo largo de las líneas anteriores proporciona respuestas exactas con eficacia , ya que están tan cerca de las respuestas calculadas a partir de la recursión como esperaríamos que sean las respuestas exactas).2.22e-16
Aquí está mi código para eso (la mayor parte es solo inicializar las variables, el trabajo es todo en una línea). El código comienza después del primer lanzamiento (para salvarme de poner en una celda 0, que es una pequeña molestia para tratar en R); en cada paso toma la celda más baja que podría estar ocupada y avanza por una tirada de dados (distribuyendo la probabilidad de esa celda en las siguientes 6 celdas):
(podríamos usar
rollapply
(fromzoo
) para hacer esto de manera más eficiente, o una serie de otras funciones similares, pero será más fácil de traducir si lo mantengo explícito)Tenga en cuenta que
d6
es una función de probabilidad discreta de 1 a 6, por lo que el código dentro del bucle en la última línea está construyendo promedios ponderados de valores anteriores. Es esta relación la que suaviza las probabilidades (hasta los últimos valores que nos interesan).Así que aquí están los primeros 50 valores impares (los primeros 25 valores marcados con círculos). En cada , el valor en el eje y representa la probabilidad de que se acumule en la celda más posterior antes de que avancemos hacia las siguientes 6 celdas.t
Como puede ver, se suaviza (a , el recíproco de la media del número de pasos que da cada tirada) bastante rápido y se mantiene constante.1/μ
Y una vez que llegamos a , esas probabilidades disminuyen (porque no estamos poniendo la probabilidad de valores en y más adelante a su vez)M M
Por lo tanto, la idea de que los valores en a deberían ser igualmente probables porque las fluctuaciones de las condiciones iniciales se suavizarán se ve claramente como el caso.M−1 M−6
Dado que el razonamiento no depende de nada más que de que es lo suficientemente grande como para que las condiciones iniciales desaparezcan de manera que a sean casi igualmente probables en el tiempo , la distribución será esencialmente la misma para cualquier grande , como Henry sugirió en los comentarios.M M−1 M−6 τ−1 M
En retrospectiva, la pista de Henry (que también está en su pregunta) para trabajar con la suma menos M ahorraría un poco de esfuerzo, pero el argumento seguiría líneas muy similares. Puede proceder dejando y escribiendo ecuaciones similares que relacionen con los valores anteriores, y así sucesivamente.Rt=St−M R0
A partir de la distribución de probabilidad, la media y la varianza de las probabilidades son simples.
Editar: supongo que debería dar la media asintótica y la desviación estándar de la posición final menos :M
El exceso medio asintótico es y la desviación estándar es . En esto es exacto en un grado mucho mayor de lo que probablemente le interese.53 25√3 M=300
fuente
Sea el conjunto de secuencias de sumas parciales de las tiradas de dados (con cada secuencia comenzando en ). Para cualquier número entero , sea el evento de que aparece en una secuencia; es decir,Ω 0 n En n
Definir para ser el primer valor de que es igual o superior . La pregunta pide propiedades de . Podemos obtener la distribución exacta de , y de ahí todo se deduce.XM(ω) ω M XM−M XM
Primero, observe que . Al dividir el evento acuerdo con el valor inmediatamente anterior en , y dejando que sea la probabilidad de observar la cara en una tirada del dado ( ), se deduce queX M - M = k ω p ( i ) = 1 / 6 i i = 1 , 2 , 3 , 4 , 5 , 6XM(ω)−M∈{0,1,2,3,4,5} XM−M=k ω p(i)=1/6 i i=1,2,3,4,5,6
En este punto, podríamos argumentar heurísticamente que, con una muy buena aproximación para todos menos el ,Esto se debe a que el valor esperado de una tirada es y su recíproco debe ser la frecuencia limitante y estable a largo plazo de cualquier valor particular en .M
Una forma rigurosa de demostrar esto considera cómo podría ocurrir . O ocurre y la tirada posterior fue un ; o se produce y la tirada posterior fue un ; o ... o ocurre y la tirada posterior fue un . Esta es una partición exhaustiva de las posibilidades, de dondeEi Ei−1 1 Ei−2 2 Ei−6 6
Los valores iniciales de esta secuencia son
Esta gráfica de contra muestra la rapidez con que las posibilidades se asientan a un constante , que se muestra mediante la línea de puntos horizontal.Pr(Ei) i 2/7
Existe una teoría estándar de tales secuencias recursivas. Puede desarrollarse mediante funciones generadoras, cadenas de Markov o incluso manipulación algebraica. El resultado general es que existe una fórmula de forma cerrada para .Pr(Ei) Será una combinación lineal de una constante y los poderes de las raíces del polinomioith
La mayor magnitud de estas raíces es aproximadamente . En una representación de coma flotante de doble precisión, es esencialmente cero. Por lo tanto, para , podemos ignorar completamente todos menos la constante. Esta constante es .exp(−0.314368) exp(−36.05) i≫−36.05/−0.314368=115 2/7
En consecuencia, para , a todos los efectos prácticos, podemos tomar , de dondeM=300≫115 EM+k−j=2/7
Calcular la media y la varianza de esta distribución es sencillo y sencillo.
Aquí hay unaM+5=305 X300−300 χ2 0.1367
R
simulación para confirmar estas conclusiones. Genera casi 100,000 secuencias a través de , tabula los valores de y aplica una para evaluar si los resultados son consistentes con lo anterior. El valor p (en este caso) de es lo suficientemente grande como para indicar que son consistentes.fuente