Estoy tirando un dado justo. Cada vez que obtengo un 1, 2 o 3, escribo un '1'; cada vez que obtengo un 4 escribo un '2'; cada vez que obtengo un 5 o un 6, escribo un '3.'
Sea el número total de lanzamientos que necesito para que el producto de todos los números que escribí sea . Quiero calcular (o aproximar) , y se puede dar una aproximación en función de la distribución Normal.
Primero, sé que porque . Ahora, vamos , , y es el número de veces que anotó un 1, 2, y 3, respectivamente. Entonces:
Lo que quiero calcular es:
¿Cómo calculo esto?
--EDITAR:
Por lo tanto, se sugirió que podría reemplazar la condición con:
donde , , y .
¡Esto parece más solucionable! Lamentablemente, todavía no tengo idea de cómo resolverlo.
Respuestas:
La presente pregunta es un caso específico en el que se trata de una cantidad que es una función lineal de una variable aleatoria multinomial. Es posible resolver su problema exactamente, enumerando las combinaciones multinomiales que satisfacen la desigualdad requerida y sumando la distribución en ese rango. En el caso donde es grande, esto puede volverse computacionalmente inviable. En este caso, es posible obtener una distribución aproximada utilizando la aproximación normal al multinomio. A continuación se muestra una versión generalizada de esta aproximación, y luego se aplica a su ejemplo específico.N
Problema general de aproximación: supongamos que tenemos una secuencia de variables aleatorias intercambiables con rango . Para cualquier podemos formar el vector de recuento , que cuenta el número de ocurrencias de cada resultado en los primeros valores de la secuencia. Como la secuencia subyacente es intercambiable, el vector de recuento se distribuye como:1,2,...,m n∈N X≡X(n)≡(X1,X2,...,Xm) n
Ahora, supongamos que tenemos algún vector de pesos no negativos y usamos estos pesos para definir la función lineal:w=(w1,w2,...,wm)
Como los pesos no son negativos, esta nueva cantidad no disminuye en . Luego definimos el número , que es el menor número de observaciones requerido para obtener un valor mínimo especificado para nuestra función lineal. Queremos aproximar la distribución de en el caso de que este valor sea (estocásticamente) grande.n N(a)≡min{n∈N|A(n)⩾a} N(a)
Resolviendo el problema general de aproximación: Primero, notamos que dado que no es decreciente en (lo cual se cumple porque hemos asumido que todos los pesos no son negativos), tenemos:A(n) n
Por lo tanto, la distribución de está directamente relacionada con la distribución de . Suponiendo que la primera cantidad es grande, podemos aproximar la distribución de la segunda reemplazando el vector aleatorio discreto con una aproximación continua de la distribución normal multivariada. Esto lleva a una aproximación normal para la cantidad lineal , y podemos calcular los momentos de esta cantidad directamente. Para hacer esto, usamos el hecho de que , y para . Con algo de álgebra básica, esto nos da:N A X A(n) E(Xi)=nθi V(Xi)=nθi(1−θi) C(Xi,Xj)=−nθiθj i≠j
Tomar la aproximación normal al multinomio ahora nos da la distribución aproximada . Aplicando esta aproximación se obtienen:A(n) ~ N(nμ,nμ(1−μ))
(El símbolo es la notación estándar para la función de distribución normal estándar). Es posible aplicar esta aproximación para encontrar probabilidades relativas a la cantidad para un valor específico de . Esta es una aproximación básica que no ha intentado incorporar la corrección de continuidad en los valores de los valores de recuento multinomiales subyacentes. Se obtiene tomando una aproximación normal usando los mismos dos primeros momentos centrales como la función lineal exacta.Φ N(a) a
Aplicación a su problema: en su problema tiene probabilidades , weights , y el valor de corte a . Por lo tanto, tiene (redondeando a seis puntos decimales) . Aplicando la aproximación anterior que tenemos (redondeando a seis puntos decimales):θ=(12,16,13) w=(0,ln2,ln3) a=ln100000 μ=16ln2+13ln3=0.481729
Mediante la aplicación de la distribución multinomial exacta, sumando todas las combinaciones que satisfacen el requisito , se puede demostrar que el resultado exacto es . Por lo tanto, podemos ver que la aproximación es bastante cercana a la respuesta exacta en el presente caso.P(A(24)<a) P(N(a)⩾25)=0.483500
Con suerte, esta respuesta le dará una respuesta a su pregunta específica, al tiempo que la ubica dentro de un marco más general de resultados probabilísticos que se aplican a funciones lineales de vectores aleatorios multinomiales. El método actual debería permitirle obtener soluciones aproximadas a los problemas del tipo general que enfrenta, permitiendo la variación en los números específicos en su ejemplo.
fuente
Hagamos una aproximación normal.
Primero, reformulemos completamente su problema en los registros. Empiezas en 0 en el tiempo t = 0. Luego, en cada paso de tiempo, agrega:
0 con probabilidad 1/2
Detiene este proceso cuando su suma excede momento en el que observa cuántos lanzamientos ha realizado. El número de lanzamientos que te llevó alcanzar ese punto es ^log(105) N
Mi calculadora me dice que la media de sus incrementos es: y que la varianza es . Como referencia, el punto final es de así que lo alcanzaremos en aproximadamente 24 pasos≈0.48 ≈0.25 ≈11.51
Condicional al hecho de que hemos realizado 25 pasos, la distribución de la suma es aproximadamente un gaussiano centrado en 12.0 y con una varianza de 6.25. Esto nos da una aproximación gaussiana aproximada dep(N≥25)≈0.5
Tendría que mirar los acumulativos de la suma en N = 25 para saber si la aproximación gaussiana está bien o no. Dado que los incrementos no son simétricos, el aprox. Podría no ser el mejor
fuente