¿Ventajas de simulaciones múltiples en el antiguo Monte Carlo?

8

El espíritu de esta pregunta proviene del "Monte Carlo ordinario", también conocido como "el buen Monte Carlo a la antigua".

Supongamos que tengo una variable aleatoria , conX

μ: =mi[X]σ2: =Vunar[X]

Ambos son valores desconocidos, porque la función de distribución de probabilidad de es desconocida (o los cálculos son intratables).X

De cualquier manera, supongamos que de alguna manera podemos simular dibuja (estos son independientes e idénticamente distribuidas) de la distribución de . Definamos los parámetros de muestranorteX1,X2,...,XnorteX

μ^norte: =1norteyo=1norteXyoσ^norte2: =1norteyo=1norte(Xyo-μ^norte)2

Según el Teorema del límite central, a medida que norte vuelve muy grande, la media muestral μ^norte obedecerá estrechamente a una distribución normal

μ^norte(μ,σ2norte)

Antes de que podamos calcular los intervalos de confianza, el autor afirma que, dado que no conocemos σ2 , haremos la estimación de que σ2σ^2 , o más precisamente para una estimación imparcial σ2nortenorte-1σ^2 , y podemos proceder desde allí utilizando técnicas estándar.

Ahora, aunque el autor menciona la importancia de norte suficientemente grande ( número de dibujos por simulación), no se menciona el número de simulaciones y su efecto en nuestra confianza.

¿Hay alguna ventaja de ejecutar simulaciones (realizar sorteos cada vez) para obtener varias medias de muestra , y luego usar los medios de los medios para mejorar nuestras estimaciones y confianza con respecto a los desconocidos de ?knorteμ^norte,1,μ^norte,2,...μ^norte,kμ,σX

¿O es suficiente extraer muestras de en una sola simulación, siempre que sea ​​lo suficientemente grande?norteXnorte

jII
fuente

Respuestas:

5

Siempre y cuando se eviten los problemas relacionados con la generación de números pseudoaleatorios (ver nota al final), los dos enfoques ( simulaciones con sorteos versus simulación simple con suficientemente grande ) son equivalentes con respecto a la estimación de la media . Con respecto a la memoria, observe que, en el caso de las simulaciones , debe almacenar los medios de muestra antes de realizar el media final, mientras que esto no sucede en el escenario de simulación única. Con las computadoras modernas, realizar una sola simulación con suficientemente grande no debería ser más difícil de lo que se describió anteriormente y, de hecho, debería ahorrar tiempo.knortenortekμ^norte,1,...,μ^norte,knorte

La razón matemática más allá de la equivalencia es la linealidad. Para ser más precisos, en el escenario de simulaciones , calcula la media muestral "final" siguiente manera donde denota el sorteo numerado en la simulación . Este orden es arbitrario si no sucede nada extraño, por lo tanto, puede volver a etiquetar cada con un nuevo índice, digamos , obteniendo kμ^

μ^=1kh=1kμ^norte,h=1kh=1k1norteyo=1norteXyo(h)=1nortekh=1kyo=1norteXyo(h)
Xyo(h)yohXyo(h)metro=1,...,nortek
μ^=1nortekmetro=1nortekXmetro
Pero esto es equivalente a realizar una sola simulación con draws (obviamente, los sorteos deben ser iid, como ya se señaló).nortek

Nota: Los posibles problemas con los PRNG se describen en la página de Wikipedia .

PseudoRandom
fuente
1
¡Gran respuesta! Me había dado cuenta un poco después de publicar. Y dado que la varianza de nuestro muestreo es inversamente proporcional a (el número de muestras), nuestra confianza también mejora (al menos, en teoría). norte
jII