Después del quemado, ¿podemos usar directamente las iteraciones de MCMC para la estimación de densidad, como trazar un histograma o una estimación de densidad del núcleo? Mi preocupación es que las iteraciones de MCMC no son necesariamente independientes, aunque a lo sumo están distribuidas de manera idéntica.
¿Qué sucede si seguimos aplicando adelgazamiento a las iteraciones de MCMC? Mi preocupación es que las iteraciones de MCMC no están correlacionadas, y aún no son independientes.
El fundamento que aprendí para usar una función de distribución empírica como una estimación de la función de distribución verdadera se basa en el teorema de Glivenko-Cantelli , donde la función de distribución empírica se calcula en función de una muestra iid. Parecía ver algunos motivos (¿resultados asintóticos?) Para usar histogramas, o estimaciones de densidad del núcleo como estimaciones de densidad, pero no puedo recordarlas.
Currículum
Puede usar directamente las iteraciones de MCMC para cualquier cosa porque el valor promedio de su observable se acercará asintóticamente al valor verdadero (porque está después del quemado).
Sin embargo, tenga en cuenta que la varianza de este promedio está influenciada por las correlaciones entre las muestras. Esto significa que si las muestras están correlacionadas, como es común en MCMC, almacenar cada medición no traerá ninguna ventaja real.
En teoría, debe medir después de N pasos, donde N es del orden del tiempo de autocorrelación del observable que está midiendo.
Explicación detallada
Definamos alguna notación para responder formalmente a su pregunta. Deje que sea el estado de su simulación MCMC en el tiempo , asumido mucho más alto que el tiempo de quemado. Deje ser el observable que desea medir.xt t f
Por ejemplo, , y : "1 if , 0 else". se extrae de una distribución , que se hace con MCMC.xt∈R f=fa(x) x∈[a,a+Δ] xt P(x)
En cualquier muestreo, siempre necesitará calcular un promedio de una observable , lo que hace usando un estimador:f
Vemos que el valor promedio de este estimador (con respecto a ) es⟨F⟩ P(x)
que es lo que quieres obtener
La principal preocupación es que cuando calcula la varianza de este estimador, , obtendrá los términos de la forma⟨F2⟩−⟨F⟩2
que no se cancelan si son muestras correlacionadas. Además, como puede escribir , puede escribir la suma doble anterior como suma de la función de autocorrelación dext j=i+Δ f R(Δ)
Entonces, para recapitular:
Si computacionalmente no cuesta nada almacenar cada medida, puede hacerlo, pero tenga en cuenta que la varianza no se puede calcular utilizando la fórmula habitual.
fuente