Refiriéndose a este hilo: ¿Cómo explicaría Markov Chain Monte Carlo (MCMC) a un laico? .
Puedo ver que es una combinación de Cadenas de Markov y Montecarlo: se crea una cadena de Markov con el posterior como distribución limitante invariante y luego los sorteos de Monte Carlo (dependientes) se hacen a partir de la distribución limitante (= nuestro posterior).
Digamos (sé que estoy simplificando aquí) que después de pasos estamos en la distribución limitante (*).Π
La cadena de Markov es una secuencia de variables aleatorias, obtengo una secuencia , donde es una variable aleatoria y es la limitación ' 'variable aleatoria' 'de la que deseamos muestrear. X i Π
El MCMC comienza con un valor inicial, es decir, es una variable aleatoria con toda la masa en ese valor . Si uso letras mayúsculas para variables aleatorias y letras pequeñas para la realización de una variable aleatoria, entonces el MCMC me da una secuencia . Entonces, la longitud de la cadena MCMC es L + n.x 1 x 1 , x 2 , x 3 , ... x L , π 1 , π 2 , π 3 , . . . . π n
[[* Nota: las letras mayúsculas son variables aleatorias (es decir, una gran cantidad de resultados) y la pequeña son resultados, es decir, un valor particular. *]]
Obviamente, solo el pertenece a mi '' posterior '' y para aproximar el '' pozo '' posterior, el valor de debe ser '' suficientemente grande ''. n
Si resumo esto, entonces tengo una cadena MCMC de longitud , solo son relevantes para mi aproximación posterior, debería ser lo suficientemente grande. N = L + n π 1 , π 2 , … , π n n
Si algo de (es decir, realizaciones antes de que se alcance la distribución invariante) en el cálculo de la aproximación de la parte posterior, entonces será "ruidoso".
Sé la longitud de la cadena MCMC , pero sin conocer la , es decir, el paso donde estoy seguro de tomar muestras de la distribución limitante, no puedo estar seguro de que no incluí ruido, ni puedo asegúrese de que , el tamaño de mi muestra de la distribución limitante, en particular, no puedo estar seguro de si es "lo suficientemente grande". L n = N - L
Entonces, por lo que entendí, este valor de es de importancia crítica para la calidad de aproximación de la parte posterior (exclusión de ruido y una gran muestra de él) .
¿Hay alguna forma de encontrar una estimación razonable de cuando solicito MCMC?
(*) Creo que, en general, dependerá del valor inicial x 1 .