Métodos MCMC: ¿quemar muestras?

12

En los métodos MCMC , sigo leyendo sobre el burn-intiempo o el número de muestras "burn". ¿Qué es esto exactamente y por qué es necesario?

Actualizar:

Una vez que MCMC se estabiliza, ¿permanece estable? ¿Cómo se relaciona la noción de burn-intiempo con la de tiempo de mezcla?

Amelio Vazquez-Reina
fuente
1
La frase ' quemar ' no implica 'quemar' las muestras, sino dejar que el sistema se asiente satisfactoriamente de su "nuevo" estado a uno donde sea adecuado para su uso. (Las muestras se descartan durante el asentamiento, sí, pero la frase no implica 'quemarse' en ese sentido. Está más cerca de 'calentar el motor' antes de llevarlo a la carretera.) Vea esta respuesta para una discusión sobre para que sirve
Glen_b -Reinstalar Monica
(Específicamente, el primer párrafo de esa respuesta)
Glen_b -Reinstale Monica
1
@Glen_b, supongo que lo sabía, pero me gusta más la imagen mental de las dudosas muestras que suben en humo ...
Matt Krause

Respuestas:

17

Burn-in está destinado a darle a la cadena de Markov tiempo para alcanzar su distribución de equilibrio, particularmente si ha comenzado desde un punto de partida pésimo. Para "quemar" una cadena, simplemente descarta las primeras muestras antes de comenzar a acumular puntos.n

La idea es que un punto de partida "malo" puede sobremuestrear regiones que en realidad tienen una probabilidad muy baja bajo la distribución de equilibrio antes de establecerse en la distribución de equilibrio. Si arroja esos puntos, entonces los puntos que deberían ser poco probables serán adecuadamente raros.

Esta página ofrece un buen ejemplo, pero también señala que el quemado es más un truco / forma de arte que una técnica basada en principios. En teoría, podría probar durante mucho tiempo o encontrar una forma de elegir un punto de partida decente.

Editar: el tiempo de mezcla se refiere al tiempo que tarda la cadena en acercarse a su estado estacionario, pero a menudo es difícil de calcular directamente. Si conociera el tiempo de mezcla, simplemente descartaría tantas muestras, pero en muchos casos, no. Por lo tanto, eliges un tiempo de encendido que, con suerte, es lo suficientemente grande.

En cuanto a la estabilidad, depende. Si su cadena ha convergido, entonces ... está convergente. Sin embargo, también hay situaciones en las que la cadena parece haber convergido, pero en realidad solo está "colgando" en una parte del espacio de estado. Por ejemplo, imagine que hay varios modos, pero cada modo está mal conectado a los demás. Es posible que la muestra demore mucho tiempo en atravesar esa brecha y se verá como si la cadena convergiera justo hasta que saltara.

Hay diagnósticos para la convergencia, pero muchos de ellos tienen dificultades para distinguir la verdadera convergencia y la pseudoconvergencia. El capítulo de Charles Geyer (# 1) en el Manual de Markov Chain Monte Carlo es bastante pesimista acerca de todo, excepto de manejar la cadena todo el tiempo que pueda.

Matt Krause
fuente
Gracias. He agregado una pequeña actualización al OP con la esperanza de aclarar aún más el concepto.
Amelio Vazquez-Reina
Agregué un poco más; Espero que ayude.
Matt Krause
6

El algoritmo Metropolis-Hastings toma muestras al azar de la distribución posterior. Típicamente, las muestras iniciales no son completamente válidas porque la Cadena de Markov no se ha estabilizado a la distribución estacionaria. La grabación en muestras le permite descartar estas muestras iniciales que aún no están en el estacionario.

Eric Peterson
fuente
1
Gracias. Una vez que la cadena de Markov se estabiliza, ¿se mantiene estable? ¿Cómo se relaciona esto con la noción de tiempo de mezcla? ¿Es lo mismo?
Amelio Vazquez-Reina