¿Puedo cambiar la distribución de la propuesta en MH MCMC de paseo aleatorio sin afectar a Markovianity?

14

Paseo aleatorio Metropolis-Hasitings con propuesta simétrica

q(XEl |y)=sol(El |y-XEl |) tiene la propiedad de que la probabilidad de aceptación

PAG(unCCmipagt y)=min{1,F(y)/ /F(X)}

no depende de la propuesta .sol()

¿ Eso significa que puedo cambiar la en función del rendimiento anterior de la cadena, sin afectar la markovianidad de la cadena?sol()

De particular interés para mí es el ajuste de la escala de la propuesta Normal en función de la tasa de aceptación.

También agradecería mucho si alguien puede señalar los algoritmos de adaptación utilizados en la práctica para este tipo de problema.

Muchas gracias.

[edit: Comenzando con las referencias dadas por robertsy y wok, encontré las siguientes referencias en algoritmos adaptativos MH:

Andrieu, Christophe y Éric Moulines. 2006.
Sobre las propiedades de ergodicidad de algunos algoritmos adaptativos de MCMC. Los Anales de Probabilidad Aplicada 16, no. 3: 1462-1505. http://www.jstor.org/stable/25442804 .

Andrieu, Christophe y Johannes Thoms.
2008. Un tutorial sobre MCMC adaptativo. Estadística e Informática 18, no. 4 (12): 343-373. doi: 10.1007 / s11222-008-9110-y. http://www.springerlink.com/content/979087678366r78v/ .

Atchadé, Y., G. Fort, E. Moulines y P. Priouret. 2009.
Adaptive Markov Chain Monte Carlo: Teoría y Métodos. Preimpresión

Atchadé, Yves. 2010.
Teoremas de límite para algunos algoritmos MCMC adaptativos con núcleos subgeométricos. Bernoulli 16, no. 1 (febrero): 116-154. doi: 10.3150 / 09-BEJ199. http://projecteuclid.org/DPubS?verb=Display&version=1.0&service=UI&handle=euclid.bj/1265984706&page=record .

Cappé, O., S. J Godsill y E. Moulines. 2007.
Una visión general de los métodos existentes y los avances recientes en secuencial Monte Carlo. Actas del IEEE 95, no. 5: 899-924.

Giordani, Paolo. 2010.
Adaptive Independent Metropolis – Hastings by Fast Estimation of Mixtures of Normals. Revista de estadística computacional y gráfica 19, no. 2 (6): 243-259. doi: 10.1198 / jcgs.2009.07174. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.07174 .

Latuszynski, Krzysztof, Gareth O Roberts y Jeffrey S Rosenthal. 2011.
Muestras adaptativas de Gibbs y métodos MCMC relacionados. 1101.5838 (30 de enero). http://arxiv.org/abs/1101.5838 .

Pasarica, C. y A. Gelman. 2009.
Escala adaptativa del algoritmo Metropolis usando la distancia de salto al cuadrado esperada. Statistica Sinica.

Roberts, Gareth O. 2009.
Ejemplos de MCMC adaptativo. Revista de Estadística Computacional y Gráfica 18, no. 2 (6): 349-367. doi: 10.1198 / jcgs.2009.06134. http://pubs.amstat.org/doi/abs/10.1198/jcgs.2009.06134 .

]

VitoshKa
fuente
¿Cómo es que no tienes un bono de +100 de tu registro SO?
@mbq, probablemente porque creé esta cuenta hace mucho tiempo cuando también tenía 0 en el sistema operativo ... lástima, 100 en CW parece un gran problema, ya que debes ser un tipo real para responder cosas aquí :)
VitoshKa
Puede obtener la bonificación borrando todas las asociaciones y luego asociando cuentas nuevamente.
Wok

Respuestas:

7

Creo que este artículo de Heikki Haario et al. te dará la respuesta que necesitas. La markovianidad de la cadena se ve afectada por la adaptación de la densidad propuesta, porque entonces un nuevo valor propuesto depende no solo del anterior sino de toda la cadena. Pero parece que la secuencia aún tiene buenas propiedades si se tiene mucho cuidado.

robertsy
fuente
Gracias Robertsy, por una buena referencia. de hecho el proceso no es markov. Incluso si la probabilidad de aceptación es independiente del pasado, el núcleo de transición del proceso es una función de la densidad de la propuesta y, por lo tanto, depende de toda la cadena.
VitoshKa
3

Puede mejorar la tasa de aceptación utilizando el rechazo tardío como se describe en Tierney, Mira (1999) . Se basa en una segunda función de propuesta y una segunda probabilidad de aceptación , lo que garantiza que la cadena de Markov sigue siendo reversible con la misma distribución invariante: hay que tener cuidado ya que " es fácil construir métodos adaptativos que parecen funcionar, pero de hecho muestra de la distribución incorrecta ".

Wok
fuente
3

Los enfoques sugeridos por los usuarios wok y robertsy cubren los ejemplos más comúnmente citados de lo que estás buscando que yo sepa. Solo para ampliar esas respuestas, Haario y Mira escribieron un documento en 2006 que combina los dos enfoques, un enfoque que llaman DRAM (Metrópolis adaptativa de rechazo tardío) .

Andrieu tiene un buen tratamiento de varios enfoques diferentes de MCMC adaptativos (pdf) que cubre Haario 2001 pero también discute varias alternativas que se han propuesto en los últimos años.

redmoskito
fuente
1

Este es un complemento un tanto descarado de una publicación mía, pero hacemos exactamente esto en este trabajo ( arxiv ). Entre otras cosas, proponemos adaptar la varianza de la distribución exponencial para mejorar la aceptación (paso S3.2 en algoritmo en el documento).

F1

No utilizamos información sobre la tasa de aceptación, pero obtenemos una aceptación independiente de la cantidad que nos interesa (equivalente a la energía de un sistema de rotación, abajo a la derecha de la Fig. 4).

Jorge Leitao
fuente