¿Podemos cambiar la tasa de aceptación en el algoritmo de Metrópolis de paseo aleatorio cambiando el parámetro de la distribución de la propuesta?

8

¿Podemos cambiar la tasa de aceptación en el algoritmo de Metrópolis de paseo aleatorio cambiando el parámetro de la distribución de la propuesta?

Deje que la distribución de destino sea . Sea la densidad de propuesta para un nuevo estado en el estado actual . La tasa de aceptación es πp(x2|x1)x2x1

α=min(1,π(x2)p(x1|x2)π(x1)p(x2|x1))

Si estoy en lo cierto, en el algoritmo Metropolis de caminata aleatoria, la densidad de la propuesta es simétrica en el sentido de que p(x2|x1)=p(x1|x2) , por lo que la tasa de aceptación no depende de la densidad de la propuesta, sino solo en la distribución de destino π que se muestreará. Por lo tanto, cambiar el parámetro de la distribución de la propuesta no cambiará la tasa de aceptación α .

Por ejemplo, si la distribución de la propuesta, en el estado actual x1 , es una distribución gaussiana centrada en el estado actual con una varianza constante, es decir, N(x1,σ2) , que por cierto es simétrica en el sentido anterior, será cambiando la varianza σ2 de la distribución de propuesta gaussiana no cambia la tasa de aceptación α ?

¡Gracias!

Tim
fuente

Respuestas:

11

Si su propuesta tiene una variación muy baja, su nuevo estado propuesto será muy similar al estado actual, por lo que estará cerca de 1 (en el límite, con 0 varianza, la propuesta y el estado actual serán los mismos y tendrá exactamente igual a 1), por lo que la tasa de aceptación será cercana al 100%.π(x2)π(x1)

Sin embargo, si su propuesta tiene una gran varianza, será (al menos a veces) mucho menor que 1, por lo que su tasa de aceptación se acercará más y más al 0%. Por lo tanto, la tasa de aceptación disminuye a medida que aumenta la varianza de la propuesta.π(x2)π(x1)

El problema con las variaciones muy bajas (lo que le dará una mayor tasa de aceptación) es que tardan más en explorar el espacio posterior al no alejarse nunca del estado actual. Métodos adaptativos de MCMC como Haario et al. trate de manejar ese problema cambiando la matriz de varianza de la propuesta sobre la marcha.

Para ajustar su tasa de aceptación, puede intentar aumentar y disminuir la varianza, un enfoque de prueba y error. Pero dependiendo de la geometría de la parte posterior, la tasa de aceptación puede cambiar drásticamente durante el proceso de muestreo. Además, para los modelos multiparamétricos, la matriz de covarianza propuesta tiene muchos términos de varianza y covarianza y dicho método no resulta práctico.

Hay métodos más sofisticados para manejar esto, como el método de la metrópoli adaptativa descrito en el enlace anterior, o es posible que desee ver otros métodos como los que se enumeran aquí . También puede probar software como Jags y Stan si Metropolis no funciona para su problema.

random_user
fuente
¡Gracias! puedes ver mi publicación actualizada? por "Pr (estado de la propuesta)", ¿quiere decir "Pr (estado de la propuesta | estado actual)"?
Tim
Hola, en tu nueva notación quise decir . No me molesté con ya que dijiste que estás trabajando con una propuesta simétrica y, por lo tanto, su relación es constante e igual a 1 para la variación que elijas. π(x2)/π(x1)p(x1|x2)/p(x2|x1)
random_user
Se amplió un poco la respuesta para dar cuenta de esto.
random_user
debido a que el estado de la propuesta es una variable aleatoria, ¿es correcto que no haya forma de controlar la tasa de aceptación en un intervalo como [0.2,0.5]?
Tim
2
Dependerá de la geometría del AFAIK posterior. Si su posterior es una distribución normal o algo similar y si tiene una distribución de propuesta que también es normal, no veo por qué no pudo "controlar" su tasa de aceptación haciendo prueba y error en la variación de propuesta. Por supuesto, los problemas reales pueden ser (y son) mucho más complejos que esto.
random_user
2

Creo que señalar algunas definiciones puede ser beneficioso para futuras referencias a esta pregunta y respuesta.

La relación entre el número de estados propuestos aceptados y el número de proposiciones da la tasa de aceptación. Tenga en cuenta que la tasa de aceptación es la tasa de aceptación en el transcurso de la caminata aleatoria.

α en la pregunta es llamada "probabilidad de aceptación" por Robert & Casella en su libro Introducción a los métodos de Monte Carlo con R (2010, p. 171). Esto es muy razonable ya que , en su presentación, adaptada a la notación en la pregunta, se ve aquí:α

x2={x2with probability α(x2,x1)x1with probability 1α(x2,x1)where  α(x2,x1)=min{1,π(x2)p(x1|x2)π(x1)p(x2|x1)}

Ahora tenga en cuenta que aquí puede volverse independiente de la densidad de la propuesta en el caso de una propuesta de recorrido aleatorio cuando . Sin embargo, la tasa de aceptación como se definió anteriormente todavía depende de ella debido a las razones explicadas por random_user.αp(x|y)=p(y|x)

Robert y Casella son muy claros acerca de diferenciar los dos y definen a este último como "el [...] promedio de probabilidad de aceptación sobre las iteraciones".

Tengo poca experiencia en el tema, pero fue suficiente para mí observar que lo que se refiere en cuestión por "tasa de aceptación" a veces se denomina "índice de aceptación" (ver Wikipedia, por ejemplo), lo que lleva a confusiones similares a las de la pregunta.

Oğuzhan Öğreden
fuente