Distribución de propuestas - Metropolis Hastings MCMC

8

En la cadena Monte Carlo de Metropolis-Hastings Markov, la distribución de la propuesta puede ser cualquier cosa, incluida la gaussiana (según Wikipedia).

P: ¿Cuál es la motivación para usar algo que no sea gaussiano? Gaussian funciona, es fácil de evaluar, es rápido y todos lo entienden. ¿Por qué consideraría algo más?

P: Dado que la distribución de la propuesta puede ser cualquier cosa, ¿puedo usar una distribución uniforme?

Hola Mundo
fuente

Respuestas:

10

A1: De hecho, la distribución gaussiana es probablemente la distribución de propuestas más utilizada principalmente debido a la facilidad de uso. Sin embargo, uno podría querer usar otras distribuciones de propuestas por la siguiente razón

  1. Colas pesadas : la distribución gaussiana tiene colas ligeras. Esto significa que N(xt1,σ2) posiblemente solo sugiera valores entre (xt13σ,xt1+3σ). Pero untla distribución tiene colas más pesadas y, por lo tanto, puede proponer valores que están más lejos. Esto asegura que la cadena de Markov resultante explore el espacio de estado más libremente, y posiblemente reduzca la autocorrelación. La siguiente gráfica muestra elN(0,1) en comparación con el t1. Ya ves comot probablemente propondrá más valores más lejos de 0.

ingrese la descripción de la imagen aquí

  1. Espacio restringido : la distribución gaussiana se define en todos los reales. Si la distribución de la que está tomando muestras es, por ejemplo, definida solo en los positivos o en(0,1), entonces el gaussiano probablemente propondrá valores para los cuales la densidad objetivo es 0. Dichos valores se rechazan inmediatamente y la cadena de Markov no se mueve desde su punto actual. Esto está esencialmente desperdiciando un empate de la cadena de Markov. En cambio, si está en lo positivo, podría usar una distribución Gamma y(0,1) podrías usar una Beta.
  2. Modos múltiples : cuando la distribución objetivo es multimodal, una propuesta gaussiana probablemente llevará a que la cadena de Markov se quede atascada cerca de un modo. Esto se debe en parte a las colas ligeras del gaussiano. Por lo tanto, en cambio, las personas usan propuestas basadas en gradientes, o una mezcla de gaussianos como propuesta.

Puedes encontrar más discusión aquí y aquí .

A2: Sí, puede usar una distribución Uniforme siempre que el soporte para la distribución uniforme esté limitado (ya que si el soporte no está limitado, la distribución Uniforme es incorrecta ya que se integra a ) Entonces un uniforme en(xt1c,xt1+c).

Greenparker
fuente
1
¿Puede aclarar el significado de "el espacio está limitado" en A2 (tenga en cuenta que el espacio donde se encuentra el parámetro objetivo no necesita estar limitado siempre que la cadena pueda moverse a todas partes, posiblemente requiriendo múltiples pasos). Además, ¿hay un error tipográfico en ese punto final que tienext1 mientras que otro tiene xt+1?
Juho Kokkala
@JuhoKokkala Se corrigió el error tipográfico, gracias por señalarlo. La distribución uniforme debe definirse en un espacio acotado; de lo contrario, no se integra a 1 (y se integra a)
Greenparker
3
@Greenparker: necesita aclarar más a qué se refiere con "el espacio". El soporte de la distribución objetivo puede ser ilimitado, mientras que el soporte de una propuesta uniforme está limitado, pero la propuesta uniforme correspondiente aún puede producir una cadena de Markov irreducible en todo el espacio.
Xi'an
1. sigma es un parámetro de elección, por lo que este argumento no es válido. 2. Si está discutiendo la caminata aleatoria MH (como indica 1.), esto solo será un problema en el límite.
Hunaphu
@Hunaphu σcambia la variación de la propuesta, pero no la estructura de las colas. ¿Y puede ampliar lo que quiere decir con "esto solo será un problema en el límite"?
Greenparker