Diagnóstico de convergencia Gelman y Rubin, ¿cómo generalizar para trabajar con vectores?

14

El diagnóstico de Gelman y Rubin se utiliza para verificar la convergencia de múltiples cadenas mcmc que se ejecutan en paralelo. Compara la varianza dentro de la cadena con la varianza entre cadenas, la exposición es la siguiente:

Pasos (para cada parámetro):

  1. Ejecute m ≥ 2 cadenas de longitud 2n desde valores iniciales sobredispersos.
  2. Deseche los primeros n sorteos en cada cadena.
  3. Calcule la varianza dentro de la cadena y entre cadenas.
  4. Calcule la varianza estimada del parámetro como una suma ponderada de la varianza dentro de la cadena y entre cadenas.
  5. Calcule el factor de reducción de escala potencial.
  6. Elemento de la lista

Quiero usar esta estadística pero las variables con las que quiero usarla son vectores aleatorios.

¿Tiene sentido tomar la media de las matrices de covarianza en este caso?

Tim
fuente

Respuestas:

17

Una recomendación: solo calcule el PSRF por separado para cada componente escalar

El artículo original de Gelman & Rubin [1], así como el libro de texto Bayesian Data Analysis de Gelman et al. [2], recomienda calcular el factor de reducción de escala potencial (PSRF) por separado para cada parámetro escalar de interés. Para deducir la convergencia, se requiere que todos los PSRF estén cerca de 1. No importa que sus parámetros se interpreten como vectores aleatorios, sus componentes son escalares para los que puede calcular los PSRF.

Brooks y Gelman [3] han propuesto una extensión multivariada del PSRF, que reviso en la siguiente sección de esta respuesta. Sin embargo, para citar a Gelman y Shirley [4]:

[...] estos métodos a veces pueden representar una exageración: los parámetros individuales se pueden estimar bien incluso si la convergencia aproximada de simulaciones de una distribución multivariada puede llevar mucho tiempo.

Alternativa: extensión multivariada de Brooks & Gelman

Wsi

V^=norte-1norteW+1nortesi,
norteV^,W
R^=maxununTV^ununTWun=norte-1norte+(metro+1metro)λ1,
metroλ1W-1V^/ /norteλ10 0norteR^

Referencias

[1] Gelman, Andrew y Donald B. Rubin. "Inferencia de simulación iterativa usando múltiples secuencias". Ciencia estadística (1992): 457-472.

[2] Gelman, Andrew y col. Análisis de datos bayesianos. Prensa CRC, 2013.

[3] Brooks, Stephen P. y Andrew Gelman. "Métodos generales para monitorear la convergencia de simulaciones iterativas". Journal of Computational and Graphical Statistics 7.4 (1998): 434-455.

[4] Gelman, Andrew y Kenneth Shirley. "Inferencia de simulaciones y monitoreo de convergencia". (Capítulo 6 en Brooks, Steve, et al., Eds. Manual de Markov Chain Monte Carlo. CRC Press, 2011.)

Todos los artículos, excepto el libro de texto [2], están disponibles en el sitio web de Andrew Gelman .

Juho Kokkala
fuente