¿El algoritmo de muestreo de Gibbs garantiza un equilibrio detallado?

Según la autoridad suprema ^1, Gibbs Sampling es un caso especial del algoritmo Metropolis-Hastings para el muestreo de Markov Chain Monte Carlo. El algoritmo MH siempre proporciona una probabilidad de transición con la propiedad de balance detallada; Espero que Gibbs también lo haga. Entonces, ¿dónde en el siguiente caso simple me he equivocado?

Para la distribución de destino en dos variables discretas (por simplicidad), las distribuciones condicionales completas son: $\pi(x, y)$

\begin{aligned} q_{1} (x; y) & = \frac{π (x, y)}{\sum_{z} π (z, y)} \\ q_{2} (y; x) & = \frac{π (x, y)}{\sum_{z} π (x, z)} \end{aligned}

$\begin{align} q_1 (x;y) & =\frac{\pi (x,y)}{\sum_z \pi (z,y)} \\ q_2 (y;x) & =\frac{\pi (x,y)}{\sum_z \pi (x,z)} \end{align}$

Según entiendo Gibbs Sampling, la probabilidad de transición se puede escribir:

P r o b {(y_{1}, y_{2}) \to (x_{1}, x_{2})} = q_{1} (x_{1}; y_{2}) q_{2} (x_{2}; x_{1})

$Prob\{(y_1, y_2) \to (x_1, x_2)\} = q_1(x_1; y_2) q_2(x_2; x_1)$

La pregunta es, ¿ pero lo más cercano que puedo obtener es Eso es sutilmente diferente y no implica un balance detallado. Gracias por cualquier comentario!

π (y_{1}, y_{2}) P r o b {(y_{1}, y_{2}) \to (x_{1}, x_{2})} \overset{?}{=} π (x_{1}, x_{2}) P r o b {(x_{1}, x_{2}) \to (y_{1}, y_{2})},

$\pi(y_1,y_2) Prob\{(y_1, y_2) \to (x_1, x_2)\} \overset{?}{=} \pi(x_1,x_2) Prob\{(x_1, x_2) \to (y_1, y_2)\},$

\begin{aligned} π (y_{1}, y_{2}) P r o b {(y_{1}, y_{2}) & \to (x_{1}, x_{2})} \\ = π (y_{1}, y_{2}) q_{2} (x_{2}; x_{1}) q_{1} (x_{1}; y_{2}) \\ = \frac{π (x_{1}, x_{2})}{\sum_{z} π (x_{1}, z)} \frac{π (x_{1}, y_{2})}{\sum_{z} π (z, y_{2})} π (y_{1}, y_{2}) \\ = π (x_{1}, x_{2}) q_{2} (y_{2}; x_{1}) q_{1} (y_{1}; y_{2}) \end{aligned}

$\begin{align} \pi(y_1,y_2) Prob\{(y_1, y_2) & \to (x_1, x_2)\} \\ & = \pi(y_1, y_2) q_2(x_2; x_1) q_1(x_1; y_2) \\ & = \frac{\pi(x_1, x_2)}{\sum_z \pi(x_1,z)}\frac{\pi(x_1, y_2)}{\sum_z \pi(z, y_2)}\pi (y_1, y_2) \\ & = \pi(x_1, x_2) q_2(y_2; x_1) q_1(y_1; y_2) \end{align}$

mcmc gibbs Ian
fuente

Intentó mostrar un balance detallado para la cadena de Markov que se obtiene al considerar que una transición de la cadena de Markov es el 'barrido de Gibbs' donde se muestrea cada componente a su vez a partir de su distribución condicional. Para esta cadena, el saldo detallado no está satisfecho. El punto es más bien que cada muestreo de un componente particular de su distribución condicional es una transición que satisface el equilibrio detallado. Sería más exacto decir que el muestreo de Gibbs es un caso especial de un Metropolis-Hastings ligeramente generalizado, donde se alternan entre múltiples propuestas diferentes. Más detalles siguen.

Los barridos no satisfacen el equilibrio detallado

Construyo un contraejemplo. Considere dos variables de Bernoulli ( ), con probabilidades como se muestra en la siguiente tabla: Suponga que el barrido de Gibbs está ordenado para que se muestree primero. Pasar del estado al estado en un movimiento es imposible, ya que requeriría pasar de a . Sin embargo, pasar de a tiene una probabilidad positiva, a saber, $X_1,X_2$

\begin{array}{ccc} X_{2} = 0 & X_{2} = 1 \\ X_{1} = 0 & \frac{1}{3} & \frac{1}{3} \\ X_{1} = 1 & 0 & \frac{1}{3} \end{array}

$\begin{equation} \begin{array}{ccc} & X_2 = 0 & X_2 = 1 \\ X_1 = 0 & \frac{1}{3} & \frac{1}{3} \\ X_1 = 1 & 0 & \frac{1}{3} \end{array} \end{equation}$

X_{1}

$X_1$

(0, 0)

$(0,0)$

(1, 1)

$(1,1)$

(0, 0)

$(0,0)$

(1, 0)

$(1,0)$

(1, 1)

$(1,1)$

(0, 0)

$(0,0)$

\frac{1}{4}

$\frac{1}{4}$ . Por lo tanto, concluimos que el balance detallado no está satisfecho.

Sin embargo, esta cadena todavía tiene una distribución estacionaria que es la correcta. El balance detallado es una condición suficiente, pero no necesaria, para converger a la distribución objetivo.

Los movimientos por componentes satisfacen el equilibrio detallado

Considere un estado de dos variables donde muestreamos la primera variable de su distribución condicional. Un movimiento entre y tiene probabilidad cero en ambas direcciones si y, por lo tanto, para estos casos se mantiene claramente el equilibrio detallado. A continuación, considere : $(x_1,x_2)$ $(y_1,y_2)$ $x_2 \neq y_2$ $x_2 = y_2$

π (x_{1}, x_{2}) P r o b ((x_{1}, x_{2}) \to (y_{1}, x_{2})) = π (x_{1}, x_{2}) p (y_{1} ∣ X_{2} = x_{2}) = π (x_{1}, x_{2}) \frac{π (y_{1}, x_{2})}{\sum_{z} π (z, x_{2})} = π (y_{1}, x_{2}) \frac{π (x_{1}, x_{2})}{\sum_{z} π (z, x_{2})} = π (y_{1}, x_{2}) p (x_{1} ∣ X_{2} = x_{2}) = π (y_{1}, x_{2}) P r o b ((y_{1}, x_{2}) \to (x_{1}, x_{2})) .

$\begin{equation} \pi(x_1,x_2) \mathrm{Prob}((x_1,x_2) \rightarrow (y_1,x_2)) = \pi(x_1,x_2)\,p(y_1 \mid X_2 = x_2) = \pi(x_1,x_2) \, \frac{\pi(y_1,x_2)}{\sum_z \pi(z,x_2)} \\ = \pi(y_1,x_2) \, \frac{\pi(x_1,x_2)}{\sum_z \pi(z,x_2)} = \pi(y_1,x_2) \,p(x_1 \mid X_2 = x_2) = \pi(y_1,x_2) \mathrm{Prob}((y_1,x_2) \rightarrow (x_1,x_2)). \end{equation}$

¿Cómo los movimientos de componentes son movimientos de Metropolis-Hastings?

Tomando muestras del primer componente, nuestra distribución de propuesta es la distribución condicional. (Para todos los demás componentes, proponemos los valores actuales con probabilidad ). Considerando un movimiento de a , la razón de probabilidades objetivo es Pero la razón de probabilidades de propuesta es $1$ $(x_1, x_2)$ $(y_1, y_2)$

\frac{π (y_{1}, x_{2})}{π (x_{1}, x_{2})} .

$\begin{equation} \frac{\pi(y_1,x_2)}{\pi(x_1,x_2)}. \end{equation}$

\frac{P r o b ((y_{1}, x_{2}) \to (x_{1}, x_{2}))}{P r o b ((x_{1}, x_{2}) \to (y_{1}, x_{2}))} = \frac{\frac{π (x_{1}, x_{2})}{\sum_{z} π (z, x_{2})}}{\frac{π (y_{1}, x_{2})}{\sum_{z} π (z, x_{2})}} = \frac{π (x_{1}, x_{2})}{π (y_{1}, x_{2})} .

$\begin{equation} \frac{\mathrm{Prob}((y_1,x_2) \rightarrow (x_1,x_2))}{\mathrm{Prob}((x_1,x_2) \rightarrow (y_1,x_2))} = \frac{\frac{\pi(x_1,x_2)}{\sum_z \pi(z,x_2)}}{\frac{\pi(y_1,x_2)}{\sum_z \pi(z,x_2)}} = \frac{\pi(x_1,x_2)}{\pi(y_1,x_2)}. \end{equation}$ Entonces, la razón de probabilidades objetivo y la razón de probabilidades propuestas son recíprocas, y por lo tanto la probabilidad de aceptación será . En este sentido, cada uno de los movimientos en la muestra de Gibbs son casos especiales de movimientos de Metropolis-Hastings. Sin embargo, el algoritmo general visto desde este punto de vista es una ligera generalización del algoritmo de Metropolis-Hastings que se presenta típicamente en el sentido de que tiene alternancia entre diferentes distribuciones de propuestas (una para cada componente de la variable objetivo).

1

$1$

Juho Kokkala
fuente

Gran respuesta, gracias (edición menor: y_2 -> x_2 en tu tercera sección). Al llamar al barrido de Gibbs un paso, ¿es la existencia de la distribución estacionaria (junto con la irreductibilidad y la recurrencia) una condición suficiente para la convergencia a la distribución estacionaria desde cualquier estado inicial?

Ian

La muestra de Gibbs es una composición de movimientos de Metropolis-Hastings con probabilidad de aceptación 1. Cada movimiento es reversible pero la composición no lo es, a menos que el orden de los pasos sea aleatorio.

Xi'an

¿El algoritmo de muestreo de Gibbs garantiza un equilibrio detallado?

Respuestas:

Los barridos no satisfacen el equilibrio detallado

Los movimientos por componentes satisfacen el equilibrio detallado

¿Cómo los movimientos de componentes son movimientos de Metropolis-Hastings?