Rao-Blackwellization de filtros secuenciales de Monte Carlo

11

En el documento seminal "Filtrado de partículas Rao-Blackwellised para redes bayesianas dinámicas" por A. Doucet et. Alabama. Se propone un filtro secuencial Monte Carlo (filtro de partículas), que utiliza una subestructura lineal en un proceso de Markov x k = ( x L k , x N k ) . Al marginar esta estructura lineal, el filtro se puede dividir en dos partes: una parte no lineal que usa un filtro de partículas y una parte lineal que se puede manejar con un filtro de Kalman (condicionado por la parte no lineal x N k )xkLxk=(xkL,xkN)xkN

Entiendo la parte de marginación (y a veces el filtro descrito también se llama filtro marginado). Mi intuición de por qué se llama Filtro de Partículas Rao-Blackwellized (RBPF) es que los parámetros gaussianos son estadísticas suficientes para el proceso lineal subyacente, y siguiendo el teorema de Rao-Blackwell, un estimador condicionado a estos parámetros funciona al menos tan bien como el estimador de muestreo.

El estimador Rao-Blackwell se define como . En este contexto, supongo que δ ( X ) es el estimador de Monte Carlo, δ 1 ( X ) el RBPF y T ( X ) la parametrización gaussiana. Mi problema es que no veo dónde se aplica esto realmente en el documento.E(δ(X)|T(X))=δ1(X)δ(X)δ1(X)T(X)

Entonces, ¿por qué se llama filtro de partículas Rao-Blackwellized, y dónde ocurre realmente la Rao-Blackwellization?

Jakob
fuente

Respuestas:

1

I1^E[f]I2^

Más adelante en el documento, la expectativa se calcula utilizando filtros Kalman.

Hunaphu
fuente