Confusión relacionada con los sistemas dinámicos lineales.

9

Estaba leyendo este libro Reconocimiento de patrones y aprendizaje automático de Bishop. Tuve una confusión relacionada con una derivación del sistema dinámico lineal. En SUD asumimos que las variables latentes son continuas. Si Z denota las variables latentes y X denota las variables observadas

p(zn|zn1)=N(zn|Azn1,τ)

p(xn|zn)=N(xn,Czn,Σ)

p(z1)=N(z1|u0,V0)

En LDS también se utiliza el paso de mensajes alfa beta hacia adelante y hacia atrás para calcular la distribución latente posterior, es decir,p(zn|X)

α(zn)=p(x1...xn,zn)

α^(zn)=α(zn)/P(x1....xn)

Mi primera pregunta está en el libro, se da como

α^(zn)=N(zn|un,Vn)

¿Cómo es que obtuvimos lo anterior? Me refiero a = . Quiero decir, ¿cómo conseguimos esto?α^(zn)N(zn|un,Vn))

Mi siguiente pregunta está relacionada con la derivación, ya que puede seguir las capturas de pantalla de las páginas del libro adjunto. No entendí de dónde vino y qué ganancia de filtro de Kalman esKn

un=Aun1+Kn(xnCAun1)

Vn=IKnC)P(n1)

cn=N(xn|CAun1,CPn1CT+Σ

Kn es la matriz de ganancia de KalmanPn1CT(CPn1CT+Σ)1

¿Cómo derivamos las ecuaciones anteriores, quiero decir cómo

un=Aun1+Kn(xnCAun1)

Estoy confundido sobre cómo se hace la derivación anterior. ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

usuario34790
fuente

Respuestas:

1

Hay una buena derivación, varias en realidad, en lo siguiente: http://amzn.com/0470173661

Este es un buen libro sobre el tema también: http://amzn.com/0471708585

La derivación completa y las simplificaciones que resultan en la forma abreviada del libro de texto que presenta, no es corta / limpia, por lo que a menudo se omite o se deja como ejercicio para el lector.

Puede pensar en la ganancia de Kalman como una proporción de mezcla que hace una suma ponderada de un modelo analítico / simbólico y alguna medición ruidosa del mundo real. Si tiene mediciones deficientes, pero un buen modelo, una ganancia de Kalman establecida correctamente debería favorecer el modelo. Si tiene un modelo basura, pero las mediciones son bastante buenas, entonces su ganancia de Kalman debería favorecer las mediciones. Si no tiene un buen control de cuáles son sus incertidumbres, puede ser difícil configurar correctamente su filtro Kalman.

Si configura las entradas correctamente, entonces es un estimador óptimo. Hay una serie de supuestos que intervienen en su derivación y si alguno de ellos no es cierto, entonces se convierte en un buen estimador subóptimo. Por ejemplo, un diagrama de Lag demostrará que la suposición de Markov de un paso implícita en el filtro de Kalman no es cierta para una función coseno. Una serie de Taylor es una aproximación, pero no es exacta. Puede hacer un filtro Kalman extendido basado en la serie Taylor pero es aproximado, no exacto. Si puede obtener información de dos estados anteriores en lugar de uno, puede usar un filtro Block Kalman y recuperar su óptima. En pocas palabras, no es una mala herramienta, pero no es "la bala de plata" y su kilometraje variará. Asegúrate de caracterizarlo bien antes de usarlo en el mundo real.

Estudiante
fuente