Definición ambigua del filtro de Kalman de estado de error (indirecto)

11

Me confunde lo que significa precisamente el término "filtro de Kalman indirecto" o "filtro de Kalman de estado de error".

La definición más plausible que encontré está en el libro de Maybeck [1]:

Como su nombre indica, en la formulación del espacio de estado total (directo), los estados totales como la posición y la velocidad del vehículo se encuentran entre las variables de estado en el filtro, y las mediciones son salidas de acelerómetro INS y señales de fuente externa. En la formulación del espacio de estado de error (indirecto), los errores en la posición y velocidad indicadas por el INS se encuentran entre las variables estimadas, y cada medición presentada al filtro es la diferencia entre el INS y los datos de fuente externa.

20 años después Roumeliotis et al. en [2] escriba:

El modelado engorroso del vehículo específico y su interacción con un entorno dinámico se evita seleccionando en su lugar el modelado giroscópico. La señal giroscópica aparece en las ecuaciones del sistema (en lugar de la medición) y, por lo tanto, la formulación del problema requiere un enfoque de filtro de Kalman indirecto (estado de error).

No puedo entender la parte audaz, ya que Lefferts et al. en [3] escribe mucho antes:

Para las naves espaciales autónomas, el uso de unidades de referencia inerciales como reemplazo del modelo permite eludir estos problemas.

Y luego proceda a mostrar diferentes variantes de EKF utilizando modelos de giroscopio que son filtros Kalman claramente directos de acuerdo con la definición de Maybeck: el estado solo consiste en la actitud de cuaternión y sesgo giroscópico, no estados de error. De hecho, no hay un INS separado cuyo error de estimar con un filtro de Kalman de estado de error.

Entonces mis preguntas son:

  • ¿Existe una definición diferente, tal vez más nueva, de filtros Kalman indirectos (estado de error) que desconozco?

  • ¿Cómo se relacionan el modelado giroscópico con el uso de un modelo dinámico adecuado, por un lado, y la decisión de usar un filtro de Kalman directo o indirecto, por otro lado? Tenía la impresión de que ambas son decisiones independientes.

[1] Maybeck, Peter S. Modelos estocásticos, estimación y control. Vol. 1. Prensa académica, 1979.

[2] Roumeliotis, Stergios I., Gaurav S. Sukhatme y George A. Bekey. "Eludir el modelado dinámico: evaluación del filtro kalman de estado de error aplicado a la localización de robots móviles". Robótica y Automatización, 1999. Actas. 1999 Conferencia Internacional IEEE sobre. Vol. 2. IEEE, 1999.

[3] Lefferts, Ern J., F. Landis Markley y Malcolm D. Shuster. "Filtro de Kalman para la estimación de la actitud de la nave espacial". Journal of Guidance, Control, and Dynamics 5.5 (1982): 417-429.

sebsch
fuente

Respuestas:

6

Hola y bienvenido al amplio, ambiguo y confuso mundo de la investigación. Pero en serio, mirar 20 años de documentos a veces producirá estas confusiones. Veamos qué está pasando. En la primera referencia, lo que dicen es:

Un INS / Gyro es bueno, pero tiene un error. Ese error cambia (deriva) con el tiempo. Por lo tanto, el error en el INS es realmente una parte del estado del sistema.

La suposición de Markov utilizada en el filtro de Kalman supone que el estiamte actual encapsula todo el estado del sistema y todos los estados anteriores del sistema. El paso de actualización del EKF / FK supone que los sensores miden el estado del sistema directamente y sin sesgos . Sin embargo, un INS tiene un sesgo (el error), y ese sesgo cambia. Entonces nuestro estado medible (la medición del INS / Gyro) es

z(t)=x(t)+b(t)+n

para el vector de polarización y ruido . El vector , desafortunadamente, es desconocido, varía en el tiempo y no tiene una media cero. Se supone que el vector es ruido de media cero (p. Ej., Imparcial). Entonces, si supiéramos , podríamos restarlo de para obtener una medición imparcial del estado. Esto es útil. Entonces, una estimación de se mantiene como parte del estado.bnbn b(t)zb(t)

Un filtro kalman de estado de error crea un nuevo vector de estado,

[x(t)b(t)]=[x(t)b(t)]+n
donde de nuevo es el verdadero estado y es el verdadero sesgo.xb

Ok, pasando a la referencia dos, parecen decir que la señal del giroscopio (que tiene medidas de la forma nuevamente) se usa en lugar de suponer que el giroscopio está midiendo El estado directamente. Eso encaja con lo que sé sobre la investigación del profesor Roumeliotis, así como con la definición de estado de error KF y ref 1.z(t)=x+b(t)+n

Ahora la referencia 3 está redactada ligeramente mal. No pude adquirir un PDF para revisarlo rápidamente. Lo que creo que significa es que están utilizando el supuesto común de que un buen modelo de la dinámica del sistema no está disponible para un paso de predicción (o propagación). En cambio, suponen que las mediciones del INS son una estimación decente del estado del sistema, y ​​luego utilizan otros sensores para actualizar la estimación del estado.

Esto es similar a usar odometría en lugar de modelar cómo las entradas de control producen un cambio de estado en un robot con ruedas . Sí, la estimación adelantada tendrá el sesgo del SIN, pero las mediciones deberían corregirlo. De hecho, la introducción a ese documento establece lo mismo que hemos resumido aquí, que el sesgo en el giroscopio debería ser una parte del sistema que se estima.

Este es un resumen de alto nivel, que es lo mejor que puedo hacer en este momento. Si hay preocupaciones específicas, puedo editar según sea necesario.

Josh Vander Hook
fuente
Solo quiero entender lo que está pasando aquí. El problema aquí es que el ruido es parcial, por lo que uno de los requisitos del filtro Kalman está roto y no es aplicable usarlo directamente con giroscopio. Es por eso que necesitan otra forma de moverse. ¿Es este el problema? Gracias por la respuesta.
CroCo
Sí, actualizaré la respuesta para que sea más clara también.
Josh Vander Hook