El filtro de Kalman extendido invariante (IEKF) (que no debe confundirse con el filtro de Kalman extendido iterado) se introdujo por primera vez como una versión del filtro de Kalman extendido (EKF) para sistemas no lineales que poseen simetrías (o invariancias ), [1] luego se generalizó y reformuló como una adaptación a los grupos de Lie de la teoría de filtrado de Kalman lineal . [2] [3] En lugar de utilizar un término de corrección lineal basado en un error de salida lineal, el IEKF utiliza un término de corrección adaptado geométricamente basado en un error de salida invariante; de la misma manera, la matriz de ganancia no se actualiza a partir de un error de estado lineal, sino de un error de estado invariante. El principal beneficio es que las ecuaciones de ganancia y covarianza tienen una dependencia reducida del valor estimado del estado. En algunos casos convergen a valores constantes en un conjunto mucho más grande de trayectorias que en el caso del EKF, lo que resulta en una mejor convergencia de la estimación.
Derivación de filtros
Marco de tiempo discreto
Consideremos un sistema cuyo estado está codificado en el paso de tiempo por un elemento de un grupo de Lie y la dinámica tiene la siguiente forma: [4]
donde es un automorfismo de grupo de , es la operación de grupo y un elemento de . Se supone que el sistema se observa a través de una medición que tiene la siguiente forma:
donde pertenece a un espacio vectorial dotado de una acción izquierda de los elementos de denotados nuevamente por (lo cual no puede crear confusión con la operación de grupo ya que el segundo miembro de la operación es un elemento de , no ). Alternativamente, la misma teoría se aplica a una medida definida por una acción derecha :
Ecuaciones de filtrado
El filtro de Kalman extendido invariante es un observador definido por las siguientes ecuaciones si la función de medición es una acción izquierda:
donde es el mapa exponencial de y es una matriz de ganancia que se ajustará a través de una ecuación de Riccati.
Si la función de medición es una acción correcta, entonces el estado de actualización se define como:
Marco de tiempo continuo
El marco de tiempo discreto anterior se introdujo por primera vez para la dinámica de tiempo continuo de la forma:
donde el campo vectorial verifica en cualquier momento la relación: [2]
donde el elemento identidad del grupo se denota por y se utiliza la notación abreviada (resp. ) para la traslación a la izquierda (resp. la traslación a la derecha ) donde denota el espacio tangente a en . Conduce a cálculos más complejos que el marco de tiempo discreto, pero las propiedades son similares.
Propiedades principales
El principal beneficio del filtrado de Kalman extendido invariante es el comportamiento de la variable de error invariante, cuya definición depende del tipo de medición. Para las acciones de izquierda, definimos una variable de error invariante a la izquierda como:
- ,
- ,
Mientras que para las acciones correctas definimos una variable de error invariante a la derecha como:
- ,
- ,
De hecho, reemplazando , , por sus valores obtenemos para las acciones de la izquierda, después de algo de álgebra:
- ,
- ,
y por las acciones correctas:
- ,
- ,
Vemos que el valor estimado del estado no está involucrado en la ecuación seguida de la variable de error, una propiedad del filtrado de Kalman lineal que el filtro de Kalman extendido clásico no comparte, pero la similitud con el caso lineal en realidad va mucho más allá. Sea una versión lineal de la variable de error definida por la identidad:
Entonces, definido por la expansión de Taylor, en realidad tenemos: [2]
En otras palabras, no hay términos de orden superior: la dinámica es lineal para la variable de error . Este resultado y la independencia de la dinámica de error son la base de las propiedades teóricas y el desempeño práctico de IEKF. [2]
Relación con los observadores que preservan la simetría
La mayoría de los sistemas físicos poseen simetrías naturales (o invariancia), es decir, existen transformaciones (por ejemplo, rotaciones, traslaciones, escalas) que dejan el sistema inalterado. Desde un punto de vista matemático y de ingeniería, tiene sentido que un filtro bien diseñado para el sistema considerado conserve las mismas propiedades de invariancia. La idea del IEKF es una modificación de las ecuaciones del EKF para aprovechar las simetrías del sistema.
Definición
Considere el sistema
donde son ruidos gaussianos blancos independientes . Considérese un grupo de Lie con identidad , y grupos de transformación (locales) ( ) tales que . Se dice que el sistema anterior con ruido es invariante si no cambia con la acción de los grupos de transformación ; es decir, si
- .
Ecuaciones de filtrado y resultado principal
Dado que es un filtro que preserva la simetría , la forma general de un IEKF se lee [5]
dónde
- es un error de salida invariante, que es diferente del error de salida habitual
- es un marco invariante
- es un vector invariante
- es una matriz de ganancia elegida libremente.
Para analizar la convergencia del error se define un error de estado invariante , que es diferente del error de salida estándar , ya que el error de salida estándar normalmente no preserva las simetrías del sistema.
Dado el sistema considerado y el grupo de transformación asociado, existe un método constructivo para determinar , basado en el método del marco móvil.
De manera similar al EKF, la matriz de ganancia se determina a partir de las ecuaciones [6]
- ,
- ,
donde las matrices dependen aquí sólo del vector invariante conocido , en lugar de como en el EKF estándar. Esta dependencia mucho más simple y sus consecuencias son los principales intereses del IEKF. De hecho, las matrices son entonces constantes en un conjunto mucho mayor de trayectorias (las llamadas trayectorias permanentes ) que los puntos de equilibrio como es el caso del EKF. Cerca de tales trayectorias, volvemos al filtro de Kalman "verdadero", es decir, lineal, donde la convergencia está garantizada. Informalmente, esto significa que el IEKF converge en general al menos alrededor de cualquier trayectoria permanente que varíe lentamente, en lugar de solo alrededor de cualquier punto de equilibrio que varíe lentamente para el EKF.
Ejemplos de aplicación
Sistemas de referencia de actitud y rumbo
Los filtros de Kalman extendidos invariantes se utilizan, por ejemplo, en sistemas de referencia de actitud y rumbo . En dichos sistemas, la orientación, velocidad y/o posición de un cuerpo rígido en movimiento, por ejemplo, una aeronave, se estiman a partir de diferentes sensores integrados, como sensores inerciales, magnetómetros, GPS o sonares. El uso de un IEKF conduce naturalmente [6] a considerar el error de cuaternión , que a menudo se utiliza como un truco ad hoc para preservar las restricciones del grupo de cuaterniones. Los beneficios del IEKF en comparación con el EKF se muestran experimentalmente para un gran conjunto de trayectorias. [7]
Navegación inercial
Una aplicación importante del filtro de Kalman extendido invariante es la navegación inercial , que se ajusta al marco después de la incorporación del estado (que consiste en la matriz de actitud , el vector de velocidad y el vector de posición ) en el grupo de Lie [8] definido por la operación de grupo:
Localización y mapeo simultáneo
El problema de la localización y el mapeo simultáneos también se ajusta al marco del filtrado de Kalman extendido invariante después de la incrustación del estado (que consiste en una matriz de actitud , un vector de posición y una secuencia de puntos de características estáticas ) en el grupo de Lie (o para sistemas planares) [8] definido por la operación de grupo:
El principal beneficio del filtro de Kalman extendido invariante en este caso es resolver el problema de la falsa observabilidad. [8]
Referencias
- ^ Bonnabel, S. (diciembre de 2007). Filtro de Kalman extendido invariante a la izquierda y estimación de actitud. En 2007, 46.ª Conferencia IEEE sobre decisiones y control (pp. 1027-1032). IEEE.
- ^ abcd Barrau, A., y Bonnabel, S. (2016). El filtro de Kalman extendido invariante como observador estable. IEEE Transactions on Automatic Control, 62(4), 1797-1812.
- ^ Potokar, Easton R.; Beard, Randal W.; Mangelson, Joshua G. (2024). "Introducción al filtro de Kalman extendido invariante [Apuntes de clase]". IEEE Control Systems . 44 (6): 50–71. doi :10.1109/MCS.2024.3466488. ISSN 1066-033X.
- ^ Barrau, A., y Bonnabel, S. (2019). Sistemas lineales observados en grupos. Systems & Control Letters, 129, 36-42.
- ^ S. Bonnabel, Ph. Martin y P. Rouchon, “Observadores que preservan la simetría”, IEEE Transactions on Automatic and Control , vol. 53, núm. 11, págs. 2514–2526, 2008.
- ^ ab S. Bonnabel, Ph. Martin y E. Salaün, "Filtro de Kalman extendido invariante: teoría y aplicación a un problema de estimación de actitud asistida por velocidad", 48.ª Conferencia IEEE sobre decisiones y control, págs. 1297-1304, 2009.
- ^ Ph. Martin y E. Salaün, "Filtro Kalman extendido multiplicativo generalizado para el sistema de referencia de rumbo y actitud asistido", Conferencia de guía, navegación y control de la AIAA, 2010
- ^ abc Barrau, A., & Bonnabel, S. (2015). Un algoritmo EKF-SLAM con propiedades de consistencia. Preimpresión de arXiv arXiv :1510.06263.