stringtranslate.com

Filtro de Kalman extendido

En teoría de la estimación , el filtro de Kalman extendido ( EKF ) es la versión no lineal [ se necesita desambiguación ] del filtro de Kalman que linealiza una estimación de la media y la covarianza actuales . En el caso de modelos de transición bien definidos, el EKF ha sido considerado [1] el estándar de facto en la teoría de estimación de estado no lineal, sistemas de navegación y GPS . [2]

Historia

Los artículos que establecen los fundamentos matemáticos de los filtros tipo Kalman se publicaron entre 1959 y 1961. [3] [4] [5] El filtro de Kalman es el estimador lineal óptimo para modelos de sistemas lineales con ruido blanco aditivo independiente tanto en la transición como en la medición. sistemas. Desafortunadamente, en ingeniería la mayoría de los sistemas son no lineales , por lo que se intentó aplicar este método de filtrado a sistemas no lineales; la mayor parte de este trabajo se realizó en la NASA Ames . [6] [7] El EKF adaptó técnicas del cálculo , concretamente expansiones multivariadas en series de Taylor , para linealizar un modelo alrededor de un punto de trabajo. Si el modelo del sistema (como se describe a continuación) no es bien conocido o es inexacto, entonces se emplean métodos de Monte Carlo , especialmente filtros de partículas , para la estimación. Las técnicas de Monte Carlo son anteriores a la existencia del EKF pero son computacionalmente más costosas para cualquier espacio de estados moderadamente dimensionado .

Formulación

En el filtro de Kalman extendido, los modelos de observación y transición de estado no necesitan ser funciones lineales del estado, sino que pueden ser funciones diferenciables .

Aquí w k y v k son los ruidos de proceso y de observación, que se supone que son ruidos gaussianos multivariados de media cero con covarianza Q k y R k respectivamente. u k es el vector de control.

La función f se puede utilizar para calcular el estado previsto a partir de la estimación anterior y, de manera similar, la función h se puede utilizar para calcular la medición prevista a partir del estado previsto. Sin embargo, f y h no se pueden aplicar directamente a la covarianza. En lugar de ello , se calcula una matriz de derivadas parciales (la jacobiana ).

En cada paso de tiempo, el jacobiano se evalúa con los estados actuales previstos. Estas matrices se pueden utilizar en las ecuaciones del filtro de Kalman. Este proceso esencialmente linealiza la función no lineal alrededor de la estimación actual.

Consulte el artículo Filtro de Kalman para comentarios sobre notaciones.

Predicción y actualización de ecuaciones en tiempo discreto.

La notación representa la estimación de en el momento n dadas las observaciones hasta el momento mn inclusive .

Predecir

Actualizar

donde las matrices de observación y transición de estado se definen como los siguientes jacobianos

Desventajas y alternativas

A diferencia de su contraparte lineal, el filtro de Kalman extendido en general no es un estimador óptimo (es óptimo si la medición y el modelo de transición de estado son ambos lineales, ya que en ese caso el filtro de Kalman extendido es idéntico al normal). Además, si la estimación inicial del estado es incorrecta, o si el proceso se modela incorrectamente, el filtro puede divergir rápidamente debido a su linealización. Otro problema con el filtro de Kalman extendido es que la matriz de covarianza estimada tiende a subestimar la matriz de covarianza verdadera y, por lo tanto, corre el riesgo de volverse inconsistente en el sentido estadístico sin la adición de "ruido estabilizador" [8] .

De manera más general, se debe considerar la naturaleza de dimensión infinita del problema de filtrado no lineal y la insuficiencia de un estimador simple de media y varianza-covarianza para representar completamente el filtro óptimo. También cabe señalar que el filtro de Kalman extendido puede ofrecer rendimientos deficientes incluso para sistemas unidimensionales muy simples, como el sensor cúbico, [9] donde el filtro óptimo puede ser bimodal [10] y, como tal, no puede representarse eficazmente mediante un estimador único de media y varianza, que tiene una estructura rica, o similar para el sensor cuadrático. [11] En tales casos se han estudiado los filtros de proyección como alternativa, habiéndose aplicado también a la navegación. [12] En este caso se pueden considerar otros métodos generales de filtrado no lineal, como filtros de partículas completas.

Dicho esto, el filtro Kalman extendido puede ofrecer un rendimiento razonable y podría decirse que es el estándar de facto en sistemas de navegación y GPS.

Generalizaciones

Filtro Kalman extendido de tiempo continuo

Modelo

Inicializar

Predecir-Actualizar

A diferencia del filtro de Kalman extendido de tiempo discreto, los pasos de predicción y actualización están acoplados en el filtro de Kalman extendido de tiempo continuo. [13]

Mediciones en tiempo discreto

La mayoría de los sistemas físicos se representan como modelos de tiempo continuo, mientras que con frecuencia se toman medidas de tiempo discreto para estimar el estado mediante un procesador digital. Por lo tanto, el modelo del sistema y el modelo de medición están dados por

dónde .

Inicializar

Predecir

dónde

Actualizar

dónde

Las ecuaciones de actualización son idénticas a las del filtro de Kalman extendido en tiempo discreto.

Filtros de Kalman extendidos de orden superior

La recursión anterior es un filtro de Kalman extendido de primer orden (EKF). Se pueden obtener EKF de orden superior reteniendo más términos de las expansiones de la serie de Taylor. Por ejemplo, se han descrito EKF de segundo y tercer orden. [14] Sin embargo, los EKF de orden superior tienden a proporcionar beneficios de rendimiento solo cuando el ruido de medición es pequeño.

Formulación y ecuaciones de ruido no aditivo.

La formulación típica del EKF implica la suposición de ruido de proceso y medición aditivo. Sin embargo, esta suposición no es necesaria para la implementación del EKF . [15] En su lugar, considere un sistema más general de la forma:

Aquí w k y v k son los ruidos de proceso y de observación, que se supone que son ruidos gaussianos multivariados de media cero con covarianza Q k y R k respectivamente. Entonces las ecuaciones de predicción de covarianza e innovación se convierten en

donde las matrices y son matrices jacobianas:

La estimación del estado previsto y el residuo de medición se evalúan en la media de los términos de ruido del proceso y de la medición, que se supone que es cero. De lo contrario, la formulación de ruido no aditivo se implementa de la misma manera que el ruido aditivo EKF .

Filtro de Kalman extendido implícito

En ciertos casos, el modelo de observación de un sistema no lineal no se puede resolver , pero se puede expresar mediante la función implícita :

¿Dónde están las ruidosas observaciones?

El filtro de Kalman extendido convencional se puede aplicar con las siguientes sustituciones: [16] [17]

dónde:

Aquí se transforma la matriz de covarianza de observación original y la innovación se define de manera diferente. La matriz jacobiana se define como antes, pero determinada a partir del modelo de observación implícito .

Modificaciones

Filtro de Kalman extendido iterado

El filtro de Kalman extendido iterado mejora la linealización del filtro de Kalman extendido modificando recursivamente el punto central de la expansión de Taylor. Esto reduce el error de linealización a costa de mayores requisitos computacionales. [17]

Robusto filtro Kalman extendido

El filtro de Kalman extendido robusto surge al linealizar el modelo de señal sobre la estimación del estado actual y usar el filtro de Kalman lineal para predecir la siguiente estimación. Esto intenta producir un filtro localmente óptimo; sin embargo, no es necesariamente estable porque no se garantiza que las soluciones de la ecuación de Riccati subyacente sean definidas positivas. Una forma de mejorar el rendimiento es la falsa técnica algebraica de Riccati [18] que intercambia optimización por estabilidad. Se conserva la estructura familiar del filtro de Kalman extendido, pero la estabilidad se logra seleccionando una solución definida positiva a una falsa ecuación algebraica de Riccati para el diseño de ganancia.

Otra forma de mejorar el rendimiento del filtro Kalman extendido es emplear los resultados H-infinito de un control robusto. Los filtros robustos se obtienen agregando un término definido positivo a la ecuación de diseño de Riccati. [19] El término adicional está parametrizado por un escalar que el diseñador puede modificar para lograr un equilibrio entre los criterios de rendimiento del error cuadrático medio y del error máximo.

Filtro de Kalman extendido invariante

El filtro de Kalman extendido invariante (IEKF) es una versión modificada del EKF para sistemas no lineales que poseen simetrías (o invariancias ). Combina las ventajas tanto del EKF como de los filtros de preservación de simetría recientemente introducidos . En lugar de utilizar un término de corrección lineal basado en un error de salida lineal, el IEKF utiliza un término de corrección adaptado geométricamente basado en un error de salida invariante; de la misma manera la matriz de ganancia no se actualiza a partir de un error de estado lineal, sino de un error de estado invariante. El principal beneficio es que las ecuaciones de ganancia y covarianza convergen a valores constantes en un conjunto de trayectorias mucho mayor que los puntos de equilibrio, como es el caso del EKF, lo que resulta en una mejor convergencia de la estimación.

Filtros Kalman sin perfume

Un filtro Kalman no lineal que parece prometedor como mejora con respecto al EKF es el filtro Kalman sin perfume (UKF). En el UKF, la densidad de probabilidad se aproxima mediante un muestreo determinista de puntos que representan la distribución subyacente como gaussiana . La transformación no lineal de estos puntos pretende ser una estimación de la distribución posterior, cuyos momentos pueden derivarse luego de las muestras transformadas. La transformación se conoce como transformación sin perfume . El UKF tiende a ser más robusto y preciso que el EKF en su estimación del error en todas las direcciones.

"El filtro de Kalman extendido (EKF) es probablemente el algoritmo de estimación más utilizado para sistemas no lineales. Sin embargo, más de 35 años de experiencia en la comunidad de estimación han demostrado que es difícil de implementar, de ajustar y sólo confiable para sistemas que son casi lineales en la escala de tiempo de las actualizaciones. Muchas de estas dificultades surgen del uso de la linealización". [1]

Un artículo de 2012 incluye resultados de simulación que sugieren que algunas variantes publicadas del UKF no son tan precisas como el filtro de Kalman extendido de segundo orden (SOEKF), también conocido como filtro de Kalman aumentado. [20] El SOEKF es anterior al UKF en aproximadamente 35 años con la dinámica de momento descrita por primera vez por Bass et al. [21] La dificultad para implementar filtros de tipo Kalman para transiciones de estado no lineales se debe a los problemas de estabilidad numérica necesarios para la precisión; [22] sin embargo, el UKF no escapa a esta dificultad porque también utiliza la linealización, es decir, la regresión lineal. Los problemas de estabilidad del UKF generalmente surgen de la aproximación numérica a la raíz cuadrada de la matriz de covarianza, mientras que los problemas de estabilidad tanto del EKF como del SOEKF surgen de posibles problemas en la aproximación de la serie de Taylor a lo largo de la trayectoria.

Conjunto de filtro Kalman

De hecho, el UKF fue anterior al filtro Ensemble Kalman , inventado por Evensen en 1994. Tiene la ventaja sobre el UKF de que el número de miembros del conjunto utilizados puede ser mucho menor que la dimensión estatal, lo que permite aplicaciones en sistemas de muy altas dimensiones. , como la predicción del tiempo, con tamaños de espacio de estados de mil millones o más.

Filtro de Kalman difuso

Recientemente se propuso un filtro difuso de Kalman con un nuevo método para representar distribuciones de posibilidades para reemplazar las distribuciones de probabilidad por distribuciones de posibilidades con el fin de obtener un filtro posibilista genuino, permitiendo el uso de ruidos de proceso y observación no simétricos, así como mayores imprecisiones tanto en el proceso como en el proceso. modelos de observación. [23]

Ver también

Referencias

  1. ^ ab Julier, SJ; Uhlmann, JK (2004). "Filtrado sin perfume y estimación no lineal" (PDF) . Actas del IEEE . 92 (3): 401–422. doi :10.1109/jproc.2003.823141. S2CID  9614092.
  2. ^ Cursos, E.; Encuestas, T. (2006). "Filtros Sigma-Point: una descripción general con aplicaciones para la navegación integrada y el control asistido por visión". 2006 Taller de procesamiento de señales estadísticas no lineales del IEEE . págs. 201-202. doi :10.1109/NSSPW.2006.4378854. ISBN 978-1-4244-0579-4. S2CID  18535558.
  3. ^ RE Kalman (1960). "Contribuciones a la teoría del control óptimo". bol. Soc. Estera. Mexicana : 102-119. CiteSeerX 10.1.1.26.4070 . 
  4. ^ RE Kalman (1960). "Un nuevo enfoque para los problemas de predicción y filtrado lineal" (PDF) . Revista de Ingeniería Básica . 82 : 35–45. doi : 10.1115/1.3662552. S2CID  1242324.
  5. ^ RE Kalman; RS Bucy (1961). "Nuevos resultados en teoría de predicción y filtrado lineal" (PDF) . Revista de Ingeniería Básica . 83 : 95-108. doi :10.1115/1.3658902. S2CID  8141345.
  6. ^ Bruce A. McElhoe (1966). "Una evaluación de la navegación y correcciones de rumbo para un sobrevuelo tripulado a Marte o Venus". Transacciones IEEE sobre sistemas aeroespaciales y electrónicos . 2 (4): 613–623. Código Bib :1966ITAES...2..613M. doi :10.1109/TAES.1966.4501892. S2CID  51649221.
  7. ^ GL Smith; SF Schmidt y LA McGee (1962). "Aplicación de la teoría de filtros estadísticos a la estimación óptima de posición y velocidad a bordo de un vehículo circunlunar". Administración Nacional de Aeronáutica y Espacio.
  8. ^ Huang, Guoquan P; Mourikis, Anastasio I; Roumeliotis, Stergios I (2008). "Análisis y mejora de la consistencia de SLAM basado en filtro de Kalman extendido". Robótica y Automatización, 2008. ICRA 2008. Conferencia Internacional IEEE sobre . págs. 473–479. doi :10.1109/ROBOT.2008.4543252.
  9. ^ M. Hazewinkel, SI Marcus, HJ Sussmann (1983). Inexistencia de filtros de dimensión finita para la estadística condicional del problema del sensor cúbico. Cartas de sistemas y control 3(6), páginas 331-340, https://doi.org/10.1016/0167-6911(83)90074-9.
  10. ^ Brigo, Damián ; Hanzón, Bernard; LeGland, Francois (1998). "Un enfoque geométrico diferencial para el filtrado no lineal: el filtro de proyección" (PDF) . Transacciones IEEE sobre control automático . 43 (2): 247–252. doi : 10.1109/9.661075.
  11. ^ Armstrong, Juan; Brigo, Damián (2016). "Filtrado no lineal mediante proyección estocástica de PDE en colectores de mezcla en métrica directa L2". Matemáticas de Control, Señales y Sistemas . 28 (1): 1–33. doi :10.1007/s00498-015-0154-1. hdl : 10044/1/30130 . S2CID  42796459.
  12. ^ Azimi-Sadjadi, Babak; Krishnaprasad, PS (2005). "Filtrado no lineal aproximado y su aplicación en la navegación". Automática . 41 (6): 945–956. doi :10.1016/j.automatica.2004.12.013.
  13. ^ Marrón, Robert Grover; Hwang, Patrick YC (1997). Introducción a las señales aleatorias y el filtrado de Kalman aplicado (3 ed.). Nueva York: John Wiley & Sons. págs. 289–293. ISBN 978-0-471-12839-7.
  14. ^ Einicke, GA (2019). Suavizado, filtrado y predicción: estimación del pasado, presente y futuro (2ª ed.) . Publicación de Amazon Prime. ISBN 978-0-6485115-0-2.
  15. ^ Simón, Dan (2006). Estimación del estado óptimo . Hoboken, Nueva Jersey: John Wiley & Sons. ISBN 978-0-471-70858-2.
  16. ^ Quan, Quan (2017). Introducción al diseño y control de multicópteros . Singapur: Springer. ISBN 978-981-10-3382-7.
  17. ^ ab Zhang, Zhengyou (1997). "Técnicas de estimación de parámetros: un tutorial con aplicación al ajuste cónico" (PDF) . Computación de Imagen y Visión . 15 (1): 59–76. doi :10.1016/s0262-8856(96)01112-2. ISSN  0262-8856.
  18. ^ Einicke, GA; Blanco, libra; Bitmead, RR (septiembre de 2003). "El uso de ecuaciones algebraicas falsas de Riccati para la demodulación cocanal". Traducción IEEE. Proceso de señal . 51 (9): 2288–2293. Código Bib : 2003ITSP...51.2288E. doi :10.1109/tsp.2003.815376. hdl : 2440/2403 .
  19. ^ Einicke, GA; White, LB (septiembre de 1999). "Filtrado de Kalman extendido y robusto". Traducción IEEE. Proceso de señal . 47 (9): 2596–2599. Código bibliográfico : 1999ITSP...47.2596E. doi : 10.1109/78.782219.
  20. ^ Gustafsson, F.; Hendeby, G.; "Algunas relaciones entre los filtros Kalman extendidos y sin perfume", Signal Processing, IEEE Transactions on, vol.60, no.2, pp.545-555, febrero de 2012
  21. ^ R. Bass, V. Norum y L. Schwartz, “Filtrado no lineal multicanal óptimo (problema de filtrado no lineal multicanal óptimo de estimación de varianza mínima del estado de un sistema no lineal de n dimensiones sujeto a perturbaciones estocásticas)”, J. Análisis y aplicaciones matemáticas , vol. 16, págs. 152-164, 1966
  22. ^ Mohinder S. Grewal; Angus P. Andrews (2 de febrero de 2015). Filtrado de Kalman: teoría y práctica con MATLAB. John Wiley e hijos. ISBN 978-1-118-98496-3.
  23. ^ Matía, F.; Jiménez, V.; Alvarado, BP; Haber, R. (enero de 2021). " El filtro difuso de Kalman: mejorar su implementación reformulando la representación de la incertidumbre ". Sistema de conjuntos difusos . 402 : 78-104. doi :10.1016/j.fss.2019.10.015. S2CID  209913435.

Otras lecturas

enlaces externos