stringtranslate.com

Filtro Kalman extendido

En teoría de estimación , el filtro de Kalman extendido ( EKF ) es la versión no lineal del filtro de Kalman que linealiza alrededor de una estimación de la media y la covarianza actuales . En el caso de modelos de transición bien definidos, el EKF se ha considerado [1] el estándar de facto en la teoría de estimación de estado no lineal, sistemas de navegación y GPS . [2]

Historia

Los artículos que establecen las bases matemáticas de los filtros de tipo Kalman se publicaron entre 1959 y 1961. [3] [4] [5] El filtro de Kalman es el estimador lineal óptimo para modelos de sistemas lineales con ruido blanco independiente aditivo tanto en los sistemas de transición como de medición. Desafortunadamente, en ingeniería, la mayoría de los sistemas son no lineales , por lo que se intentó aplicar este método de filtrado a sistemas no lineales; la mayor parte de este trabajo se realizó en NASA Ames . [6] [7] El EKF adaptó técnicas del cálculo , a saber, expansiones de series de Taylor multivariadas , para linealizar un modelo sobre un punto de trabajo. Si el modelo del sistema (como se describe a continuación) no se conoce bien o es inexacto, entonces se emplean métodos de Monte Carlo , especialmente filtros de partículas , para la estimación. Las técnicas de Monte Carlo son anteriores a la existencia del EKF, pero son más costosas computacionalmente para cualquier espacio de estados de dimensión moderada .

Formulación

En el filtro de Kalman extendido, los modelos de transición de estado y de observación no necesitan ser funciones lineales del estado, sino que pueden ser funciones diferenciables .

Aquí w k y v k son los ruidos de proceso y de observación, que se supone que son ruidos gaussianos multivariados de media cero con covarianza Q k y R k respectivamente. u k es el vector de control.

La función f se puede utilizar para calcular el estado predicho a partir de la estimación anterior y, de manera similar, la función h se puede utilizar para calcular la medida predicha a partir del estado predicho. Sin embargo, f y h no se pueden aplicar a la covarianza directamente. En su lugar, se calcula una matriz de derivadas parciales (la jacobiana ).

En cada paso de tiempo, el jacobiano se evalúa con los estados predichos actuales. Estas matrices se pueden utilizar en las ecuaciones de filtro de Kalman. Este proceso esencialmente linealiza la función no lineal en torno a la estimación actual.

Consulte el artículo sobre el filtro de Kalman para obtener observaciones sobre la notación.

Ecuaciones de predicción y actualización en tiempo discreto

La notación representa la estimación de un número determinado de observaciones en el tiempo n hasta el tiempo mn inclusive .

Predecir

Actualizar

donde las matrices de transición de estado y de observación se definen como los siguientes jacobianos

Desventajas y alternativas

A diferencia de su contraparte lineal, el filtro de Kalman extendido en general no es un estimador óptimo (es óptimo si la medición y el modelo de transición de estado son ambos lineales, ya que en ese caso el filtro de Kalman extendido es idéntico al regular). Además, si la estimación inicial del estado es errónea, o si el proceso está modelado incorrectamente, el filtro puede divergir rápidamente, debido a su linealización. Otro problema con el filtro de Kalman extendido es que la matriz de covarianza estimada tiende a subestimar la matriz de covarianza verdadera y, por lo tanto, corre el riesgo de volverse inconsistente en el sentido estadístico sin la adición de "ruido estabilizador" [8] .

En términos más generales, se debe considerar la naturaleza de dimensión infinita del problema de filtrado no lineal y la inadecuación de un estimador simple de media y varianza-covarianza para representar completamente el filtro óptimo. También se debe tener en cuenta que el filtro Kalman extendido puede dar malos resultados incluso para sistemas unidimensionales muy simples, como el sensor cúbico [9] , donde el filtro óptimo puede ser bimodal [10] y, como tal, no se puede representar de manera efectiva mediante un único estimador de media y varianza, que tenga una estructura rica, o de manera similar para el sensor cuadrático [11] . En tales casos, los filtros de proyección se han estudiado como una alternativa, habiéndose aplicado también a la navegación [12 ]. En este caso, se pueden considerar otros métodos generales de filtrado no lineal, como los filtros de partículas completos.

Dicho esto, el filtro Kalman extendido puede ofrecer un rendimiento razonable y podría decirse que es el estándar de facto en los sistemas de navegación y GPS.

Generalizaciones

Filtro de Kalman extendido de tiempo continuo

Modelo

Inicializar

Predecir-Actualizar

A diferencia del filtro de Kalman extendido de tiempo discreto, los pasos de predicción y actualización están acoplados en el filtro de Kalman extendido de tiempo continuo. [13]

Mediciones de tiempo discreto

La mayoría de los sistemas físicos se representan como modelos de tiempo continuo, mientras que las mediciones de tiempo discreto se toman con frecuencia para la estimación del estado a través de un procesador digital. Por lo tanto, el modelo del sistema y el modelo de medición se dan por

dónde .

Inicializar

Predecir

dónde

Actualizar

dónde

Las ecuaciones de actualización son idénticas a las del filtro de Kalman extendido de tiempo discreto.

Filtros de Kalman extendidos de orden superior

La recursión anterior es un filtro de Kalman extendido de primer orden (EKF). Se pueden obtener EKF de orden superior reteniendo más términos de las expansiones de la serie de Taylor. Por ejemplo, se han descrito EKF de segundo y tercer orden. [14] Sin embargo, los EKF de orden superior tienden a proporcionar beneficios de rendimiento solo cuando el ruido de medición es pequeño.

Formulación y ecuaciones de ruido no aditivo

La formulación típica del EKF supone la suposición de ruido aditivo en el proceso y en la medición. Sin embargo, esta suposición no es necesaria para la implementación del EKF . [15] En cambio, considere un sistema más general de la forma:

Aquí w k y v k son los ruidos de proceso y de observación, que se supone que son ruidos gaussianos multivariados de media cero con covarianza Q k y R k respectivamente. Entonces, las ecuaciones de predicción de covarianza y de innovación se convierten en

donde las matrices y son matrices jacobianas:

La estimación del estado previsto y el residuo de medición se evalúan en la media de los términos de ruido de proceso y medición, que se supone que es cero. De lo contrario, la formulación de ruido no aditivo se implementa de la misma manera que la formulación de ruido aditivo EKF .

Filtro de Kalman extendido implícito

En ciertos casos, el modelo de observación de un sistema no lineal no se puede resolver para , pero se puede expresar mediante la función implícita :

¿Dónde están las observaciones ruidosas?

El filtro de Kalman extendido convencional se puede aplicar con las siguientes sustituciones: [16] [17]

dónde:

En este caso, se transforma la matriz de covarianza de la observación original y se define la innovación de forma diferente. La matriz jacobiana se define como antes, pero se determina a partir del modelo de observación implícito .

Modificaciones

Filtro de Kalman extendido iterado

El filtro de Kalman extendido iterado mejora la linealización del filtro de Kalman extendido modificando recursivamente el punto central de la expansión de Taylor. Esto reduce el error de linealización a costa de mayores requisitos computacionales. [17]

Filtro Kalman extendido y robusto

El filtro Kalman extendido robusto surge al linealizar el modelo de señal sobre la estimación del estado actual y usar el filtro Kalman lineal para predecir la próxima estimación. Esto intenta producir un filtro localmente óptimo, sin embargo, no es necesariamente estable porque no se garantiza que las soluciones de la ecuación de Riccati subyacente sean definidas positivas. Una forma de mejorar el rendimiento es la técnica de Riccati algebraica falsa [18] que intercambia optimalidad por estabilidad. La estructura familiar del filtro Kalman extendido se conserva, pero la estabilidad se logra seleccionando una solución definida positiva para una ecuación de Riccati algebraica falsa para el diseño de ganancia.

Otra forma de mejorar el rendimiento del filtro Kalman extendido es emplear los resultados H-infinito del control robusto. Los filtros robustos se obtienen añadiendo un término definido positivo a la ecuación de Riccati de diseño. [19] El término adicional está parametrizado por un escalar que el diseñador puede ajustar para lograr un equilibrio entre los criterios de rendimiento de error cuadrático medio y error máximo.

Filtro de Kalman extendido invariante

El filtro de Kalman extendido invariante (IEKF) es una versión modificada del EKF para sistemas no lineales que poseen simetrías (o invariancias ). Combina las ventajas tanto del EKF como de los filtros de conservación de simetría introducidos recientemente . En lugar de utilizar un término de corrección lineal basado en un error de salida lineal, el IEKF utiliza un término de corrección adaptado geométricamente basado en un error de salida invariante; de ​​la misma manera, la matriz de ganancia no se actualiza a partir de un error de estado lineal, sino de un error de estado invariante. El principal beneficio es que las ecuaciones de ganancia y covarianza convergen a valores constantes en un conjunto mucho más grande de trayectorias que los puntos de equilibrio, como es el caso del EKF, lo que da como resultado una mejor convergencia de la estimación.

Filtros Kalman sin perfume

Un filtro de Kalman no lineal que promete ser una mejora con respecto al EKF es el filtro de Kalman sin aroma (UKF). En el UKF, la densidad de probabilidad se aproxima mediante un muestreo determinista de puntos que representan la distribución subyacente como una gaussiana . La transformación no lineal de estos puntos pretende ser una estimación de la distribución posterior , cuyos momentos se pueden derivar a partir de las muestras transformadas. La transformación se conoce como la transformación sin aroma . El UKF tiende a ser más robusto y más preciso que el EKF en su estimación del error en todas las direcciones.

"El filtro de Kalman extendido (EKF) es probablemente el algoritmo de estimación más utilizado para sistemas no lineales. Sin embargo, más de 35 años de experiencia en la comunidad de estimación han demostrado que es difícil de implementar, difícil de ajustar y sólo confiable para sistemas que son casi lineales en la escala de tiempo de las actualizaciones. Muchas de estas dificultades surgen de su uso de la linealización". [1]

Un artículo de 2012 incluye resultados de simulación que sugieren que algunas variantes publicadas del UKF no son tan precisas como el Filtro Kalman Extendido de Segundo Orden (SOEKF), también conocido como el filtro Kalman aumentado. [20] El SOEKF es anterior al UKF por aproximadamente 35 años con la dinámica de momentos descrita por primera vez por Bass et al. [21] La dificultad en la implementación de cualquier filtro de tipo Kalman para transiciones de estado no lineales se deriva de los problemas de estabilidad numérica requeridos para la precisión, [22] sin embargo, el UKF no escapa a esta dificultad ya que también utiliza linealización, es decir, regresión lineal . Los problemas de estabilidad para el UKF generalmente se derivan de la aproximación numérica a la raíz cuadrada de la matriz de covarianza, mientras que los problemas de estabilidad tanto para el EKF como para el SOEKF se derivan de posibles problemas en la aproximación de la Serie de Taylor a lo largo de la trayectoria.

Filtro Kalman de conjunto

De hecho, el UKF fue precedido por el filtro Kalman de conjunto , inventado por Evensen en 1994. Tiene la ventaja sobre el UKF de que el número de miembros del conjunto utilizados puede ser mucho menor que la dimensión del estado, lo que permite aplicaciones en sistemas de dimensiones muy altas, como la predicción del tiempo, con tamaños de espacio de estados de mil millones o más.

Filtro de Kalman difuso

Recientemente se propuso un filtro difuso de Kalman con un nuevo método para representar distribuciones de posibilidad, con el fin de reemplazar distribuciones de probabilidad por distribuciones de posibilidad para obtener un filtro posibilista genuino, que permita el uso de ruidos de procesos y observaciones no simétricos, así como mayores imprecisiones tanto en los modelos de procesos como de observación. [23]

Véase también

Referencias

  1. ^ ab Julier, SJ; Uhlmann, JK (2004). "Filtrado sin aroma y estimación no lineal" (PDF) . Actas del IEEE . 92 (3): 401–422. doi :10.1109/jproc.2003.823141. S2CID  9614092.
  2. ^ Cursos, E.; Encuestas, T. (2006). "Filtros de punto sigma: una descripción general con aplicaciones para la navegación integrada y el control asistido por visión". Taller sobre procesamiento de señales estadísticas no lineales del IEEE de 2006. págs. 201–202. doi :10.1109/NSSPW.2006.4378854. ISBN 978-1-4244-0579-4.S2CID 18535558  .
  3. ^ RE Kalman (1960). "Contribuciones a la teoría del control óptimo". Bol. Soc. Mat. Mexicana : 102–119. CiteSeerX 10.1.1.26.4070 . 
  4. ^ RE Kalman (1960). "Un nuevo enfoque para problemas de filtrado y predicción lineal" (PDF) . Journal of Basic Engineering . 82 : 35–45. doi :10.1115/1.3662552. S2CID  1242324.
  5. ^ RE Kalman; RS Bucy (1961). "Nuevos resultados en filtrado lineal y teoría de predicción" (PDF) . Journal of Basic Engineering . 83 : 95–108. doi :10.1115/1.3658902. S2CID  8141345.
  6. ^ Bruce A. McElhoe (1966). "Una evaluación de la navegación y las correcciones de rumbo para un sobrevuelo tripulado de Marte o Venus". IEEE Transactions on Aerospace and Electronic Systems . 2 (4): 613–623. Bibcode :1966ITAES...2..613M. doi :10.1109/TAES.1966.4501892. S2CID  51649221.
  7. ^ GL Smith; SF Schmidt y LA McGee (1962). "Aplicación de la teoría de filtros estadísticos a la estimación óptima de la posición y la velocidad a bordo de un vehículo circunlunar". Administración Nacional de Aeronáutica y del Espacio.
  8. ^ Huang, Guoquan P; Mourikis, Anastasios I; Roumeliotis, Stergios I (2008). "Análisis y mejora de la consistencia de SLAM basado en filtros Kalman extendidos". Robótica y automatización, 2008. ICRA 2008. IEEE International Conference on . págs. 473–479. doi :10.1109/ROBOT.2008.4543252.
  9. ^ M. Hazewinkel, SI Marcus, HJ Sussmann (1983). Inexistencia de filtros de dimensión finita para estadísticas condicionales del problema del sensor cúbico. Systems & Control Letters 3(6), páginas 331-340, https://doi.org/10.1016/0167-6911(83)90074-9.
  10. ^ Brigo, Damiano ; Hanzon, Bernard; LeGland, Francois (1998). "Un enfoque geométrico diferencial para el filtrado no lineal: el filtro de proyección" (PDF) . IEEE Transactions on Automatic Control . 43 (2): 247–252. doi :10.1109/9.661075.
  11. ^ Armstrong, John; Brigo, Damiano (2016). "Filtrado no lineal mediante proyección de EDP estocástica en variedades de mezcla en métrica directa L2". Matemáticas de control, señales y sistemas . 28 (1): 1–33. Bibcode :2016MCSS...28....5A. doi :10.1007/s00498-015-0154-1. hdl : 10044/1/30130 . S2CID  42796459.
  12. ^ Azimi-Sadjadi, Babak; Krishnaprasad, PS (2005). "Filtrado no lineal aproximado y su aplicación en la navegación". Automática . 41 (6): 945–956. doi :10.1016/j.automatica.2004.12.013.
  13. ^ Brown, Robert Grover; Hwang, Patrick YC (1997). Introducción a las señales aleatorias y al filtrado de Kalman aplicado (3.ª ed.). Nueva York: John Wiley & Sons. pp. 289–293. ISBN 978-0-471-12839-7.
  14. ^ Einicke, GA (2019). Suavizado, filtrado y predicción: estimación del pasado, el presente y el futuro (2.ª ed.) . Amazon Prime Publishing. ISBN 978-0-6485115-0-2.
  15. ^ Simon, Dan (2006). Estimación del estado óptimo . Hoboken, Nueva Jersey: John Wiley & Sons. ISBN 978-0-471-70858-2.
  16. ^ Quan, Quan (2017). Introducción al diseño y control de multicópteros . Singapur: Springer. ISBN 978-981-10-3382-7.
  17. ^ ab Zhang, Zhengyou (1997). "Técnicas de estimación de parámetros: un tutorial con aplicación al ajuste cónico" (PDF) . Image and Vision Computing . 15 (1): 59–76. doi :10.1016/s0262-8856(96)01112-2. ISSN  0262-8856.
  18. ^ Einicke, GA; White, LB; Bitmead, RR (septiembre de 2003). "El uso de ecuaciones de Riccati algebraicas falsas para la demodulación cocanal". IEEE Trans. Signal Process . 51 (9): 2288–2293. Bibcode :2003ITSP...51.2288E. doi :10.1109/tsp.2003.815376. hdl : 2440/2403 .
  19. ^ Einicke, GA; White, LB (septiembre de 1999). "Filtrado de Kalman robusto y extendido". IEEE Trans. Signal Process . 47 (9): 2596–2599. Bibcode :1999ITSP...47.2596E. doi :10.1109/78.782219.
  20. ^ Gustafsson, F.; Hendeby, G.; "Algunas relaciones entre filtros Kalman extendidos y no perfumados", Procesamiento de señales, IEEE Transactions on, vol. 60, n.º 2, págs. 545-555, febrero de 2012
  21. ^ R. Bass, V. Norum y L. Schwartz, “Filtrado no lineal multicanal óptimo (problema de filtrado no lineal multicanal óptimo de estimación de varianza mínima del estado de un sistema no lineal n-dimensional sujeto a perturbación estocástica)”, J. Mathematical Analysis and Applications, vol. 16, págs. 152-164, 1966
  22. ^ Mohinder S. Grewal; Angus P. Andrews (2 de febrero de 2015). Filtrado de Kalman: teoría y práctica con MATLAB. John Wiley & Sons. ISBN 978-1-118-98496-3.
  23. ^ Matía, F.; Jiménez, V.; Alvarado, BP; Haber, R. (enero de 2021). « El filtro difuso de Kalman: Mejorando su implementación reformulando la representación de la incertidumbre ». Fuzzy Sets Syst . 402 : 78–104. doi :10.1016/j.fss.2019.10.015. S2CID  209913435.

Lectura adicional

Enlaces externos