stringtranslate.com

Transformación sin perfume

La transformada sin aroma (UT) es una función matemática utilizada para estimar el resultado de aplicar una transformación no lineal dada a una distribución de probabilidad que se caracteriza sólo en términos de un conjunto finito de estadísticas. El uso más común de la transformada sin aroma es en la proyección no lineal de estimaciones de media y covarianza en el contexto de extensiones no lineales del filtro de Kalman . Su creador, Jeffrey Uhlmann, explicó que "sin perfume" era un nombre arbitrario que adoptó para evitar que lo llamaran "filtro Uhlmann". [1]

Fondo

Muchos métodos de filtrado y control representan estimaciones del estado de un sistema en forma de un vector medio y una matriz de covarianza de error asociada. Como ejemplo, la posición bidimensional estimada de un objeto de interés podría representarse mediante un vector de posición media, con una incertidumbre dada en forma de una matriz de covarianza de 2x2 que proporciona la varianza en , la varianza en y la covarianza cruzada. entre los dos. Una covarianza cero implica que no hay incertidumbre ni error y que la posición del objeto es exactamente la especificada por el vector medio.

La representación de la media y la covarianza solo proporciona los dos primeros momentos de una distribución de probabilidad subyacente, pero por lo demás desconocida. En el caso de un objeto en movimiento, la distribución de probabilidad desconocida podría representar la incertidumbre de la posición del objeto en un momento dado. La representación de la incertidumbre en media y covarianza es matemáticamente conveniente porque cualquier transformación lineal se puede aplicar a un vector de media y una matriz de covarianza como y . Esta propiedad de linealidad no se cumple para los momentos más allá del primer momento bruto (la media) y el segundo momento central (la covarianza), por lo que generalmente no es posible determinar la media y la covarianza resultantes de una transformación no lineal porque el resultado depende de todos los momentos, y sólo se dan los dos primeros.

Aunque la matriz de covarianza a menudo se trata como el error cuadrático esperado asociado con la media, en la práctica la matriz se mantiene como un límite superior del error cuadrático real. Específicamente, se mantiene de manera conservadora una estimación de media y covarianza de modo que la matriz de covarianza sea mayor o igual que el error cuadrado real asociado con . Matemáticamente, esto significa que el resultado de restar el error cuadrático esperado (que generalmente no se conoce) es una matriz semidefinida o definida positiva . La razón para mantener una estimación de covarianza conservadora es que la mayoría de los algoritmos de filtrado y control tenderán a divergir (fallar) si se subestima la covarianza. Esto se debe a que una covarianza falsamente pequeña implica menos incertidumbre y lleva al filtro a otorgar más importancia (confianza) de la justificada a la precisión de la media.

Volviendo al ejemplo anterior, cuando la covarianza es cero, es trivial determinar la ubicación del objeto después de que se mueve según una función no lineal arbitraria : basta con aplicar la función al vector medio. Cuando la covarianza no es cero, la media transformada generalmente no será igual y ni siquiera es posible determinar la media de la distribución de probabilidad transformada únicamente a partir de su media y covarianza anteriores. Dada esta indeterminación, la media y la covarianza transformadas no linealmente sólo pueden aproximarse. La primera aproximación fue linealizar la función no lineal y aplicar la matriz jacobiana resultante a la media y la covarianza dadas. Esta es la base del filtro de Kalman extendido (EKF), y aunque se sabía que daba malos resultados en muchas circunstancias, durante muchas décadas no hubo una alternativa práctica.

Motivación para la transformación sin perfume

En 1994, Jeffrey Uhlmann señaló que el EKF toma una función no lineal e información de distribución parcial (en forma de estimación de media y covarianza) del estado de un sistema, pero aplica una aproximación a la función conocida en lugar de a la distribución de probabilidad conocida de manera imprecisa. . Sugirió que un mejor enfoque sería utilizar la función no lineal exacta aplicada a una distribución de probabilidad aproximada. La motivación para este enfoque se da en su tesis doctoral, donde se definió por primera vez el término transformación sin perfume : [2]

Considere la siguiente intuición: con un número fijo de parámetros debería ser más fácil aproximar una distribución dada que aproximar una función/transformación no lineal arbitraria . Siguiendo esta intuición, el objetivo es encontrar una parametrización que capture la información de media y covarianza y al mismo tiempo permita la propagación directa de la información a través de un conjunto arbitrario de ecuaciones no lineales. Esto se puede lograr generando una distribución discreta que tenga el mismo primer y segundo momento (y posiblemente mayores), donde cada punto de la aproximación discreta se pueda transformar directamente. Luego, la media y la covarianza del conjunto transformado se pueden calcular como la estimación de la transformación no lineal de la distribución original. De manera más general, la aplicación de una transformación no lineal dada a una distribución discreta de puntos, calculada para capturar un conjunto de estadísticas conocidas de una distribución desconocida, se conoce como transformación sin aroma .

En otras palabras, la información de media y covarianza dada se puede codificar exactamente en un conjunto de puntos, denominados puntos sigma , que, si se tratan como elementos de una distribución de probabilidad discreta, tienen una media y una covarianza iguales a la media y la covarianza dadas. Esta distribución se puede propagar exactamente aplicando la función no lineal a cada punto. La media y la covarianza del conjunto de puntos transformados representan entonces la estimación transformada deseada. La principal ventaja de este enfoque es que se aprovecha al máximo la función no lineal, a diferencia del EKF que la reemplaza por una lineal. Eliminar la necesidad de linealización también proporciona ventajas independientes de cualquier mejora en la calidad de la estimación. Una ventaja inmediata es que la UT se puede aplicar con cualquier función determinada, mientras que la linealización puede no ser posible para funciones que no son diferenciables. Una ventaja práctica es que la UT puede ser más fácil de implementar porque evita la necesidad de derivar e implementar una matriz jacobiana linealizante.

puntos sigma

Para calcular la transformación sin aroma, primero hay que elegir un conjunto de puntos sigma. Desde el trabajo fundamental de Uhlmann, se han propuesto en la literatura muchos conjuntos diferentes de puntos sigma. Se puede encontrar una revisión exhaustiva de estas variantes en el trabajo de Menegaz et al. [3] En general, los puntos sigma son necesarios y suficientes para definir una distribución discreta que tiene una media y una covarianza determinadas en las dimensiones. [2]

Un conjunto canónico de puntos sigma es el conjunto simétrico propuesto originalmente por Uhlmann. Considere los vértices de un triángulo equilátero centrado en el origen en dos dimensiones:

Se puede verificar que el conjunto de puntos anterior tiene media y covarianza (la matriz de identidad). Dada cualquier media y covarianza bidimensional, los puntos sigma deseados se pueden obtener multiplicando cada punto por la raíz cuadrada de la matriz y sumando . Se puede generar un conjunto canónico similar de puntos sigma en cualquier número de dimensiones tomando el vector cero y los puntos que comprenden las filas de la matriz identidad, calculando la media del conjunto de puntos, restando la media de cada punto de modo que el resultado conjunto tiene una media de cero, luego se calcula la covarianza del conjunto de puntos de media cero y se aplica su inverso a cada punto de modo que la covarianza del conjunto sea igual a la identidad.

Uhlmann demostró que es posible generar convenientemente un conjunto simétrico de puntos sigma a partir de las columnas de y el vector cero, donde está la matriz de covarianza dada, sin tener que calcular una matriz inversa. Es computacionalmente eficiente y, debido a que los puntos forman una distribución simétrica, captura el tercer momento central (el sesgo) siempre que se conozca o se pueda suponer que la distribución subyacente de la estimación del estado es simétrica. [2] También demostró que los pesos, incluidos los pesos negativos, se pueden utilizar para afectar las estadísticas del conjunto. Julier también desarrolló y examinó técnicas para generar puntos sigma para capturar el tercer momento (la inclinación) de una distribución arbitraria y el cuarto momento (la curtosis) de una distribución simétrica. [4] [5]

Ejemplo

La transformada sin aroma se define para la aplicación de una función dada a cualquier caracterización parcial de una distribución que de otro modo sería desconocida, pero su uso más común es para el caso en el que solo se dan la media y la covarianza. Un ejemplo común es la conversión de un sistema de coordenadas a otro, como por ejemplo de un sistema de coordenadas cartesianas a coordenadas polares. [4]

Supongamos que una estimación de covarianza y media bidimensional, , se da en coordenadas cartesianas con:

y la función de transformación a coordenadas polares, , es:

Multiplicando cada uno de los puntos sigma simplex canónicos (indicados anteriormente) por y sumando la media, se obtiene:

Aplicando la función de transformación a cada uno de los puntos anteriores se obtiene:

La media de estos tres puntos transformados, es la estimación UT de la media en coordenadas polares:

La estimación UT de la covarianza es:

donde cada término cuadrado de la suma es un producto exterior vectorial. Esto da:

Esto se puede comparar con la media linealizada y la covarianza:

La diferencia absoluta entre las estimaciones UT y linealizadas en este caso es relativamente pequeña, pero en aplicaciones de filtrado el efecto acumulativo de pequeños errores puede conducir a una divergencia irrecuperable de la estimación. El efecto de los errores se exacerba cuando se subestima la covarianza porque esto hace que el filtro confíe demasiado en la precisión de la media. En el ejemplo anterior se puede ver que la estimación de covarianza linealizada es menor que la estimación UT, lo que sugiere que la linealización probablemente ha producido una subestimación del error real en su media.

En este ejemplo, no hay forma de determinar la precisión absoluta de la UT y las estimaciones linealizadas sin la verdad fundamental en la forma de la distribución de probabilidad real asociada con la estimación original y la media y la covarianza de esa distribución después de la aplicación de la transformación no lineal (por ejemplo, , determinado analíticamente o mediante integración numérica). Dichos análisis se han realizado para transformaciones de coordenadas bajo el supuesto de gaussianidad para las distribuciones subyacentes, y las estimaciones UT tienden a ser significativamente más precisas que las obtenidas a partir de la linealización. [6] [7]

El análisis empírico ha demostrado que el uso del conjunto simplex mínimo de puntos sigma es significativamente menos preciso que el uso del conjunto simétrico de puntos cuando la distribución subyacente es gaussiana. [7] Esto sugiere que el uso del conjunto simplex en el ejemplo anterior no sería la mejor opción si la distribución subyacente asociada con él es simétrica. Incluso si la distribución subyacente no es simétrica, es probable que el conjunto simplex sea menos preciso que el conjunto simétrico porque la asimetría del conjunto simplex no coincide con la asimetría de la distribución real.

Volviendo al ejemplo, el conjunto simétrico mínimo de puntos sigma se puede obtener de la matriz de covarianza simplemente como el vector medio, más y menos las columnas de :

Esta construcción garantiza que la media y la covarianza de los cuatro puntos sigma anteriores son , lo cual es directamente verificable. Aplicando la función no lineal a cada uno de los puntos sigma se obtiene:

La media de estos cuatro puntos sigma transformados, es la estimación UT de la media en coordenadas polares:

La estimación UT de la covarianza es:

donde cada término al cuadrado de la suma es un producto exterior vectorial. Esto da:

La diferencia entre las estimaciones medias UT y linealizadas da una medida del efecto de la no linealidad de la transformación. Cuando la transformación es lineal, por ejemplo, las estimaciones UT y linealizadas serán idénticas. Esto motiva el uso del cuadrado de esta diferencia para agregarlo a la covarianza UT para evitar la subestimación del error real en la media. Este enfoque no mejora la precisión de la media, pero puede mejorar significativamente la precisión de un filtro con el tiempo al reducir la probabilidad de que se subestime la covarianza. [2]

Optimidad de la transformación sin perfume.

Uhlmann señaló que dadas sólo la media y la covarianza de una distribución de probabilidad desconocida, el problema de transformación está mal definido porque hay un número infinito de posibles distribuciones subyacentes con los mismos dos primeros momentos. Sin ninguna información o suposiciones a priori sobre las características de la distribución subyacente, cualquier elección de distribución utilizada para calcular la media transformada y la covarianza es tan razonable como cualquier otra. En otras palabras, no hay elección de distribución con una media y una covarianza dadas que sean superiores a las proporcionadas por el conjunto de puntos sigma, por lo que la transformada sin aroma es trivialmente óptima.

Esta afirmación general de optimización es, por supuesto, inútil para hacer afirmaciones cuantitativas sobre el rendimiento del UT, por ejemplo, en comparación con la linealización; en consecuencia, él, Julier y otros han realizado análisis bajo varios supuestos sobre las características de la distribución y/o la forma de la función de transformación no lineal. Por ejemplo, si la función es diferenciable, lo cual es esencial para la linealización, estos análisis validan la superioridad esperada y empíricamente corroborada de la transformada sin aroma. [6] [7]

Aplicaciones

La transformada sin aroma se puede utilizar para desarrollar una generalización no lineal del filtro de Kalman, conocida como filtro de Kalman sin aroma (UKF) . Este filtro ha reemplazado en gran medida al EKF en muchas aplicaciones de control y filtrado no lineal, incluso para navegación submarina, [8] terrestre y aérea, [9] y naves espaciales. [10] La transformada sin aroma también se ha utilizado como marco computacional para el control óptimo de Riemann-Stieltjes. [11] Este enfoque computacional se conoce como control óptimo sin aroma . [12] [13]

Filtro Kalman sin perfume

Uhlmann y Simon Julier publicaron varios artículos que muestran que el uso de la transformación sin perfume en un filtro Kalman , conocido como filtro Kalman sin perfume (UKF), proporciona mejoras significativas de rendimiento con respecto al EKF en una variedad de aplicaciones. [14] [4] [6] Julier y Uhlmann publicaron artículos utilizando una forma parametrizada particular de la transformación sin aroma en el contexto del UKF que utilizó pesos negativos para capturar información de distribución supuesta. [14] [6] Esa forma de la UT es susceptible a una variedad de errores numéricos que las formulaciones originales (el conjunto simétrico originalmente propuesto por Uhlmann) no sufren. Julier describió posteriormente formas parametrizadas que no utilizan pesos negativos y tampoco están sujetas a esos problemas. [15]

Ver también

Referencias

  1. ^ "De primera mano: The Unscented Transform - Wiki de historia de la ingeniería y la tecnología".
  2. ^ abcd Uhlmann, Jeffrey (1995). Construcción y localización de mapas dinámicos: nuevos fundamentos teóricos (tesis doctoral). Universidad de Oxford.
  3. ^ Menegaz, Henrique MT; João, Y. Ishihara; Borges, Geovany A.; Vargas, Alessandro N. (16 de febrero de 2015). "Una sistematización de la teoría del filtro de Kalman sin perfume". Transacciones IEEE sobre control automático . 60 (10): 2583–2598. doi :10.1109/TAC.2015.2404511. hdl : 20.500.11824/251 . S2CID  12606055.
  4. ^ abc Julier, S.; J. Uhlmann (1997). "Método consistente y desviado para la conversión entre sistemas de coordenadas polares y cartesianas". Actas de la Conferencia SPIE de 1997 sobre adquisición, seguimiento y señalización . vol. 3086. ESPÍA.
  5. ^ Julier, Simón (1998). "Un enfoque sesgado del filtrado". Las actas del 12º Internacional. Síntoma. Sobre sensores, simulación y controles aeroespaciales/de defensa . vol. 3373. ESPÍA.
  6. ^ abcd Julier, Simón; Uhlmann, Jeffrey (2000). "Un nuevo método para la transformación no lineal de medias y covarianzas en filtros no lineales". Transacciones IEEE sobre control automático . 45 (3): 477–482. doi : 10.1109/9.847726.
  7. ^ abc Zhang, W.; M. Liu; Z. Zhao (2009). "Análisis de precisión de la transformación sin perfume de varias estrategias de muestreo". Proc. del 10° Internacional. Conf. en Ingeniería de Software, Inteligencia Artificial, Redes y Computación Paralela/Distribuida . ACIS.
  8. ^ Wu, L.; J. Ma; J.Tian (2010). "Filtrado Kalman autoadaptable sin perfume para navegación asistida por gravedad bajo el agua". Proc. de Planes IEEE/ION .
  9. ^ El-Sheimy, N; Shin, EH; Niu, X (2006). "Enfrentamiento del filtro Kalman: filtros Kalman extendidos versus sin perfume para GPS integrado y MEMS inercial". Inside GNSS: Soluciones de ingeniería para la comunidad de sistemas globales de navegación por satélite . 1 (2).
  10. ^ Crassidis, J.; Markley, F. (2003). "Filtrado sin perfume para la estimación de la actitud de las naves espaciales". Revista de orientación, control y dinámica . 26 (4): 536–542. Código Bib : 2003JGCD...26..536C. doi :10.2514/2.5102.
  11. ^ Ross, I. Michael; Proulx, Ronald J.; Karpenko, Marcos; Gong, Qi (julio de 2015). "Problemas de control óptimo de Riemann-Stieltjes para sistemas dinámicos inciertos". Revista de orientación, control y dinámica . 38 (7): 1251-1263. Código Bib : 2015JGCD...38.1251R. doi :10.2514/1.G000505. S2CID  121424228.
  12. ^ IM Ross, RJ Proulx y M. Karpenko, "Unscented Optimal Control for Space Flight", Actas del 24º Simposio internacional sobre dinámica de vuelos espaciales (ISSFD) , 5 al 9 de mayo de 2014, Laurel, MD. http://issfd.org/ISSFD_2014/ISSFD24_Paper_S12-5_Karpenko.pdf
  13. ^ Ross, I. Michael; Proulx, Ronald J.; Karpenko, Mark (julio de 2015). "Guía sin perfume". Conferencia Americana de Control (ACC) 2015 . págs. 5605–5610. doi :10.1109/ACC.2015.7172217. ISBN 978-1-4799-8684-2. S2CID  28136418.
  14. ^ ab Julier, S.; J. Uhlmann (1997). "Nueva extensión del filtro de Kalman a sistemas no lineales". Actas de la conferencia SPIE de 1997 sobre procesamiento de señales, fusión de sensores y reconocimiento de objetivos . vol. 3068.
  15. ^ Julier, Simón (2002). "La transformación escalada sin perfume". Actas de la Conferencia Americana de Control . vol. 6. IEEE.