stringtranslate.com

Transformación sin perfume

La transformada no perfumada (UT) es una función matemática que se utiliza para estimar el resultado de aplicar una transformación no lineal dada a una distribución de probabilidad que se caracteriza solo en términos de un conjunto finito de estadísticas. El uso más común de la transformada no perfumada es en la proyección no lineal de estimaciones de media y covarianza en el contexto de extensiones no lineales del filtro de Kalman . Su creador Jeffrey Uhlmann explicó que "no perfumada" era un nombre arbitrario que adoptó para evitar que se lo mencionara como el "filtro de Uhlmann". [1]

Fondo

Muchos métodos de filtrado y control representan estimaciones del estado de un sistema en forma de un vector de media y una matriz de covarianza de error asociada. Como ejemplo, la posición bidimensional estimada de un objeto de interés podría representarse mediante un vector de posición media, , con una incertidumbre dada en forma de una matriz de covarianza 2x2 que dé la varianza en , la varianza en y la covarianza cruzada entre las dos. Una covarianza que es cero implica que no hay incertidumbre ni error y que la posición del objeto es exactamente la especificada por el vector de media.

La representación de la media y la covarianza solo proporciona los dos primeros momentos de una distribución de probabilidad subyacente, pero desconocida por lo demás. En el caso de un objeto en movimiento, la distribución de probabilidad desconocida podría representar la incertidumbre de la posición del objeto en un momento dado. La representación de la incertidumbre por la media y la covarianza es matemáticamente conveniente porque cualquier transformación lineal se puede aplicar a un vector de media y a una matriz de covarianza como y . Esta propiedad de linealidad no se cumple para los momentos más allá del primer momento bruto (la media) y del segundo momento central (la covarianza), por lo que generalmente no es posible determinar la media y la covarianza resultantes de una transformación no lineal porque el resultado depende de todos los momentos, y solo se proporcionan los dos primeros.

Aunque la matriz de covarianza se suele tratar como el error cuadrático esperado asociado con la media, en la práctica la matriz se mantiene como un límite superior del error cuadrático real. Específicamente, se mantiene de manera conservadora una estimación de la media y la covarianza de modo que la matriz de covarianza sea mayor o igual que el error cuadrático real asociado con . Matemáticamente, esto significa que el resultado de restar el error cuadrático esperado (que generalmente no se conoce) de es una matriz semidefinida o definida positiva . La razón para mantener una estimación de covarianza conservadora es que la mayoría de los algoritmos de filtrado y control tenderán a divergir (fallar) si se subestima la covarianza. Esto se debe a que una covarianza espuriamente pequeña implica menos incertidumbre y lleva al filtro a colocar más peso (confianza) del que se justifica en la precisión de la media.

Volviendo al ejemplo anterior, cuando la covarianza es cero, es trivial determinar la ubicación del objeto después de que se mueve de acuerdo con una función no lineal arbitraria : simplemente aplique la función al vector de media. Cuando la covarianza no es cero, la media transformada generalmente no será igual a y ni siquiera es posible determinar la media de la distribución de probabilidad transformada a partir de solo su media y covarianza anteriores. Dada esta indeterminación, la media y la covarianza transformadas de manera no lineal solo se pueden aproximar. La primera aproximación fue linealizar la función no lineal y aplicar la matriz jacobiana resultante a la media y la covarianza dadas. Esta es la base del filtro de Kalman extendido (EKF), y aunque se sabía que arrojaba malos resultados en muchas circunstancias, no hubo una alternativa práctica durante muchas décadas.

Motivación para la transformación sin perfume

En 1994, Jeffrey Uhlmann observó que la EKF toma una función no lineal e información de distribución parcial (en forma de estimación de media y covarianza) del estado de un sistema, pero aplica una aproximación a la función conocida en lugar de a la distribución de probabilidad conocida de forma imprecisa. Sugirió que un mejor enfoque sería utilizar la función no lineal exacta aplicada a una distribución de probabilidad aproximada. La motivación para este enfoque se da en su tesis doctoral, donde se definió por primera vez el término transformada sin aroma : [2]

Considere la siguiente intuición: con un número fijo de parámetros debería ser más fácil aproximar una distribución dada que aproximar una función/transformación no lineal arbitraria . Siguiendo esta intuición, el objetivo es encontrar una parametrización que capture la información de media y covarianza mientras que al mismo tiempo permite la propagación directa de la información a través de un conjunto arbitrario de ecuaciones no lineales. Esto se puede lograr generando una distribución discreta que tenga los mismos momentos primero y segundo (y posiblemente superiores), donde cada punto en la aproximación discreta se puede transformar directamente. La media y la covarianza del conjunto transformado se pueden calcular entonces como la estimación de la transformación no lineal de la distribución original. De manera más general, la aplicación de una transformación no lineal dada a una distribución discreta de puntos, calculada de modo de capturar un conjunto de estadísticas conocidas de una distribución desconocida, se conoce como una transformación sin aroma .

En otras palabras, la información de media y covarianza dada se puede codificar exactamente en un conjunto de puntos, denominados puntos sigma , que si se tratan como elementos de una distribución de probabilidad discreta tienen media y covarianza iguales a la media y covarianza dadas. Esta distribución se puede propagar exactamente aplicando la función no lineal a cada punto. La media y la covarianza del conjunto de puntos transformados representan entonces la estimación transformada deseada. La principal ventaja del enfoque es que la función no lineal se explota por completo, a diferencia de la EKF que la reemplaza con una lineal. Eliminar la necesidad de linealización también proporciona ventajas independientes de cualquier mejora en la calidad de la estimación. Una ventaja inmediata es que la UT se puede aplicar con cualquier función dada, mientras que la linealización puede no ser posible para funciones que no son diferenciables. Una ventaja práctica es que la UT puede ser más fácil de implementar porque evita la necesidad de derivar e implementar una matriz jacobiana linealizante.

Puntos sigma

Para calcular la transformación sin aroma, primero hay que elegir un conjunto de puntos sigma. Desde el trabajo seminal de Uhlmann, se han propuesto muchos conjuntos diferentes de puntos sigma en la literatura. Se puede encontrar una revisión exhaustiva de estas variantes en el trabajo de Menegaz et al. [3] En general, los puntos sigma son necesarios y suficientes para definir una distribución discreta que tiene una media y una covarianza dadas en las dimensiones. [2]

Un conjunto canónico de puntos sigma es el conjunto simétrico propuesto originalmente por Uhlmann. Consideremos los vértices de un triángulo equilátero centrado en el origen en dos dimensiones:

Se puede verificar que el conjunto de puntos anterior tiene media y covarianza (la matriz identidad). Dada cualquier media y covarianza bidimensional, , los puntos sigma deseados se pueden obtener multiplicando cada punto por la raíz cuadrada de la matriz de y sumando . Se puede generar un conjunto canónico similar de puntos sigma en cualquier número de dimensiones tomando el vector cero y los puntos que comprenden las filas de la matriz identidad, calculando la media del conjunto de puntos, restando la media de cada punto de modo que el conjunto resultante tenga una media de cero, luego calculando la covarianza del conjunto de puntos de media cero y aplicando su inversa a cada punto de modo que la covarianza del conjunto sea igual a la identidad.

Uhlmann demostró que es posible generar de manera conveniente un conjunto simétrico de puntos sigma a partir de las columnas de y el vector cero, donde es la matriz de covarianza dada, sin tener que calcular una matriz inversa. Es computacionalmente eficiente y, debido a que los puntos forman una distribución simétrica, captura el tercer momento central (el sesgo) siempre que se conozca la distribución subyacente de la estimación de estado o se pueda suponer que es simétrica. [2] También demostró que los pesos, incluidos los pesos negativos, se pueden usar para afectar las estadísticas del conjunto. Julier también desarrolló y examinó técnicas para generar puntos sigma para capturar el tercer momento (el sesgo) de una distribución arbitraria y el cuarto momento (la curtosis) de una distribución simétrica. [4] [5]

Ejemplo

La transformación sin aroma se define para la aplicación de una función dada a cualquier caracterización parcial de una distribución desconocida, pero su uso más común es para el caso en el que solo se dan la media y la covarianza. Un ejemplo común es la conversión de un sistema de coordenadas a otro, como de un marco de coordenadas cartesianas a coordenadas polares. [4]

Supongamos que se da una estimación de media y covarianza bidimensional, , en coordenadas cartesianas con:

y la función de transformación a coordenadas polares, , es:

Al multiplicar cada uno de los puntos sigma simplex canónicos (dados arriba) por y sumar la media, , se obtiene:

Aplicando la función de transformación a cada uno de los puntos anteriores se obtiene:

La media de estos tres puntos transformados, , es la estimación UT de la media en coordenadas polares:

La estimación UT de la covarianza es:

donde cada término al cuadrado de la suma es un producto externo vectorial. Esto da:

Esto se puede comparar con la media y la covarianza linealizadas:

En este caso, la diferencia absoluta entre las estimaciones UT y linealizadas es relativamente pequeña, pero en aplicaciones de filtrado, el efecto acumulativo de pequeños errores puede provocar una divergencia irrecuperable de la estimación. El efecto de los errores se ve exacerbado cuando se subestima la covarianza, ya que esto hace que el filtro confíe demasiado en la precisión de la media. En el ejemplo anterior, se puede ver que la estimación de la covarianza linealizada es menor que la de la estimación UT, lo que sugiere que es probable que la linealización haya producido una subestimación del error real en su media.

En este ejemplo, no hay forma de determinar la precisión absoluta de las estimaciones linealizadas y de UT sin una verdad fundamental en forma de la distribución de probabilidad real asociada con la estimación original y la media y la covarianza de esa distribución después de la aplicación de la transformación no lineal (por ejemplo, determinada analíticamente o mediante integración numérica). Se han realizado tales análisis para transformaciones de coordenadas bajo el supuesto de gaussianidad para las distribuciones subyacentes, y las estimaciones de UT tienden a ser significativamente más precisas que las obtenidas a partir de la linealización. [6] [7]

El análisis empírico ha demostrado que el uso del conjunto simplex mínimo de puntos sigma es significativamente menos preciso que el uso del conjunto simétrico de puntos cuando la distribución subyacente es gaussiana. [7] Esto sugiere que el uso del conjunto simplex en el ejemplo anterior no sería la mejor opción si la distribución subyacente asociada con es simétrica. Incluso si la distribución subyacente no es simétrica, es probable que el conjunto simplex sea menos preciso que el conjunto simétrico porque la asimetría del conjunto simplex no coincide con la asimetría de la distribución real.

Volviendo al ejemplo, el conjunto simétrico mínimo de puntos sigma se puede obtener de la matriz de covarianza simplemente como el vector medio, más y menos las columnas de :

Esta construcción garantiza que la media y la covarianza de los cuatro puntos sigma anteriores sean , lo que es directamente verificable. Al aplicar la función no lineal a cada uno de los puntos sigma se obtiene:

La media de estos cuatro puntos sigma transformados, , es la estimación UT de la media en coordenadas polares:

La estimación UT de la covarianza es:

donde cada término al cuadrado de la suma es un producto externo vectorial. Esto da:

La diferencia entre las estimaciones de la media linealizada y la UT proporciona una medida del efecto de la no linealidad de la transformación. Cuando la transformación es lineal, por ejemplo, las estimaciones de la media linealizada y la UT serán idénticas. Esto motiva el uso del cuadrado de esta diferencia para agregarse a la covarianza de la UT para evitar la subestimación del error real en la media. Este enfoque no mejora la precisión de la media, pero puede mejorar significativamente la precisión de un filtro a lo largo del tiempo al reducir la probabilidad de que se subestime la covarianza. [2]

Optimalidad de la transformación sin aroma

Uhlmann observó que, dadas únicamente la media y la covarianza de una distribución de probabilidad desconocida, el problema de la transformación está mal definido porque hay un número infinito de posibles distribuciones subyacentes con los mismos dos primeros momentos. Sin ninguna información a priori ni suposiciones sobre las características de la distribución subyacente, cualquier elección de distribución utilizada para calcular la media y la covarianza transformadas es tan razonable como cualquier otra. En otras palabras, no hay ninguna elección de distribución con una media y una covarianza dadas que sea superior a la proporcionada por el conjunto de puntos sigma, por lo tanto, la transformación sin aroma es trivialmente óptima.

Esta afirmación general de optimalidad es, por supuesto, inútil para hacer afirmaciones cuantitativas sobre el rendimiento de la transformación unitaria, por ejemplo, en comparación con la linealización; en consecuencia, él, Julier y otros han realizado análisis bajo diversos supuestos sobre las características de la distribución y/o la forma de la función de transformación no lineal. Por ejemplo, si la función es diferenciable, lo cual es esencial para la linealización, estos análisis validan la superioridad esperada y corroborada empíricamente de la transformación no lineal. [6] [7]

Aplicaciones

La transformación sin aroma se puede utilizar para desarrollar una generalización no lineal del filtro de Kalman, conocida como el filtro de Kalman sin aroma (UKF) . Este filtro ha reemplazado en gran medida al EKF en muchas aplicaciones de filtrado y control no lineales, incluidas las de navegación submarina [8] , terrestre y aérea [9] y espacial [10] . La transformación sin aroma también se ha utilizado como marco computacional para el control óptimo de Riemann-Stieltjes [11] . Este enfoque computacional se conoce como control óptimo sin aroma [12] [13]

Filtro Kalman sin fragancia

Uhlmann y Simon Julier publicaron varios artículos que muestran que el uso de la transformación sin aroma en un filtro de Kalman , que se conoce como el filtro de Kalman sin aroma (UKF), proporciona mejoras de rendimiento significativas sobre el EKF en una variedad de aplicaciones. [14] [4] [6] Julier y Uhlmann publicaron artículos que utilizan una forma parametrizada particular de la transformación sin aroma en el contexto del UKF que utiliza pesos negativos para capturar información de distribución asumida. [14] [6] Esa forma del UT es susceptible a una variedad de errores numéricos que las formulaciones originales (el conjunto simétrico propuesto originalmente por Uhlmann) no sufren. Julier ha descrito posteriormente formas parametrizadas que no utilizan pesos negativos y tampoco están sujetas a esos problemas. [15]

Véase también

Referencias

  1. ^ "De primera mano: La transformación sin aroma - Wiki de historia de la ingeniería y la tecnología". Abril de 2021.
  2. ^ abcd Uhlmann, Jeffrey (1995). Construcción y localización de mapas dinámicos: nuevos fundamentos teóricos (tesis doctoral). Universidad de Oxford.
  3. ^ Menegaz, Henrique MT; João, Y. Ishihara; Borges, Geovany A.; Vargas, Alessandro N. (16 de febrero de 2015). "Una sistematización de la teoría del filtro de Kalman sin perfume". Transacciones IEEE sobre control automático . 60 (10): 2583–2598. doi :10.1109/TAC.2015.2404511. hdl : 20.500.11824/251 . S2CID  12606055.
  4. ^ abc Julier, S.; J. Uhlmann (1997). "Método consistente sin sesgo para la conversión entre sistemas de coordenadas polares y cartesianas". Actas de la Conferencia SPIE de 1997 sobre adquisición, seguimiento y apuntamiento . Vol. 3086. SPIE.
  5. ^ Julier, Simon (1998). "Un enfoque sesgado del filtrado". Actas del 12.º Simposio internacional sobre detección, simulación y controles aeroespaciales y de defensa . Vol. 3373. SPIE.
  6. ^ abcd Julier, Simon; Uhlmann, Jeffrey (2000). "Un nuevo método para la transformación no lineal de medias y covarianzas en filtros no lineales". IEEE Transactions on Automatic Control . 45 (3): 477–482. doi :10.1109/9.847726.
  7. ^ abc Zhang, W.; M. Liu; Z. Zhao (2009). "Análisis de precisión de la transformación sin aroma de varias estrategias de muestreo". Actas de la 10.ª Conferencia Internacional sobre Ingeniería de Software, Inteligencia Artificial, Redes y Computación Paralela/Distribuida . ACIS.
  8. ^ Wu, L.; J. Ma; J. Tian (2010). "Filtro Kalman autoadaptable sin aroma para navegación submarina asistida por gravedad". Proc. de los planes IEEE/ION .
  9. ^ El-Sheimy, N; Shin, EH; Niu, X (2006). "Competencia entre filtros Kalman: filtros Kalman extendidos y no perfumados para sistemas inerciales MEMS y GPS integrados". Inside GNSS: Soluciones de ingeniería para la comunidad de sistemas globales de navegación por satélite . 1 (2).
  10. ^ Crassidis, J.; Markley, F. (2003). "Filtrado sin aroma para la estimación de la actitud de las naves espaciales". Revista de orientación, control y dinámica . 26 (4): 536–542. Bibcode :2003JGCD...26..536C. doi :10.2514/2.5102.
  11. ^ Ross, I. Michael; Proulx, Ronald J.; Karpenko, Mark; Gong, Qi (julio de 2015). "Problemas de control óptimo de Riemann–Stieltjes para sistemas dinámicos inciertos". Journal of Guidance, Control, and Dynamics . 38 (7): 1251–1263. Bibcode :2015JGCD...38.1251R. doi :10.2514/1.G000505. hdl : 10945/48189 . S2CID  121424228.
  12. ^ IM Ross, RJ Proulx y M. Karpenko, "Control óptimo sin aroma para vuelos espaciales", Actas del 24.° Simposio internacional sobre dinámica de vuelos espaciales (ISSFD) , 5 al 9 de mayo de 2014, Laurel, MD. http://issfd.org/ISSFD_2014/ISSFD24_Paper_S12-5_Karpenko.pdf
  13. ^ Ross, I. Michael; Proulx, Ronald J.; Karpenko, Mark (julio de 2015). "Orientación sin aroma". Conferencia Americana de Control de 2015 (ACC) . págs. 5605–5610. doi :10.1109/ACC.2015.7172217. ISBN 978-1-4799-8684-2. Número de identificación del sujeto  28136418.
  14. ^ ab Julier, S.; J. Uhlmann (1997). "Nueva extensión del filtro Kalman a sistemas no lineales". Actas de la Conferencia SPIE de 1997 sobre procesamiento de señales, fusión de sensores y reconocimiento de objetivos . Vol. 3068.
  15. ^ Julier, Simon (2002). "La transformación sin aroma a escala". Actas de la Conferencia de Control Americana . Vol. 6. IEEE.