stringtranslate.com

Ecuación algebraica de Riccati

Una ecuación de Riccati algebraica es un tipo de ecuación no lineal que surge en el contexto de problemas de control óptimo de horizonte infinito en tiempo continuo o tiempo discreto .

Una ecuación de Riccati algebraica típica es similar a una de las siguientes:

La ecuación algebraica de Riccati en tiempo continuo (CARE):

o la ecuación algebraica de Riccati en tiempo discreto (DARE):

P es la matriz simétrica desconocida n por n y A , B , Q , R son matrices de coeficientes reales conocidas , con Q y R simétricos.

Aunque generalmente esta ecuación puede tener muchas soluciones, se suele especificar que queremos obtener la única solución estabilizadora, si tal solución existe.

Origen del nombre

El nombre Riccati se da a estas ecuaciones debido a su relación con la ecuación diferencial de Riccati . De hecho, la CARE se verifica por las soluciones invariantes en el tiempo de la ecuación diferencial de Riccati con valor matricial asociada. En cuanto a la DARE, se verifica por las soluciones invariantes en el tiempo de la ecuación diferencial de Riccati con valor matricial (que es el análogo de la ecuación diferencial de Riccati en el contexto de LQR de tiempo discreto).

Contexto de la ecuación algebraica de Riccati en tiempo discreto

En los problemas de control óptimo de horizonte infinito , nos preocupamos por el valor de alguna variable de interés en un futuro arbitrario y debemos elegir de manera óptima un valor de una variable controlada en este momento, sabiendo que también nos comportaremos de manera óptima en todo momento en el futuro. Los valores actuales óptimos de las variables de control del problema en cualquier momento se pueden encontrar utilizando la solución de la ecuación de Riccati y las observaciones actuales sobre las variables de estado en evolución. Con múltiples variables de estado y múltiples variables de control, la ecuación de Riccati será una ecuación matricial .

La ecuación algebraica de Riccati determina la solución del problema del regulador cuadrático lineal invariante en el tiempo y de horizonte infinito (LQR), así como la del problema de control gaussiano cuadrático lineal invariante en el tiempo y de horizonte infinito (LQG). Estos son dos de los problemas más fundamentales en la teoría de control .

Una especificación típica del problema de control cuadrático lineal de tiempo discreto es minimizar

sujeto a la ecuación de estado

donde x es un vector n × 1 de variables de estado, u es un vector k × 1 de variables de control, A es la matriz de transición de estado n × n , B es la matriz n × k de multiplicadores de control, Q ( n × n ) es una matriz de costo de estado semidefinida positiva simétrica , y R ( k × k ) es una matriz de costo de control definida positiva simétrica.

La inducción hacia atrás en el tiempo se puede utilizar para obtener la solución de control óptima en cada momento, [1]

con la matriz de costo de avance definida positiva simétrica P evolucionando hacia atrás en el tiempo desde de acuerdo con

que se conoce como la ecuación de Riccati dinámica de tiempo discreto de este problema. La caracterización de estado estable de P , relevante para el problema del horizonte infinito en el que T tiende al infinito, se puede encontrar iterando la ecuación dinámica repetidamente hasta que converge; luego, P se caracteriza eliminando los subíndices de tiempo de la ecuación dinámica.

Solución

Por lo general, los solucionadores intentan encontrar la única solución estabilizadora, si es que existe. Una solución es estabilizadora si su uso para controlar el sistema LQR asociado hace que el sistema de bucle cerrado sea estable.

Para el CUIDADO, el control es

y la matriz de transferencia de estado de bucle cerrado es

que es estable si y sólo si todos sus valores propios tienen parte real estrictamente negativa.

Para el DARE, el control es

y la matriz de transferencia de estado de bucle cerrado es

que es estable si y sólo si todos sus valores propios están estrictamente dentro del círculo unitario del plano complejo.

Se puede obtener una solución a la ecuación algebraica de Riccati mediante factorizaciones matriciales o iterando sobre la ecuación de Riccati. Un tipo de iteración se puede obtener en el caso de tiempo discreto utilizando la ecuación dinámica de Riccati que surge en el problema del horizonte finito: en el último tipo de problema, cada iteración del valor de la matriz es relevante para la elección óptima en cada período que es una distancia finita en el tiempo desde un período de tiempo final, y si se itera infinitamente hacia atrás en el tiempo converge a la matriz específica que es relevante para la elección óptima una longitud de tiempo infinita antes de un período final, es decir, cuando hay un horizonte infinito.

También es posible encontrar la solución mediante la descomposición propia de un sistema más grande. Para el CARE, definimos la matriz hamiltoniana

Como es hamiltoniano, si no tiene ningún valor propio en el eje imaginario, entonces exactamente la mitad de sus valores propios tienen una parte real negativa. Si denotamos la matriz cuyas columnas forman una base del subespacio correspondiente, en notación matricial de bloques, como

entonces

es una solución de la ecuación de Riccati; además, los valores propios de son los valores propios de con parte real negativa.

Para el DARE, cuando es invertible, definimos la matriz simpléctica

Como es simpléctica, si no tiene ningún valor propio en el círculo unitario, entonces exactamente la mitad de sus valores propios están dentro del círculo unitario. Si denotamos la matriz cuyas columnas forman una base del subespacio correspondiente, en notación matricial de bloques, como

donde y resultan de la descomposición [2]

entonces

es una solución de la ecuación de Riccati; además, los valores propios de son los valores propios de los cuales están dentro del círculo unitario.

Véase también

Referencias

  1. ^ Chow, Gregory (1975). Análisis y control de sistemas económicos dinámicos . Nueva York: John Wiley & Sons. ISBN 0-471-15616-7.
  2. ^ William Arnold; Alan Laub (1984). "Software y algoritmos de problemas propios generalizados para ecuaciones algebraicas de Riccati".

Enlaces externos