El método pseudoespectral de Bellman es un método pseudoespectral para el control óptimo basado en el principio de optimización de Bellman . Es parte de la teoría más amplia del control óptimo pseudoespectral , término acuñado por Ross . [1] El método lleva el nombre de Richard E. Bellman . Fue introducido por Ross et al. [2] [3] primero como un medio para resolver problemas de control óptimo multiescala, y luego ampliado para obtener soluciones subóptimas para problemas de control óptimo generales.
La versión multiescala del método pseudoespectral de Bellman se basa en la propiedad de convergencia espectral de los métodos pseudoespectrales de Ross-Fahroo . Es decir, debido a que el método pseudoespectral de Ross-Fahroo converge a una velocidad exponencialmente rápida, la convergencia puntual a una solución se obtiene con un número muy bajo de nodos, incluso cuando la solución tiene componentes de alta frecuencia. Este fenómeno de aliasing en control óptimo fue descubierto por primera vez por Ross et al. [2] En lugar de utilizar técnicas de procesamiento de señales para suavizar la solución, Ross et al. propuso que el principio de optimización de Bellman se puede aplicar a la solución convergente para extraer información entre los nodos. Debido a que los nodos de Gauss-Lobatto se agrupan en los puntos límite, Ross et al. sugirió que si la densidad de nodos alrededor de las condiciones iniciales satisface el teorema de muestreo de Nyquist-Shannon , entonces la solución completa se puede recuperar resolviendo el problema de control óptimo de forma recursiva sobre segmentos por partes conocidos como segmentos de Bellman. [2]
En una versión ampliada del método, Ross et al. [3] propusieron que el método también podría usarse para generar soluciones factibles que no fueran necesariamente óptimas. En esta versión, se puede aplicar el método pseudoespectral de Bellman en un número aún menor de nodos incluso sabiendo que es posible que la solución no haya convergido a la óptima. En esta situación, se obtiene una solución factible.
Una característica notable del método pseudoespectral de Bellman es que determina automáticamente varias medidas de subóptima en función del costo pseudoespectral original y el costo generado por la suma de los segmentos de Bellman. [2] [3]
Una de las ventajas computacionales del método pseudoespectral de Bellman es que permite escapar de las reglas gaussianas en la distribución de puntos de nodos. Es decir, en un método pseudoespectral estándar, la distribución de los puntos de los nodos es gaussiana (típicamente Gauss-Lobatto para horizonte finito y Gauss-Radau para horizonte infinito). Los puntos gaussianos son escasos en el medio del intervalo (el medio se define en un sentido desplazado para problemas de horizonte infinito) y densos en los límites. La acumulación de puntos de segundo orden cerca de los límites tiene el efecto de desperdiciar nodos. El método pseudoespectral de Bellman aprovecha la acumulación de nodos en el punto inicial para suavizar la solución y descarta el resto de los nodos. Por tanto, la distribución final de nodos es no gaussiana y densa, mientras que el método computacional conserva una estructura dispersa.
El método pseudoespectral de Bellman fue aplicado por primera vez por Ross et al. [2] para resolver el desafiante problema de la optimización de la trayectoria de muy bajo empuje. Se ha aplicado con éxito para resolver un problema práctico de generación de soluciones de muy alta precisión para un problema de inyección transterrestre consistente en llevar una cápsula espacial desde una órbita lunar a una condición de interfaz terrestre precisa para una reentrada exitosa. [4] [5]
El método pseudoespectral de Bellman se utiliza más comúnmente como una verificación adicional de la optimización de una solución pseudoespectral generada por los métodos pseudoespectrales de Ross-Fahroo. Es decir, además del uso del principio mínimo de Pontryagin junto con las soluciones obtenidas mediante los métodos pseudoespectrales de Ross-Fahroo, el método pseudoespectral de Bellman se utiliza como prueba primaria únicamente sobre la optimización de la solución calculada. [6] [7]