stringtranslate.com

Teoría del control dual

La teoría del control dual es una rama de la teoría del control que se ocupa del control de sistemas cuyas características son inicialmente desconocidas. [1] [2] Se denomina dual porque al controlar un sistema de este tipo los objetivos del controlador son dobles:

Estos dos objetivos pueden estar parcialmente en conflicto. En el contexto del aprendizaje por refuerzo , esto se conoce como el equilibrio entre exploración y explotación (por ejemplo, Bandido multiarmado#Motivación empírica ).

La teoría del control dual fue desarrollada por Alexander Aronovich Feldbaum en 1960. Demostró que, en principio, la solución óptima se puede encontrar mediante programación dinámica , pero esto a menudo es poco práctico; como resultado, se han ideado varios métodos para diseñar controladores duales subóptimos.

Ejemplo

Para utilizar una analogía : si usted conduce un coche nuevo, desea llegar a su destino de forma económica y sin problemas, pero también desea ver qué tan bien acelera, frena y gira el coche para tener una mejor idea de cómo conducirlo, por lo que realizará algunas maniobras de prueba para este propósito. De manera similar, un controlador dual inyectará una señal denominada de sondeo (o exploración) en el sistema que puede restarle valor al rendimiento a corto plazo, pero que mejorará el control en el futuro.

Referencias

  1. ^ Feldbâum, Ά. Á. (1963-06-01). "Problemas de teoría de control dual". IFAC Proceedings Volumes . 2nd International IFAC Congress on Automatic and Remote Control: Theory, Basilea, Suiza, 1963. 1 (2): 541–550. doi :10.1016/S1474-6670(17)69687-3. ISSN  1474-6670.
  2. ^ Chen, Wen-Hua; Rhodes, Callum; Liu, Cunjia (1 de noviembre de 2021). "Control dual para explotación y exploración (DCEE) en búsqueda autónoma" (PDF) . Automatica . 133 : 109851. doi :10.1016/j.automatica.2021.109851. ISSN  0005-1098. S2CID  228372721.