stringtranslate.com

Observador estatal

En teoría de control , un observador de estado o estimador de estado es un sistema que proporciona una estimación del estado interno de un sistema real determinado a partir de mediciones de la entrada y la salida del sistema real. Normalmente se implementa mediante ordenador y constituye la base de muchas aplicaciones prácticas.

Conocer el estado del sistema es necesario para resolver muchos problemas de teoría de control ; por ejemplo, estabilizar un sistema utilizando retroalimentación de estado . En la mayoría de los casos prácticos, el estado físico del sistema no se puede determinar mediante observación directa. En cambio, los efectos indirectos del estado interno se observan a través de las salidas del sistema. Un ejemplo simple es el de los vehículos en un túnel: las tasas y velocidades a las que los vehículos entran y salen del túnel se pueden observar directamente, pero el estado exacto dentro del túnel solo se puede estimar. Si un sistema es observable , es posible reconstruir completamente el estado del sistema a partir de sus mediciones de salida utilizando el observador de estado.

Modelo de observador típico

Diagrama de bloques del observador de Luenberger. La entrada de ganancia del observador L es .

Los observadores lineales, retardados, de modo deslizante, de alta ganancia, Tau, basados ​​en homogeneidad, extendidos y cúbicos son algunas de las estructuras de observadores que se utilizan para la estimación del estado de sistemas lineales y no lineales. En las siguientes secciones se describe una estructura de observador lineal.

Caso de tiempo discreto

Se supone que el estado de un sistema de tiempo discreto, lineal e invariante en el tiempo satisface

donde, en el momento , es el estado de la planta; son sus entradas; y son sus salidas. Estas ecuaciones simplemente dicen que las salidas actuales de la planta y su estado futuro están determinados únicamente por sus estados actuales y las entradas actuales. (Aunque estas ecuaciones se expresan en términos de pasos de tiempo discretos , ecuaciones muy similares se cumplen para sistemas continuos ). Si este sistema es observable , entonces la salida de la planta, , se puede utilizar para dirigir el estado del observador de estado.

El modelo de observador del sistema físico se deriva entonces típicamente de las ecuaciones anteriores. Se pueden incluir términos adicionales para asegurar que, al recibir valores medidos sucesivos de las entradas y salidas de la planta, el estado del modelo converja al de la planta. En particular, la salida del observador se puede restar de la salida de la planta y luego multiplicar por una matriz ; esto se agrega luego a las ecuaciones para el estado del observador para producir un llamado observador de Luenberger , definido por las ecuaciones siguientes. Obsérvese que las variables de un observador de estado se denotan comúnmente con un "sombrero": y para distinguirlas de las variables de las ecuaciones satisfechas por el sistema físico.

Se dice que el observador es asintóticamente estable si el error del observador converge a cero cuando . Para un observador de Luenberger, el error del observador satisface . Por lo tanto, el observador de Luenberger para este sistema de tiempo discreto es asintóticamente estable cuando la matriz tiene todos los valores propios dentro del círculo unitario.

Para fines de control, la salida del sistema de observación se retroalimenta a la entrada tanto del observador como de la planta a través de la matriz de ganancias .

Las ecuaciones del observador entonces se convierten en:

o, más simplemente,

Gracias al principio de separación sabemos que podemos elegir y de forma independiente sin perjudicar la estabilidad general de los sistemas. Como regla general, los polos del observador suelen elegirse para que converjan 10 veces más rápido que los polos del sistema .

Caso de tiempo continuo

El ejemplo anterior se refería a un observador implementado en un sistema LTI de tiempo discreto. Sin embargo, el proceso es similar para el caso de tiempo continuo; las ganancias del observador se eligen para hacer que la dinámica del error de tiempo continuo converja a cero de manera asintótica (es decir, cuando es una matriz de Hurwitz ).

Para un sistema lineal de tiempo continuo

donde , el observador parece similar al caso de tiempo discreto descrito anteriormente:

.

El error del observador satisface la ecuación

.

Los valores propios de la matriz se pueden elegir arbitrariamente mediante la elección adecuada de la ganancia del observador cuando el par es observable, es decir, se cumple la condición de observabilidad . En particular, se puede hacer Hurwitz, de modo que el error del observador cuando .

Métodos de observación y otros métodos de observación

Cuando la ganancia del observador es alta, el observador lineal de Luenberger converge a los estados del sistema muy rápidamente. Sin embargo, una ganancia alta del observador conduce a un fenómeno de pico en el que el error inicial del estimador puede ser prohibitivamente grande (es decir, poco práctico o inseguro de usar). [1] Como consecuencia, hay métodos de observador no lineales de alta ganancia disponibles que convergen rápidamente sin el fenómeno de pico. Por ejemplo, el control de modo deslizante se puede utilizar para diseñar un observador que lleve el error de un estado estimado a cero en un tiempo finito incluso en presencia de un error de medición; los otros estados tienen un error que se comporta de manera similar al error en un observador de Luenberger después de que el pico haya disminuido. Los observadores de modo deslizante también tienen propiedades atractivas de resiliencia al ruido que son similares a un filtro de Kalman . [2] [3] Otro enfoque es aplicar múltiples observadores, que mejora significativamente los transitorios y reduce el sobreimpulso del observador. Los múltiples observadores se pueden adaptar a cada sistema donde sea aplicable un observador de alta ganancia. [4]

Observadores estatales para sistemas no lineales

Los observadores de alta ganancia, modo deslizante y extendido son los observadores más comunes para sistemas no lineales. Para ilustrar la aplicación de los observadores de modo deslizante para sistemas no lineales, primero considere el sistema no lineal sin entrada:

donde . Supongamos también que hay una salida medible dada por

Existen varios enfoques no aproximados para diseñar un observador. Los dos observadores que se indican a continuación también se aplican al caso en el que el sistema tiene una entrada. Es decir,

Dinámica de error linealizable

Una sugerencia de Krener e Isidori [5] y Krener y Respondek [6] se puede aplicar en una situación en la que existe una transformación linealizante (es decir, un difeomorfismo , como el utilizado en la linealización por retroalimentación ) tal que en nuevas variables las ecuaciones del sistema se leen

El observador de Luenberger está entonces diseñado como

.

El error del observador para la variable transformada satisface la misma ecuación que en el caso lineal clásico.

.

Como lo demostraron Gauthier, Hammouri y Othman [7] y Hammouri y Kinnaert [8], si existe una transformación tal que el sistema puede transformarse en la forma

Entonces el observador está diseñado como

,

donde es una ganancia de observador variable en el tiempo.

Ciccarella, Dalla Mora y Germani [9] obtuvieron resultados más avanzados y generales, eliminando la necesidad de una transformación no lineal y demostrando la convergencia asintótica global del estado estimado al estado verdadero utilizando solo suposiciones simples sobre la regularidad.

Observadores cambiados

Como se discutió para el caso lineal anterior, el fenómeno de pico presente en los observadores de Luenberger justifica el uso de observadores conmutados. Un observador conmutado abarca un relé o interruptor binario que actúa al detectar cambios minúsculos en la salida medida. Algunos tipos comunes de observadores conmutados incluyen el observador de modo deslizante, el observador de estado extendido no lineal, [10] observador de tiempo fijo, [11] observador de alta ganancia conmutada [12] y observador unificador. [13] El observador de modo deslizante utiliza retroalimentación de alta ganancia no lineal para llevar los estados estimados a una hipersuperficie donde no hay diferencia entre la salida estimada y la salida medida. La ganancia no lineal utilizada en el observador se implementa típicamente con una función de conmutación escalada, como el signo (es decir, sgn) del error de salida estimado - medido. Por lo tanto, debido a esta retroalimentación de alta ganancia, el campo vectorial del observador tiene un pliegue en él para que las trayectorias del observador se deslicen a lo largo de una curva donde la salida estimada coincide exactamente con la salida medida. Por lo tanto, si el sistema es observable desde su salida, todos los estados del observador serán llevados a los estados reales del sistema. Además, al utilizar el signo del error para controlar el observador en modo deslizante, las trayectorias del observador se vuelven insensibles a muchas formas de ruido. Por lo tanto, algunos observadores en modo deslizante tienen propiedades atractivas similares al filtro de Kalman, pero con una implementación más simple. [2] [3]

Como lo sugiere Drakunov, [14] también se puede diseñar un observador de modo deslizante para una clase de sistemas no lineales. Un observador de este tipo se puede escribir en términos de la estimación de la variable original y tiene la forma

dónde:

La idea se puede explicar brevemente de la siguiente manera. Según la teoría de los modos deslizantes, para describir el comportamiento del sistema, una vez que se inicia el modo deslizante, la función debe reemplazarse por valores equivalentes (ver control equivalente en la teoría de los modos deslizantes ). En la práctica, conmuta (vibra) con alta frecuencia con un componente lento que es igual al valor equivalente. Aplicando un filtro de paso bajo apropiado para deshacerse del componente de alta frecuencia, se puede obtener el valor del control equivalente, que contiene más información sobre el estado del sistema estimado. El observador descrito anteriormente utiliza este método varias veces para obtener el estado del sistema no lineal idealmente en tiempo finito.

El error de observación modificado se puede escribir en los estados transformados . En particular,

y entonces

Entonces:

  1. Mientras , la primera fila de la dinámica de error, , cumplirá condiciones suficientes para ingresar al modo deslizante en tiempo finito.
  2. A lo largo de la superficie, el control equivalente correspondiente será igual a , y por lo tanto . Por lo tanto, mientras , la segunda fila de la dinámica de error, , entrará en el modo deslizante en un tiempo finito.
  3. A lo largo de la superficie, el control equivalente correspondiente será igual a . Por lo tanto, siempre que , la fila n de la dinámica de error, , entrará en el modo deslizante en un tiempo finito.

Por lo tanto, para ganancias suficientemente grandes, todos los estados estimados por el observador alcanzan los estados reales en un tiempo finito. De hecho, el aumento permite la convergencia en cualquier tiempo finito deseado siempre que cada función pueda acotarse con certeza. Por lo tanto, el requisito de que la función sea un difeomorfismo (es decir, que su linealización jacobiana sea invertible) afirma que la convergencia del resultado estimado implica la convergencia del estado estimado. Es decir, el requisito es una condición de observabilidad.

En el caso del observador en modo deslizante para el sistema con la entrada, se necesitan condiciones adicionales para que el error de observación sea independiente de la entrada. Por ejemplo, que

No depende del tiempo. El observador es entonces

Multiobservador

El algoritmo multiobservador extiende la estructura de observador de alta ganancia de un solo observador a uno de múltiples observadores, con muchos modelos trabajando simultáneamente. Tiene dos capas: la primera consiste en múltiples observadores de alta ganancia con diferentes estados de estimación, y la segunda determina los pesos de importancia de los observadores de la primera capa. El algoritmo es simple de implementar y no contiene operaciones riesgosas como la diferenciación. [4] La idea de múltiples modelos se aplicó anteriormente para obtener información en el control adaptativo. [15]

Suponiendo que el número de observadores de alta ganancia es igual a ,

donde es el índice del observador. Los observadores de la primera capa constan de la misma ganancia pero difieren del estado inicial . En la segunda capa, todos los observadores se combinan en uno para obtener una estimación del vector de estado único.

donde son factores de ponderación. Estos factores se modifican para proporcionar la estimación en la segunda capa y mejorar el proceso de observación.

Supongamos que

y

donde es un vector que depende del error del observador .

Algunas transformaciones dan lugar a un problema de regresión lineal.

Esta fórmula permite estimar . Para construir la variedad necesitamos una correspondencia entre y una garantía de que sea calculable a partir de señales mensurables. Lo primero es eliminar el fenómeno del estacionamiento por error del observador

.

Calcular la derivada multiplicada por para encontrar la función m que conduce a la definición de

donde es una constante de tiempo. Nótese que depende de ambos y de sus integrales, por lo que está fácilmente disponible en el sistema de control. Además, se especifica mediante la ley de estimación; y, por lo tanto, demuestra que la variedad es medible. En la segunda capa , se introduce como estimaciones de coeficientes. El error de mapeo se especifica como

donde . Si los coeficientes son iguales a , entonces el error de mapeo Ahora es posible calcular a partir de la ecuación anterior y, por lo tanto, el fenómeno de pico se reduce gracias a las propiedades de la variedad. El mapeo creado brinda mucha flexibilidad en el proceso de estimación. Incluso es posible estimar el valor de en la segunda capa y calcular el estado . [4]

Observadores delimitadores

Los observadores de límite [16] o de intervalo [17] [18] constituyen una clase de observadores que proporcionan dos estimaciones del estado simultáneamente: una de las estimaciones proporciona un límite superior del valor real del estado, mientras que la segunda proporciona un límite inferior. Se sabe entonces que el valor real del estado siempre está dentro de estas dos estimaciones.

Estos límites son muy importantes en aplicaciones prácticas, [19] [20] ya que permiten conocer en cada momento la precisión de la estimación.

Matemáticamente, se pueden utilizar dos observadores de Luenberger, si se seleccionan adecuadamente, utilizando, por ejemplo, propiedades de sistemas positivos : [21] uno para el límite superior (que asegura que converge a cero desde arriba cuando , en ausencia de ruido e incertidumbre ), y un límite inferior (que asegura que converge a cero desde abajo). Es decir, siempre

Véase también

Referencias

Referencias en línea
  1. ^ Khalil, HK (2002), Sistemas no lineales (3.ª ed.), Upper Saddle River, NJ: Prentice Hall , ISBN 978-0-13-067389-3
  2. ^ ab Utkin, Vadim; Guldner, Jürgen; Shi, Jingxin (1999), Control de modo deslizante en sistemas electromecánicos , Filadelfia, PA: Taylor & Francis, Inc., ISBN 978-0-7484-0116-1
  3. ^ ab Drakunov, SV (1983), "Un filtro cuasióptimo adaptativo con parámetros discontinuos", Automatización y control remoto , 44 ​​(9): 1167–1175
  4. ^ abc Bernat, J.; Stepien, S. (2015), "Modelado múltiple como nuevo esquema de estimación para observadores de alta ganancia", International Journal of Control , 88 (6): 1209–1222, Bibcode :2015IJC....88.1209B, doi :10.1080/00207179.2014.1000380, S2CID  8599596
  5. ^ Krener, AJ; Isidori, Alberto (1983), "Linealización por inyección de salida y observadores no lineales", System and Control Letters , 3 : 47–52, doi :10.1016/0167-6911(83)90037-3
  6. ^ Krener, AJ; Respondek, W. (1985), "Observadores no lineales con dinámica de error linealizable", SIAM Journal on Control and Optimization , 23 (2): 197–216, doi :10.1137/0323016
  7. ^ Gauthier, JP; Hammouri, H.; Othman, S. (1992), "Un observador simple para aplicaciones de sistemas no lineales en biorreactores", IEEE Transactions on Automatic Control , 37 (6): 875–880, doi :10.1109/9.256352
  8. ^ Hammouri, H.; Kinnaert, M. (1996), "Un nuevo procedimiento para la linealización variable en el tiempo hasta la inyección de salida", System and Control Letters , 28 (3): 151–157, doi :10.1016/0167-6911(96)00022-9
  9. ^ Ciccarella, G.; Dalla Mora, M.; Germani, A. (1993), "Un observador tipo Luenberger para sistemas no lineales", International Journal of Control , 57 (3): 537–556, doi :10.1080/00207179308934406
  10. ^ Guo, Bao-Zhu; Zhao, Zhi-Liang (enero de 2011). "Extended State Observer for Nonlinear Systems with Uncertainty". IFAC Proceedings Volumes . 44 (1). Federación Internacional de Control Automático : 1855–1860. doi :10.3182/20110828-6-IT-1002.00399 . Consultado el 8 de agosto de 2023 .
  11. ^ "La Wayback Machine no ha archivado esa URL" . Consultado el 8 de agosto de 2023 .[ enlace muerto ]
  12. ^ Kumar, Sunil; Kumar Pal, Anil; Kamal, Shyam; Xiong, Xiaogang (19 de mayo de 2023). "Diseño de observador conmutado de alta ganancia para sistemas no lineales" . Revista internacional de ciencia de sistemas . 54 (7). Science Publishing Group : 1471–1483. Bibcode :2023IJSS...54.1471K. doi :10.1080/00207721.2023.2178863. S2CID  257145897 . Consultado el 8 de agosto de 2023 .
  13. ^ "Registro" . IEEE Xplore . Consultado el 8 de agosto de 2023 .
  14. ^ Drakunov, SV (1992). "Observadores de modo deslizante basados ​​en un método de control equivalente". [1992] Actas de la 31.ª Conferencia IEEE sobre decisión y control. págs. 2368-2370. doi :10.1109/CDC.1992.371368. ISBN 978-0-7803-0872-5.S2CID 120072463  .
  15. ^ Narendra, KS; Han, Z. (agosto de 2012). "Un nuevo enfoque para el control adaptativo utilizando múltiples modelos". Revista internacional de control adaptativo y procesamiento de señales . 26 (8): 778–799. doi :10.1002/acs.2269. ISSN  1099-1115. S2CID  60482210.
  16. ^ Combastel, C. (2003). "Un observador delimitador de estados basado en zonotopos" (PDF) . Conferencia Europea de Control de 2003 (ECC) . pp. 2589–2594. doi :10.23919/ECC.2003.7085991. ISBN . 978-3-9524173-7-9. Número de identificación del sujeto  13790057.
  17. ^ Rami, M. Ait; Cheng, CH; De Prada, C. (2008). "Observadores de intervalos robustos ajustados: un enfoque LP" (PDF) . 2008 47.ª Conferencia IEEE sobre decisiones y control . pp. 2967–2972. doi :10.1109/CDC.2008.4739280. ISBN . 978-1-4244-3123-6. Número de identificación del sujeto  288928.
  18. ^ Efimov, D.; Raïssi, T. (2016). "Diseño de observadores de intervalo para sistemas dinámicos inciertos". Automatización y control remoto . 77 (2): 191–225. doi :10.1134/S0005117916020016. hdl : 20.500.12210/25069 . S2CID  49322177.
  19. ^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf [ URL básica PDF ]
  20. ^ Hadj-Sadok, MZ; Gouzé, JL (2001). "Estimación de modelos inciertos de procesos de lodos activados con observadores de intervalo". Journal of Process Control . 11 (3): 299–310. doi :10.1016/S0959-1524(99)00074-8.
  21. ^ Rami, Mustapha Ait; Tadeo, Fernando; Helmke, Uwe (2011). "Observadores positivos para sistemas positivos lineales y sus implicaciones". Revista Internacional de Control . 84 (4): 716–725. Bibcode :2011IJC....84..716A. doi :10.1080/00207179.2011.573000. S2CID  21211012.
Referencias generales

Enlaces externos