En teoría de control , un observador de estado o estimador de estado es un sistema que proporciona una estimación del estado interno de un sistema real determinado a partir de mediciones de la entrada y la salida del sistema real. Normalmente se implementa mediante ordenador y constituye la base de muchas aplicaciones prácticas.
Conocer el estado del sistema es necesario para resolver muchos problemas de teoría de control ; por ejemplo, estabilizar un sistema utilizando retroalimentación de estado . En la mayoría de los casos prácticos, el estado físico del sistema no se puede determinar mediante observación directa. En cambio, los efectos indirectos del estado interno se observan a través de las salidas del sistema. Un ejemplo simple es el de los vehículos en un túnel: las tasas y velocidades a las que los vehículos entran y salen del túnel se pueden observar directamente, pero el estado exacto dentro del túnel solo se puede estimar. Si un sistema es observable , es posible reconstruir completamente el estado del sistema a partir de sus mediciones de salida utilizando el observador de estado.
Modelo de observador típico
Los observadores lineales, retardados, de modo deslizante, de alta ganancia, Tau, basados en homogeneidad, extendidos y cúbicos son algunas de las estructuras de observadores que se utilizan para la estimación del estado de sistemas lineales y no lineales. En las siguientes secciones se describe una estructura de observador lineal.
Caso de tiempo discreto
Se supone que el estado de un sistema de tiempo discreto, lineal e invariante en el tiempo satisface
donde, en el momento , es el estado de la planta; son sus entradas; y son sus salidas. Estas ecuaciones simplemente dicen que las salidas actuales de la planta y su estado futuro están determinados únicamente por sus estados actuales y las entradas actuales. (Aunque estas ecuaciones se expresan en términos de pasos de tiempo discretos , ecuaciones muy similares se cumplen para sistemas continuos ). Si este sistema es observable , entonces la salida de la planta, , se puede utilizar para dirigir el estado del observador de estado.
El modelo de observador del sistema físico se deriva entonces típicamente de las ecuaciones anteriores. Se pueden incluir términos adicionales para asegurar que, al recibir valores medidos sucesivos de las entradas y salidas de la planta, el estado del modelo converja al de la planta. En particular, la salida del observador se puede restar de la salida de la planta y luego multiplicar por una matriz ; esto se agrega luego a las ecuaciones para el estado del observador para producir un llamado observador de Luenberger , definido por las ecuaciones siguientes. Obsérvese que las variables de un observador de estado se denotan comúnmente con un "sombrero": y para distinguirlas de las variables de las ecuaciones satisfechas por el sistema físico.
Se dice que el observador es asintóticamente estable si el error del observador converge a cero cuando . Para un observador de Luenberger, el error del observador satisface . Por lo tanto, el observador de Luenberger para este sistema de tiempo discreto es asintóticamente estable cuando la matriz tiene todos los valores propios dentro del círculo unitario.
Para fines de control, la salida del sistema de observación se retroalimenta a la entrada tanto del observador como de la planta a través de la matriz de ganancias .
Las ecuaciones del observador entonces se convierten en:
o, más simplemente,
Gracias al principio de separación sabemos que podemos elegir y de forma independiente sin perjudicar la estabilidad general de los sistemas. Como regla general, los polos del observador suelen elegirse para que converjan 10 veces más rápido que los polos del sistema .
Caso de tiempo continuo
El ejemplo anterior se refería a un observador implementado en un sistema LTI de tiempo discreto. Sin embargo, el proceso es similar para el caso de tiempo continuo; las ganancias del observador se eligen para hacer que la dinámica del error de tiempo continuo converja a cero de manera asintótica (es decir, cuando es una matriz de Hurwitz ).
Para un sistema lineal de tiempo continuo
donde , el observador parece similar al caso de tiempo discreto descrito anteriormente:
.
El error del observador satisface la ecuación
.
Los valores propios de la matriz se pueden elegir arbitrariamente mediante la elección adecuada de la ganancia del observador cuando el par es observable, es decir, se cumple la condición de observabilidad . En particular, se puede hacer Hurwitz, de modo que el error del observador cuando .
Métodos de observación y otros métodos de observación
Cuando la ganancia del observador es alta, el observador lineal de Luenberger converge a los estados del sistema muy rápidamente. Sin embargo, una ganancia alta del observador conduce a un fenómeno de pico en el que el error inicial del estimador puede ser prohibitivamente grande (es decir, poco práctico o inseguro de usar). [1] Como consecuencia, hay métodos de observador no lineales de alta ganancia disponibles que convergen rápidamente sin el fenómeno de pico. Por ejemplo, el control de modo deslizante se puede utilizar para diseñar un observador que lleve el error de un estado estimado a cero en un tiempo finito incluso en presencia de un error de medición; los otros estados tienen un error que se comporta de manera similar al error en un observador de Luenberger después de que el pico haya disminuido. Los observadores de modo deslizante también tienen propiedades atractivas de resiliencia al ruido que son similares a un filtro de Kalman . [2] [3]
Otro enfoque es aplicar múltiples observadores, que mejora significativamente los transitorios y reduce el sobreimpulso del observador. Los múltiples observadores se pueden adaptar a cada sistema donde sea aplicable un observador de alta ganancia. [4]
Observadores estatales para sistemas no lineales
Los observadores de alta ganancia, modo deslizante y extendido son los observadores más comunes para sistemas no lineales. Para ilustrar la aplicación de los observadores de modo deslizante para sistemas no lineales, primero considere el sistema no lineal sin entrada:
donde . Supongamos también que hay una salida medible dada por
Existen varios enfoques no aproximados para diseñar un observador. Los dos observadores que se indican a continuación también se aplican al caso en el que el sistema tiene una entrada. Es decir,
Dinámica de error linealizable
Una sugerencia de Krener e Isidori [5] y Krener y Respondek [6] se puede aplicar en una situación en la que existe una transformación linealizante (es decir, un difeomorfismo , como el utilizado en la linealización por retroalimentación ) tal que en nuevas variables las ecuaciones del sistema se leen
El observador de Luenberger está entonces diseñado como
.
El error del observador para la variable transformada satisface la misma ecuación que en el caso lineal clásico.
.
Como lo demostraron Gauthier, Hammouri y Othman [7]
y Hammouri y Kinnaert [8], si existe una transformación tal que el sistema puede transformarse en la forma
Entonces el observador está diseñado como
,
donde es una ganancia de observador variable en el tiempo.
Ciccarella, Dalla Mora y Germani [9] obtuvieron resultados más avanzados y generales, eliminando la necesidad de una transformación no lineal y demostrando la convergencia asintótica global del estado estimado al estado verdadero utilizando solo suposiciones simples sobre la regularidad.
Observadores cambiados
Como se discutió para el caso lineal anterior, el fenómeno de pico presente en los observadores de Luenberger justifica el uso de observadores conmutados. Un observador conmutado abarca un relé o interruptor binario que actúa al detectar cambios minúsculos en la salida medida. Algunos tipos comunes de observadores conmutados incluyen el observador de modo deslizante, el observador de estado extendido no lineal, [10] observador de tiempo fijo, [11] observador de alta ganancia conmutada [12] y observador unificador. [13] El observador de modo deslizante utiliza retroalimentación de alta ganancia no lineal para llevar los estados estimados a una hipersuperficie donde no hay diferencia entre la salida estimada y la salida medida. La ganancia no lineal utilizada en el observador se implementa típicamente con una función de conmutación escalada, como el signo (es decir, sgn) del error de salida estimado - medido. Por lo tanto, debido a esta retroalimentación de alta ganancia, el campo vectorial del observador tiene un pliegue en él para que las trayectorias del observador se deslicen a lo largo de una curva donde la salida estimada coincide exactamente con la salida medida. Por lo tanto, si el sistema es observable desde su salida, todos los estados del observador serán llevados a los estados reales del sistema. Además, al utilizar el signo del error para controlar el observador en modo deslizante, las trayectorias del observador se vuelven insensibles a muchas formas de ruido. Por lo tanto, algunos observadores en modo deslizante tienen propiedades atractivas similares al filtro de Kalman, pero con una implementación más simple. [2] [3]
Como lo sugiere Drakunov, [14] también se puede diseñar un observador de modo deslizante para una clase de sistemas no lineales. Un observador de este tipo se puede escribir en términos de la estimación de la variable original y tiene la forma
El vector tiene componentes que son la función de salida y sus derivadas de Lie repetidas. En particular,
donde es la derivada de Lie i- ésima de la función de salida a lo largo del campo vectorial (es decir, a lo largo de las trayectorias del sistema no lineal). En el caso especial en el que el sistema no tiene entrada o tiene un grado relativo de n , es una colección de la salida y sus derivadas. Debido a que debe existir la inversa de la linealización jacobiana de para que este observador esté bien definido, se garantiza que la transformación sea un difeomorfismo local .
donde, para cada elemento , y es adecuadamente grande para garantizar la accesibilidad del modo deslizante.
El vector del observador es tal que
donde aquí está la función signo normal definida para escalares, y denota un "operador de valor equivalente" de una función discontinua en modo deslizante.
La idea se puede explicar brevemente de la siguiente manera. Según la teoría de los modos deslizantes, para describir el comportamiento del sistema, una vez que se inicia el modo deslizante, la función debe reemplazarse por valores equivalentes (ver control equivalente en la teoría de los modos deslizantes ). En la práctica, conmuta (vibra) con alta frecuencia con un componente lento que es igual al valor equivalente. Aplicando un filtro de paso bajo apropiado para deshacerse del componente de alta frecuencia, se puede obtener el valor del control equivalente, que contiene más información sobre el estado del sistema estimado. El observador descrito anteriormente utiliza este método varias veces para obtener el estado del sistema no lineal idealmente en tiempo finito.
El error de observación modificado se puede escribir en los estados transformados . En particular,
y entonces
Entonces:
Mientras , la primera fila de la dinámica de error, , cumplirá condiciones suficientes para ingresar al modo deslizante en tiempo finito.
A lo largo de la superficie, el control equivalente correspondiente será igual a , y por lo tanto . Por lo tanto, mientras , la segunda fila de la dinámica de error, , entrará en el modo deslizante en un tiempo finito.
A lo largo de la superficie, el control equivalente correspondiente será igual a . Por lo tanto, siempre que , la fila n de la dinámica de error, , entrará en el modo deslizante en un tiempo finito.
Por lo tanto, para ganancias suficientemente grandes, todos los estados estimados por el observador alcanzan los estados reales en un tiempo finito. De hecho, el aumento permite la convergencia en cualquier tiempo finito deseado siempre que cada función pueda acotarse con certeza. Por lo tanto, el requisito de que la función sea un difeomorfismo (es decir, que su linealización jacobiana sea invertible) afirma que la convergencia del resultado estimado implica la convergencia del estado estimado. Es decir, el requisito es una condición de observabilidad.
En el caso del observador en modo deslizante para el sistema con la entrada, se necesitan condiciones adicionales para que el error de observación sea independiente de la entrada. Por ejemplo, que
no depende del tiempo. El observador es entonces
Multiobservador
El algoritmo multiobservador extiende la estructura de observador de alta ganancia de un solo observador a uno de múltiples observadores, con muchos modelos trabajando simultáneamente. Tiene dos capas: la primera consiste en múltiples observadores de alta ganancia con diferentes estados de estimación, y la segunda determina los pesos de importancia de los observadores de la primera capa. El algoritmo es simple de implementar y no contiene operaciones riesgosas como la diferenciación. [4] La idea de múltiples modelos se aplicó anteriormente para obtener información en el control adaptativo. [15]
Esquema multiobservador
Suponiendo que el número de observadores de alta ganancia es igual a ,
donde es el índice del observador. Los observadores de la primera capa constan de la misma ganancia pero difieren del estado inicial . En la segunda capa, todos los observadores se combinan en uno para obtener una estimación del vector de estado único.
donde son factores de ponderación. Estos factores se modifican para proporcionar la estimación en la segunda capa y mejorar el proceso de observación.
Supongamos que
y
donde es un vector que depende del error del observador .
Algunas transformaciones dan lugar a un problema de regresión lineal.
Esta fórmula permite estimar . Para construir la variedad necesitamos una correspondencia entre y una garantía de que sea calculable a partir de señales mensurables. Lo primero es eliminar el fenómeno del estacionamiento por error del observador
.
Calcular la derivada multiplicada por para encontrar la función m que conduce a la definición de
donde es una constante de tiempo. Nótese que depende de ambos y de sus integrales, por lo que está fácilmente disponible en el sistema de control. Además, se especifica mediante la ley de estimación; y, por lo tanto, demuestra que la variedad es medible. En la segunda capa , se introduce como estimaciones de coeficientes. El error de mapeo se especifica como
donde . Si los coeficientes son iguales a , entonces el error de mapeo Ahora es posible calcular a partir de la ecuación anterior y, por lo tanto, el fenómeno de pico se reduce gracias a las propiedades de la variedad. El mapeo creado brinda mucha flexibilidad en el proceso de estimación. Incluso es posible estimar el valor de en la segunda capa y calcular el estado . [4]
Observadores delimitadores
Los observadores de límite [16] o de intervalo [17] [18] constituyen una clase de observadores que proporcionan dos estimaciones del estado simultáneamente: una de las estimaciones proporciona un límite superior del valor real del estado, mientras que la segunda proporciona un límite inferior. Se sabe entonces que el valor real del estado siempre está dentro de estas dos estimaciones.
Estos límites son muy importantes en aplicaciones prácticas, [19] [20] ya que permiten conocer en cada momento la precisión de la estimación.
Matemáticamente, se pueden utilizar dos observadores de Luenberger, si se seleccionan adecuadamente, utilizando, por ejemplo, propiedades de sistemas positivos : [21] uno para el límite superior (que asegura que converge a cero desde arriba cuando , en ausencia de ruido e incertidumbre ), y un límite inferior (que asegura que converge a cero desde abajo). Es decir, siempre
^ ab Utkin, Vadim; Guldner, Jürgen; Shi, Jingxin (1999), Control de modo deslizante en sistemas electromecánicos , Filadelfia, PA: Taylor & Francis, Inc., ISBN978-0-7484-0116-1
^ ab Drakunov, SV (1983), "Un filtro cuasióptimo adaptativo con parámetros discontinuos", Automatización y control remoto , 44 (9): 1167–1175
^ abc Bernat, J.; Stepien, S. (2015), "Modelado múltiple como nuevo esquema de estimación para observadores de alta ganancia", International Journal of Control , 88 (6): 1209–1222, Bibcode :2015IJC....88.1209B, doi :10.1080/00207179.2014.1000380, S2CID 8599596
^ Krener, AJ; Isidori, Alberto (1983), "Linealización por inyección de salida y observadores no lineales", System and Control Letters , 3 : 47–52, doi :10.1016/0167-6911(83)90037-3
^ Krener, AJ; Respondek, W. (1985), "Observadores no lineales con dinámica de error linealizable", SIAM Journal on Control and Optimization , 23 (2): 197–216, doi :10.1137/0323016
^ Gauthier, JP; Hammouri, H.; Othman, S. (1992), "Un observador simple para aplicaciones de sistemas no lineales en biorreactores", IEEE Transactions on Automatic Control , 37 (6): 875–880, doi :10.1109/9.256352
^ Hammouri, H.; Kinnaert, M. (1996), "Un nuevo procedimiento para la linealización variable en el tiempo hasta la inyección de salida", System and Control Letters , 28 (3): 151–157, doi :10.1016/0167-6911(96)00022-9
^ Ciccarella, G.; Dalla Mora, M.; Germani, A. (1993), "Un observador tipo Luenberger para sistemas no lineales", International Journal of Control , 57 (3): 537–556, doi :10.1080/00207179308934406
^ Guo, Bao-Zhu; Zhao, Zhi-Liang (enero de 2011). "Extended State Observer for Nonlinear Systems with Uncertainty". IFAC Proceedings Volumes . 44 (1). Federación Internacional de Control Automático : 1855–1860. doi :10.3182/20110828-6-IT-1002.00399 . Consultado el 8 de agosto de 2023 .
^ "La Wayback Machine no ha archivado esa URL" . Consultado el 8 de agosto de 2023 .[ enlace muerto ]
^ Kumar, Sunil; Kumar Pal, Anil; Kamal, Shyam; Xiong, Xiaogang (19 de mayo de 2023). "Diseño de observador conmutado de alta ganancia para sistemas no lineales" . Revista internacional de ciencia de sistemas . 54 (7). Science Publishing Group : 1471–1483. Bibcode :2023IJSS...54.1471K. doi :10.1080/00207721.2023.2178863. S2CID 257145897 . Consultado el 8 de agosto de 2023 .
^ "Registro" . IEEE Xplore . Consultado el 8 de agosto de 2023 .
^ Drakunov, SV (1992). "Observadores de modo deslizante basados en un método de control equivalente". [1992] Actas de la 31.ª Conferencia IEEE sobre decisión y control. págs. 2368-2370. doi :10.1109/CDC.1992.371368. ISBN978-0-7803-0872-5.S2CID 120072463 .
^ Narendra, KS; Han, Z. (agosto de 2012). "Un nuevo enfoque para el control adaptativo utilizando múltiples modelos". Revista internacional de control adaptativo y procesamiento de señales . 26 (8): 778–799. doi :10.1002/acs.2269. ISSN 1099-1115. S2CID 60482210.
^ Combastel, C. (2003). "Un observador delimitador de estados basado en zonotopos" (PDF) . Conferencia Europea de Control de 2003 (ECC) . pp. 2589–2594. doi :10.23919/ECC.2003.7085991. ISBN .978-3-9524173-7-9. Número de identificación del sujeto 13790057.
^ Rami, M. Ait; Cheng, CH; De Prada, C. (2008). "Observadores de intervalos robustos ajustados: un enfoque LP" (PDF) . 2008 47.ª Conferencia IEEE sobre decisiones y control . pp. 2967–2972. doi :10.1109/CDC.2008.4739280. ISBN .978-1-4244-3123-6. Número de identificación del sujeto 288928.
^ Efimov, D.; Raïssi, T. (2016). "Diseño de observadores de intervalo para sistemas dinámicos inciertos". Automatización y control remoto . 77 (2): 191–225. doi :10.1134/S0005117916020016. hdl : 20.500.12210/25069 . S2CID 49322177.
^ http://www.iaeng.org/publication/WCE2010/WCE2010_pp656-661.pdf [ URL básica PDF ]
^ Hadj-Sadok, MZ; Gouzé, JL (2001). "Estimación de modelos inciertos de procesos de lodos activados con observadores de intervalo". Journal of Process Control . 11 (3): 299–310. doi :10.1016/S0959-1524(99)00074-8.
^ Rami, Mustapha Ait; Tadeo, Fernando; Helmke, Uwe (2011). "Observadores positivos para sistemas positivos lineales y sus implicaciones". Revista Internacional de Control . 84 (4): 716–725. Bibcode :2011IJC....84..716A. doi :10.1080/00207179.2011.573000. S2CID 21211012.
Referencias generales
Sontag, Eduardo (1998), Teoría del control matemático: sistemas deterministas de dimensión finita. Segunda edición , Springer, ISBN 978-0-387-98489-6
Enlaces externos
Explicación sencilla del filtro de Kalman: tutorial paso a paso del filtro de Kalman con ecuaciones