La respuesta al escalón de un sistema en un estado inicial dado consiste en la evolución temporal de sus salidas cuando sus entradas de control son funciones escalón de Heaviside . En ingeniería electrónica y teoría de control , la respuesta al escalón es el comportamiento temporal de las salidas de un sistema general cuando sus entradas cambian de cero a uno en un tiempo muy corto. El concepto puede extenderse a la noción matemática abstracta de un sistema dinámico utilizando un parámetro de evolución .
Desde un punto de vista práctico, es importante saber cómo responde el sistema a una entrada repentina, ya que las desviaciones grandes y posiblemente rápidas del estado estable a largo plazo pueden tener efectos extremos en el propio componente y en otras partes del sistema general que dependen de este componente. Además, el sistema general no puede actuar hasta que la salida del componente se estabilice en una proximidad cercana a su estado final, lo que retrasa la respuesta general del sistema. Formalmente, conocer la respuesta al escalón de un sistema dinámico proporciona información sobre la estabilidad de dicho sistema y sobre su capacidad para alcanzar un estado estacionario al partir de otro.
Esta sección proporciona una definición matemática formal de la respuesta al escalón en términos del concepto matemático abstracto de un sistema dinámico : aquí se enumeran todas las notaciones y suposiciones necesarias para la siguiente descripción.
Para un sistema dinámico general, la respuesta al escalón se define de la siguiente manera:
Es la función de evolución cuando las entradas de control (o término fuente , o entradas forzadas) son funciones de Heaviside: la notación enfatiza este concepto mostrando H ( t ) como subíndice.
Para una caja negra lineal invariante en el tiempo (LTI), supongamos , por conveniencia de notación: la respuesta al escalón se puede obtener mediante la convolución del control de la función escalón de Heaviside y la respuesta al impulso h ( t ) del sistema mismo.
lo que para un sistema LTI equivale simplemente a integrar este último. Por el contrario, para un sistema LTI, la derivada de la respuesta al escalón da como resultado la respuesta al impulso:
Sin embargo, estas relaciones simples no son verdaderas para un sistema no lineal o variable en el tiempo . [1]
En lugar de la respuesta de frecuencia, el rendimiento del sistema se puede especificar en términos de parámetros que describen la dependencia temporal de la respuesta. La respuesta escalonada se puede describir mediante las siguientes cantidades relacionadas con su comportamiento temporal :
En el caso de sistemas dinámicos lineales , se puede inferir mucho acerca del sistema a partir de estas características. A continuación se presenta la respuesta en escalón de un amplificador bipolar simple y se ilustran algunos de estos términos.
En los sistemas LTI, la función que tiene la velocidad de respuesta más pronunciada y que no genera sobreimpulsos ni oscilaciones es la función gaussiana, ya que es la única función cuya transformada de Fourier tiene la misma forma.
En esta sección se describe la respuesta en escalón de un amplificador de retroalimentación negativa simple que se muestra en la Figura 1. El amplificador de retroalimentación consta de un amplificador principal de bucle abierto con ganancia A OL y un bucle de retroalimentación gobernado por un factor de retroalimentación β. Se analiza este amplificador de retroalimentación para determinar cómo su respuesta en escalón depende de las constantes de tiempo que rigen la respuesta del amplificador principal y de la cantidad de retroalimentación utilizada.
Un amplificador de retroalimentación negativa tiene una ganancia dada por (ver amplificador de retroalimentación negativa ):
donde A OL = ganancia de lazo abierto , A FB = ganancia de lazo cerrado (la ganancia con retroalimentación negativa presente) y β = factor de retroalimentación .
En muchos casos, el amplificador directo se puede modelar suficientemente bien en términos de un único polo dominante de constante de tiempo τ, como una ganancia de bucle abierto dada por:
con ganancia de frecuencia cero A 0 y frecuencia angular ω = 2π f . Este amplificador directo tiene respuesta de escalón unitario
un enfoque exponencial desde 0 hacia el nuevo valor de equilibrio de A 0 .
La función de transferencia del amplificador unipolar conduce a la ganancia de bucle cerrado:
Esta ganancia de bucle cerrado tiene la misma forma que la ganancia de bucle abierto: un filtro unipolar. Su respuesta escalonada tiene la misma forma: una caída exponencial hacia el nuevo valor de equilibrio. Pero la constante de tiempo de la función escalonada de bucle cerrado es τ / (1 + β A 0 ), por lo que es más rápida que la respuesta del amplificador directo por un factor de 1 + β A 0 :
A medida que aumenta el factor de retroalimentación β , la respuesta escalonada se hará más rápida, hasta que la suposición original de un polo dominante ya no sea precisa. Si hay un segundo polo, cuando la constante de tiempo de bucle cerrado se acerque a la constante de tiempo del segundo polo, será necesario un análisis de dos polos.
En el caso de que la ganancia de lazo abierto tenga dos polos (dos constantes de tiempo , τ 1 , τ 2 ), la respuesta al escalón es un poco más complicada. La ganancia de lazo abierto viene dada por:
con ganancia de frecuencia cero A 0 y frecuencia angular ω = 2 πf .
La función de transferencia del amplificador de dos polos conduce a la ganancia de bucle cerrado:
La dependencia temporal del amplificador es fácil de descubrir cambiando las variables a s = j ω, con lo cual la ganancia se convierte en:
Los polos de esta expresión (es decir, los ceros del denominador) se encuentran en:
lo que muestra que para valores suficientemente grandes de βA 0 la raíz cuadrada se convierte en la raíz cuadrada de un número negativo, es decir, la raíz cuadrada se vuelve imaginaria y las posiciones polares son números conjugados complejos, ya sea s + o s − ; ver Figura 2:
con
y
Utilizando coordenadas polares con la magnitud del radio de las raíces dada por | s | (Figura 2):
y la coordenada angular φ viene dada por:
Las tablas de transformadas de Laplace muestran que la respuesta temporal de dicho sistema se compone de combinaciones de las dos funciones:
Es decir, las soluciones son oscilaciones amortiguadas en el tiempo. En particular, la respuesta al escalón unitario del sistema es: [2]
Lo cual se simplifica a
cuando A 0 tiende a infinito y el factor de retroalimentación β es uno.
Nótese que la amortiguación de la respuesta está determinada por ρ, es decir, por las constantes de tiempo del amplificador de lazo abierto. En contraste, la frecuencia de oscilación está determinada por μ, es decir, por el parámetro de retroalimentación a través de β A 0 . Debido a que ρ es una suma de los recíprocos de las constantes de tiempo, es interesante notar que ρ está dominado por el más corto de los dos.
La figura 3 muestra la respuesta temporal a una entrada de escalón unitario para tres valores del parámetro μ. Se puede observar que la frecuencia de oscilación aumenta con μ, pero las oscilaciones están contenidas entre las dos asíntotas establecidas por las exponenciales [ 1 − exp(− ρt ) ] y [ 1 + exp(−ρt) ]. Estas asíntotas están determinadas por ρ y, por lo tanto, por las constantes de tiempo del amplificador de lazo abierto, independientemente de la realimentación.
El fenómeno de oscilación en torno al valor final se denomina oscilación de oscilación . El sobreimpulso es la oscilación máxima por encima del valor final y aumenta claramente con μ. Del mismo modo, el subimpulso es la oscilación mínima por debajo del valor final, que también aumenta con μ. El tiempo de estabilización es el tiempo que tarda la desviación del valor final en descender por debajo de un nivel especificado, por ejemplo, el 10 % del valor final.
La dependencia del tiempo de asentamiento con respecto a μ no es obvia, y la aproximación de un sistema de dos polos probablemente no sea lo suficientemente precisa como para sacar conclusiones reales sobre la dependencia de la retroalimentación del tiempo de asentamiento. Sin embargo, las asíntotas [ 1 − exp(− ρt ) ] y [ 1 + exp (− ρt ) ] claramente afectan el tiempo de asentamiento, y están controladas por las constantes de tiempo del amplificador de lazo abierto, en particular la más corta de las dos constantes de tiempo. Esto sugiere que se debe cumplir con una especificación sobre el tiempo de asentamiento mediante un diseño apropiado del amplificador de lazo abierto.
Las dos conclusiones principales de este análisis son:
Aparte de esto, se puede notar que las desviaciones en el mundo real de este modelo lineal de dos polos ocurren debido a dos complicaciones importantes: primero, los amplificadores reales tienen más de dos polos, además de ceros; y segundo, los amplificadores reales son no lineales, por lo que su respuesta al escalón cambia con la amplitud de la señal.
A continuación se analiza cómo se puede controlar el sobreimpulso mediante la elección de parámetros adecuados.
Utilizando las ecuaciones anteriores, la cantidad de sobreimpulso se puede encontrar diferenciando la respuesta al escalón y hallando su valor máximo. El resultado para la respuesta al escalón máxima Smax es : [3]
El valor final de la respuesta al escalón es 1, por lo que la exponencial es el sobreimpulso real en sí. Está claro que el sobreimpulso es cero si μ = 0, que es la condición:
Esta ecuación cuadrática se resuelve para la relación de constantes de tiempo estableciendo x = ( τ 1 / τ 2 ) 1/2 con el resultado
Como β A 0 ≫ 1, se puede omitir el 1 en la raíz cuadrada y el resultado es
En otras palabras, la primera constante de tiempo debe ser mucho mayor que la segunda. Para ser más aventureros que un diseño que no permita sobrepasar el límite, podemos introducir un factor α en la relación anterior:
y sea α el valor de sobreimpulso que sea aceptable.
La figura 4 ilustra el procedimiento. La comparación del panel superior (α = 4) con el panel inferior (α = 0,5) muestra que los valores más bajos de α aumentan la tasa de respuesta, pero aumentan el sobreimpulso. El caso α = 2 (panel central) es el diseño de máxima planitud que no muestra picos en el gráfico de ganancia de Bode frente a frecuencia . Ese diseño tiene el margen de seguridad incorporado de la regla general para lidiar con realidades no ideales como polos múltiples (o ceros), no linealidad (dependencia de la amplitud de la señal) y variaciones de fabricación, cualquiera de las cuales puede conducir a un sobreimpulso excesivo. El ajuste de la separación de polos (es decir, la configuración de α) es el tema de la compensación de frecuencia , y uno de esos métodos es la división de polos .
La amplitud de la oscilación en la respuesta al escalón de la Figura 3 está determinada por el factor de amortiguamiento exp(− ρt ). Es decir, si especificamos una desviación aceptable de la respuesta al escalón respecto del valor final, digamos Δ, es decir:
Esta condición se cumple independientemente del valor de β A OL siempre que el tiempo sea mayor que el tiempo de establecimiento, digamos t S , dado por: [4]
donde τ 1 ≫ τ 2 es aplicable debido a la condición de control de sobreimpulso, que hace que τ 1 = αβA OL τ 2 . A menudo, se hace referencia a la condición de tiempo de establecimiento diciendo que el período de establecimiento es inversamente proporcional al ancho de banda de ganancia unitaria, porque 1/(2 π τ 2 ) está cerca de este ancho de banda para un amplificador con compensación de polo dominante típica . Sin embargo, este resultado es más preciso que esta regla empírica . Como ejemplo de esta fórmula, si Δ = 1/e 4 = 1,8 %, la condición de tiempo de establecimiento es t S = 8 τ 2 .
En general, el control del sobreimpulso establece la relación de la constante de tiempo y el tiempo de establecimiento t S establece τ 2 . [5] [6] [7]
Este método utiliza puntos significativos de la respuesta al escalón. No es necesario adivinar tangentes a la señal medida. Las ecuaciones se derivan mediante simulaciones numéricas, determinando algunas relaciones significativas y parámetros de ajuste de ecuaciones no lineales. Véase también. [8]
Aquí los pasos:
A continuación, la elección de la relación de polos τ 1 / τ 2 está relacionada con el margen de fase del amplificador de realimentación. [9] Se sigue el procedimiento descrito en el artículo sobre el diagrama de Bode . La Figura 5 es el diagrama de ganancia de Bode para el amplificador de dos polos en el rango de frecuencias hasta la segunda posición polar. La suposición detrás de la Figura 5 es que la frecuencia f 0 dB se encuentra entre el polo más bajo en f 1 = 1/(2πτ 1 ) y el segundo polo en f 2 = 1/(2πτ 2 ). Como se indica en la Figura 5, esta condición se cumple para valores de α ≥ 1.
Utilizando la Figura 5, se encuentra la frecuencia (indicada por f 0 dB ) donde la ganancia de bucle β A 0 satisface la condición de ganancia unitaria o 0 dB, como se define por:
La pendiente del tramo descendente del gráfico de ganancia es (20 dB/década); por cada aumento de diez veces en la frecuencia, la ganancia cae en el mismo factor:
El margen de fase es la desviación de la fase en f 0 dB desde −180°. Por lo tanto, el margen es:
Como f 0 dB / f 1 = βA 0 ≫ 1, el término en f 1 es 90°. Esto hace que el margen de fase sea:
En particular, para el caso α = 1, φ m = 45°, y para α = 2, φ m = 63,4°. Sansen [10] recomienda α = 3, φ m = 71,6° como una "buena posición de seguridad para empezar".
Si α se incrementa acortando τ 2 , el tiempo de asentamiento t S también se acorta. Si α se incrementa alargando τ 1 , el tiempo de asentamiento t S se altera poco. Más comúnmente, tanto τ 1 como τ 2 cambian, por ejemplo, si se utiliza la técnica de división de polos .
Por otra parte, para un amplificador con más de dos polos, el diagrama de la Figura 5 aún puede ajustarse a los diagramas de Bode haciendo de f 2 un parámetro de ajuste, al que se hace referencia como posición de "segundo polo equivalente". [11]