Ecuación rígida

En matemáticas , una ecuación rígida es una ecuación diferencial para la cual ciertos métodos numéricos para resolver la ecuación son numéricamente inestables , a menos que el tamaño del paso se considere extremadamente pequeño. Ha resultado difícil formular una definición precisa de rigidez, pero la idea principal es que la ecuación incluye algunos términos que pueden llevar a una variación rápida en la solución.

Al integrar numéricamente una ecuación diferencial, se esperaría que el tamaño de paso requerido fuera relativamente pequeño en una región donde la curva de solución muestra mucha variación y que fuera relativamente grande donde la curva de solución se endereza para acercarse a una línea con pendiente cercana a cero. Para algunos problemas este no es el caso. Para que un método numérico proporcione una solución confiable al sistema diferencial, a veces se requiere que el tamaño del paso esté en un nivel inaceptablemente pequeño en una región donde la curva de solución es muy suave. El fenómeno se conoce como rigidez . En algunos casos puede haber dos problemas diferentes con la misma solución, pero uno no es rígido y el otro sí. Por lo tanto, el fenómeno no puede ser una propiedad de la solución exacta, ya que es la misma para ambos problemas y debe ser una propiedad del propio sistema diferencial. Por lo tanto, tales sistemas se conocen como sistemas rígidos .

Ejemplo motivador

Métodos numéricos explícitos que presentan inestabilidad al integrar una ecuación diferencial ordinaria rígida

Consideremos el problema del valor inicial

La solución exacta (mostrada en cian) es

Buscamos una solución numérica que exhiba el mismo comportamiento.

La figura (derecha) ilustra los problemas numéricos para varios integradores numéricos aplicados en la ecuación.

El método de Euler con un tamaño de paso de oscila violentamente y sale rápidamente del rango del gráfico (mostrado en rojo). $h={\tfrac {1}{4}}$
El método de Euler con la mitad del tamaño de paso, , produce una solución dentro de los límites del gráfico, pero oscila alrededor de cero (mostrado en verde). $h={\tfrac {1}{8}}$
El método trapezoidal (es decir, el método de Adams-Moulton de dos etapas ) viene dado por donde . Al aplicar este método en lugar del método de Euler se obtiene un resultado mucho mejor (azul). Los resultados numéricos disminuyen monótonamente hasta cero, al igual que la solución exacta. $y'=f(t,y)$

Uno de los ejemplos más destacados de ecuaciones diferenciales ordinarias (EDO) rígidas es un sistema que describe la reacción química de Robertson: ^[1]

Si se trata este sistema en un intervalo corto, por ejemplo, no hay problema de integración numérica. Sin embargo, si el intervalo es muy grande (digamos 10 ¹¹ ), muchos códigos estándar no logran integrarlo correctamente. $t\in [0,40]$

Relación de rigidez

Consideremos el sistema no homogéneo de coeficientes constantes lineales

donde y es una matriz constante, diagonalizable, con valores propios (supuestos distintos) y vectores propios correspondientes . La solución general de ( 5 ) toma la forma $\mathbf {y},\mathbf {f} \en \mathbb {R} ^{n}$ $\mathbf {A}$ $n\veces n$ $\lambda _{t}\in \mathbb {C} ,t=1,2,\ldots ,n$ $\mathbf {c} _{t}\in \mathbb {C} ^{n},t=1,2,\ldots ,n$

donde son constantes arbitrarias y es una integral particular. Ahora supongamos que $\kappa_{t}$ $\mathbf {g} (x)$

lo que implica que cada uno de los términos como , de modo que la solución se aproxima asintóticamente como ; el término decaerá monótonamente si es real y sinusoidalmente si es complejo. $e^{\lambda _{t}x}\mathbf {c} _{t}\to 0$ $x\to \infty$ $\mathbf {y} (x)$ $\mathbf {g} (x)$ $x\to \infty$ $e^{\lambda _{t}x}\mathbf {c} _{t}$ $\lambda_{t}$ $\lambda_{t}$

Interpretando como tiempo (como se hace a menudo en problemas físicos), se denomina solución transitoria y solución de estado estable . Si es grande, entonces el término correspondiente decaerá rápidamente a medida que aumenta y, por lo tanto, se denomina transitorio rápido ; si es pequeño, el término correspondiente decae lentamente y se denomina transitorio lento . Sea definido por ${\estilo de visualización x}$ ${\textstyle \sum _{t=1}^{n}\kappa _{t}e^{\lambda _{t}x}\mathbf {c} _{t}}$ $\mathbf {g} (x)$ $\left|\operatorname {Re} (\lambda _{t})\right|$ $\kappa _{t}e^{\lambda _{t}x}\mathbf {c} _{t}$ ${\estilo de visualización x}$ $\left|\operatorname {Re} (\lambda _{t})\right|$ $\kappa _{t}e^{\lambda _{t}x}\mathbf {c} _{t}$ ${\overline {\lambda }},{\underline {\lambda }}\in \{\lambda _{t},t=1,2,\ldots ,n\}$

De modo que este es el transitorio más rápido y el más lento. Ahora definimos la relación de rigidez como ^[2] $\kappa _{t}e^{{\overline {\lambda }}x}\mathbf {c} _{t}$ $\kappa _{t}e^{{\underline {\lambda }}x}\mathbf {c} _{t}$

Caracterización de la rigidez

En esta sección consideramos varios aspectos del fenómeno de la rigidez. "Fenómeno" es probablemente una palabra más apropiada que "propiedad", ya que esta última implica más bien que la rigidez puede definirse en términos matemáticos precisos; resulta que no es posible hacer esto de una manera satisfactoria, incluso para la clase restringida de sistemas lineales de coeficientes constantes. También veremos varias afirmaciones cualitativas que pueden hacerse (y en su mayoría se han hecho) en un intento de resumir la noción de rigidez, y enunciaremos lo que es probablemente la más satisfactoria de ellas como una "definición" de rigidez.

JD Lambert define la rigidez de la siguiente manera:

Si un método numérico con una región finita de estabilidad absoluta , aplicado a un sistema con cualesquiera condiciones iniciales , se ve obligado a utilizar en un cierto intervalo de integración una longitud de paso que es excesivamente pequeña en relación con la suavidad de la solución exacta en ese intervalo, entonces se dice que el sistema es rígido en ese intervalo.

Existen otras características que se presentan en muchos ejemplos de problemas rígidos, pero para cada una de ellas existen contraejemplos, por lo que estas características no constituyen buenas definiciones de rigidez. No obstante, algunos autores utilizan comúnmente definiciones basadas en estas características y son buenas pistas sobre la presencia de rigidez. Lambert se refiere a ellas como "enunciados" en lugar de definiciones, por las razones antes mencionadas. Algunas de ellas son:

Un sistema lineal de coeficientes constantes es rígido si todos sus valores propios tienen una parte real negativa y la relación de rigidez es grande.
La rigidez se produce cuando los requisitos de estabilidad, en lugar de los de precisión, limitan la longitud del paso.
La rigidez se produce cuando algunos componentes de la solución se desintegran mucho más rápidamente que otros. ^[3]

Etimología

El origen del término "rigidez" no ha sido claramente establecido. Según Joseph Oakland Hirschfelder , el término "rígido" se utiliza porque tales sistemas corresponden a un acoplamiento estrecho entre el conductor y el accionado en los servomecanismos . ^[4] Según Richard L. Burden y J. Douglas Faires,

Pueden surgir dificultades importantes cuando se aplican técnicas numéricas estándar para aproximar la solución de una ecuación diferencial cuando la solución exacta contiene términos de la forma , donde es un número complejo con parte real negativa. $e^{\lambda t}$ $\lambda$
. . .
Los problemas que involucran soluciones transitorias de rápida descomposición ocurren naturalmente en una amplia variedad de aplicaciones, incluyendo el estudio de sistemas de resortes y amortiguamiento, el análisis de sistemas de control y problemas en cinética química . Todos estos son ejemplos de una clase de problemas llamados sistemas rígidos (rigidez matemática) de ecuaciones diferenciales, debido a su aplicación en el análisis del movimiento de sistemas de resortes y masas que tienen constantes de resorte grandes ( rigidez física ). ^[5]

Por ejemplo, el problema del valor inicial

con , , , se puede escribir en la forma ( 5 ) con y $m=1$ $c=1001$ $k=1000$ $n=2$

y tiene valores propios . Ambos valores propios tienen una parte real negativa y la relación de rigidez es ${\overline {\lambda }}=-1000,{\underline {\lambda }}=-1$

que es bastante grande. El sistema ( 10 ) ciertamente satisface las afirmaciones 1 y 3. Aquí la constante de resorte es grande y la constante de amortiguamiento es aún mayor. ^[6] (aunque "grande" no es un término claramente definido, pero cuanto mayores sean las cantidades anteriores, más pronunciado será el efecto de la rigidez). La solución exacta para ( 10 ) es $k$ $c$

La ecuación 13 se comporta de manera bastante similar a una exponencial simple , pero la presencia del término, incluso con un coeficiente pequeño, es suficiente para que el cálculo numérico sea muy sensible al tamaño del paso. La integración estable de ( 10 ) requiere un tamaño de paso muy pequeño hasta bien entrada la parte suave de la curva de solución, lo que da como resultado un error mucho menor que el requerido para la precisión. Por lo tanto, el sistema también satisface la afirmación 2 y la definición de Lambert. $x_{0}e^{-t}$ $e^{-1000t}$

A-estabilidad

El comportamiento de los métodos numéricos en problemas rígidos se puede analizar aplicando estos métodos a la ecuación de prueba sujeta a la condición inicial con . La solución de esta ecuación es . Esta solución se acerca a cero como cuando Si el método numérico también exhibe este comportamiento (para un tamaño de paso fijo), entonces se dice que el método es A-estable. ^[7] Un método numérico que es L-estable (ver a continuación) tiene la propiedad más fuerte de que la solución se acerca a cero en un solo paso a medida que el tamaño del paso tiende al infinito. Los métodos A-estables no exhiben los problemas de inestabilidad como se describe en el ejemplo motivador. $y'=ky$ $y(0)=1$ $k\in \mathbb {C}$ $y(t)=e^{kt}$ $t\to \infty$ $\operatorname {Re} (k)<0.$

Métodos de Runge-Kutta

Los métodos de Runge-Kutta aplicados a la ecuación de prueba toman la forma , y, por inducción, . La función se denomina función de estabilidad . Por lo tanto, la condición de que como es equivalente a . Esto motiva la definición de la región de estabilidad absoluta (a veces denominada simplemente región de estabilidad ), que es el conjunto . El método es A-estable si la región de estabilidad absoluta contiene el conjunto , es decir, el semiplano izquierdo. $y'=k\cdot y$ $y_{n+1}=\phi (hk)\cdot y_{n}$ $y_{n}={\bigl (}\phi (hk){\bigr )}^{n}\cdot y_{0}$ $\phi$ $y_{n}\to 0$ $n\to \infty$ $|\phi (hk)|<1$ ${\bigl \{}z\in \mathbb {C} \,{\big |}\,|\phi (z)|<1{\bigr \}}$ ${\bigl \{}z\in \mathbb {C} \,{\big |}\,\operatorname {Re} (z)<0{\bigr \}}$

Ejemplo: Los métodos de Euler

Considere los métodos de Euler anteriores. El método de Euler explícito aplicado a la ecuación de prueba es $y'=k\cdot y$

y_{n+1}=y_{n}+h\cdot f(t_{n},y_{n})=y_{n}+h\cdot (ky_{n})=y_{n}+h\cdot k\cdot y_{n}=(1+h\cdot k)y_{n}.

Por lo tanto, con . La región de estabilidad absoluta para este método es, por tanto , que es el disco representado a la derecha. El método de Euler no es A-estable. $y_{n}=(1+hk)^{n}\cdot y_{0}$ $\phi (z)=1+z$ ${\bigl \{}z\in \mathbb {C} \,{\big |}\,|1+z|<1{\bigr \}}$

El ejemplo motivador tenía . El valor de z cuando se toma el tamaño del paso es , que está fuera de la región de estabilidad. De hecho, los resultados numéricos no convergen a cero. Sin embargo, con un tamaño de paso , tenemos que está justo dentro de la región de estabilidad y los resultados numéricos convergen a cero, aunque de forma bastante lenta. $k=-15$ $h={\tfrac {1}{4}}$ $z=-15\times {\tfrac {1}{4}}=-3.75$ $h={\tfrac {1}{8}}$ $z=-1.875$

Ejemplo: método trapezoidal

Consideremos el método trapezoidal

y_{n+1}=y_{n}+{\tfrac {1}{2}}h\cdot {\bigl (}f(t_{n},y_{n})+f(t_{n+1},y_{n+1}){\bigr )},

Cuando se aplica a la ecuación de prueba , es $y'=k\cdot y$

y_{n+1}=y_{n}+{\tfrac {1}{2}}h\cdot \left(ky_{n}+ky_{n+1}\right).

Resolviendo los rendimientos $y_{n+1}$

y_{n+1}={\frac {1+{\frac {1}{2}}hk}{1-{\frac {1}{2}}hk}}\cdot y_{n}.

Por lo tanto, la función de estabilidad es

\phi (z)={\frac {1+{\frac {1}{2}}z}{1-{\frac {1}{2}}z}}

y la región de estabilidad absoluta es

\left\{z\in \mathbb {C} \ \left|\ \left|{\frac {1+{\frac {1}{2}}z}{1-{\frac {1}{2}}z}}\right|<1\right.\right\}.

Esta región contiene el semiplano izquierdo, por lo que el método trapezoidal es A-estable. De hecho, la región de estabilidad es idéntica al semiplano izquierdo y, por lo tanto, la solución numérica de converge a cero si y solo si lo hace la solución exacta. Sin embargo, el método trapezoidal no tiene un comportamiento perfecto: amortigua todos los componentes en decaimiento, pero los componentes en decaimiento rápido se amortiguan solo muy levemente, porque como . Esto condujo al concepto de L-estabilidad : un método es L-estable si es A-estable y como . El método trapezoidal es A-estable pero no L-estable. El método de Euler implícito es un ejemplo de un método L-estable. ^[8] $y'=k\cdot y$ $\phi (z)\to 1$ $z\to -\infty$ $|\phi (z)|\to 0$ $z\to \infty$

Teoría general

La función de estabilidad de un método de Runge-Kutta con coeficientes y está dada por $\mathbf {A}$ $\mathbf {b}$

\phi (z)={\frac {\det \left(\mathbf {I} -z\mathbf {A} +z\mathbf {e} \mathbf {b} ^{\mathsf {T}}\right)}{\det(\mathbf {I} -z\mathbf {A} )}},

donde denota el vector con todos los unos. Esta es una función racional (un polinomio dividido por otro). $\mathbf {e}$

Los métodos explícitos de Runge-Kutta tienen una matriz de coeficientes triangular estrictamente inferior y, por lo tanto, su función de estabilidad es un polinomio. De ello se desprende que los métodos explícitos de Runge-Kutta no pueden ser A-estables. $\mathbf {A}$

La función de estabilidad de los métodos Runge-Kutta implícitos se suele analizar utilizando estrellas de orden. La estrella de orden de un método con función de estabilidad se define como el conjunto . Un método es A-estable si y solo si su función de estabilidad no tiene polos en el plano izquierdo y su estrella de orden no contiene números puramente imaginarios. ^[9] $\phi$ ${\bigl \{}z\in \mathbb {C} \,{\big |}\,|\phi (z)|>|e^{z}|{\bigr \}}$

Métodos de varios pasos

Los métodos lineales de varios pasos tienen la forma

y_{n+1}=\sum _{i=0}^{s}a_{i}y_{n-i}+h\sum _{j=-1}^{s}b_{j}f\left(t_{n-j},y_{n-j}\right).

Aplicados a la ecuación de prueba, se convierten en

y_{n+1}=\sum _{i=0}^{s}a_{i}y_{n-i}+hk\sum _{j=-1}^{s}b_{j}y_{n-j},

que puede simplificarse a

\left(1-b_{-1}z\right)y_{n+1}-\sum _{j=0}^{s}\left(a_{j}+b_{j}z\right)y_{n-j}=0

donde . Esta es una relación de recurrencia lineal . El método es A-estable si todas las soluciones de la relación de recurrencia convergen a cero cuando . El polinomio característico es $z=hk$ $\{y_{n}\}$ $\operatorname {Re} (z)<0$

\Phi (z,w)=w^{s+1}-\sum _{i=0}^{s}a_{i}w^{s-i}-z\sum _{j=-1}^{s}b_{j}w^{s-j}.

Todas las soluciones convergen a cero para un valor dado de si todas las soluciones de se encuentran en el círculo unitario. $z$ $w$ $\Phi (z,w)=0$

La región de estabilidad absoluta para un método de varios pasos de la forma anterior es entonces el conjunto de todos los que satisfacen . Nuevamente, si este conjunto contiene el semiplano izquierdo, se dice que el método de varios pasos es A-estable. $z\in \mathbb {C}$ $w$ $\Phi (z,w)=0$ $|w|<1$

Ejemplo: El método de Adams-Bashforth de segundo orden

Determinemos la región de estabilidad absoluta para el método de Adams-Bashforth de dos pasos

y_{n+1}=y_{n}+h\left({\tfrac {3}{2}}f(t_{n},y_{n})-{\tfrac {1}{2}}f(t_{n-1},y_{n-1})\right).

El polinomio característico es

\Phi (w,z)=w^{2}-\left(1+{\tfrac {3}{2}}z\right)w+{\tfrac {1}{2}}z=0

que tiene raíces

w={\tfrac {1}{2}}\left(1+{\tfrac {3}{2}}z\pm {\sqrt {1+z+{\tfrac {9}{4}}z^{2}}}\right),

Por lo tanto, la región de estabilidad absoluta es

\left\{z\in \mathbb {C} \ \left|\ \left|{\tfrac {1}{2}}\left(1+{\tfrac {3}{2}}z\pm {\sqrt {1+z+{\tfrac {9}{4}}z^{2}}}\right)\right|<1\right.\right\}.

Esta región se muestra a la derecha. No incluye todo el semiplano izquierdo (de hecho, solo incluye el eje real entre ), por lo que el método de Adams-Bashforth no es A-estable. $-1\leq z\leq 0$

Teoría general

Los métodos multipaso explícitos nunca pueden ser A-estables, al igual que los métodos Runge-Kutta explícitos. Los métodos multipaso implícitos solo pueden ser A-estables si su orden es como máximo 2. Este último resultado se conoce como la segunda barrera de Dahlquist ; restringe la utilidad de los métodos multipaso lineales para ecuaciones rígidas. Un ejemplo de un método A-estable de segundo orden es la regla trapezoidal mencionada anteriormente, que también puede considerarse como un método multipaso lineal. ^[10]

Véase también

Fórmula de diferenciación hacia atrás , una familia de métodos implícitos especialmente utilizados para la solución de ecuaciones diferenciales rígidas.
Número de condición
Inclusión diferencial , una extensión de la noción de ecuación diferencial que permite discontinuidades, en parte como una forma de evitar algunos problemas de rigidez.
Métodos explícitos e implícitos

Notas

^ Robertson, HH (1966). "La solución de un conjunto de ecuaciones de velocidad de reacción". Análisis numérico: una introducción . Academic Press. págs. 178–182.
^ Lambert (1992, págs. 216-217)
^ Lambert (1992, págs. 217-220)
^ Hirshfelder (1963)
^ Carga y ferias (1993, pág.314)
^ Kreyszig (1972, págs. 62–68)
^ Esta definición se debe a Dahlquist (1963).
^ La definición de L-estabilidad se debe a Ehle (1969).
^ La definición se debe a Wanner, Hairer y Nørsett (1978); véase también Iserles y Nørsett (1991).
^ Véase Dahlquist (1963).

Referencias

Burden, Richard L.; Faires, J. Douglas (1993), Análisis numérico (5.ª ed.), Boston: Prindle, Weber y Schmidt, ISBN 0-534-93219-3.
Dahlquist, Germund (1963), "Un problema de estabilidad especial para métodos lineales de múltiples pasos", BIT , 3 (1): 27–43, doi :10.1007/BF01963532, hdl : 10338.dmlcz/103497 , S2CID 120241743.
Eberly, David (2008), Análisis de estabilidad para sistemas de ecuaciones diferenciales (PDF).
Ehle, BL (1969), Sobre aproximaciones de Padé a la función exponencial y métodos A-estables para la solución numérica de problemas de valor inicial (PDF) , Universidad de Waterloo.
Gear, CW (1971), Problemas numéricos de valores iniciales en ecuaciones diferenciales ordinarias , Englewood Cliffs: Prentice Hall , Bibcode :1971nivp.book.....G.
Gear, CW (1981), "Solución numérica de ecuaciones diferenciales ordinarias: ¿queda algo por hacer?", SIAM Review , 23 (1): 10–24, doi :10.1137/1023002.
Hairer, Ernst; Wanner, Gerhard (1996), Solución de ecuaciones diferenciales ordinarias II: Problemas rígidos y diferenciales-algebraicos (segunda ed.), Berlín: Springer-Verlag , ISBN 978-3-540-60452-5.
Hirshfelder, JO (1963), "Matemáticas aplicadas tal como se utilizan en la química teórica", Simposio de la American Mathematical Society : 367–376.
Iserles, Arieh; Nørsett, Syvert (1991), Orden de estrellas , Chapman & Hall , ISBN 978-0-412-35260-7.
Kreyszig, Erwin (1972), Matemáticas avanzadas de ingeniería (3.ª ed.), Nueva York: Wiley , ISBN 0-471-50728-8.
Lambert, JD (1977), D. Jacobs (ed.), "El problema del valor inicial para ecuaciones diferenciales ordinarias", El estado del arte en análisis numérico , Nueva York: Academic Press : 451–501.
Lambert, JD (1992), Métodos numéricos para sistemas diferenciales ordinarios , Nueva York: Wiley , ISBN 978-0-471-92990-1.
Mathews, John; Fink, Kurtis (1992), Métodos numéricos utilizando MATLAB.
Press, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007). "Sección 17.5. Conjuntos rígidos de ecuaciones". Recetas numéricas: el arte de la computación científica (3.ª ed.). Nueva York: Cambridge University Press. ISBN 978-0-521-88068-8Archivado desde el original el 11-08-2011 . Consultado el 17-08-2011 .
Shampine, LF; Gear, CW (1979), "La visión de un usuario sobre la solución de ecuaciones diferenciales ordinarias rígidas", SIAM Review , 21 (1): 1–17, doi :10.1137/1021001.
Wanner, Gerhard; Hairer, Ernst; Nørsett, Syvert (1978), "Estrellas de orden y teoría de la estabilidad", BIT , 18 (4): 475–489, doi :10.1007/BF01932026, S2CID 8824105.
Estabilidad de los métodos de Runge-Kutta [1]

Enlaces externos

Introducción al modelado basado en la física: funciones de energía y rigidez
Sistemas rígidos Lawrence F. Shampine y Skip Thompson Scholarpedia , 2(3):2855. doi:10.4249/scholarpedia.2855