stringtranslate.com

ecuación rígida

En matemáticas , una ecuación rígida es una ecuación diferencial para la cual ciertos métodos numéricos para resolver la ecuación son numéricamente inestables , a menos que se considere que el tamaño del paso es extremadamente pequeño. Ha resultado difícil formular una definición precisa de rigidez, pero la idea principal es que la ecuación incluye algunos términos que pueden conducir a una rápida variación en la solución.

Al integrar numéricamente una ecuación diferencial, se esperaría que el tamaño de paso requerido fuera relativamente pequeño en una región donde la curva solución muestra mucha variación y que fuera relativamente grande donde la curva solución se endereza para aproximarse a una línea con pendiente cercana a cero. Para algunos problemas este no es el caso. Para que un método numérico dé una solución confiable al sistema diferencial, a veces se requiere que el tamaño del paso esté en un nivel inaceptablemente pequeño en una región donde la curva de solución es muy suave. El fenómeno se conoce como rigidez . En algunos casos puede haber dos problemas diferentes con la misma solución, pero uno no es rígido y el otro sí. Por tanto, el fenómeno no puede ser una propiedad de la solución exacta, ya que ésta es la misma para ambos problemas, y debe ser una propiedad del propio sistema diferencial. Por tanto, estos sistemas se conocen como sistemas rígidos .

Ejemplo motivador

Métodos numéricos explícitos que muestran inestabilidad al integrar una ecuación diferencial ordinaria rígida

Considere el problema del valor inicial.

La solución exacta (mostrada en cian) es

Buscamos una solución numérica que muestre el mismo comportamiento.

La figura (derecha) ilustra los problemas numéricos de varios integradores numéricos aplicados a la ecuación.

  1. El método de Euler con un tamaño de paso de oscila violentamente y rápidamente sale del rango del gráfico (que se muestra en rojo).
  2. El método de Euler con la mitad del tamaño del paso, produce una solución dentro de los límites del gráfico, pero oscila alrededor de cero (se muestra en verde).
  3. El método trapezoidal (es decir, el método Adams-Moulton de dos etapas ) viene dado por
    dónde . La aplicación de este método en lugar del método de Euler da un resultado mucho mejor (azul). Los resultados numéricos disminuyen monótonamente hasta cero, tal como lo hace la solución exacta.

Uno de los ejemplos más destacados de ecuaciones diferenciales ordinarias rígidas (EDO) es un sistema que describe la reacción química de Robertson: [1]

Si se trata este sistema en un intervalo corto, por ejemplo, no hay problema en la integración numérica. Sin embargo, si el intervalo es muy grande (digamos 10 11 ), muchos códigos estándar no logran integrarlo correctamente.

Ejemplos adicionales son los conjuntos de EDO resultantes de la integración temporal de grandes mecanismos de reacción química. Aquí, la rigidez surge de la coexistencia de reacciones muy lentas y muy rápidas. [ cita necesaria ] Para resolverlos, se pueden utilizar los paquetes de software KPP y Autochem .

Relación de rigidez

Considere el sistema no homogéneo de coeficiente constante lineal.

donde y es una matriz constante, diagonalizable, con valores propios (se suponen distintos) y vectores propios correspondientes . La solución general de ( 5 ) toma la forma

donde son constantes arbitrarias y es una integral particular. Ahora supongamos que

lo que implica que cada uno de los términos es as , de modo que la solución se aproxima asintóticamente a as ; el término decaerá monótonamente si es real y sinusoidalmente si es complejo.

La interpretación como tiempo (como suele ocurrir en los problemas físicos) se denomina solución transitoria y solución de estado estacionario . Si es grande, entonces el término correspondiente decaerá rápidamente a medida que aumente y, por lo tanto, se denomina transitorio rápido ; Si es pequeño, el término correspondiente decae lentamente y se denomina transitorio lento . Dejemos definir por

entonces ese es el transitorio más rápido y el más lento. Ahora definimos la relación de rigidez como [2]

Caracterización de la rigidez.

En esta sección consideramos varios aspectos del fenómeno de la rigidez. "Fenómeno" es probablemente una palabra más apropiada que "propiedad", ya que esta última implica que la rigidez puede definirse en términos matemáticos precisos; resulta que no es posible hacer esto de manera satisfactoria, incluso para la clase restringida de sistemas lineales de coeficientes constantes. También veremos varias afirmaciones cualitativas que pueden hacerse (y en su mayoría se han hecho) en un intento de resumir la noción de rigidez y exponer la que probablemente sea la más satisfactoria de ellas como una "definición" de rigidez.

JD Lambert define la rigidez de la siguiente manera:

Si un método numérico con una región finita de estabilidad absoluta , aplicado a un sistema con cualesquiera condiciones iniciales , se ve obligado a utilizar en un determinado intervalo de integración una longitud de paso excesivamente pequeña en relación con la suavidad de la solución exacta en ese intervalo , entonces se dice que el sistema es rígido en ese intervalo.

Hay otras características que exhiben muchos ejemplos de problemas de rigidez, pero para cada uno hay contraejemplos, por lo que estas características no constituyen buenas definiciones de rigidez. No obstante, algunos autores utilizan comúnmente definiciones basadas en estas características y son buenas pistas sobre la presencia de rigidez. Lambert se refiere a ellas como "declaraciones" en lugar de definiciones, por las razones antes mencionadas. Algunos de estos son:

  1. Un sistema lineal de coeficientes constantes es rígido si todos sus valores propios tienen parte real negativa y la relación de rigidez es grande.
  2. La rigidez ocurre cuando los requisitos de estabilidad, más que los de precisión, limitan la longitud del paso.
  3. La rigidez ocurre cuando algunos componentes de la solución se descomponen mucho más rápidamente que otros. [3]

Etimología

El origen del término "rigidez" no ha sido claramente establecido. Según Joseph Oakland Hirschfelder , el término "rígido" se utiliza porque este tipo de sistemas corresponden a un acoplamiento estrecho entre el conductor y el conducido en servomecanismos . [4] Según Ricardo. L. Burden y J. Douglas Faires,

Pueden ocurrir dificultades significativas cuando se aplican técnicas numéricas estándar para aproximar la solución de una ecuación diferencial cuando la solución exacta contiene términos de la forma , donde es un número complejo con parte real negativa.

. . .

Los problemas que involucran soluciones transitorias de rápida descomposición ocurren naturalmente en una amplia variedad de aplicaciones, incluido el estudio de sistemas de resortes y amortiguación, el análisis de sistemas de control y problemas de cinética química . Todos estos son ejemplos de una clase de problemas llamados sistemas rígidos (rigidez matemática) de ecuaciones diferenciales, debido a su aplicación en el análisis del movimiento de sistemas de masa y resortes que tienen constantes elásticas grandes ( rigidez física ). [5]

Por ejemplo, el problema del valor inicial

con , , , se puede escribir en la forma ( 5 ) con y

y tiene valores propios . Ambos valores propios tienen parte real negativa y la relación de rigidez es

que es bastante grande. Entonces el sistema ( 10 ) ciertamente satisface los enunciados 1 y 3. Aquí la constante elástica es grande y la constante de amortiguación es aún mayor. [6] (aunque "grande" no es un término claramente definido, pero cuanto mayores sean las cantidades anteriores, más pronunciado será el efecto de la rigidez). La solución exacta de ( 10 ) es

La ecuación 13 se comporta de manera bastante similar a una exponencial simple , pero la presencia del término, incluso con un coeficiente pequeño, es suficiente para hacer que el cálculo numérico sea muy sensible al tamaño del paso. La integración estable de ( 10 ) requiere un tamaño de paso muy pequeño hasta bien entrada la parte suave de la curva de solución, lo que resulta en un error mucho menor que el requerido para la precisión. Por tanto, el sistema también satisface el enunciado 2 y la definición de Lambert.

A-estabilidad

El comportamiento de los métodos numéricos en problemas rígidos se puede analizar aplicando estos métodos a la ecuación de prueba sujeta a la condición inicial con . La solución de esta ecuación es . Esta solución tiende a cero como cuando . Si el método numérico también muestra este comportamiento (para un tamaño de paso fijo), entonces se dice que el método es A-estable. [7] Un método numérico que es L-estable (ver más abajo) tiene la propiedad más fuerte de que la solución se acerca a cero en un solo paso cuando el tamaño del paso llega al infinito. Los métodos A-estables no presentan los problemas de inestabilidad descritos en el ejemplo motivador.

Métodos de Runge-Kutta

Los métodos de Runge-Kutta aplicados a la ecuación de prueba toman la forma y, por inducción ,. La función se llama función de estabilidad . Por tanto, la condición de que as es equivalente a . Esto motiva la definición de la región de estabilidad absoluta (a veces denominada simplemente región de estabilidad ), que es el conjunto . El método es A-estable si la región de estabilidad absoluta contiene el conjunto , es decir, el semiplano izquierdo.

Ejemplo: los métodos de Euler

El disco rosa muestra la región de estabilidad del método de Euler.

Considere los métodos de Euler anteriores. El método explícito de Euler aplicado a la ecuación de prueba es

Por tanto, con . La región de estabilidad absoluta para este método es, por tanto, el disco que se muestra a la derecha. El método de Euler no es A-estable.

El ejemplo motivador tenía . El valor de z cuando se toma el tamaño del paso es , que está fuera de la región de estabilidad. De hecho, los resultados numéricos no convergen a cero. Sin embargo, con el tamaño del paso , tenemos que está justo dentro de la región de estabilidad y los resultados numéricos convergen a cero, aunque bastante lentamente.

Ejemplo: método trapezoidal

La región rosa es la región de estabilidad del método trapezoidal.

Considere el método trapezoidal.

cuando se aplica a la ecuación de prueba , es

Resolviendo para los rendimientos

Por tanto, la función de estabilidad es

y la región de estabilidad absoluta es

Esta región contiene el semiplano izquierdo, por lo que el método trapezoidal es A-estable. De hecho, la región de estabilidad es idéntica al semiplano izquierdo y, por tanto, la solución numérica de converge a cero si y sólo si la solución exacta lo hace. Sin embargo, el método trapezoidal no tiene un comportamiento perfecto: amortigua todos los componentes que se descomponen, pero los componentes que se descomponen rápidamente se amortiguan sólo muy suavemente, porque como . Esto llevó al concepto de L-estabilidad : un método es L-estable si es A-estable y como . El método trapezoidal es A-estable pero no L-estable. El método implícito de Euler es un ejemplo de método L-estable. [8]

teoría general

La función de estabilidad de un método de Runge-Kutta con coeficientes y está dada por

donde denota el vector con todos unos. Esta es una función racional (un polinomio dividido por otro).

Los métodos explícitos de Runge-Kutta tienen una matriz de coeficientes triangular estrictamente inferior y, por tanto, su función de estabilidad es un polinomio. De ello se deduce que los métodos explícitos de Runge-Kutta no pueden ser A-estables.

La función de estabilidad de los métodos implícitos de Runge-Kutta a menudo se analiza utilizando estrellas de orden. La estrella de orden para un método con función de estabilidad se define como el conjunto . Un método es A-estable si y sólo si su función de estabilidad no tiene polos en el plano izquierdo y su estrella de orden no contiene números puramente imaginarios. [9]

Métodos de varios pasos

Los métodos lineales de varios pasos tienen la forma

Aplicados a la ecuación de prueba, se convierten en

que se puede simplificar a

dónde . Esta es una relación de recurrencia lineal . El método es A-estable si todas las soluciones de la relación de recurrencia convergen a cero cuando . El polinomio característico es

Todas las soluciones convergen a cero para un valor dado de si todas las soluciones de se encuentran en el círculo unitario.

La región de estabilidad absoluta para un método de varios pasos de la forma anterior es entonces el conjunto de todos los que satisfacen . Nuevamente, si este conjunto contiene el semiplano izquierdo, se dice que el método de varios pasos es A-estable.

Ejemplo: el método Adams-Bashforth de segundo orden

La región rosa es la región de estabilidad del método Adams-Bashforth de segundo orden.

Determinemos la región de estabilidad absoluta para el método de dos pasos Adams-Bashforth

El polinomio característico es

que tiene raíces

por tanto, la región de estabilidad absoluta es

Esta región se muestra a la derecha. No incluye todo el semiplano izquierdo (de hecho, solo incluye el eje real entre ), por lo que el método Adams-Bashforth no es A-estable.

teoría general

Los métodos explícitos de varios pasos nunca pueden ser A-estables, al igual que los métodos explícitos de Runge-Kutta. Los métodos implícitos de varios pasos sólo pueden ser A-estables si su orden es como máximo 2. Este último resultado se conoce como segunda barrera de Dahlquist ; restringe la utilidad de los métodos lineales de varios pasos para ecuaciones rígidas. Un ejemplo de un método A-estable de segundo orden es la regla trapezoidal mencionada anteriormente, que también puede considerarse como un método lineal de varios pasos. [10]

Ver también

Notas

  1. ^ Robertson, HH (1966). "La solución de un conjunto de ecuaciones de velocidad de reacción". Análisis numérico: una introducción . Prensa académica. págs. 178–182.
  2. ^ Lambert (1992, págs. 216-217)
  3. ^ Lambert (1992, págs. 217-220)
  4. ^ Hirshfelder (1963)
  5. ^ Carga y ferias (1993, pág.314)
  6. ^ Kreyszig (1972, págs. 62–68)
  7. ^ Esta definición se debe a Dahlquist (1963).
  8. ^ La definición de L-estabilidad se debe a Ehle (1969).
  9. ^ La definición se debe a Wanner, Hairer & Nørsett (1978); véase también Iserles y Nørsett (1991).
  10. ^ Véase Dahlquist (1963).

Referencias

enlaces externos