stringtranslate.com

Método Rayleigh-Ritz

El método Rayleigh-Ritz es un método numérico directo de aproximación de valores propios , originado en el contexto de la solución de problemas de valores límite físicos y llamado así en honor a Lord Rayleigh y Walther Ritz .

En este método, un operador lineal de dimensión infinita se aproxima mediante una compresión de dimensión finita , sobre la que podemos utilizar un algoritmo de valor propio .

Se utiliza en todas las aplicaciones que implican la aproximación de valores propios y vectores propios , a menudo bajo diferentes nombres. En mecánica cuántica , donde un sistema de partículas se describe utilizando un hamiltoniano , el método Ritz utiliza funciones de onda de prueba para aproximar la función propia del estado fundamental con la energía más baja. En el contexto del método de elementos finitos , matemáticamente el mismo algoritmo se denomina comúnmente método Ritz-Galerkin . La terminología del método Rayleigh-Ritz o método Ritz es típica en ingeniería mecánica y estructural para aproximar los modos propios y las frecuencias de resonancia de una estructura.

Nombre y atribución

El nombre del método y su historia de origen han sido debatidos por los historiadores. [1] [2] Se le ha llamado método Ritz en honor a Walther Ritz , ya que el procedimiento numérico fue publicado por Walther Ritz en 1908-1909. Según AW Leissa, [1] Lord Rayleigh escribió un artículo felicitando a Ritz por su trabajo en 1911, pero afirmando que él mismo había utilizado el método de Ritz en muchos lugares de su libro y en otra publicación. Esta afirmación, aunque posteriormente se cuestionó, y el hecho de que el método en el caso trivial de un solo vector da como resultado el cociente de Rayleigh justifican el nombre de método Rayleigh-Ritz . Según S. Ilanko, [2] citando a Richard Courant , tanto Lord Rayleigh como Walther Ritz concibieron independientemente la idea de utilizar la equivalencia entre los problemas de valores en la frontera de ecuaciones diferenciales parciales por un lado y los problemas de cálculo de variaciones por otro lado para el cálculo numérico de las soluciones, sustituyendo los problemas variacionales por problemas de aproximación de extremos más simples en los que se necesita determinar un número finito de parámetros. Irónicamente para el debate, la justificación moderna del algoritmo abandona el cálculo de variaciones en favor del enfoque más simple y más general de la proyección ortogonal como en el método de Galerkin llamado así en honor a Boris Galerkin , lo que conduce también al nombre del método Ritz-Galerkin . [ cita requerida ]

Método

Sea un operador lineal en un espacio de Hilbert , con producto interno . Ahora considere un conjunto finito de funciones . Dependiendo de la aplicación, estas funciones pueden ser:

Se podría utilizar la base ortonormal generada a partir de las funciones propias del operador, lo que producirá matrices de aproximación diagonal , pero en este caso ya habríamos tenido que calcular el espectro.

Ahora nos aproximamos por , que se define como la matriz con entradas [3]

y resolver el problema del valor propio . Se puede demostrar que la matriz es la compresión de a . [3]

Para los operadores diferenciales (como los operadores de Sturm-Liouville ), el producto interno puede reemplazarse por la formulación débil . [4] [6]

Si se utilizó un subconjunto de la base ortonormal para encontrar la matriz, los vectores propios de serán combinaciones lineales de funciones de base ortonormales y, como resultado, serán aproximaciones de los vectores propios de . [7]

Propiedades

Contaminación espectral

Es posible que el método de Rayleigh-Ritz produzca valores que no converjan a los valores reales en el espectro del operador a medida que el truncamiento se hace grande. Estos valores se conocen como contaminación espectral. [3] [5] [8] En algunos casos (como en el caso de la ecuación de Schrödinger ), no existe una aproximación que incluya todos los valores propios de la ecuación y no contenga contaminación. [9]

El espectro de la compresión (y por tanto de la contaminación) está limitado por el rango numérico del operador; en muchos casos está limitado por un subconjunto del rango numérico conocido como rango numérico esencial. [10] [11]

Para problemas de valores propios de matrices

En álgebra lineal numérica, el método de Rayleigh–Ritz se aplica comúnmente [12] para aproximar un problema de valor propio para la matriz de tamaño utilizando una matriz proyectada de un tamaño menor , generada a partir de una matriz dada con columnas ortonormales . La versión matricial del algoritmo es la más simple:

  1. Calcular la matriz , donde denota la transpuesta compleja conjugada de
  2. Resolver el problema del valor propio
  3. Calcular los vectores Ritz y el valor Ritz
  4. Aproximaciones de salida , llamadas pares Ritz, a los valores propios y vectores propios de la matriz original .

Si el subespacio con la base ortonormal dada por las columnas de la matriz contiene vectores que están cerca de los vectores propios de la matriz , el método de Rayleigh-Ritz anterior encuentra vectores de Ritz que se aproximan bien a estos vectores propios. La cantidad fácilmente computable determina la precisión de dicha aproximación para cada par de Ritz.

En el caso más sencillo , la matriz se convierte en un vector columna unitario , la matriz es un escalar que es igual al cociente de Rayleigh , la única solución al problema de valor propio es y y el único vector de Ritz es él mismo. Por lo tanto, el método de Rayleigh-Ritz se convierte en el cálculo del cociente de Rayleigh si .

Otra conexión útil con el cociente de Rayleigh es que para cada par de Ritz , lo que permite derivar algunas propiedades de los valores de Ritz a partir de la teoría correspondiente para el cociente de Rayleigh . Por ejemplo, si es una matriz hermítica , su cociente de Rayleigh (y, por lo tanto, cada valor de Ritz) es real y toma valores dentro del intervalo cerrado de los valores propios más pequeños y más grandes de .

Ejemplo

La matriz tiene valores propios y los vectores propios correspondientes Tomemos entonces con valores propios y los vectores propios correspondientes de modo que los valores de Ritz sean y los vectores de Ritz sean Observamos que cada uno de los vectores de Ritz es exactamente uno de los vectores propios de para el dado así como los valores de Ritz dan exactamente dos de los tres valores propios de . Una explicación matemática para la aproximación exacta se basa en el hecho de que el espacio de columnas de la matriz resulta ser exactamente el mismo que el subespacio abarcado por los dos vectores propios y en este ejemplo.

Para problemas de valores singulares de matrices

La descomposición en valores singulares truncados (SVD) en álgebra lineal numérica también puede utilizar el método de Rayleigh-Ritz para encontrar aproximaciones a vectores singulares izquierdo y derecho de la matriz de tamaño en subespacios dados convirtiendo el problema del valor singular en un problema de valor propio.

Usando la matriz normal

La definición del valor singular y los vectores singulares izquierdo y derecho correspondientes es y . Habiendo encontrado un conjunto (izquierda o derecha) de vectores singulares aproximados y valores singulares aplicando ingenuamente el método de Rayleigh-Ritz a la matriz normal hermítica o , la que sea de menor tamaño, se podría determinar el otro conjunto de vectores singulares izquierda o derecha simplemente dividiendo por los valores singulares, es decir, y . Sin embargo, la división es inestable o falla para valores singulares pequeños o cero.

Un enfoque alternativo, por ejemplo, definir la matriz normal como de tamaño , aprovecha el hecho de que para una matriz dada con columnas ortonormales, el problema de valor propio del método de Rayleigh-Ritz para la matriz puede interpretarse como un problema de valor singular para la matriz . Esta interpretación permite el cálculo simultáneo simple de vectores singulares aproximados izquierdo y derecho de la siguiente manera.

  1. Calcular la matriz .
  2. Calcule la SVD delgada, o de tamaño económico, con matriz , matriz diagonal y matriz .
  3. Calcular las matrices de los vectores singulares izquierdo y derecho de Ritz .
  4. Aproximaciones de salida , llamadas tripletes singulares de Ritz, a valores singulares seleccionados y los vectores singulares izquierdo y derecho correspondientes de la matriz original que representan una descomposición en valores singulares truncados (SVD) aproximada con vectores singulares izquierdos restringidos al espacio de columnas de la matriz .

El algoritmo se puede utilizar como un paso de posprocesamiento donde la matriz es una salida de un solucionador de valores propios, por ejemplo, como LOBPCG , que aproxima vectores propios seleccionados numéricamente de la matriz normal .

Ejemplo

La matriz tiene sus valores singulares de matriz normal y la SVD delgada correspondiente donde las columnas del primer multiplicador del conjunto completo de los vectores singulares izquierdos de la matriz , las entradas diagonales del término medio son los valores singulares y las columnas del último multiplicador transpuesto (aunque la transposición no lo cambia) son los vectores singulares derechos correspondientes.

Tomemos el espacio de columnas que está abarcado por los dos vectores singulares exactos correspondientes a los valores singulares 1 y 2.

Siguiendo el paso 1 del algoritmo, calculamos y en el paso 2 su SVD delgada con Por lo tanto, ya obtenemos los valores singulares 2 y 1 de y de los dos vectores singulares izquierdos correspondientes como y , que abarcan el espacio de columnas de la matriz , lo que explica por qué las aproximaciones son exactas para el dado .

Finalmente, el paso 3 calcula la matriz recuperando de sus filas los dos vectores singulares derechos como y . Validamos el primer vector: y Por lo tanto, para la matriz dada con su espacio de columnas que está abarcado por dos vectores singulares derechos exactos, determinamos estos vectores singulares derechos, así como los vectores singulares izquierdos correspondientes y los valores singulares, todos exactamente. Para una matriz arbitraria , obtenemos tripletes singulares aproximados que son óptimos dados en el sentido de optimalidad del método de Rayleigh-Ritz.

Aplicaciones y ejemplos

En física cuántica

En física cuántica, donde el espectro del hamiltoniano es el conjunto de niveles de energía discretos permitidos por un sistema mecánico cuántico, se utiliza el método de Rayleigh-Ritz para aproximar los estados de energía y las funciones de onda de un sistema atómico o nuclear complicado. [7] De hecho, para cualquier sistema más complicado que un solo átomo de hidrógeno, no se conoce una solución exacta para el espectro del hamiltoniano. [6]

En este caso, se prueba una función de onda de prueba , , en el sistema. Esta función de prueba se selecciona para cumplir con las condiciones de contorno (y cualquier otra restricción física). No se conoce la función exacta; la función de prueba contiene uno o más parámetros ajustables, que se varían para encontrar una configuración de energía más baja.

Se puede demostrar que la energía del estado fundamental, , satisface una desigualdad:

Es decir, la energía del estado fundamental es menor que este valor. La función de onda de prueba siempre dará un valor esperado mayor o igual que la energía fundamental.

Si se sabe que la función de onda de prueba es ortogonal al estado fundamental, entonces proporcionará un límite para la energía de algún estado excitado.

La función de respuesta de Ritz es una combinación lineal de N funciones base conocidas , parametrizadas por coeficientes desconocidos:

Con un hamiltoniano conocido, podemos escribir su valor esperado como

Las funciones base no suelen ser ortogonales, de modo que la matriz de superposición S tiene elementos no diagonales distintos de cero. Se puede utilizar o (la conjugación de la primera) para minimizar el valor esperado. Por ejemplo, al hacer las derivadas parciales de sobre cero, se obtiene la siguiente igualdad para cada k = 1, 2, ..., N : lo que conduce a un conjunto de N ecuaciones seculares :

En las ecuaciones anteriores, la energía y los coeficientes son desconocidos. Con respecto a c , este es un conjunto homogéneo de ecuaciones lineales, que tiene una solución cuando el determinante de los coeficientes para estas incógnitas es cero: lo que a su vez es cierto solo para N valores de . Además, dado que el hamiltoniano es un operador hermítico , la matriz H también es hermítica y los valores de serán reales. El valor más bajo entre (i=1,2,..,N), , será la mejor aproximación al estado fundamental para las funciones base utilizadas. Las N-1 energías restantes son estimaciones de energías de estado excitado. Se puede obtener una aproximación para la función de onda del estado i encontrando los coeficientes de la ecuación secular correspondiente.

En ingeniería mecánica

El método de Rayleigh-Ritz se utiliza a menudo en ingeniería mecánica para hallar las frecuencias resonantes reales aproximadas de sistemas de varios grados de libertad , como sistemas de masa-resorte o volantes de inercia sobre un eje con sección transversal variable . Es una extensión del método de Rayleigh. También se puede utilizar para hallar cargas de pandeo y comportamiento posterior al pandeo de columnas.

Consideremos el caso en el que queremos encontrar la frecuencia de resonancia de oscilación de un sistema. Primero, escribimos la oscilación en la forma, con una forma modal desconocida . A continuación, encontramos la energía total del sistema, que consta de un término de energía cinética y un término de energía potencial. El término de energía cinética implica el cuadrado de la derivada temporal de y, por lo tanto, gana un factor de . Por lo tanto, podemos calcular la energía total del sistema y expresarla en la siguiente forma:

Por conservación de la energía, la energía cinética media debe ser igual a la energía potencial media. Por lo tanto, lo que también se conoce como cociente de Rayleigh . Por lo tanto, si supiéramos la forma del modo , podríamos calcular y , y a su vez obtener la frecuencia propia. Sin embargo, aún no conocemos la forma del modo. Para encontrar esto, podemos aproximarnos como una combinación de algunas funciones de aproximación donde son constantes a determinar. En general, si elegimos un conjunto aleatorio de , describirá una superposición de los modos propios reales del sistema. Sin embargo, si buscamos tal que la frecuencia propia se minimice, entonces el modo descrito por este conjunto de será cercano al modo propio real más bajo posible del sistema. Por lo tanto, esto encuentra la frecuencia propia más baja. Si encontramos modos propios ortogonales a este modo propio más bajo aproximado, también podemos encontrar aproximadamente las siguientes frecuencias propias.

En general, podemos expresar y como una colección de términos cuadráticos en los coeficientes : donde y son la matriz de rigidez y la matriz de masa de un sistema discreto respectivamente.

La minimización de se convierte en:

Resolviendo esto,

Para una solución no trivial de c, requerimos que el determinante del coeficiente de la matriz de c sea cero.

Esto proporciona una solución para las primeras N frecuencias y modos propios del sistema, siendo N el número de funciones de aproximación.

Caso simple de sistema doble masa-resorte

En el siguiente análisis se utiliza el caso más simple, en el que el sistema tiene dos resortes y dos masas agrupadas, y solo se suponen dos formas modales. Por lo tanto, M = [ m 1 , m 2 ] y K = [ k 1 , k 2 ] .

Se supone  una forma modal para el sistema, con dos términos, uno de los cuales está ponderado por un factor B , p. ej., Y = [1, 1] +  B [1, −1]. La teoría del movimiento armónico simple dice que la velocidad en el momento en que la deflexión es cero es la frecuencia angular multiplicada por la deflexión (y) en el momento de máxima deflexión. En este ejemplo, la energía cinética (EC) para cada masa es etc., y la energía potencial (EP) para cada resorte es etc.

También sabemos que sin amortiguamiento, la EC máxima es igual a la EP máxima. Por lo tanto,

La amplitud total de la forma del modo se cancela siempre desde cada lado. Es decir, el tamaño real de la desviación supuesta no importa, solo la forma del modo .

Las manipulaciones matemáticas luego obtienen una expresión para , en términos de B, que se puede diferenciar con respecto a B, para encontrar el mínimo, es decir, cuando . Esto da el valor de B para el cual es el más bajo. Esta es una solución de límite superior para si se espera que sea la frecuencia fundamental predicha del sistema porque se supone que la forma del modo es , pero hemos encontrado el valor más bajo de ese límite superior, dadas nuestras suposiciones, porque B se usa para encontrar la 'mezcla' óptima de las dos funciones de forma del modo supuestas.

Existen muchos trucos con este método, el más importante es tratar de elegir formas de modos asumidos realistas. Por ejemplo, en el caso de problemas de deflexión de vigas, es aconsejable utilizar una forma deformada que sea analíticamente similar a la solución esperada. Una forma cuártica puede adaptarse a la mayoría de los problemas fáciles de vigas simplemente vinculadas, incluso si el orden de la solución deformada puede ser menor. Los resortes y las masas no tienen que ser discretos, pueden ser continuos (o una mezcla), y este método se puede utilizar fácilmente en una hoja de cálculo para encontrar las frecuencias naturales de sistemas distribuidos bastante complejos, si puede describir los términos EC y EP distribuidos fácilmente, o bien dividir los elementos continuos en partes discretas.

Este método se puede utilizar de forma iterativa, agregando formas de modo adicionales a la mejor solución anterior, o se puede construir una expresión larga con muchas B y muchas formas de modo, y luego diferenciarlas parcialmente .

En sistemas dinámicos

El operador Koopman permite codificar un sistema no lineal de dimensión finita como un sistema lineal de dimensión infinita . En general, ambos problemas son difíciles de resolver, pero para el último podemos utilizar el método de Ritz-Galerkin para aproximar una solución. [13]

La relación con el método de elementos finitos

En el lenguaje del método de elementos finitos, la matriz es precisamente la matriz de rigidez del hamiltoniano en el espacio de elementos lineales por partes, y la matriz es la matriz de masa . En el lenguaje del álgebra lineal, el valor es un valor propio del hamiltoniano discretizado, y el vector es un vector propio discretizado.

Véase también

Notas y referencias

  1. ^ ab Leissa, AW (2005). "Las bases históricas de los métodos de Rayleigh y Ritz" . Journal of Sound and Vibration . 287 (4–5): 961–978. Bibcode :2005JSV...287..961L. doi :10.1016/j.jsv.2004.12.021.
  2. ^ ab Ilanko, Sinniah (2009). "Comentarios sobre las bases históricas de los métodos de Rayleigh y Ritz". Journal of Sound and Vibration . 319 (1–2): 731–733. Bibcode :2009JSV...319..731I. doi :10.1016/j.jsv.2008.06.001.
  3. ^ abcd Davies, EB ; Plum, M. (2003). "Contaminación espectral". Revista IMA de análisis numérico .
  4. ^ ab Süli, Endre ; Mayers, David (2003). Introducción al análisis numérico . Cambridge University Press . ISBN 0521007941.
  5. ^ ab Levitin, Michael; Shargorodsky, Eugene (2004). "Contaminación espectral y espectros relativos de segundo orden para operadores autoadjuntos". IMA Journal of Numerical Analysis .
  6. ^ ab Pryce, John D. (1994). Solución numérica de problemas de Sturm-Liouville . Oxford University Press. ISBN 0198534159.
  7. ^ ab Arfken, George B. ; Weber, Hans J. (2005). Métodos matemáticos para físicos (6.ª ed.). Academic Press.
  8. ^ Colbrook, Matthew. "Descifrando el infinito: ¿podemos calcular espectros?". Matemáticas hoy . Instituto de Matemáticas y sus Aplicaciones.
  9. ^ Colbrook, Matthew; Roman, Bogdan; Hansen, Anders (2019). "Cómo calcular espectros con control de errores". Physical Review Letters .
  10. ^ Pokrzywa, Andrzej (1979). "Método de proyecciones ortogonales y aproximación del espectro de un operador acotado". Studia Mathematica .
  11. ^ Bögli, Sabine; Marletta, Marco; Tretter, Christiane (2020). "El rango numérico esencial para operadores lineales ilimitados". Revista de análisis funcional .
  12. ^ Trefethen, Lloyd N.; Bau, III, David (1997). Álgebra lineal numérica. SIAM. pág. 254. ISBN 978-0-89871-957-4.
  13. ^ Servadio, Simone; Arnas, David; Linares, Richard. "Un tutorial sobre el operador Koopman con polinomios ortogonales". arXiv.

Enlaces externos