stringtranslate.com

Método Rayleigh-Ritz

El método Rayleigh-Ritz es un método numérico directo para aproximar valores propios , originado en el contexto de la resolución de problemas de valores límite físicos y que lleva el nombre de Lord Rayleigh y Walther Ritz .

En este método, un operador lineal de dimensión infinita se aproxima mediante una compresión de dimensión finita , en la que podemos utilizar un algoritmo de valores propios .

Se utiliza en todas las aplicaciones que implican la aproximación de valores propios y vectores propios , a menudo con nombres diferentes. En mecánica cuántica , donde un sistema de partículas se describe mediante un hamiltoniano , el método de Ritz utiliza funciones de onda de prueba para aproximar la función propia del estado fundamental con la energía más baja. En el contexto del método de elementos finitos , matemáticamente el mismo algoritmo se denomina comúnmente método de Ritz-Galerkin . La terminología del método Rayleigh-Ritz o método de Ritz es típica en ingeniería mecánica y estructural para aproximar los modos propios y las frecuencias resonantes de una estructura.

Denominación y atribución

Los historiadores han debatido el nombre del método y su historia de origen. [1] [2] Se le ha llamado método de Ritz en honor a Walther Ritz , ya que el procedimiento numérico fue publicado por Walther Ritz en 1908-1909. Según AW Leissa, [1] Lord Rayleigh escribió un artículo felicitando a Ritz por su trabajo en 1911, pero afirmando que él mismo había utilizado el método de Ritz en muchos lugares de su libro y en otra publicación. Esta afirmación, aunque posteriormente cuestionada, y el hecho de que el método en el caso trivial de un solo vector da como resultado el cociente de Rayleigh justifican el nombre método de Rayleigh-Ritz . Según S. Ilanko, [2] citando a Richard Courant , tanto Lord Rayleigh como Walther Ritz concibieron de forma independiente la idea de utilizar la equivalencia entre problemas de valores en la frontera de ecuaciones diferenciales parciales, por un lado, y problemas de cálculo de variaciones, por otro. para el cálculo numérico de las soluciones, sustituyendo los problemas variacionales por problemas extremos de aproximación más simples en los que es necesario determinar un número finito de parámetros. Irónicamente para el debate, la justificación moderna del algoritmo abandona el cálculo de variaciones en favor del enfoque más simple y general de la proyección ortogonal como en el método de Galerkin que lleva el nombre de Boris Galerkin , lo que lleva también a la denominación del método de Ritz-Galerkin . [ cita necesaria ]

Método

Sea un operador lineal en un espacio de Hilbert , con producto interno . Consideremos ahora un conjunto finito de funciones . Dependiendo de la aplicación estas funciones pueden ser:

Se podría utilizar la base ortonormal generada a partir de las funciones propias del operador, que producirá matrices de aproximación diagonal , pero en este caso ya habríamos tenido que calcular el espectro.

Ahora aproximamos por , que se define como la matriz con entradas [3]

y resolver el problema de valores propios . Se puede demostrar que la matriz es la compresión de a . [3]

Para los operadores diferenciales (como los operadores de Sturm-Liouville ), el producto interno puede reemplazarse por la formulación débil . [4] [6]

Si se utilizó un subconjunto de la base ortonormal para encontrar la matriz, los vectores propios de serán combinaciones lineales de funciones de base ortonormal y, como resultado, serán aproximaciones de los vectores propios de . [7]

Propiedades

Contaminación espectral

Es posible que el método de Rayleigh-Ritz produzca valores que no converjan con los valores reales en el espectro del operador a medida que el truncamiento aumenta. Estos valores se conocen como contaminación espectral. [3] [5] [8] En algunos casos (como en el caso de la ecuación de Schrödinger ), no existe una aproximación que incluya todos los valores propios de la ecuación y no contenga contaminación. [9]

El espectro de la compresión (y por tanto de la contaminación) está limitado por el rango numérico del operador; en muchos casos está limitado por un subconjunto del rango numérico conocido como rango numérico esencial. [10] [11]

Para problemas de valores propios de matrices

En álgebra lineal numérica, el método de Rayleigh-Ritz se aplica comúnmente [12] para aproximar un problema de valores propios para la matriz de tamaño utilizando una matriz proyectada de un tamaño más pequeño , generada a partir de una matriz dada con columnas ortonormales . La versión matricial del algoritmo es la más simple:

  1. Calcule la matriz , donde denota la transpuesta conjugada compleja de
  2. Resuelve el problema de valores propios.
  3. Calcular los vectores de Ritz y el valor de Ritz.
  4. Aproximaciones de salida , llamadas pares de Ritz, a valores propios y vectores propios de la matriz original .

Si el subespacio con la base ortonormal dada por las columnas de la matriz contiene vectores que están cerca de los vectores propios de la matriz , el método de Rayleigh-Ritz anterior encuentra vectores de Ritz que se aproximan bien a estos vectores propios. La cantidad, fácilmente computable, determina la precisión de dicha aproximación para cada par del Ritz.

En el caso más sencillo , la matriz se convierte en un vector columna unitario , la matriz es un escalar que es igual al cociente de Rayleigh , la única solución al problema de valores propios es y , y el único vector de Ritz es él mismo. Por tanto, el método de Rayleigh-Ritz se convierte en el cálculo del cociente de Rayleigh si .

Otra conexión útil con el cociente de Rayleigh es la de cada par de Ritz , lo que permite derivar algunas propiedades de los valores de Ritz a partir de la teoría correspondiente para el cociente de Rayleigh . Por ejemplo, si es una matriz hermitiana , su cociente de Rayleigh (y por lo tanto cada valor de Ritz) es real y toma valores dentro del intervalo cerrado de los valores propios más pequeños y más grandes de .

Ejemplo

La matriz tiene valores propios y los vectores propios correspondientes Tomemos entonces con valores propios y los vectores propios correspondientes para que los valores de Ritz sean y los vectores de Ritz sean Observamos que cada uno de los vectores de Ritz es exactamente uno de los vectores propios de para lo dado también ya que los valores de Ritz dan exactamente dos de los tres valores propios de . Una explicación matemática para la aproximación exacta se basa en el hecho de que el espacio columna de la matriz resulta ser exactamente el mismo que el subespacio abarcado por los dos vectores propios y en este ejemplo.

Para problemas de valores singulares de matrices

La descomposición de valores singulares truncados (SVD) en álgebra lineal numérica también puede utilizar el método de Rayleigh-Ritz para encontrar aproximaciones a los vectores singulares izquierdo y derecho de la matriz de tamaño en subespacios dados convirtiendo el problema de valores singulares en un problema de valores propios.

Usando la matriz normal

La definición del valor singular y los correspondientes vectores singulares izquierdo y derecho es y . Habiendo encontrado un conjunto (de izquierda a derecha) de vectores singulares aproximados y valores singulares aplicando ingenuamente el método de Rayleigh-Ritz a la matriz normal hermitiana o , cualquiera que sea de menor tamaño, se podría determinar el otro conjunto de vectores singulares de izquierda a derecha simplemente dividiendo por los valores singulares, es decir, y . Sin embargo, la división es inestable o falla para valores singulares pequeños o cero.

Un enfoque alternativo, por ejemplo, definir la matriz normal como de tamaño , aprovecha el hecho de que para una matriz dada con columnas ortonormales el problema de valores propios del método de Rayleigh-Ritz para la matriz puede interpretarse como un problema de valores singulares para la matriz. . Esta interpretación permite un cálculo simultáneo simple de los vectores singulares aproximados izquierdo y derecho de la siguiente manera.

  1. Calcule la matriz .
  2. Calcule el SVD delgado o de tamaño económico con matriz , matriz diagonal y matriz .
  3. Calcule las matrices de los vectores singulares izquierdo y derecho de Ritz.
  4. Aproximaciones de salida , llamadas tripletes singulares de Ritz, a valores singulares seleccionados y los correspondientes vectores singulares izquierdo y derecho de la matriz original que representan una descomposición de valores singulares truncados (SVD) aproximada con vectores singulares izquierdos restringidos al espacio columna de la matriz .

El algoritmo se puede utilizar como un paso de posprocesamiento donde la matriz es una salida de un solucionador de valores propios, por ejemplo, como LOBPCG , que aproxima vectores propios seleccionados numéricamente de la matriz normal .

Ejemplo

La matriz tiene sus valores singulares de matriz normal y el SVD delgado correspondiente donde las columnas del primer multiplicador del conjunto completo de los vectores singulares izquierdos de la matriz , las entradas diagonales del término medio son los valores singulares y las columnas del El último multiplicador transpuesto (aunque la transposición no lo cambia) son los correspondientes vectores singulares derechos.

Tomemos el espacio de columnas que abarca los dos vectores singulares derechos exactos correspondientes a los valores singulares 1 y 2.

Siguiendo el paso 1 del algoritmo, calculamos y en el paso 2 su SVD delgado con. Por lo tanto, ya obtenemos los valores singulares 2 y 1 de y de los dos vectores singulares izquierdos correspondientes como y , que abarcan el espacio de columnas de la matriz , explicando por qué las aproximaciones son exactas para lo dado .

Finalmente, el paso 3 calcula la matriz recuperando de sus filas los dos vectores singulares derechos como y . Validamos el primer vector: y así, para la matriz dada con su espacio columna que está abarcado por dos vectores singulares derechos exactos, determinamos estos vectores singulares derechos, así como los correspondientes vectores singulares izquierdos y los valores singulares, todos exactamente . Para una matriz arbitraria , obtenemos tripletes singulares aproximados que son óptimos dado en el sentido de optimidad del método de Rayleigh-Ritz.

Aplicaciones y ejemplos

En física cuántica

En física cuántica, donde el espectro del hamiltoniano es el conjunto de niveles de energía discretos permitidos por un sistema mecánico cuántico, el método Rayleigh-Ritz se utiliza para aproximar los estados de energía y las funciones de onda de un sistema atómico o nuclear complicado. [7] De hecho, para cualquier sistema más complicado que un solo átomo de hidrógeno, no se conoce una solución exacta para el espectro del hamiltoniano. [6]

En este caso, se prueba una función de onda de prueba , , en el sistema. Esta función de prueba se selecciona para cumplir las condiciones de contorno (y cualquier otra restricción física). Se desconoce la función exacta; la función de prueba contiene uno o más parámetros ajustables, que varían para encontrar una configuración de energía más baja.

Se puede demostrar que la energía del estado fundamental, satisface una desigualdad:

Es decir, la energía del estado fundamental es menor que este valor. La función de onda de prueba siempre dará un valor esperado mayor o igual a la energía del suelo.

Si se sabe que la función de onda de prueba es ortogonal al estado fundamental, entonces proporcionará un límite para la energía de algún estado excitado.

La función Ritz ansatz es una combinación lineal de N funciones de base conocidas , parametrizadas por coeficientes desconocidos:

Con un hamiltoniano conocido, podemos escribir su valor esperado como

Las funciones de base no suelen ser ortogonales, de modo que la matriz de superposición S tiene elementos no diagonales distintos de cero. Se puede utilizar o ( la conjugación del primero) para minimizar el valor esperado. Por ejemplo, al hacer las derivadas parciales de cero , se obtiene la siguiente igualdad para cada k = 1, 2, ..., N : lo que conduce a un conjunto de N ecuaciones seculares :

En las ecuaciones anteriores, se desconocen la energía y los coeficientes . Con respecto a c , este es un conjunto homogéneo de ecuaciones lineales, que tiene solución cuando el determinante de los coeficientes de estas incógnitas es cero: lo que a su vez es cierto sólo para N valores de . Además, dado que el hamiltoniano es un operador hermitiano , la matriz H también es hermitiana y los valores de serán reales. El valor más bajo entre (i=1,2,..,N), será la mejor aproximación al estado fundamental para las funciones base utilizadas. Las energías N-1 restantes son estimaciones de energías del estado excitado. Se puede obtener una aproximación de la función de onda del estado i encontrando los coeficientes de la ecuación secular correspondiente.

en ingenieria mecanica

El método Rayleigh-Ritz se utiliza a menudo en ingeniería mecánica para encontrar las frecuencias resonantes reales aproximadas de sistemas de múltiples grados de libertad , como sistemas de masa de resorte o volantes en un eje con sección transversal variable . Es una extensión del método de Rayleigh. También se puede utilizar para encontrar cargas de pandeo y comportamiento posterior al pandeo de columnas.

Considere el caso en el que queremos encontrar la frecuencia de resonancia de oscilación de un sistema. Primero, escribe la oscilación en la forma, con una forma modo desconocida . Luego, encuentre la energía total del sistema, que consta de un término de energía cinética y un término de energía potencial. El término de energía cinética involucra el cuadrado de la derivada del tiempo y por lo tanto gana un factor de . Así, podemos calcular la energía total del sistema y expresarla de la siguiente forma:

Por conservación de energía, la energía cinética promedio debe ser igual a la energía potencial promedio. Así, lo que también se conoce como cociente de Rayleigh . Por lo tanto, si conociéramos la forma del modo , podríamos calcular y , y a su vez obtener la frecuencia propia. Sin embargo, todavía no conocemos la forma del modo. Para encontrar esto, podemos aproximarnos como una combinación de algunas funciones aproximadas donde se deben determinar constantes. En general, si elegimos un conjunto aleatorio de , describirá una superposición de los modos propios reales del sistema. Sin embargo, si buscamos que la frecuencia propia sea minimizada, entonces el modo descrito por este conjunto estará cerca del modo propio real más bajo posible del sistema. Por tanto, esto encuentra la frecuencia propia más baja. Si encontramos modos propios ortogonales a este modo propio más bajo aproximado, también podemos encontrar aproximadamente las siguientes frecuencias propias.

En general, podemos expresar y como una colección de términos cuadráticos en los coeficientes : donde y son la matriz de rigidez y la matriz de masas de un sistema discreto respectivamente.

La minimización de se convierte en:

Resolviendo esto,

Para una solución no trivial de c, requerimos que el determinante del coeficiente matricial de c sea cero.

Esto da una solución para las primeras N frecuencias propias y modos propios del sistema, siendo N el número de funciones aproximadas.

Caso simple de sistema doble resorte-masa.

La siguiente discusión utiliza el caso más simple, donde el sistema tiene dos resortes concentrados y dos masas concentradas, y sólo se suponen dos formas modales. Por tanto M = [ m 1 , m 2 ] y K = [ k 1 , k 2 ] .

Se supone  una forma modal para el sistema, con dos términos, uno de los cuales está ponderado por un factor B , por ejemplo, Y = [1, 1] +  B [1, −1]. La teoría del movimiento armónico simple dice que la velocidad en el momento en que la deflexión es cero es la frecuencia angular multiplicada por la deflexión (y) en el momento de máxima deflexión. En este ejemplo, la energía cinética (KE) de cada masa es etc. y la energía potencial (PE) de cada resorte es etc.

También sabemos que sin amortiguamiento, el KE máximo es igual al PE máximo. De este modo,

La amplitud general de la forma del modo se cancela desde cada lado, siempre. Es decir, el tamaño real de la deflexión supuesta no importa, sólo la forma del modo .

Las manipulaciones matemáticas obtienen entonces una expresión para , en términos de B, que puede derivarse con respecto a B, para encontrar el mínimo, es decir, cuando . Esto da el valor de B para el cual es más bajo. Esta es una solución de límite superior para si se espera que sea la frecuencia fundamental predicha del sistema porque se supone que la forma del modo es , pero hemos encontrado el valor más bajo de ese límite superior, dadas nuestras suposiciones, porque B se usa para encontrar el valor óptimo. 'mezcla' de las dos funciones de forma de modo asumidas.

Hay muchos trucos con este método, el más importante es intentar elegir formas de modo realistas asumidas. Por ejemplo, en el caso de problemas de deflexión de vigas, es aconsejable utilizar una forma deformada que sea analíticamente similar a la solución esperada. Una cuartica puede adaptarse a la mayoría de los problemas fáciles de vigas simplemente unidas, incluso si el orden de la solución deformada puede ser menor. Los resortes y las masas no tienen que ser discretos, pueden ser continuos (o una mezcla), y este método se puede usar fácilmente en una hoja de cálculo para encontrar las frecuencias naturales de sistemas distribuidos bastante complejos, si se puede describir el KE distribuido y términos PE fácilmente, o bien dividir los elementos continuos en partes discretas.

Este método podría usarse de forma iterativa, agregando formas modales adicionales a la mejor solución anterior, o puede crear una expresión larga con muchas B y muchas formas modales, y luego diferenciarlas parcialmente .

En sistemas dinámicos

El operador Koopman permite codificar un sistema no lineal de dimensión finita como un sistema lineal de dimensión infinita . En general, ambos problemas son difíciles de resolver, pero para el último podemos utilizar el método de Ritz-Galerkin para aproximar una solución. [13]

La relación con el método de los elementos finitos.

En el lenguaje del método de elementos finitos, la matriz es precisamente la matriz de rigidez del hamiltoniano en el espacio de elementos lineales por partes, y la matriz es la matriz de masas . En el lenguaje del álgebra lineal, el valor es un valor propio del hamiltoniano discretizado y el vector es un vector propio discretizado.

Ver también

notas y referencias

  1. ^ ab Leissa, AW (2005). «Las bases históricas de los métodos Rayleigh y Ritz» . Revista de Sonido y Vibración . 287 (4–5): 961–978. Código Bib : 2005JSV...287..961L. doi :10.1016/j.jsv.2004.12.021.
  2. ^ ab Ilanko, Sinniah (2009). "Comentarios sobre las bases históricas de los métodos de Rayleigh y Ritz". Revista de Sonido y Vibración . 319 (1–2): 731–733. Código Bib : 2009JSV...319..731I. doi :10.1016/j.jsv.2008.06.001.
  3. ^ abcd Davies, EB ; Ciruela, M. (2003). "Contaminación espectral". Revista IMA de Análisis Numérico .
  4. ^ ab Süli, Endre ; Mayers, David (2003). Introducción al análisis numérico . Prensa de la Universidad de Cambridge . ISBN 0521007941.
  5. ^ ab Levitin, Michael; Shargorodsky, Eugenio (2004). "Contaminación espectral y espectros relativos de segundo orden para operadores autoadjuntos". Revista IMA de Análisis Numérico .
  6. ^ ab Pryce, John D. (1994). Solución numérica de problemas de Sturm-Liouville . Prensa de la Universidad de Oxford. ISBN 0198534159.
  7. ^ ab Arfken, George B .; Weber, Hans J. (2005). Métodos matemáticos para físicos (6ª ed.). Prensa académica.
  8. ^ Colbrook, Mateo. "Descifrando el infinito: ¿podemos calcular espectros?". Matemáticas hoy . Instituto de Matemáticas y sus Aplicaciones.
  9. ^ Colbrook, Mateo; Romano, Bogdan; Hansen, Anders (2019). "Cómo calcular espectros con control de errores". Cartas de revisión física .
  10. ^ Pokrzywa, Andrzej (1979). "Método de proyecciones ortogonales y aproximación del espectro de un operador acotado". Estudios Matemáticos .
  11. ^ Bögli, Sabine; Marletta, Marco; Tretter, Christiane (2020). "El rango numérico esencial para operadores lineales ilimitados". Revista de análisis funcional .
  12. ^ Trefethen, Lloyd N.; Bau, III, David (1997). Álgebra lineal numérica. SIAM. pag. 254.ISBN 978-0-89871-957-4.
  13. ^ Servadio, Simone; Arnas, David; Linares, Ricardo. "Un tutorial del operador Koopman con polinomios ortogonales". arXiv.

enlaces externos