stringtranslate.com

Teoría de Sturm-Liouville

En matemáticas y sus aplicaciones, un problema de Sturm-Liouville es una ecuación diferencial ordinaria lineal de segundo orden de la forma para funciones dadas , y , junto con algunas condiciones de contorno en valores extremos de . Los objetivos de un problema de Sturm-Liouville dado son:

La teoría de Sturm-Liouville es el estudio general de los problemas de Sturm-Liouville. En particular, para un problema de Sturm-Liouville "regular", se puede demostrar que existe una cantidad infinita de valores propios, cada uno con una función propia única, y que estas funciones propias forman una base ortonormal de un determinado espacio de Hilbert de funciones.

Esta teoría es importante en matemáticas aplicadas , donde los problemas de Sturm-Liouville ocurren con mucha frecuencia, en particular cuando se trata de ecuaciones diferenciales parciales lineales separables . Por ejemplo, en mecánica cuántica , la ecuación de Schrödinger unidimensional e independiente del tiempo es un problema de Sturm-Liouville.

La teoría de Sturm-Liouville recibe su nombre de Jacques Charles François Sturm (1803-1855) y Joseph Liouville (1809-1882), quienes desarrollaron la teoría.

Resultados principales

Los principales resultados de la teoría de Sturm-Liouville se aplican a un problema de Sturm-Liouville

en un intervalo finito que es "regular". Se dice que el problema es regular si:

La función , a veces denominada , se denomina función de peso o función de densidad .

Los objetivos de un problema de Sturm-Liouville son:

En un problema regular de Sturm–Liouville, una función se denomina solución si es continuamente diferenciable y satisface la ecuación ( 1 ) en cada . En el caso de , las soluciones deben entenderse en un sentido débil .

Los términos valor propio y vector propio se utilizan porque las soluciones corresponden a los valores propios y funciones propias de un operador diferencial hermítico en un espacio de Hilbert apropiado de funciones con producto interno definido utilizando la función de peso. La teoría de Sturm-Liouville estudia la existencia y el comportamiento asintótico de los valores propios, la teoría cualitativa correspondiente de las funciones propias y su completitud en el espacio de funciones.

El resultado principal de la teoría de Sturm-Liouville establece que, para cualquier problema regular de Sturm-Liouville:

Reducción a la forma Sturm-Liouville

Se dice que la ecuación diferencial ( 1 ) está en forma Sturm–Liouville o en forma autoadjunta . Todas las ecuaciones diferenciales ordinarias homogéneas lineales de segundo orden se pueden reformular en la forma del lado izquierdo de ( 1 ) multiplicando ambos lados de la ecuación por un factor de integración apropiado (aunque no sucede lo mismo con las ecuaciones diferenciales parciales de segundo orden o si y es un vector ). A continuación se muestran algunos ejemplos.

Ecuación de Bessel

que se puede escribir en forma de Sturm-Liouville (primero dividiendo por x , luego colapsando los dos primeros términos de la izquierda en un solo término) como

Ecuación de Legendre

que puede ponerse fácilmente en forma de Sturm-Liouville, ya qued/Dx (1 − x 2 ) = −2 x , por lo que la ecuación de Legendre es equivalente a

Ejemplo utilizando un factor integrador

Dividir todo por x 3 :

Multiplicando todo por un factor de integración de da que se puede poner fácilmente en forma de Sturm-Liouville ya que entonces la ecuación diferencial es equivalente a

Factor de integración para ecuación homogénea general de segundo orden

Al multiplicar por el factor integrador y luego sumar se obtiene la forma de Sturm-Liouville: o, explícitamente:

Ecuaciones de Sturm-Liouville como operadores diferenciales autoadjuntos

La función definida por: puede verse como un operador lineal L que asigna una función u a otra función Lu , y puede estudiarse en el contexto del análisis funcional . De hecho, la ecuación ( 1 ) puede escribirse como

Éste es precisamente el problema de los valores propios ; es decir, se buscan los valores propios λ 1 , λ 2 , λ 3 ,... y los vectores propios correspondientes u 1 , u 2 , u 3 ,... del operador L. La configuración adecuada para este problema es el espacio de Hilbert con producto escalar

En este espacio L se define sobre funciones suficientemente suaves que satisfacen las condiciones de contorno regulares anteriores. Además, L es un operador autoadjunto :

Esto se puede ver formalmente utilizando la integración por partes dos veces, donde los términos de contorno se anulan en virtud de las condiciones de contorno. Entonces se deduce que los valores propios de un operador de Sturm-Liouville son reales y que las funciones propias de L correspondientes a diferentes valores propios son ortogonales. Sin embargo, este operador no está acotado y, por lo tanto, la existencia de una base ortonormal de funciones propias no es evidente. Para superar este problema, se observa el resolvente donde z no es un valor propio. Luego, calcular el resolvente equivale a resolver una ecuación no homogénea, lo que se puede hacer utilizando la fórmula de variación de parámetros . Esto muestra que el resolvente es un operador integral con un núcleo simétrico continuo (la función de Green del problema). Como consecuencia del teorema de Arzelà-Ascoli , este operador integral es compacto y la existencia de una secuencia de valores propios α n que convergen a 0 y funciones propias que forman una base ortonormal se deduce del teorema espectral para operadores compactos . Por último, tenga en cuenta que son equivalentes, por lo que podemos tomar con las mismas funciones propias.

Si el intervalo no está acotado, o si los coeficientes tienen singularidades en los puntos límite, se dice que L es singular. En este caso, el espectro ya no consta solo de valores propios y puede contener un componente continuo. Todavía hay una expansión de función propia asociada (similar a la serie de Fourier versus la transformada de Fourier). Esto es importante en mecánica cuántica , ya que la ecuación de Schrödinger unidimensional independiente del tiempo es un caso especial de una ecuación de Sturm-Liouville.

Aplicación a problemas de valores en la frontera de segundo orden no homogéneos

Consideremos una ecuación diferencial lineal general no homogénea de segundo orden para funciones dadas . Como antes, esto se puede reducir a la forma de Sturm-Liouville : escribiendo un operador de Sturm-Liouville general como: se resuelve el sistema:

Basta con resolver las dos primeras ecuaciones, lo que equivale a resolver ( Pw )′ = Qw , o

Una solución es:

Dada esta transformación, queda resolver:

En general, si se especifican las condiciones iniciales en algún punto, por ejemplo y ( a ) = 0 y y ′( a ) = 0 , una ecuación diferencial de segundo orden se puede resolver utilizando métodos ordinarios y el teorema de Picard-Lindelöf asegura que la ecuación diferencial tiene una solución única en un entorno del punto donde se han especificado las condiciones iniciales.

Pero si en lugar de especificar valores iniciales en un único punto , se desea especificar valores en dos puntos diferentes (los llamados valores de contorno), por ejemplo y ( a ) = 0 y y ( b ) = 1 , el problema resulta mucho más difícil. Nótese que añadiendo una función diferenciable conocida adecuada a y , cuyos valores en a y b satisfacen las condiciones de contorno deseadas, e inyectando dentro de la ecuación diferencial propuesta, se puede suponer sin pérdida de generalidad que las condiciones de contorno son de la forma y ( a ) = 0 y y ( b ) = 0 .

Aquí entra en juego la teoría de Sturm-Liouville: de hecho, una gran clase de funciones f se puede expandir en términos de una serie de funciones propias ortonormales u i del operador de Liouville asociado con valores propios correspondientes λ i :

Entonces una solución a la ecuación propuesta es evidentemente:

Esta solución sólo será válida en el intervalo abierto a < x < b y puede fallar en los límites.

Ejemplo: serie de Fourier

Consideremos el problema de Sturm-Liouville:

Para las incógnitas λ y u ( x ) . Para las condiciones de contorno, tomamos por ejemplo:

Observe que si k es cualquier entero, entonces la función es una solución con valor propio λ = k 2 . Sabemos que las soluciones de un problema de Sturm-Liouville forman una base ortogonal y sabemos por las series de Fourier que este conjunto de funciones sinusoidales es una base ortogonal. Dado que las bases ortogonales son siempre máximas (por definición), concluimos que el problema de Sturm-Liouville en este caso no tiene otros vectores propios.

Dado lo anterior, resolvamos ahora el problema no homogéneo con las mismas condiciones de contorno . En este caso, debemos desarrollar f ( x ) = x como una serie de Fourier. El lector puede comprobar, ya sea integrando e ikx x dx o consultando una tabla de transformadas de Fourier, que así obtenemos

Esta serie de Fourier en particular es problemática debido a sus pobres propiedades de convergencia. No está claro a priori si la serie converge puntualmente. Debido al análisis de Fourier, dado que los coeficientes de Fourier son " sumables al cuadrado ", la serie de Fourier converge en L 2 , que es todo lo que necesitamos para que funcione esta teoría en particular. Mencionamos para el lector interesado que en este caso podemos confiar en un resultado que dice que la serie de Fourier converge en cada punto de diferenciabilidad, y en los puntos de salto (la función x , considerada como una función periódica, tiene un salto en  π ) converge al promedio de los límites izquierdo y derecho (ver convergencia de la serie de Fourier ).

Por lo tanto, utilizando la fórmula ( 4 ), obtenemos la solución:

En este caso, podríamos haber encontrado la respuesta usando antidiferenciación , pero esto ya no es útil en la mayoría de los casos cuando la ecuación diferencial tiene muchas variables.

Aplicación a ecuaciones diferenciales parciales

Modos normales

Ciertas ecuaciones diferenciales parciales pueden resolverse con la ayuda de la teoría de Sturm-Liouville. Supongamos que nos interesan los modos vibracionales de una membrana delgada, colocada en un marco rectangular, 0 ≤ xL 1 , 0 ≤ yL 2 . La ecuación de movimiento para el desplazamiento vertical de la membrana, W ( x , y , t ) viene dada por la ecuación de onda :

El método de separación de variables sugiere buscar primero soluciones de la forma simple W = X ( x ) × Y ( y ) × T ( t ) . Para una función como W la ecuación diferencial parcial se convierte en X/incógnita + Y/Y = 1/c2 T/yo . Dado que los tres términos de esta ecuación son funciones de x , y , t por separado, deben ser constantes. Por ejemplo, el primer término da X ″ = λX para una constante  λ . Las condiciones de contorno ("mantenidas en un marco rectangular") son W = 0 cuando x = 0 , L 1 o y = 0 , L 2 y definen los problemas de valores propios de Sturm-Liouville más simples posibles como en el ejemplo, produciendo las "soluciones de modo normal" para W con dependencia armónica del tiempo, donde m y n son números enteros distintos de cero, A mn son constantes arbitrarias y

Las funciones W mn forman la base del espacio de Hilbert de soluciones (generalizadas) de la ecuación de onda; es decir, una solución arbitraria W puede descomponerse en una suma de estos modos, que vibran en sus frecuencias individuales ω mn . Esta representación puede requerir una suma infinita convergente .

Ecuación lineal de segundo orden

Considérese una ecuación diferencial lineal de segundo orden en una dimensión espacial y de primer orden en el tiempo de la forma:

Separando las variables, asumimos que Entonces nuestra ecuación diferencial parcial anterior puede escribirse como: donde

Dado que, por definición, y X ( x ) son independientes del tiempo t y y T ( t ) son independientes de la posición x , entonces ambos lados de la ecuación anterior deben ser iguales a una constante:

La primera de estas ecuaciones debe resolverse como un problema de Sturm-Liouville en términos de las funciones propias X n ( x ) y los valores propios λ n . La segunda de estas ecuaciones puede resolverse analíticamente una vez que se conocen los valores propios.

dónde

Representación de soluciones y cálculo numérico

La ecuación diferencial de Sturm-Liouville ( 1 ) con condiciones de contorno se puede resolver analíticamente, lo que puede ser exacto o proporcionar una aproximación, mediante el método de Rayleigh-Ritz , o mediante el método matricial variacional de Gerck et al. [1] [2] [3]

En el plano numérico, también se dispone de una gran variedad de métodos. En casos difíciles, puede ser necesario realizar cálculos intermedios con una precisión de varios cientos de decimales para obtener los valores propios con una precisión de unos pocos decimales.

Métodos de disparo

Los métodos de disparo se basan en adivinar un valor de λ , resolver un problema de valor inicial definido por las condiciones de contorno en un punto final, digamos, a , del intervalo [ a , b ] , comparar el valor que toma esta solución en el otro punto final b con la otra condición de contorno deseada y, finalmente, aumentar o disminuir λ según sea necesario para corregir el valor original. Esta estrategia no es aplicable para localizar valores propios complejos. [ aclaración necesaria ]

Método de series de potencias de parámetros espectrales

El método de series de potencias de parámetros espectrales (SPPS) hace uso de una generalización del siguiente hecho sobre ecuaciones diferenciales ordinarias lineales homogéneas de segundo orden: si y es una solución de la ecuación ( 1 ) que no se anula en ningún punto de [ a , b ] , entonces la función es una solución de la misma ecuación y es linealmente independiente de y . Además, todas las soluciones son combinaciones lineales de estas dos soluciones. En el algoritmo SPPS, se debe comenzar con un valor arbitrario λ
0
(a menudo λ
0
= 0
; no necesita ser un valor propio) y cualquier solución y 0 de ( 1 ) con λ = λ
0
que no se anula en [ a , b ] . (A continuación se analizan las formas de encontrar y 0 y λ apropiados)
0
.) Dos secuencias de funciones X ( n ) ( t ) , ( n ) ( t ) en [ a , b ] , denominadas integrales iteradas , se definen recursivamente de la siguiente manera. Primero, cuando n = 0 , se toman como idénticamente iguales a 1 en [ a , b ] . Para obtener las siguientes funciones se multiplican alternativamente por 1/Pio2
0
y wy2
0
e integrado, específicamente, para n > 0 :

Las integrales iteradas resultantes se aplican ahora como coeficientes en las siguientes dos series de potencias en  λ : Entonces, para cualquier λ (real o complejo), u 0 y u 1 son soluciones linealmente independientes de la ecuación correspondiente ( 1 ). (Las funciones p ( x ) y q ( x ) participan en esta construcción a través de su influencia en la elección de y 0 .)

A continuación se eligen los coeficientes c 0 y c 1 de modo que la combinación y = c 0 u 0 + c 1 u 1 satisface la primera condición de contorno ( 2 ). Esto es sencillo de hacer ya que X ( n ) ( a ) = 0 y ( n ) ( a ) = 0 , para n > 0 . Los valores de X ( n ) ( b ) y ( n ) ( b ) proporcionan los valores de u 0 ( b ) y u 1 ( b ) y las derivadas u0 ( b ) y u0 ( b ) , por lo que la segunda condición de contorno ( 3 ) se convierte en una ecuación en una serie de potencias en  λ . Para el trabajo numérico se puede truncar esta serie a un número finito de términos, produciendo un polinomio calculable en λ cuyas raíces son aproximaciones de los valores propios buscados.

Cuando λ = λ 0 , esto se reduce a la construcción original descrita anteriormente para una solución linealmente independiente de una dada. Las representaciones ( 5 ) y ( 6 ) también tienen aplicaciones teóricas en la teoría de Sturm–Liouville. [6]

Construcción de una solución no evanescente

El método SPPS puede, por sí mismo, utilizarse para hallar una solución inicial y 0 . Consideremos la ecuación ( py ′)′ = μqy ; es decir, q , w y λ se sustituyen en ( 1 ) por 0, q y μ respectivamente. Entonces la función constante 1 es una solución no nula correspondiente al valor propio μ 0 = 0 . Aunque no hay garantía de que u 0 o u 1 no se anulen, la función compleja y 0 = u 0 + iu 1 nunca se anulará porque dos soluciones linealmente independientes de una ecuación regular de Sturm–Liouville no pueden anularse simultáneamente como consecuencia del teorema de separación de Sturm . Este truco da una solución y 0 de ( 1 ) para el valor λ 0 = 0 . En la práctica, si ( 1 ) tiene coeficientes reales, las soluciones basadas en y 0 tendrán partes imaginarias muy pequeñas que deben descartarse.

Véase también

Referencias

  1. ^ Ed Gerck, AB d'Oliveira, HF de Carvalho. "Bariones pesados ​​como estados ligados de tres quarks". Lettere al Nuovo Cimento 38(1):27–32, septiembre de 1983.
  2. ^ Augusto B. d'Oliveira, Ed Gerck, Jason AC Gallas. "Solución de la ecuación de Schrödinger para estados ligados en forma cerrada". Physical Review A , 26:1(1), junio de 1982.
  3. ^ Robert F. O'Connell, Jason AC Gallas, Ed Gerck. "Leyes de escala para átomos de Rydberg en campos magnéticos". Physical Review Letters 50(5):324–327, enero de 1983.
  4. ^ Pryce, JD (1993). Solución numérica de problemas de Sturm-Liouville. Oxford: Clarendon Press. ISBN 0-19-853415-9.
  5. ^ Ledoux, V.; Van Daele, M.; Berghe, G. Vanden (2009). "Cálculo eficiente de valores propios de Sturm–Liouville de alto índice para problemas de física". Comput. Phys. Commun . 180 (2): 532–554. arXiv : 0804.2605 . Código Bibliográfico :2009CoPhC.180..241L. doi :10.1016/j.cpc.2008.10.001. S2CID  13955991.
  6. ^ ab Kravchenko, VV; Porter, RM (2010). "Series de potencias de parámetros espectrales para problemas de Sturm–Liouville". Métodos matemáticos en las ciencias aplicadas . 33 (4): 459–468. arXiv : 0811.4488 . Código Bibliográfico :2010MMAS...33..459K. doi :10.1002/mma.1205. S2CID  17029224.

Lectura adicional