stringtranslate.com

cociente de Rayleigh

En matemáticas , el cociente de Rayleigh [1] ( / ˈ r . l i / ) para una matriz hermitiana compleja dada y un vector distinto de cero se define como: [2] [3]

simétricotranspuesta conjugada a la transpuestadiagonalizable sólo con valores propios realesvalor propiovector propio[4]

El cociente de Rayleigh se utiliza en el teorema mínimo-máximo para obtener valores exactos de todos los valores propios. También se utiliza en algoritmos de valores propios (como la iteración del cociente de Rayleigh ) para obtener una aproximación de valores propios a partir de una aproximación de vectores propios.

El rango del cociente de Rayleigh (para cualquier matriz, no necesariamente hermitiana) se llama rango numérico y contiene su espectro . Cuando la matriz es hermitiana, el radio numérico es igual a la norma espectral. Aún en análisis funcional, se le conoce como radio espectral . En el contexto de las -álgebras o la mecánica cuántica algebraica, la función que asocia el cociente de Rayleigh-Ritz para un estado fijo y variable a través del álgebra se denominaría estado vectorial del álgebra.

En mecánica cuántica , el cociente de Rayleigh da el valor esperado del observable correspondiente al operador de un sistema cuyo estado viene dado por .

Si fijamos la matriz compleja , entonces el mapa de cociente de Rayleigh resultante (considerado como una función de ) se determina completamente a través de la identidad de polarización ; de hecho, esto sigue siendo cierto incluso si admitimos que no somos hermitianos. Sin embargo, si restringimos el campo de los escalares a los números reales, entonces el cociente de Rayleigh sólo determina la parte simétrica de .

Límites para Hermitian M

Como se indicó en la introducción, para cualquier vector x , se tiene , donde están respectivamente los valores propios más pequeños y más grandes de . Esto es inmediato después de observar que el cociente de Rayleigh es un promedio ponderado de valores propios de M :

x

El hecho de que el cociente sea un promedio ponderado de los valores propios se puede utilizar para identificar el segundo, el tercero,... los valores propios más grandes. Sean los valores propios en orden decreciente. Si y está obligado a ser ortogonal a , en cuyo caso , entonces tiene el valor máximo , que se logra cuando .

Caso especial de matrices de covarianza

Una matriz de covarianza empírica se puede representar como el producto de la matriz de datos premultiplicada por su transpuesta . Al ser una matriz semidefinida positiva, tiene valores propios no negativos y vectores propios ortogonales (u ortogonalizables), que se pueden demostrar de la siguiente manera.

En primer lugar, que los valores propios no sean negativos:

En segundo lugar, que los vectores propios son ortogonales entre sí:

Para establecer ahora que el cociente de Rayleigh es maximizado por el vector propio con el valor propio más grande, considere descomponer un vector arbitrario sobre la base de los vectores propios :

ortonormalidad

La última representación establece que el cociente de Rayleigh es la suma de los cosenos cuadrados de los ángulos formados por el vector y cada vector propio , ponderados por los valores propios correspondientes.

Si un vector maximiza , entonces cualquier múltiplo escalar distinto de cero también maximiza , por lo que el problema puede reducirse al problema de Lagrange de maximizar bajo la restricción de que .

Definir: . Esto se convierte entonces en un programa lineal , que siempre alcanza su máximo en una de las esquinas del dominio. Un punto máximo tendrá y para todos (cuando los valores propios estén ordenados por magnitud decreciente).

Por lo tanto, el cociente de Rayleigh es maximizado por el vector propio con el valor propio más grande.

Formulación utilizando multiplicadores de Lagrange.

Alternativamente, se puede llegar a este resultado mediante el método de los multiplicadores de Lagrange . La primera parte es mostrar que el cociente es constante bajo escala , donde es un escalar.

Debido a esta invariancia, basta con estudiar el caso especial . El problema entonces es encontrar los puntos críticos de la función.

Por tanto, los vectores propios de son los puntos críticos del cociente de Rayleigh y sus correspondientes valores propios son los valores estacionarios de . Esta propiedad es la base para el análisis de componentes principales y la correlación canónica .

Uso en la teoría de Sturm-Liouville

La teoría de Sturm-Liouville se refiere a la acción del operador lineal.

espacio interior del producto
condiciones de contornoab

A veces se presenta en forma equivalente, obtenida separando la integral en el numerador y usando integración por partes :

Generalizaciones

  1. Para un par dado ( A , B ) de matrices y un vector x distinto de cero , el cociente de Rayleigh generalizado se define como:
    El cociente de Rayleigh generalizado se puede reducir al cociente de Rayleigh mediante la transformación donde está la descomposición de Cholesky de la matriz hermitiana positiva-definida B.
  2. Para un par dado ( x , y ) de vectores distintos de cero y una matriz hermitiana dada H , el cociente de Rayleigh generalizado se puede definir como:
    que coincide con R ( H , x ) cuando x  =  y . En mecánica cuántica, esta cantidad se denomina "elemento de matriz" o, a veces, "amplitud de transición".

Ver también

Referencias

  1. ^ También conocida como relación Rayleigh-Ritz ; lleva el nombre de Walther Ritz y Lord Rayleigh .
  2. ^ Cuerno, RA; Johnson, California (1985). Análisis matricial. Prensa de la Universidad de Cambridge. págs. 176–180. ISBN 0-521-30586-1.
  3. ^ Parlett, BN (1998). El problema de los valores propios simétricos . Clásicos en Matemática Aplicada. SIAM. ISBN 0-89871-402-8.
  4. ^ Costin, Rodica D. (2013). "Notas de mitad de período" (PDF) . Matemáticas 5102 Matemáticas lineales en dimensiones infinitas, notas de clase . La Universidad Estatal de Ohio.

Otras lecturas