stringtranslate.com

Cociente de Rayleigh

En matemáticas , el cociente de Rayleigh [1] ( / ˈ r . l i / ) para una matriz hermítica compleja dada y un vector distinto de cero se define como: [2] [3] Para matrices y vectores reales, la condición de ser hermítico se reduce a la de ser simétrico , y la transpuesta conjugada a la transpuesta habitual . Nótese que para cualquier escalar distinto de cero . Recordemos que una matriz hermítica (o simétrica real) es diagonalizable solo con valores propios reales . Se puede demostrar que, para una matriz dada, el cociente de Rayleigh alcanza su valor mínimo (el valor propio más pequeño de ) cuando es (el vector propio correspondiente ). [4] De manera similar, y .

El cociente de Rayleigh se utiliza en el teorema de mínimo-máximo para obtener valores exactos de todos los valores propios. También se utiliza en algoritmos de valores propios (como la iteración del cociente de Rayleigh ) para obtener una aproximación de valor propio a partir de una aproximación de vector propio.

El rango del cociente de Rayleigh (para cualquier matriz, no necesariamente hermítica) se denomina rango numérico y contiene su espectro . Cuando la matriz es hermítica, el radio numérico es igual a la norma espectral. También en análisis funcional, se conoce como radio espectral . En el contexto de las -álgebras o la mecánica cuántica algebraica, la función que asocia el cociente de Rayleigh-Ritz para un valor fijo y variable a través del álgebra se denominaría vector de estado del álgebra.

En mecánica cuántica , el cociente de Rayleigh da el valor esperado del observable correspondiente al operador para un sistema cuyo estado está dado por .

Si fijamos la matriz compleja , entonces el mapa de cociente de Rayleigh resultante (considerado como una función de ) determina completamente a través de la identidad de polarización ; de hecho, esto sigue siendo cierto incluso si permitimos que sea no hermítico. Sin embargo, si restringimos el campo de escalares a los números reales, entonces el cociente de Rayleigh solo determina la parte simétrica de .

Límites para HermitianMETRO

Como se indicó en la introducción, para cualquier vector x , se tiene , donde son respectivamente los valores propios más pequeños y más grandes de . Esto es inmediato después de observar que el cociente de Rayleigh es un promedio ponderado de los valores propios de M : donde es el -ésimo par propio después de la ortonormalización y es la ésima coordenada de x en la base propia. Entonces es fácil verificar que los límites se alcanzan en los vectores propios correspondientes .

El hecho de que el cociente sea un promedio ponderado de los valores propios se puede utilizar para identificar el segundo, el tercero, ... mayor valor propio. Sean los valores propios en orden decreciente. Si y está restringido a ser ortogonal a , en cuyo caso , entonces tiene valor máximo , que se logra cuando .

Caso especial de matrices de covarianza

Una matriz de covarianza empírica puede representarse como el producto de la matriz de datos premultiplicada por su transpuesta . Al ser una matriz semidefinida positiva, tiene valores propios no negativos y vectores propios ortogonales (u ortogonalizables), lo que puede demostrarse de la siguiente manera.

En primer lugar, que los valores propios no son negativos:

En segundo lugar, que los vectores propios sean ortogonales entre sí: si los valores propios son diferentes (en el caso de multiplicidad), la base puede ser ortogonalizada.

Para establecer ahora que el cociente de Rayleigh se maximiza por el vector propio con el valor propio más grande, considere descomponer un vector arbitrario sobre la base de los vectores propios : donde es la coordenada de proyectada ortogonalmente sobre . Por lo tanto, tenemos: que, por ortonormalidad de los vectores propios, se convierte en:

La última representación establece que el cociente de Rayleigh es la suma de los cosenos al cuadrado de los ángulos formados por el vector y cada vector propio , ponderados por los valores propios correspondientes.

Si un vector maximiza , entonces cualquier múltiplo escalar distinto de cero también maximiza , por lo que el problema puede reducirse al problema de Lagrange de maximizar bajo la restricción de que .

Definir: . Esto se convierte entonces en un programa lineal , que siempre alcanza su máximo en uno de los vértices del dominio. Un punto máximo tendrá y para todos (cuando los valores propios se ordenan por magnitud decreciente).

Por tanto, el cociente de Rayleigh se maximiza mediante el vector propio con el valor propio más grande.

Formulación utilizando multiplicadores de Lagrange

Alternativamente, se puede llegar a este resultado mediante el método de multiplicadores de Lagrange . La primera parte es demostrar que el cociente es constante bajo escala , donde es un escalar

Debido a esta invariancia, es suficiente estudiar el caso especial . El problema es entonces encontrar los puntos críticos de la función sujeta a la restricción En otras palabras, es encontrar los puntos críticos de donde es un multiplicador de Lagrange. Los puntos estacionarios de ocurren en y

Por lo tanto, los vectores propios de son los puntos críticos del cociente de Rayleigh y sus valores propios correspondientes son los valores estacionarios de . Esta propiedad es la base del análisis de componentes principales y la correlación canónica .

Uso en la teoría de Sturm-Liouville

La teoría de Sturm-Liouville se ocupa de la acción del operador lineal sobre el espacio de producto interno definido por funciones que satisfacen ciertas condiciones de contorno especificadas en a y b . En este caso, el cociente de Rayleigh es

Esto a veces se presenta en una forma equivalente, obtenida separando la integral en el numerador y utilizando la integración por partes :

Generalizaciones

  1. Para un par dado ( A , B ) de matrices, y un vector dado distinto de cero x , el cociente de Rayleigh generalizado se define como: El cociente de Rayleigh generalizado se puede reducir al cociente de Rayleigh mediante la transformación donde es la descomposición de Cholesky de la matriz hermítica definida positiva B.
  2. Para un par dado ( x , y ) de vectores distintos de cero y una matriz hermítica H dada , el cociente de Rayleigh generalizado se puede definir como: que coincide con R ( H , x ) cuando x  =  y . En mecánica cuántica, esta cantidad se denomina "elemento de matriz" o, a veces, "amplitud de transición".

Véase también

Referencias

  1. ^ También conocida como relación Rayleigh-Ritz ; recibe su nombre de Walther Ritz y Lord Rayleigh .
  2. ^ Horn, RA; Johnson, CA (1985). Análisis de matrices. Cambridge University Press. págs. 176-180. ISBN 0-521-30586-1.
  3. ^ Parlett, BN (1998). El problema del valor propio simétrico . Clásicos de las matemáticas aplicadas. SIAM. ISBN 0-89871-402-8.
  4. ^ Costin, Rodica D. (2013). "Apuntes de mitad de período" (PDF) . Matemáticas 5102 Matemáticas lineales en dimensiones infinitas, notas de clase . The Ohio State University.

Lectura adicional