Representación de matrices invertibles como operador unitario multiplicando un operador hermítico
En matemáticas , la descomposición polar de una matriz cuadrada real o compleja es una factorización de la forma , donde es una matriz unitaria y es una matriz hermítica semidefinida positiva ( es una matriz ortogonal y es una matriz simétrica semidefinida positiva en el caso real ), ambas cuadradas y del mismo tamaño. [1]
Si una matriz real se interpreta como una transformación lineal del espacio -dimensional , la descomposición polar la separa en una rotación o reflexión de , y un escalamiento del espacio a lo largo de un conjunto de ejes ortogonales.
La descomposición polar de una matriz cuadrada siempre existe. Si es invertible , la descomposición es única y el factor será positivo-definido . En ese caso, se puede escribir de forma única en la forma , donde es unitario y es el único logaritmo autoadjunto de la matriz . [2] Esta descomposición es útil para calcular el grupo fundamental de los grupos de Lie (matriciales) . [3]
La descomposición polar también se puede definir como donde es una matriz simétrica positiva definida con los mismos valores propios pero diferentes vectores propios.
La descomposición polar de una matriz puede verse como el análogo matricial de la forma polar de un número complejo como , donde es su valor absoluto (un número real no negativo ), y es un número complejo con norma unitaria (un elemento del grupo del círculo ).
La definición puede extenderse a matrices rectangulares , exigiendo que sean matrices semiunitarias y semidefinidas positivas hermíticas. La descomposición siempre existe y siempre es única. La matriz es única si y solo si tiene rango completo. [4]
Interpretación geométrica
Una matriz cuadrada real puede interpretarse como la transformación lineal de que lleva un vector columna a . Entonces, en la descomposición polar , el factor es una matriz ortonormal real. La descomposición polar puede verse entonces como la expresión de la transformación lineal definida por en un escalamiento del espacio a lo largo de cada vector propio de por un factor de escala (la acción de ), seguido por una rotación de (la acción de ).
Alternativamente, la descomposición expresa la transformación definida por como una rotación ( ) seguida de un escalamiento ( ) a lo largo de ciertas direcciones ortogonales. Los factores de escala son los mismos, pero las direcciones son diferentes.
Propiedades
La descomposición polar del complejo conjugado de está dada por Nótese que da la descomposición polar correspondiente del determinante de A , ya que y . En particular, si tiene determinante 1 entonces tanto y tienen determinante 1.
La matriz semidefinida positiva P es siempre única, incluso si A es singular , y se denota como donde denota la transpuesta conjugada de . La unicidad de P asegura que esta expresión esté bien definida. La unicidad está garantizada por el hecho de que es una matriz hermítica semidefinida positiva y, por lo tanto, tiene una raíz cuadrada hermítica semidefinida positiva única . [5] Si A es invertible, entonces P es positivamente definida, por lo tanto también invertible y la matriz U está determinada de manera única por
Relación con la SVD
En términos de la descomposición en valores singulares (SVD) de , , se tiene donde , y son matrices unitarias (llamadas matrices ortogonales si el cuerpo son los reales ). Esto confirma que es definida positiva y es unitaria. Por lo tanto, la existencia de la SVD es equivalente a la existencia de la descomposición polar.
También se puede descomponer en la forma Aquí es lo mismo que antes y se da por Esto se conoce como descomposición polar izquierda, mientras que la descomposición anterior se conoce como descomposición polar derecha. La descomposición polar izquierda también se conoce como descomposición polar inversa.
La descomposición polar de una matriz real cuadrada invertible es de la forma
donde es una matriz definida positiva y es una matriz ortogonal.
Relación con matrices normales
La matriz con descomposición polar es normal si y sólo si y conmutan : , o equivalentemente, son simultáneamente diagonalizables .
Construcción y pruebas de existencia
La idea central detrás de la construcción de la descomposición polar es similar a la utilizada para calcular la descomposición en valores singulares .
Derivación para matrices normales
Si es normal , entonces es unitariamente equivalente a una matriz diagonal: para alguna matriz unitaria y alguna matriz diagonal . Esto hace que la derivación de su descomposición polar sea particularmente sencilla, ya que podemos escribir
donde es una matriz diagonal que contiene las fases de los elementos de , es decir, cuando y cuando .
La descomposición polar es entonces , con y diagonal en la base propia de y que tienen valores propios iguales a las fases y valores absolutos de los de , respectivamente.
Derivación para matrices invertibles
A partir de la descomposición en valores singulares , se puede demostrar que una matriz es invertible si y solo si (equivalentemente, ) es. Además, esto es cierto si y solo si los valores propios de son todos distintos de cero. [6]
En este caso, la descomposición polar se obtiene directamente escribiendo
y observando que es unitaria. Para ver esto, podemos aprovechar la descomposición espectral de para escribir .
En esta expresión, es unitario porque es. Para mostrar que también es unitario, podemos usar la SVD para escribir , de modo que
donde nuevamente es unitario por construcción.
Otra forma de mostrar directamente la unitaridad de es notar que, escribiendo la SVD de en términos de matrices de rango 1 como , donde son los valores singulares de , tenemos
lo que implica directamente la unitaridad de porque una matriz es unitaria si y solo si sus valores singulares tienen valor absoluto unitario.
Nótese cómo, de la construcción anterior, se deduce que la matriz unitaria en la descomposición polar de una matriz invertible está definida de forma única .
Derivación general
La descomposición en derivadas simples de una matriz cuadrada se lee , con matrices unitarias, y una matriz semidefinida positiva diagonal. Simplemente insertando un par adicional de s o s, obtenemos las dos formas de la descomposición polar de : De manera más general, si es una matriz rectangular , su descomposición en derivadas simples se puede escribir como donde ahora y son isometrías con dimensiones y , respectivamente, donde , y es nuevamente una matriz cuadrada semidefinida positiva diagonal con dimensiones . Ahora podemos aplicar el mismo razonamiento usado en la ecuación anterior para escribir , pero ahora no es en general unitaria. No obstante, tiene el mismo soporte y rango que , y satisface y . Esto hace que en una isometría cuando su acción está restringida al soporte de , es decir, significa que es una isometría parcial .
Como ejemplo explícito de este caso más general, consideremos la descomposición en unidades de la siguiente matriz: Tenemos entonces que es una isometría, pero no unitaria. Por otra parte, si consideramos la descomposición de encontramos que es una isometría parcial (pero no una isometría).
Operadores acotados en el espacio de Hilbert
La descomposición polar de cualquier operador lineal acotado A entre espacios de Hilbert complejos es una factorización canónica como producto de una isometría parcial y un operador no negativo.
La descomposición polar para matrices se generaliza de la siguiente manera: si A es un operador lineal acotado, entonces existe una factorización única de A como producto A = UP donde U es una isometría parcial, P es un operador autoadjunto no negativo y el espacio inicial de U es el cierre del rango de P.
El operador U debe debilitarse a una isometría parcial, en lugar de unitario, debido a las siguientes cuestiones. Si A es el desplazamiento unilateral en l 2 ( N ), entonces | A | = { A * A } 1/2 = I . Por lo tanto, si A = U | A |, U debe ser A , que no es unitario.
La existencia de una descomposición polar es una consecuencia del lema de Douglas :
Lema — Si A , B son operadores acotados en un espacio de Hilbert H , y A * A ≤ B * B , entonces existe una contracción C tal que A = CB . Además, C es única si ker( B * ) ⊂ ker( C ).
El operador C puede definirse por C ( Bh ) := Ah para todo h en H , extendido por continuidad hasta la clausura de Ran ( B ), y por cero en el complemento ortogonal a todo H . El lema se deduce entonces ya que A * A ≤ B * B implica ker( B ) ⊂ ker( A ).
En particular. Si A * A = B * B , entonces C es una isometría parcial, que es única si ker( B * ) ⊂ ker( C ). En general, para cualquier operador acotado A ,
donde ( A * A ) 1/2 es la única raíz cuadrada positiva de A * A dada por el cálculo funcional habitual . Así que por el lema, tenemos
para alguna isometría parcial U , que es única si ker( A * ) ⊂ ker( U ). Tome P como ( A * A ) 1/2 y se obtiene la descomposición polar A = UP . Nótese que se puede usar un argumento análogo para mostrar A = P'U ' , donde P' es positivo y U ' una isometría parcial.
Cuando H es de dimensión finita, U se puede extender a un operador unitario; esto no es cierto en general (ver el ejemplo anterior). Alternativamente, la descomposición polar se puede mostrar utilizando la versión del operador de la descomposición en valores singulares .
Por propiedad del cálculo funcional continuo , | A | está en el C*-álgebra generada por A . Una afirmación similar pero más débil es válida para la isometría parcial: U está en el álgebra de von Neumann generada por A . Si A es invertible, la parte polar U también estará en el C*-álgebra .
Operadores ilimitados
Si A es un operador ilimitado , cerrado y densamente definido entre espacios de Hilbert complejos, entonces todavía tiene una descomposición polar (única)
donde | A | es un operador autoadjunto no negativo (posiblemente ilimitado) con el mismo dominio que A , y U es una isometría parcial que se desvanece en el complemento ortogonal del rango ran(| A |).
La prueba utiliza el mismo lema que el anterior, que se aplica a los operadores no acotados en general. Si dom( A * A ) = dom( B * B ) y A * Ah = B * Bh para todo h ∈ dom( A * A ), entonces existe una isometría parcial U tal que A = UB . U es única si ran( B ) ⊥ ⊂ ker( U ). El operador A, al estar cerrado y densamente definido, garantiza que el operador A * A sea autoadjunto (con dominio denso) y, por lo tanto, permite definir ( A * A ) 1/2 . La aplicación del lema da como resultado la descomposición polar.
Si un operador ilimitado A está afiliado a un álgebra de von Neumann M , y A = UP es su descomposición polar, entonces U está en M y también lo es la proyección espectral de P , 1 B ( P ), para cualquier conjunto de Borel B en [0, ∞) .
Descomposición polar del cuaternión
La descomposición polar de cuaterniones con base ortonormal depende de la esfera unitaria bidimensional de raíces cuadradas de menos uno , conocidas como versores rectos . Dado cualquier en esta esfera, y un ángulo − π < a ≤ π , el versor está en la esfera unitaria tridimensional de Para a = 0 y a = π , el versor es 1 o −1, independientemente de qué r se seleccione. La norma t de un cuaternión q es la distancia euclidiana desde el origen hasta q . Cuando un cuaternión no es simplemente un número real, entonces hay una descomposición polar única :
Aquí r , a , t están todos determinados de forma única de modo que r es un versor recto ( r 2 = –1 ), a satisface 0 < a < π y t > 0 .
Descomposiciones planares alternativas
En el plano cartesiano , las descomposiciones alternativas de anillos planos surgen de la siguiente manera:
- Si x ≠ 0 , z = x (1 + ε( y / x )) es una descomposición polar de un número dual z = x + yε , donde ε 2 = 0 ; es decir, ε es nilpotente . En esta descomposición polar, el círculo unitario ha sido reemplazado por la línea x = 1 , el ángulo polar por la pendiente y / x , y el radio x es negativo en el semiplano izquierdo.
- Si x 2 ≠ y 2 , entonces la hipérbola unitaria x 2 − y 2 = 1 y su conjugado x 2 − y 2 = −1 se pueden utilizar para formar una descomposición polar basada en la rama de la hipérbola unitaria a través de (1, 0) . Esta rama está parametrizada por el ángulo hiperbólico a y se escribe
donde j 2 = +1 y se utiliza la aritmética [7] de números complejos desdoblados . La rama que pasa por (−1, 0) se traza mediante − e aj . Dado que la operación de multiplicar por j refleja un punto que pasa por la línea y = x , la hipérbola conjugada tiene ramas trazadas mediante je aj o − je aj . Por lo tanto, un punto en uno de los cuadrantes tiene una descomposición polar en una de las formas:
El conjunto { 1, −1, j , − j } tiene productos que lo hacen isomorfo al cuatrigrupo de Klein . Evidentemente, la descomposición polar en este caso involucra un elemento de ese grupo.
Determinación numérica de la descomposición polar de la matriz
Para calcular una aproximación de la descomposición polar A = UP , normalmente se aproxima el factor unitario U. [8] [9] La iteración se basa en el método de Heron para la raíz cuadrada de 1 y calcula, a partir de , la secuencia
Se elige la combinación de inversión y conjugación de Hermite de modo que en la descomposición en valores singulares, los factores unitarios permanezcan iguales y la iteración se reduzca al método de Heron en los valores singulares.
Esta iteración básica se puede refinar para acelerar el proceso:
- En cada paso o en intervalos regulares, se estima el rango de los valores singulares de y luego se reescala la matriz para centrar los valores singulares alrededor de 1. El factor de escala se calcula utilizando normas matriciales de la matriz y su inversa. Algunos ejemplos de tales estimaciones de escala son:
utilizando las normas de matriz
de suma de filas y suma de columnas o
utilizando la norma de Frobenius . Incluyendo el factor de escala, la iteración ahora es
- La descomposición QR se puede utilizar en un paso de preparación para reducir una matriz singular A a una matriz regular más pequeña, y dentro de cada paso para acelerar el cálculo de la inversa.
- El método de Heron para calcular raíces de se puede reemplazar por métodos de orden superior, por ejemplo, basados en el método de Halley de tercer orden, lo que da como resultado
Esta iteración se puede combinar nuevamente con el reescalado. Esta fórmula particular tiene la ventaja de que también es aplicable a matrices singulares o rectangulares A .
Véase también
Referencias
- ^ Sala 2015 Sección 2.5
- ^ Hall 2015 Teorema 2.17
- ^ Hall 2015 Sección 13.3
- ^ Higham, Nicholas J.; Schreiber, Robert S. (1990). "Descomposición polar rápida de una matriz arbitraria". SIAM J. Sci. Stat. Comput . 11 (4). Filadelfia, PA, EE. UU.: Society for Industrial and Applied Mathematics: 648–655. CiteSeerX 10.1.1.111.9239 . doi :10.1137/0911038. ISSN 0196-5204. S2CID 14268409.
- ^ Salón 2015 Lema 2.18
- ^ Nótese cómo esto implica, por la positividad de , que los valores propios son todos reales y estrictamente positivos.
- ^ Sobczyk, G. (1995) "Plano de números hiperbólicos", College Mathematics Journal 26:268–80
- ^ Higham, Nicholas J. (1986). "Cálculo de la descomposición polar con aplicaciones". SIAM J. Sci. Stat. Comput . 7 (4). Filadelfia, PA, EE. UU.: Society for Industrial and Applied Mathematics: 1160–1174. CiteSeerX 10.1.1.137.7354 . doi :10.1137/0907079. ISSN 0196-5204.
- ^ Byers, Ralph; Hongguo Xu (2008). "Un nuevo escalamiento para la iteración de Newton para la descomposición polar y su estabilidad hacia atrás". SIAM J. Matrix Anal. Appl . 30 (2). Filadelfia, PA, EE. UU.: Society for Industrial and Applied Mathematics: 822–843. CiteSeerX 10.1.1.378.6737 . doi :10.1137/070699895. ISSN 0895-4798.
- Conway, JB : Un curso de análisis funcional. Textos de posgrado en matemáticas . Nueva York: Springer 1990
- Douglas, RG : Sobre la mayorización, factorización e inclusión de operadores en el espacio de Hilbert. Proc. Amer. Math. Soc. 17 , 413–415 (1966)
- Hall, Brian C. (2015), Grupos de Lie, álgebras de Lie y representaciones: una introducción elemental , Textos de posgrado en matemáticas, vol. 222 (2.ª ed.), Springer, ISBN 978-3319134666.
- Helgason, Sigurdur (1978), Geometría diferencial, grupos de Lie y espacios simétricos , Academic Press, ISBN 0-8218-2848-7