Descomposición propia de una matriz.

En álgebra lineal , la descomposición propia es la factorización de una matriz en una forma canónica , mediante la cual la matriz se representa en términos de sus valores propios y vectores propios . De esta forma sólo se pueden factorizar matrices diagonalizables . Cuando la matriz que se factoriza es una matriz simétrica normal o real , la descomposición se denomina "descomposición espectral", derivada del teorema espectral .

Teoría fundamental de los vectores propios y valores propios matriciales.

Un vector $v$ (distinto de cero) de dimensión $N$ es un vector propio de una matriz $A cuadrada$ $N \times N$ si satisface una ecuación lineal de la forma para algún escalar $λ$ . Entonces $λ$ se llama valor propio correspondiente a $v$ . Geométricamente hablando, los vectores propios de $A$ son los vectores que $A$ simplemente se alarga o encoge, y la cantidad en la que se alargan/encogen es el valor propio. La ecuación anterior se llama ecuación de valores propios o problema de valores propios. $\mathbf {A} \mathbf {v} =\lambda \mathbf {v}$

Esto produce una ecuación para los valores propios. Llamamos $p$ $($ $λ$ $)$ el polinomio característico , y la ecuación, llamada ecuación característica, es una ecuación polinómica de orden $N en la incógnita$ $λ$ . Esta ecuación tendrá $N$ $λ$ soluciones distintas, donde $1 \leq$ $N$ $λ$ $\leq$ $N$ . El conjunto de soluciones, es decir, los valores propios, se llama espectro de $A.$ ^[1]^[2]^[3] $p\left(\lambda \right)=\det \left(\mathbf {A} -\lambda \mathbf {I} \right)=0.$

Si el campo de escalares es algebraicamente cerrado , entonces podemos factorizar $p$ como El número entero $n$ $i$ se denomina multiplicidad algebraica del valor propio $λ$ $i$ . Las multiplicidades algebraicas suman $N$ : $p(\lambda )=\left(\lambda -\lambda _{1}\right)^{n_{1}}\left(\lambda -\lambda _{2}\right)^{n_{ 2}}\cdots \left(\lambda -\lambda _{N_{\lambda }}\right)^{n_{N_{\lambda }}}=0.$ ${\textstyle \sum _{i=1}^{N_{\lambda }}{n_{i}}=N.}$

Para cada valor propio $λ i$ , tenemos una ecuación de valor propio específica. Habrá $1 \leq$ $m$ $i$ $\leq$ $n$ $i$ soluciones linealmente independientes para cada ecuación de valor propio. Las combinaciones lineales de las $m$ $i$ soluciones (excepto la que da el vector cero) son los vectores propios asociados con el valor propio $λ$ $i$ . El número entero $m$ $i$ se denomina multiplicidad geométrica de $λ$ $i$ . Es importante tener en cuenta que la multiplicidad algebraica $n$ $i$ y la multiplicidad geométrica $m$ $i$ pueden ser iguales o no, pero siempre tenemos $m$ $i$ $\leq$ $n$ $i$ . El caso más simple es, por supuesto, cuando $m$ $i$ $=$ $n$ $i$ $= 1$ . El número total de vectores propios linealmente independientes, $N$ $v$ , se puede calcular sumando las multiplicidades geométricas $\left(\mathbf {A} -\lambda _ {i}\mathbf {I} \right)\mathbf {v} =0.$ $\sum _{i=1}^{N_{\lambda }}{m_{i}}=N_{\mathbf {v} }.$

Los vectores propios se pueden indexar mediante valores propios, utilizando un índice doble, siendo $v ij$ el $jésimo$ vector propio para el $iésimo$ valor propio. Los vectores propios también se pueden indexar utilizando la notación más simple de un único índice $v k$ , con $k = 1, 2, ..., N v$ .

Descomposición propia de una matriz.

Sea $A$ una matriz cuadrada $n \times n$ $con n$ vectores propios linealmente independientes $q i$ (donde $i = 1, ..., n$ ). Entonces $A$ se puede factorizar como donde $Q$ es la matriz cuadrada $n$ $\times$ $n$ $cuya i-$ ésima columna es el vector propio $q$ $i$ de $A$ , y $Λ$ es la matriz diagonal cuyos elementos diagonales son los valores propios correspondientes, $Λ$ $ii$ $=$ $λ$ $i$ . Tenga en cuenta que sólo se pueden factorizar de esta manera matrices diagonalizables . Por ejemplo, la matriz defectuosa (que es una matriz de corte ) no se puede diagonalizar. $\mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}$ $\left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]$

Los $n$ vectores propios $q i$ suelen estar normalizados, pero no es necesario que lo estén. Un conjunto no normalizado de $n$ vectores propios, $v i,$ también se puede utilizar como columnas de $Q.$ Esto puede entenderse observando que la magnitud de los vectores propios en $Q$ se cancela en la descomposición por la presencia de $Q -1$ . Si uno de los valores propios $λ i$ tiene múltiples vectores propios linealmente independientes (es decir, la multiplicidad geométrica de $λ i$ es mayor que 1), entonces estos vectores propios para este valor propio $λ i$ pueden elegirse para que sean mutuamente ortogonales ; sin embargo, si dos vectores propios pertenecen a dos valores propios diferentes, puede resultar imposible que sean ortogonales entre sí (consulte el ejemplo a continuación). Un caso especial es que si $A$ es una matriz normal, entonces, según el teorema espectral, siempre es posible diagonalizar $A$ en una base ortonormal ${q i}$ .

La descomposición se puede derivar de la propiedad fundamental de los vectores propios: los vectores propios linealmente independientes $q$ $i$ con valores propios distintos de cero forman una base (no necesariamente ortonormal) para todos los productos posibles $A$ $x$ , para $x$ $\in$ $C$ $n$ , que es lo mismo que la imagen ( o rango ) de la transformación matricial correspondiente , y también el espacio de columnas de la matriz $A$ . El número de vectores propios linealmente independientes $q$ $i$ con valores propios distintos de cero es igual al rango de la matriz $A$ , y también a la dimensión de la imagen (o rango) de la transformación matricial correspondiente, así como a su espacio de columnas. ${\begin{aligned}\mathbf {A} \mathbf {v} &=\lambda \mathbf {v} \\\mathbf {A} \mathbf {Q} &=\mathbf {Q} \mathbf { \Lambda } \\\mathbf {A} &=\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}.\end{aligned}}$

Los vectores propios linealmente independientes $q i$ con un valor propio de cero forman una base (que puede elegirse como ortonormal) para el espacio nulo (también conocido como núcleo) de la transformación matricial $A.$

Ejemplo

La matriz real $A$ de 2 × 2 se puede descomponer en una matriz diagonal mediante la multiplicación de una matriz no singular $Q$ $\mathbf {A} ={\begin{bmatrix}1&0\\1&3\\\end{bmatrix}}$ $\mathbf {Q} ={\begin{bmatrix}a&b\\c&d\end{bmatrix}}\in \mathbb {R} ^{2\times 2}.$

Luego, para alguna matriz diagonal real . ${\begin{bmatrix}a&b\\c&d\end{bmatrix}}^{-1}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a&b\\c&d \end{bmatrix}}={\begin{bmatrix}x&0\\0&y\end{bmatrix}},$ $\left[{\begin{smallmatrix}x&0\\0&y\end{smallmatrix}}\right]$

Multiplicar ambos lados de la ecuación de la izquierda por $Q$ : La ecuación anterior se puede descomponer en dos ecuaciones simultáneas : Factorizar los valores propios $x$ e $y$ : Dejar esto nos da dos ecuaciones vectoriales: Y se puede representar mediante una única ecuación vectorial que involucre dos soluciones como valores propios: donde $λ$ representa los dos valores propios $x$ e $y$ , y $u$ representa los vectores $a$ y $b$ . ${\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a&b\\c&d\end{bmatrix}}={\begin{bmatrix}a&b\\c&d\end{bmatrix }}{\begin{bmatrix}x&0\\0&y\end{bmatrix}}.$ ${\begin{casos}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}={\begin{bmatrix}ax\ \cx\end{bmatrix}}\\[1.2ex]{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}={\begin {bmatrix}por\\dy\end{bmatrix}}\end{cases}}.$ ${\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=x{\begin{bmatrix}a\\c\end{bmatrix}}\\[1.2ex]{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=y{\begin{bmatrix}b\\d\end{bmatrix}}\end{cases}}$ $\mathbf {a} ={\begin{bmatrix}a\\c\end{bmatrix}},\quad \mathbf {b} ={\begin{bmatrix}b\\d\end{bmatrix}},$ ${\begin{cases}\mathbf {A} \mathbf {a} =x\mathbf {a} \\\mathbf {A} \mathbf {b} =y\mathbf {b} \end{cases}}$ $\mathbf {A} \mathbf {u} =\lambda \mathbf {u}$

Desplazando $λ u$ hacia el lado izquierdo y factorizando u $.$ Dado que $Q$ no es singular, es esencial que $u$ sea distinto de cero. Por lo tanto, dándonos así las soluciones de los valores propios de la matriz $A$ como $λ$ $= 1$ o $λ$ $= 3$ , y la matriz diagonal resultante de la descomposición propia de $A$ es así . $\left(\mathbf {A} -\lambda \mathbf {I} \right)\mathbf {u} =\mathbf {0}$ $\det(\mathbf {A} -\lambda \mathbf {I} )=0$ $(1-\lambda )(3-\lambda )=0$ $\left[{\begin{smallmatrix}1&0\\0&3\end{smallmatrix}}\right]$

Volviendo a poner las soluciones en las ecuaciones simultáneas anteriores. ${\begin{cases}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}a\\c\end{bmatrix}}=1{\begin{bmatrix}a\\c\end{bmatrix}}\\[1.2ex]{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}b\\d\end{bmatrix}}=3{\begin{bmatrix}b\\d\end{bmatrix}}\end{cases}}$

Resolviendo las ecuaciones, tenemos Por lo tanto, la matriz $Q$ requerida para la descomposición propia de $A$ es es decir: $a=-2c\quad {\text{and}}\quad b=0,\qquad c,d\in \mathbb {R} .$ $\mathbf {Q} ={\begin{bmatrix}-2c&0\\c&d\end{bmatrix}},\qquad c,d\in \mathbb {R} ,$ ${\begin{bmatrix}-2c&0\\c&d\end{bmatrix}}^{-1}{\begin{bmatrix}1&0\\1&3\end{bmatrix}}{\begin{bmatrix}-2c&0\\c&d\end{bmatrix}}={\begin{bmatrix}1&0\\0&3\end{bmatrix}},\qquad c,d\in \mathbb {R}$

Matriz inversa mediante descomposición propia

Si una matriz $A$ puede descomponerse propiamente y si ninguno de sus valores propios es cero, entonces $A$ es invertible y su inversa está dada por If es una matriz simétrica, ya que se forma a partir de los vectores propios de , se garantiza que será una matriz ortogonal , por lo tanto . Además, debido a que $Λ$ es una matriz diagonal , su inversa es fácil de calcular: $\mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}$ $\mathbf {A}$ $\mathbf {Q}$ $\mathbf {A}$ $\mathbf {Q}$ $\mathbf {Q} ^{-1}=\mathbf {Q} ^{\mathrm {T} }$ $\left[\mathbf {\Lambda } ^{-1}\right]_{ii}={\frac {1}{\lambda _{i}}}$

Implicaciones prácticas

Cuando se utiliza la descomposición propia en una matriz de datos reales medidos , lo inverso puede ser menos válido cuando todos los valores propios se utilizan sin modificar en la forma anterior. Esto se debe a que a medida que los valores propios se vuelven relativamente pequeños, su contribución a la inversión es grande. Aquellos cerca de cero o en el "ruido" del sistema de medición tendrán una influencia indebida y podrían dificultar las soluciones (detección) usando lo inverso. ^[4]

Se han propuesto dos mitigaciones: truncar valores propios pequeños o nulos y extender el valor propio confiable más bajo a aquellos que están debajo de él. Véase también la regularización de Tikhonov como un método estadísticamente motivado pero sesgado para eliminar valores propios a medida que quedan dominados por el ruido.

El primer método de mitigación es similar a una muestra escasa de la matriz original, eliminando componentes que no se consideran valiosos. Sin embargo, si la solución o el proceso de detección está cerca del nivel de ruido, el truncamiento puede eliminar componentes que influyen en la solución deseada.

La segunda mitigación extiende el valor propio de modo que los valores más bajos tengan mucha menos influencia sobre la inversión, pero aún contribuyen, de modo que aún se encontrarán soluciones cercanas al ruido.

El valor propio confiable se puede encontrar suponiendo que los valores propios de valor extremadamente similar y bajo son una buena representación del ruido de medición (que se supone bajo para la mayoría de los sistemas).

Si los valores propios están ordenados por valor, entonces el valor propio confiable se puede encontrar minimizando el laplaciano de los valores propios ordenados: ^[5] donde los valores propios están subíndices con una $s$ para indicar que están ordenados. La posición de minimización es el valor propio confiable más bajo. En los sistemas de medición, la raíz cuadrada de este valor propio confiable es el ruido promedio de los componentes del sistema. $\min \left|\nabla ^{2}\lambda _{\mathrm {s} }\right|$

calculo funcional

La descomposición propia permite un cálculo mucho más sencillo de series de potencias de matrices. Si $f (x)$ está dada por entonces sabemos que debido a que $Λ$ es una matriz diagonal , las funciones de $Λ$ son muy fáciles de calcular: $f(x)=a_{0}+a_{1}x+a_{2}x^{2}+\cdots$ $f\!\left(\mathbf {A} \right)=\mathbf {Q} \,f\!\left(\mathbf {\Lambda } \right)\mathbf {Q} ^{-1}$ $\left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)$

Los elementos fuera de la diagonal de $f (Λ)$ son cero; es decir, $f (Λ)$ también es una matriz diagonal. Por lo tanto, calcular $f (A)$ se reduce a simplemente calcular la función en cada uno de los valores propios.

Una técnica similar funciona de forma más general con el cálculo funcional holomorfo , utilizándose desde arriba. Una vez más encontramos que $\mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}$ $\left[f\left(\mathbf {\Lambda } \right)\right]_{ii}=f\left(\lambda _{i}\right)$

Ejemplos

${\begin{aligned}\mathbf {A} ^{2}&=\left(\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\right)\left(\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{-1}\right)=\mathbf {Q} \mathbf {\Lambda } \left(\mathbf {Q} ^{-1}\mathbf {Q} \right)\mathbf {\Lambda } \mathbf {Q} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{2}\mathbf {Q} ^{-1}\\[1.2ex]\mathbf {A} ^{n}&=\mathbf {Q} \mathbf {\Lambda } ^{n}\mathbf {Q} ^{-1}\\[1.2ex]\exp \mathbf {A} &=\mathbf {Q} \exp(\mathbf {\Lambda } )\mathbf {Q} ^{-1}\end{aligned}}$ que son ejemplos de las funciones . Además, la matriz es exponencial . $f(x)=x^{2},\;f(x)=x^{n},\;f(x)=\exp {x}$ $\exp {\mathbf {A} }$

Descomposición de matrices espectrales.

Las matrices espectrales son matrices que poseen valores propios distintos y un conjunto completo de vectores propios. Esta característica permite que las matrices espectrales sean completamente diagonalizables, lo que significa que se pueden descomponer en formas más simples mediante descomposición propia. Este proceso de descomposición revela conocimientos fundamentales sobre la estructura y el comportamiento de la matriz, particularmente en campos como la mecánica cuántica, el procesamiento de señales y el análisis numérico. ^[6]

Matrices normales

Una matriz cuadrada de valores complejos es normal (es decir , donde está la transpuesta conjugada ) si y solo si se puede descomponer como , donde es una matriz unitaria (es decir ) y diag( ) es una matriz diagonal . ^[7] Las columnas de forman una base ortonormal y son vectores propios de con sus correspondientes valores propios . ^[8] $A$ $\mathbf {A} ^{*}\mathbf {A} =\mathbf {A} \mathbf {A} ^{*}$ $\mathbf {A} ^{*}$ $\mathbf {A} =\mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*}$ $\mathbf {U}$ $\mathbf {U} ^{*}=\mathbf {U} ^{-1}$ $\mathbf {\Lambda } =$ $\lambda _{1},\ldots ,\lambda _{n}$ $\mathbf {u} _{1},\cdots ,\mathbf {u} _{n}$ $\mathbf {U}$ $\mathbf {A}$ $\lambda _{1},\ldots ,\lambda _{n}$

Por ejemplo, considere la matriz normal de 2 x 2 . $\mathbf {A} ={\begin{bmatrix}1&2\\2&1\end{bmatrix}}$

Los valores propios son y . $\lambda _{1}=3$ $\lambda _{2}=-1$

Los vectores propios (normalizados) correspondientes a estos valores propios son y . $\mathbf {u} _{1}={\frac {1}{\sqrt {2}}}{\begin{bmatrix}1\\1\end{bmatrix}}$ $\mathbf {u} _{2}={\frac {1}{\sqrt {2}}}{\begin{bmatrix}-1\\1\end{bmatrix}}$

La diagonalización es , donde , y . $\mathbf {A} =\mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*}$ $\mathbf {U} ={\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}$ $\mathbf {\Lambda } =$ ${\begin{bmatrix}3&0\\0&-1\end{bmatrix}}$ $\mathbf {U} ^{*}=\mathbf {U} ^{-1}=$ ${\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}$

La verificación es . $\mathbf {U} \mathbf {\Lambda } \mathbf {U} ^{*}=$ ${\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}$ ${\begin{bmatrix}3&0\\0&-1\end{bmatrix}}$ ${\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\1/{\sqrt {2}}&-1/{\sqrt {2}}\end{bmatrix}}$ $={\begin{bmatrix}1&2\\2&1\end{bmatrix}}=\mathbf {A}$

Este ejemplo ilustra el proceso de diagonalizar una matriz normal encontrando sus valores propios y vectores propios, formando la matriz unitaria , la matriz diagonal y verificando la descomposición. $\mathbf {A}$ $\mathbf {U}$ $\mathbf {\Lambda }$

Matrices simétricas reales

Como caso especial, para cada matriz simétrica real $de n \times n$ , los valores propios son reales y los vectores propios pueden elegirse reales y ortonormales . Por lo tanto , una matriz simétrica real $A$ se puede descomponer como , donde $Q$ es una matriz ortogonal cuyas columnas son los vectores propios ortonormales reales de $A$ , y $Λ$ es una matriz diagonal cuyas entradas son los valores propios de $A.$ ^[9] $\mathbf {A} =\mathbf {Q} \mathbf {\Lambda } \mathbf {Q} ^{\mathsf {T}}$

Matrices diagonalizables

Las matrices diagonalizables se pueden descomponer mediante descomposición propia, siempre que tengan un conjunto completo de vectores propios linealmente independientes. Se pueden expresar como , donde es una matriz cuyas columnas son vectores propios de y es una matriz diagonal que consta de los valores propios correspondientes de . ^[8] $\mathbf {A} =\mathbf {P} \mathbf {D} \mathbf {P} ^{-1}$ $\mathbf {P}$ $\mathbf {A}$ $\mathbf {D}$ $\mathbf {A}$

Matrices definidas positivas

Las matrices definidas positivas son matrices para las cuales todos los valores propios son positivos. Se pueden descomponer utilizando la descomposición de Cholesky , donde hay una matriz triangular inferior. ^[10] $\mathbf {A} =\mathbf {L} \mathbf {L} ^{\mathsf {T}}$ $\mathbf {L}$

Matrices unitarias y hermitianas

Las matrices unitarias satisfacen (caso real) o (caso complejo), donde denota la transpuesta conjugada y denota la transpuesta conjugada. Se diagonalizan mediante transformaciones unitarias . ^[8] $\mathbf {U} \mathbf {U} ^{*}=\mathbf {I}$ $\mathbf {U} \mathbf {U} ^{\dagger }=\mathbf {I}$ $\mathbf {U} ^{*}$ $\mathbf {U} ^{\dagger }$

Las matrices hermitianas satisfacen , donde denota la transpuesta conjugada. Se pueden diagonalizar mediante matrices unitarias u ortogonales . ^[8] $\mathbf {H} =\mathbf {H} ^{\dagger }$ $\mathbf {H} ^{\dagger }$

Datos útiles

Datos útiles sobre los valores propios

El producto de los valores propios es igual al determinante de $A.$ Tenga en cuenta que cada valor propio se eleva a la potencia $n$ $i$ , la multiplicidad algebraica . $\det \left(\mathbf {A} \right)=\prod _{i=1}^{N_{\lambda }}{\lambda _{i}^{n_{i}}}$
La suma de los valores propios es igual a la traza de $A.$ Tenga en cuenta que cada valor propio se multiplica por $n$ $i$ , la multiplicidad algebraica . $\operatorname {tr} \left(\mathbf {A} \right)=\sum _{i=1}^{N_{\lambda }}{{n_{i}}\lambda _{i}}$
Si los valores propios de $A$ son $λ i$ y $A$ es invertible, entonces los valores propios de $A -1$ son simplemente $λ -1 yo$ .
Si los valores propios de $A$ son $λ i$ , entonces los valores propios de $f (A)$ son simplemente $f (λ i)$ , para cualquier función holomorfa $f$ .

Datos útiles sobre los vectores propios

Si $A$ es hermitiano y de rango completo, se puede elegir que la base de los vectores propios sea mutuamente ortogonal . Los valores propios son reales.
Los vectores propios de $A -1$ son los mismos que los vectores propios de $A$ .
Los vectores propios solo se definen hasta una constante multiplicativa. Es decir, si $Av = λ v$ entonces $c v$ también es un vector propio para cualquier escalar $c \neq 0$ . En particular, $- v$ y $e iθ v$ (para cualquier θ ) también son vectores propios.
En el caso de valores propios degenerados (un valor propio que tiene más de un vector propio), los vectores propios tienen una libertad adicional de transformación lineal, es decir, cualquier combinación lineal (ortonormal) de vectores propios que compartan un valor propio (en el subespacio degenerado) es en sí misma un vector propio (en el subespacio).

Datos útiles sobre la descomposición propia

$A$ puede descomponerse propiamente si y sólo si el número de vectores propios linealmente independientes, $N v$ , es igual a la dimensión de un vector propio: $N v = N$
Si el cuerpo de escalares es algebraicamente cerrado y si $p (λ)$ no tiene raíces repetidas, es decir, si entonces $A$ puede descomponerse de manera propia. $N_{\lambda }=N,$
La afirmación " $A$ puede descomponerse automáticamente" no implica que $A$ tenga una inversa, ya que algunos valores propios pueden ser cero, lo cual no es invertible.
La afirmación " $A$ tiene una inversa" no implica que $A$ pueda descomponerse propiamente. Un contraejemplo es , que es una matriz defectuosa invertible . $\left[{\begin{smallmatrix}1&1\\0&1\end{smallmatrix}}\right]$

Datos útiles sobre la matriz inversa

$A$ se puede invertir si y sólo si todos los valores propios son distintos de cero: $\lambda _{i}\neq 0\quad \forall \,i$
Si $λ i \neq 0$ y $N v = N$ , la inversa viene dada por $\mathbf {A} ^{-1}=\mathbf {Q} \mathbf {\Lambda } ^{-1}\mathbf {Q} ^{-1}$

Cálculos numéricos

Cálculo numérico de valores propios.

Supongamos que queremos calcular los valores propios de una matriz determinada. Si la matriz es pequeña, podemos calcularla simbólicamente usando el polinomio característico . Sin embargo, esto suele ser imposible para matrices más grandes, en cuyo caso debemos utilizar un método numérico .

En la práctica, los valores propios de matrices grandes no se calculan utilizando el polinomio característico. Calcular el polinomio se vuelve costoso en sí mismo, y las raíces exactas (simbólicas) de un polinomio de alto grado pueden ser difíciles de calcular y expresar: el teorema de Abel-Ruffini implica que las raíces de polinomios de alto grado (5 o superior) en general no pueden expresarse simplemente usando $n-$ ésimas raíces. Por tanto, los algoritmos generales para encontrar vectores propios y valores propios son iterativos .

Existen algoritmos numéricos iterativos para aproximar raíces de polinomios, como el método de Newton , pero en general no es práctico calcular el polinomio característico y luego aplicar estos métodos. Una razón es que pequeños errores de redondeo en los coeficientes del polinomio característico pueden conducir a grandes errores en los valores propios y vectores propios: las raíces son una función de los coeficientes extremadamente mal condicionada . ^[11]

Un método iterativo simple y preciso es el método de la potencia : se elige un vector aleatorio $v$ y se calcula una secuencia de vectores unitarios como ${\frac {\mathbf {A} \mathbf {v} }{\left\|\mathbf {A} \mathbf {v} \right\|}},{\frac {\mathbf {A} ^{2}\mathbf {v} }{\left\|\mathbf {A} ^{2}\mathbf {v} \right\|}},{\frac {\mathbf {A} ^{3}\mathbf {v} }{\left\|\mathbf {A} ^{3}\mathbf {v} \right\|}},\ldots$

Esta secuencia casi siempre convergerá a un vector propio correspondiente al valor propio de mayor magnitud, siempre que $v$ tenga un componente distinto de cero de este vector propio en la base del vector propio (y también siempre que haya solo un valor propio de mayor magnitud). Este sencillo algoritmo es útil en algunas aplicaciones prácticas; por ejemplo, Google lo utiliza para calcular el ranking de páginas de documentos en su motor de búsqueda. ^[12] Además, el método de la potencia es el punto de partida para muchos algoritmos más sofisticados. Por ejemplo, manteniendo no sólo el último vector de la secuencia, sino observando el intervalo de todos los vectores de la secuencia, se puede obtener una mejor aproximación (convergente más rápida) para el vector propio, y esta idea es la base de Arnoldi. iteración . ^[11] Alternativamente, el importante algoritmo QR también se basa en una transformación sutil de un método de potencia. ^[11]

Cálculo numérico de vectores propios.

Una vez que se calculan los valores propios, los vectores propios se pueden calcular resolviendo la ecuación mediante eliminación gaussiana o cualquier otro método para resolver ecuaciones matriciales . $\left(\mathbf {A} -\lambda _{i}\mathbf {I} \right)\mathbf {v} _{i,j}=\mathbf {0}$

Sin embargo, en los métodos prácticos de valores propios a gran escala, los vectores propios suelen calcularse de otras maneras, como subproducto del cálculo de los valores propios. En la iteración de potencia , por ejemplo, el vector propio en realidad se calcula antes que el valor propio (que normalmente se calcula mediante el cociente de Rayleigh del vector propio). ^[11] En el algoritmo QR para una matriz hermitiana (o cualquier matriz normal), los vectores propios ortonormales se obtienen como producto de las matrices $Q$ a partir de los pasos del algoritmo. ^[11] (Para matrices más generales, el algoritmo QR produce primero la descomposición de Schur , a partir de la cual se pueden obtener los vectores propios mediante un procedimiento de sustitución inversa . ^[13] ) Para matrices hermitianas, el algoritmo de valores propios de divide y vencerás es más eficiente que el algoritmo QR si se desean tanto vectores propios como valores propios. ^[11]

Temas adicionales

Espacios propios generalizados

Recuerde que la multiplicidad geométrica de un valor propio se puede describir como la dimensión del espacio propio asociado, el espacio nulo de $λ I - A.$ La multiplicidad algebraica también puede considerarse como una dimensión: es la dimensión del espacio propio generalizado asociado (primer sentido), que es el espacio nulo de la matriz $(λ I - A) k$ para cualquier $k$ suficientemente grande . Es decir, es el espacio de vectores propios generalizados (primer sentido), donde un vector propio generalizado es cualquier vector que eventualmente se vuelve 0 si se le aplica $λ I - A$ suficientes veces seguidas. Cualquier vector propio es un vector propio generalizado, por lo que cada espacio propio está contenido en el espacio propio generalizado asociado. Esto proporciona una prueba sencilla de que la multiplicidad geométrica es siempre menor o igual que la multiplicidad algebraica.

Este uso no debe confundirse con el problema de valores propios generalizado que se describe a continuación.

Vector propio conjugado

Un vector propio conjugado o vector coneigen es un vector enviado después de la transformación a un múltiplo escalar de su conjugado, donde el escalar se denomina valor propio conjugado o valor coneigen de la transformación lineal. Los vectores propios y valores propios representan esencialmente la misma información y significado que los vectores propios y valores propios regulares, pero surgen cuando se utiliza un sistema de coordenadas alternativo. La ecuación correspondiente es. Por ejemplo, en la teoría coherente de la dispersión electromagnética, la transformación lineal $A$ representa la acción realizada por el objeto de dispersión y los vectores propios representan los estados de polarización de la onda electromagnética. En óptica , el sistema de coordenadas se define desde el punto de vista de la onda, conocido como Alineación de dispersión hacia adelante (FSA), y da lugar a una ecuación de valor propio regular, mientras que en el radar , el sistema de coordenadas se define desde el punto de vista del radar, conocido como Atrás. Alineación de dispersión (BSA) y da lugar a una ecuación de valor coneigen. $\mathbf {A} \mathbf {v} =\lambda \mathbf {v} ^{*}.$

Problema de valores propios generalizado

Un problema de valores propios generalizado (segundo sentido) es el problema de encontrar un vector $v$ (distinto de cero) que obedezca donde $A$ y $B$ son matrices. Si $v$ obedece a esta ecuación, con algo de $λ$ , entonces llamamos $a v$ el vector propio generalizado de $A$ y $B$ (en el segundo sentido), y $a λ$ se llama el valor propio generalizado de A y B (en el segundo sentido) que corresponde al vector propio generalizado de $A$ y $B$ (en el segundo sentido). vector propio $v$ . Los posibles valores de $λ$ deben obedecer a la siguiente ecuación $\mathbf {A} \mathbf {v} =\lambda \mathbf {B} \mathbf {v}$ $\det(\mathbf {A} -\lambda \mathbf {B} )=0.$

Si se pueden encontrar $n$ vectores linealmente independientes ${v 1, \dots, v n} , tales que para cada$ $i \in {1, \dots, n}$ , $Av i = λ i Bv i$ , entonces definimos las matrices $P$ y $D$ tales que Entonces se cumple la siguiente igualdad y la prueba es $P={\begin{bmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\\|&&|\end{bmatrix}}\equiv {\begin{bmatrix}(\mathbf {v} _{1})_{1}&\cdots &(\mathbf {v} _{n})_{1}\\\vdots &&\vdots \\(\mathbf {v} _{1})_{n}&\cdots &(\mathbf {v} _{n})_{n}\end{bmatrix}}$ $(D)_{ij}={\begin{cases}\lambda _{i},&{\text{if }}i=j\\0,&{\text{otherwise}}\end{cases}}$ $\mathbf {A} =\mathbf {B} \mathbf {P} \mathbf {D} \mathbf {P} ^{-1}$ $\mathbf {A} \mathbf {P} =\mathbf {A} {\begin{bmatrix}|&&|\\\mathbf {v} _{1}&\cdots &\mathbf {v} _{n}\\|&&|\end{bmatrix}}={\begin{bmatrix}|&&|\\A\mathbf {v} _{1}&\cdots &A\mathbf {v} _{n}\\|&&|\end{bmatrix}}={\begin{bmatrix}|&&|\\\lambda _{1}B\mathbf {v} _{1}&\cdots &\lambda _{n}B\mathbf {v} _{n}\\|&&|\end{bmatrix}}={\begin{bmatrix}|&&|\\B\mathbf {v} _{1}&\cdots &B\mathbf {v} _{n}\\|&&|\end{bmatrix}}\mathbf {D} =\mathbf {B} \mathbf {P} \mathbf {D}$

Y como $P$ es invertible, multiplicamos la ecuación de la derecha por su inversa, terminando la prueba.

Al conjunto de matrices de la forma $A - λ B$ , donde $λ$ es un número complejo, se le llama lápiz ; el término lápiz de matriz también puede referirse al par $(A, B)$ de matrices. ^[14]

Si $B$ es invertible, entonces el problema original se puede escribir en la forma de un problema de valores propios estándar. Sin embargo, en la mayoría de las situaciones es preferible no realizar la inversión, sino resolver el problema de valores propios generalizado como se indicó originalmente. Esto es especialmente importante si $A$ y $B$ son matrices hermitianas , ya que en este caso $B$ $-1$ $A$ generalmente no es hermitiana y propiedades importantes de la solución ya no son evidentes. $\mathbf {B} ^{-1}\mathbf {A} \mathbf {v} =\lambda \mathbf {v}$

Si $A$ y $B$ son simétricos o hermitianos, y $B$ también es una matriz definida positiva , los valores propios $λ i$ son reales y los vectores propios $v 1$ y $v 2$ con valores propios distintos son $B$ -ortogonales ( $v 1 * Bv 2 = 0$ ). ^[15] En este caso, los vectores propios se pueden elegir de modo que la matriz $P$ definida anteriormente satisfaga o y exista una base de vectores propios generalizados (no es un problema defectuoso ). ^[14] Este caso a veces se denomina lápiz definido hermitiano o lápiz definido . ^[14] $\mathbf {P} ^{*}\mathbf {B} \mathbf {P} =\mathbf {I}$ $\mathbf {P} \mathbf {P} ^{*}\mathbf {B} =\mathbf {I} ,$

Ver también

Notas

^ Golub, gen H.; Van Loan, Charles F. (1996), Matrix Computations (3.ª ed.), Baltimore: Johns Hopkins University Press , p. 310, ISBN 978-0-8018-5414-9
^ Kreyszig, Erwin (1972), Matemáticas de ingeniería avanzada (3.ª ed.), Nueva York: Wiley , p. 273, ISBN 978-0-471-50728-4
^ Nering, Evar D. (1970). Álgebra lineal y teoría de matrices (2ª ed.). Nueva York: Wiley . pag. 270.LCCN 76091646 .
^ Hayde, AF; Twede, DR (2002). Shen, Sylvia S. (ed.). "Observaciones sobre la relación entre valores propios, ruido de instrumentos y rendimiento de detección". Espectrometría de imágenes VIII . Actas de SPIE. 4816 : 355. Código bibliográfico : 2002SPIE.4816..355H. doi : 10.1117/12.453777. S2CID 120953647.
^ Twede, DR; Hayden, AF (2004). Shen, Sylvia S; Lewis, Paul E (eds.). "Refinamiento y generalización del método de extensión de inversión de matrices de covarianza por regularización". Espectrometría de imágenes IX . Actas de SPIE. 5159 : 299. Código bibliográfico : 2004SPIE.5159..299T. doi :10.1117/12.506993. S2CID 123123072.
^ Allaire, Gregoire. "Álgebra lineal numérica".
^ Horn y Johnson 1985, pág. 133, Teorema 2.5.3
^ abcd Shores, Thomas S. "Álgebra lineal aplicada y análisis matricial".
^ Horn y Johnson 1985, pág. 136, Corolario 2.5.11
^ Carl D. Meyer (2023). Análisis matricial y álgebra lineal aplicada (2ª ed.). Sociedad de Matemática Industrial y Aplicada. ISBN 9781611977431.
^ abcdef Trefethen, Lloyd N .; Bau, David (1997). Álgebra lineal numérica . SIAM. ISBN 978-0-89871-361-9.
^ Ipsen, Ilse y Rebecca M. Wills, Análisis y computación del PageRank de Google Archivado el 21 de septiembre de 2018 en Wayback Machine , Séptimo Simposio internacional IMACS sobre métodos iterativos en informática científica, Fields Institute, Toronto, Canadá, 5 a 8 de mayo 2005.
^ Quarteroni, Alfio ; Sacco, Ricardo; Saleri, Fausto (2000). "sección 5.8.2". Matemáticas numéricas. Saltador. pag. 15.ISBN 978-0-387-98959-4.
^ abc Bai, Z.; Demmel, J .; Dongarra, J.; Ruhe, A.; Van Der Vorst, H., eds. (2000). "Problemas de valores propios hermitianos generalizados". Plantillas para la solución de problemas algebraicos de valores propios: una guía práctica. Filadelfia: SIAM. ISBN 978-0-89871-471-5. Archivado desde el original el 21 de agosto de 2010 . Consultado el 9 de septiembre de 2022 .
^ Parlett, Beresford N. (1998). El problema del valor propio simétrico (Reimpresión. Ed.). Filadelfia: Sociedad de Matemáticas Industriales y Aplicadas. pag. 345. doi :10.1137/1.9781611971163. ISBN 978-0-89871-402-9.

Referencias

Franklin, Joel N. (1968). Teoría de la matriz . Publicaciones de Dover. ISBN 978-0-486-41179-8.
Cuerno, Roger A.; Johnson, Charles R. (1985). Análisis matricial . Prensa de la Universidad de Cambridge. ISBN 978-0-521-38632-6.
Cuerno, Roger A.; Johnson, Charles R. (1991). Temas de análisis matricial . Prensa de la Universidad de Cambridge. ISBN 978-0-521-46713-1.
Strang, G. (1998). Introducción al álgebra lineal (3ª ed.). Prensa de Wellesley-Cambridge. ISBN 978-0-9614088-5-5.

enlaces externos

Programa interactivo y tutorial de Descomposición Espectral.