Valor singular de descomposición

Ilustración de la descomposición en valores singulares $UΣV ⁎$ de una matriz real $M$ $de 2 \times 2$ .
**Arriba:** La acción de $M$ , indicada por su efecto sobre el disco unitario $D$ y los dos vectores unitarios canónicos $e 1$ y $e 2$ .
**Izquierda:** La acción de $V ⁎$ , una rotación, sobre $D$ , $e 1$ y $e 2$ .
**Abajo:** La acción de $Σ$ , una escala por los valores singulares $σ 1$ horizontalmente y $σ 2$ verticalmente.
**Derecha:** La acción de $U$ , otra rotación.

En álgebra lineal , la descomposición en valores singulares ( SVD ) es una factorización de una matriz real o compleja en una rotación, seguida de un cambio de escala seguido de otra rotación. Generaliza la descomposición propia de una matriz normal cuadrada con una base propia ortonormal a cualquier matriz . Está relacionado con la descomposición polar . $m\veces n$

Específicamente, la descomposición en valores singulares de una matriz compleja ⁠ ⁠ es una factorización de la forma donde ⁠ ⁠ es una ⁠ ⁠ matriz unitaria compleja , es una matriz diagonal rectangular con números reales no negativos en la diagonal, ⁠ ⁠ es una matriz unitaria compleja matriz, y es la transpuesta conjugada de ⁠ ⁠ . Esta descomposición siempre existe para cualquier matriz compleja. Si ⁠ ⁠ es real, entonces se puede garantizar que ⁠ ⁠ y ⁠ ⁠ sean matrices ortogonales reales; en tales contextos, la SVD a menudo se denota $m\veces n$ $\mathbf {M}$ $\mathbf {M} =\mathbf {U\Sigma V^{*}} ,$ $\mathbf {U}$ $m\veces m$ $\mathbf {\Sigma }$ $m\veces n$ $\mathbf {V}$ $n\times n$ $\mathbf {V} ^{*}$ $\mathbf {V}$ $\mathbf {M}$ $\mathbf {U}$ $\mathbf {V}$ $\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{\mathrm {T} }.$

Las entradas diagonales de están determinadas únicamente por ⁠ ⁠ y se conocen como valores singulares de ⁠ ⁠ . El número de valores singulares distintos de cero es igual al rango de ⁠ ⁠ . Las columnas de ⁠ ⁠ y las columnas de ⁠ ⁠ se denominan vectores singulares izquierdos y vectores singulares derechos de ⁠ ⁠ , respectivamente. Forman dos conjuntos de bases ortonormales ⁠ ⁠ y ⁠ ⁠ y si se ordenan de modo que los valores singulares con valor cero estén todos en las columnas (o filas) con el número más alto, la descomposición del valor singular se puede escribir como $\sigma _{i}=\Sigma _{ii}$ $\mathbf {\Sigma }$ $\mathbf {M}$ $\mathbf {M}$ $\mathbf {M}$ $\mathbf {U}$ $\mathbf {V}$ $\mathbf {M}$ $\mathbf {u} _{1},\ldots,\mathbf {u} _{m}$ $\mathbf {v} _{1},\ldots,\mathbf {v} _{n},$ $\sigma _{i}$

$\mathbf {M} =\sum _{i=1}^{r}\sigma _{i}\mathbf {u} _{i}\mathbf {v} _{i}^{*},$

donde esta el rango de ⁠ ⁠ $r\leq \min\{m,n\}$ $\mathbf {M}.$

El SVD no es único, sin embargo siempre es posible elegir la descomposición de modo que los valores singulares estén en orden descendente. En este caso, (pero no ⁠ ⁠ y ⁠ ⁠ ) está determinado únicamente por ⁠ ⁠ $\Sigma _{ii}$ $\mathbf {\Sigma }$ $\mathbf {U}$ $\mathbf {V}$ $\mathbf {M}.$

El término a veces se refiere al SVD compacto , una descomposición similar ⁠ ⁠ $\mathbf {M} =\mathbf {U\Sigma V} ^{*}$ en la que ⁠ ⁠ $\mathbf {\Sigma }$ es una diagonal cuadrada de tamaño ⁠ ⁠ $r\veces r,$ donde ⁠ ⁠ $r\leq \min\{m,n\}$ es el rango de ⁠ ⁠ $\mathbf {M},$ y tiene solo valores singulares distintos de cero. En esta variante, ⁠ ⁠ $\mathbf {U}$ es una ⁠ ⁠ $m\times r$ matriz semiunitaria y es una ⁠ ⁠ matriz semiunitaria , tal que $\mathbf {V}$ $n\times r$ $\mathbf {U} ^{*}\mathbf {U} =\mathbf {V} ^{*}\mathbf {V} =\mathbf {I} _{r}.$

Las aplicaciones matemáticas del SVD incluyen calcular la pseudoinversa , la aproximación matricial y determinar el rango, el rango y el espacio nulo de una matriz. El SVD también es extremadamente útil en todas las áreas de la ciencia, la ingeniería y la estadística , como el procesamiento de señales , el ajuste de datos por mínimos cuadrados y el control de procesos .

Interpretaciones intuitivas

Rotación, escalado de coordenadas y reflexión.

En el caso especial en el que ⁠ ⁠ $\mathbf {M}$ es una ⁠ ⁠ $m\veces m$ matriz cuadrada real , las matrices ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ pueden elegirse para que sean matrices ⁠ ⁠ $m\veces m$ reales también. En ese caso, "unitario" es lo mismo que " ortogonal ". Luego, interpretando tanto las matrices unitarias como la matriz diagonal, resumida aquí como ⁠ ⁠ $\mathbf {A},$ como una transformación lineal ⁠ ⁠ $\mathbf {x} \mapsto \mathbf {Ax}$ del espacio ⁠ ⁠ $\mathbf {R} _ {m},$ las matrices ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ representan rotaciones o reflexión del espacio, mientras que ⁠ ⁠ $\mathbf {\Sigma }$ representa el escalamiento de cada coordenada ⁠ ⁠ $\mathbf {x} _ {i}$ por el factor ⁠ ⁠ $\sigma _{i}.$ Así, la descomposición SVD descompone cualquier transformación lineal de ⁠ ⁠ $\mathbf {R} ^{m}$ en una composición de tres transformaciones geométricas : una rotación o reflexión ( ⁠ ⁠ $\mathbf {V} ^{*}$ ), seguida de un escalado coordenada por coordenada ( ⁠ ⁠ $\mathbf {\Sigma }$ ), seguido de otra rotación o reflexión ( ⁠ ⁠ $\mathbf {U}$ ).

En particular, si ⁠ ⁠ $\mathbf {M}$ tiene un determinante positivo, entonces ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ pueden elegirse para que sean ambas rotaciones con reflexiones o ambas rotaciones sin reflexiones. ^{[ cita necesaria ]} Si el determinante es negativo, exactamente uno de ellos tendrá un reflejo. Si el determinante es cero, cada uno puede elegirse independientemente como de cualquier tipo.

Si la matriz ⁠ ⁠ $\mathbf {M}$ es real pero no cuadrada, es decir, ⁠ ⁠ $m\veces n$ con ⁠ ⁠, $m\neq n,$ se puede interpretar como una transformación lineal de ⁠ ⁠ $\mathbf {R} ^{n}$ a ⁠ ⁠ $\mathbf {R} ^{m}.$ Entonces ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ pueden elegirse como rotaciones/reflexiones de ⁠ ⁠ $\mathbf {R} ^{m}$ y ⁠ ⁠ $\mathbf {R} ^{n},$ respectivamente; y ⁠ ⁠ $\mathbf {\Sigma},$ además de escalar las primeras ⁠ ⁠ $\min\{m,n\}$ coordenadas, también extiende el vector con ceros, es decir, elimina las coordenadas finales, para convertir ⁠ ⁠ $\mathbf {R} ^{n}$ en ⁠ ⁠ $\mathbf {R} ^{m}.$

Valores singulares como semiejes de una elipse o elipsoide

Como se muestra en la figura, los valores singulares se pueden interpretar como la magnitud de los semiejes de una elipse en 2D. Este concepto se puede generalizar al espacio euclidiano de dimensiones , considerando $n$ los valores singulares de cualquier matriz cuadrada como la magnitud del semieje de un elipsoide de dimensiones . De manera similar, los valores singulares de cualquier ⁠ ⁠ matriz se pueden ver como la magnitud del semieje de un ⁠ ⁠ -elipsoide dimensional en ⁠ ⁠ -espacio dimensional , por ejemplo, como una elipse en un plano 2D (inclinado) en un espacio 3D. Los valores singulares codifican la magnitud del semieje, mientras que los vectores singulares codifican la dirección. Consulte a continuación para obtener más detalles. $n\times n$ $n$ $m\veces n$ $n$ $m$

las columnas deUd.yVson bases ortonormales

Dado que ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ son unitarios, las columnas de cada uno de ellos forman un conjunto de vectores ortonormales , que pueden considerarse como vectores base . La matriz ⁠ ⁠ $\mathbf {M}$ asigna el vector base ⁠ ⁠ $\mathbf {V} _ {i}$ al vector unitario estirado ⁠ ⁠ $\sigma _{i}\mathbf {U} _{i}.$ Según la definición de una matriz unitaria, lo mismo es cierto para sus transpuestas conjugadas ⁠ ⁠ $\mathbf {U} ^{*}$ y ⁠ ⁠ $\mathbf {V},$ excepto que se pierde la interpretación geométrica de los valores singulares a medida que se extiende . En resumen, las columnas de ⁠ ⁠ $\mathbf {U},$ ⁠ ⁠ $\mathbf {U} ^{*},$ ⁠ ⁠ $\mathbf {V},$ y ⁠ ⁠ $\mathbf {V} ^{*}$ son bases ortonormales . Cuando ⁠ ⁠ $\mathbf {M}$ es una matriz hermitiana semidefinida positiva , ⁠ ⁠ y ⁠ ⁠ son iguales a la matriz unitaria utilizada para diagonalizar ⁠ ⁠ Sin embargo, cuando ⁠ ⁠ no es semidefinida positiva y hermitiana pero aún es diagonalizable , su descomposición propia y su descomposición en valores singulares son distintos. $\mathbf {U}$ $\mathbf {V}$ $\mathbf {M}.$ $\mathbf {M}$

Relación con los cuatro subespacios fundamentales

Las primeras ⁠ ⁠ $r$ columnas de ⁠ ⁠ $\mathbf {U}$ son una base del espacio de columnas de ⁠ ⁠ $\mathbf {M}$ .
Las últimas ⁠ ⁠ $señor$ columnas de ⁠ ⁠ $\mathbf {U}$ son una base del espacio nulo de ⁠ ⁠ $\mathbf {M} ^{*}$ .
Las primeras ⁠ ⁠ $r$ columnas de ⁠ ⁠ $\mathbf {V}$ son una base del espacio de columnas de ⁠ ⁠ $\mathbf {M} ^{*}$ (el espacio de filas de ⁠ ⁠ $\mathbf {M}$ en el caso real).
Las últimas ⁠ ⁠ $nr$ columnas de ⁠ ⁠ $\mathbf {V}$ son una base del espacio nulo de ⁠ ⁠ $\mathbf {M}$ .

Significado geométrico

Debido a que ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V}$ son unitarios, sabemos que las columnas ⁠ ⁠ $\mathbf {U} _{1},\ldots,\mathbf {U} _{m}$ de ⁠ ⁠ $\mathbf {U}$ producen una base ortonormal de ⁠ ⁠ $K^{m}$ y las columnas ⁠ ⁠ $\mathbf {V} _{1},\ldots,\mathbf {V} _{n}$ de ⁠ ⁠ $\mathbf {V}$ producen una base ortonormal de ⁠ ⁠ (con respecto a los $K^{n}$ productos escalares estándar en estos espacios).

La transformación lineal

$T:\left\{{\begin{aligned}K^{n}&\to K^{m}\\x&\mapsto \mathbf {M} x\end{aligned}}\right.$

tiene una descripción particularmente simple con respecto a estas bases ortonormales: tenemos

$T(\mathbf {V} _{i})=\sigma _{i}\mathbf {U} _{i},\qquad i=1,\ldots ,\min(m,n),$

donde ⁠ ⁠ $\sigma _{i}$ es la ⁠ ⁠ $i$ -ésima entrada diagonal de ⁠ ⁠ $\mathbf {\Sigma},$ y ⁠ ⁠ $T(\mathbf {V} _ {i})=0$ para ⁠ ⁠ $i>\min(m,n).$

El contenido geométrico del teorema SVD se puede resumir de la siguiente manera: para cada aplicación lineal ⁠ ⁠ $T:K^{n}\a K^{m}$ se pueden encontrar bases ortonormales de ⁠ ⁠ $K^{n}$ y ⁠ ⁠ $K^{m}$ tales que ⁠ ⁠ $T$ asigna el ⁠ ⁠ -ésimo $i$ vector de base de ⁠ ⁠ $K^{n}$ a un no- múltiplo negativo del ⁠ ⁠ -ésimo $i$ vector de base de ⁠ ⁠ $K^{m},$ y envía los vectores de base sobrantes a cero. Con respecto a estas bases, el mapa ⁠ ⁠ $T$ está, por tanto, representado por una matriz diagonal con entradas diagonales reales no negativas.

Para obtener una idea más visual de los valores singulares y la factorización SVD, al menos cuando se trabaja en espacios vectoriales reales, considere la esfera ⁠ ⁠ $S$ de radio uno en ⁠ ⁠ $\mathbf {R} ^{n}.$ El mapa lineal ⁠ ⁠ $T$ asigna esta esfera a un elipsoide en ⁠ ⁠ $\mathbf {R} ^{m}.$ distinto de cero los valores singulares son simplemente las longitudes de los semiejes de este elipsoide. Especialmente cuando ⁠ ⁠ $n=m,$ y todos los valores singulares son distintos y distintos de cero, el SVD del mapa lineal ⁠ ⁠ $T$ puede analizarse fácilmente como una sucesión de tres movimientos consecutivos: considere el elipsoide ⁠ ⁠ $T(S)$ y específicamente sus ejes; luego considere las direcciones en ⁠ ⁠ $\mathbf {R} ^{n}$ enviadas por ⁠ ⁠ $T$ sobre estos ejes. Estas direcciones resultan ser mutuamente ortogonales. Aplica primero una isometría ⁠ ⁠ $\mathbf {V} ^{*}$ enviando estas direcciones a los ejes de coordenadas de ⁠ ⁠ $\mathbf {R} ^{n}.$ En un segundo movimiento, aplica un endomorfismo ⁠ ⁠ $\mathbf {D}$ diagonalizado a lo largo de los ejes de coordenadas y estirándolo o encogiéndolo en cada dirección, usando las longitudes de los semiejes de ⁠ ⁠ $T(S)$ como estiramiento coeficientes. La composición ⁠ ⁠ $\mathbf {D} \circ \mathbf {V} ^{*}$ luego envía la unidad-esfera sobre un elipsoide isométrico para ⁠ ⁠ $T(S).$ Para definir el tercer y último movimiento, aplique una isometría ⁠ ⁠ $\mathbf {U}$ a este elipsoide para obtener ⁠ ⁠ $T(S).$ Como se puede comprobar fácilmente, la composición ⁠ ⁠ $\mathbf {U} \circ \mathbf {D} \circ \mathbf {V} ^{*}$ coincide con ⁠ ⁠ $T.$

Ejemplo

Considere la matriz ⁠ ⁠ $4\times 5$

$\mathbf {M} ={\begin{bmatrix}1&0&0&0&2\\0&0&3&0&0\\0&0&0&0&0\\0&2&0&0&0\end{bmatrix}}$

Una descomposición en valores singulares de esta matriz viene dada por ⁠ ⁠ $\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}$

${\begin{aligned}\mathbf {U} &={\begin{bmatrix}\color {Green}0&\color {Blue}-1&\color {Cyan}0&\color {Emerald}0\\\color {Green}-1&\color {Blue}0&\color {Cyan}0&\color {Emerald}0\\\color {Green}0&\color {Blue}0&\color {Cyan}0&\color {Emerald}-1\\\color {Green}0&\color {Blue}0&\color {Cyan}-1&\color {Emerald}0\end{bmatrix}}\\[6pt]\mathbf {\Sigma } &={\begin{bmatrix}3&0&0&0&\color {Gray}{\mathit {0}}\\0&{\sqrt {5}}&0&0&\color {Gray}{\mathit {0}}\\0&0&2&0&\color {Gray}{\mathit {0}}\\0&0&0&\color {Red}\mathbf {0} &\color {Gray}{\mathit {0}}\end{bmatrix}}\\[6pt]\mathbf {V} ^{*}&={\begin{bmatrix}\color {Violet}0&\color {Violet}0&\color {Violet}-1&\color {Violet}0&\color {Violet}0\\\color {Plum}-{\sqrt {0.2}}&\color {Plum}0&\color {Plum}0&\color {Plum}0&\color {Plum}-{\sqrt {0.8}}\\\color {Magenta}0&\color {Magenta}-1&\color {Magenta}0&\color {Magenta}0&\color {Magenta}0\\\color {Orchid}0&\color {Orchid}0&\color {Orchid}0&\color {Orchid}1&\color {Orchid}0\\\color {Purple}-{\sqrt {0.8}}&\color {Purple}0&\color {Purple}0&\color {Purple}0&\color {Purple}{\sqrt {0.2}}\end{bmatrix}}\end{aligned}}$

La matriz de escala ⁠ ⁠ $\mathbf {\Sigma }$ es cero fuera de la diagonal (cursiva gris) y un elemento de la diagonal es cero (negrita roja, negrita azul claro en modo oscuro). Además, debido a que las matrices ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ son unitarias , al multiplicarlas por sus respectivas transpuestas conjugadas se obtienen matrices identidad , como se muestra a continuación. En este caso, debido a que ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ tienen valores reales, cada una es una matriz ortogonal .

${\begin{aligned}\mathbf {U} \mathbf {U} ^{*}&={\begin{bmatrix}1&0&0&0\\0&1&0&0\\0&0&1&0\\0&0&0&1\end{bmatrix}}=\mathbf {I} _{4}\\[6pt]\mathbf {V} \mathbf {V} ^{*}&={\begin{bmatrix}1&0&0&0&0\\0&1&0&0&0\\0&0&1&0&0\\0&0&0&1&0\\0&0&0&0&1\end{bmatrix}}=\mathbf {I} _{5}\end{aligned}}$

Esta particular descomposición de valores singulares no es única. Elegir ⁠ ⁠ $\mathbf {V}$ tal que

$\mathbf {V} ^{*}={\begin{bmatrix}\color {Violet}0&\color {Violet}1&\color {Violet}0&\color {Violet}0&\color {Violet}0\\\color {Plum}0&\color {Plum}0&\color {Plum}1&\color {Plum}0&\color {Plum}0\\\color {Magenta}{\sqrt {0.2}}&\color {Magenta}0&\color {Magenta}0&\color {Magenta}0&\color {Magenta}{\sqrt {0.8}}\\\color {Orchid}{\sqrt {0.4}}&\color {Orchid}0&\color {Orchid}0&\color {Orchid}{\sqrt {0.5}}&\color {Orchid}-{\sqrt {0.1}}\\\color {Purple}-{\sqrt {0.4}}&\color {Purple}0&\color {Purple}0&\color {Purple}{\sqrt {0.5}}&\color {Purple}{\sqrt {0.1}}\end{bmatrix}}$

También es una descomposición válida en valores singulares.

SVD y descomposición espectral.

Valores singulares, vectores singulares y su relación con el SVD

Un número real no negativo ⁠ ⁠ $\sigma$ es un valor singular para ⁠ ⁠ $\mathbf {M}$ si y sólo si existen vectores unitarios de longitud ⁠ ⁠ $\mathbf {u}$ en ⁠ ⁠ $K^{m}$ y ⁠ ⁠ $\mathbf {v}$ en ⁠ ⁠ $K^{n}$ tales que

${\begin{aligned}\mathbf {Mv} &=\sigma \mathbf {u} ,\\[3mu]\mathbf {M} ^{*}\mathbf {u} &=\sigma \mathbf {v} .\end{aligned}}$

Los vectores ⁠ ⁠ $\mathbf {u}$ y ⁠ ⁠ $\mathbf {v}$ se llaman vectores singular izquierdo y singular derecho para ⁠ ⁠ $\sigma ,$ respectivamente.

En cualquier descomposición de valores singulares

$\mathbf {M} =\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}$

las entradas diagonales de ⁠ ⁠ $\mathbf {\Sigma }$ son iguales a los valores singulares de ⁠ ⁠ $\mathbf {M} .$ Las primeras ⁠ ⁠ $p=\min(m,n)$ columnas de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V}$ son, respectivamente, vectores singulares izquierdo y derecho para los valores singulares correspondientes. En consecuencia, el teorema anterior implica que:

Una ⁠ ⁠ $m\times n$ matriz ⁠ ⁠ $\mathbf {M}$ tiene como máximo ⁠ ⁠ $p$ valores singulares distintos.
Siempre es posible encontrar una base unitaria ⁠ ⁠ $\mathbf {U}$ para ⁠ ⁠ $K^{m}$ con un subconjunto de vectores de base que abarquen los vectores singulares izquierdos de cada valor singular de ⁠ ⁠ $\mathbf {M} .$
Siempre es posible encontrar una base unitaria ⁠ ⁠ $\mathbf {V}$ para ⁠ ⁠ $K^{n}$ con un subconjunto de vectores de base que abarquen los vectores singulares derechos de cada valor singular de ⁠ ⁠ $\mathbf {M} .$

Un valor singular para el cual podemos encontrar dos vectores singulares izquierdo (o derecho) que sean linealmente independientes se llama degenerado . Si ⁠ ⁠ $\mathbf {u} _{1}$ y ⁠ ⁠ $\mathbf {u} _{2}$ son dos vectores singulares por la izquierda que corresponden al valor singular σ, entonces cualquier combinación lineal normalizada de los dos vectores también es un vector singular por la izquierda correspondiente al valor singular σ. Una afirmación similar es cierta para los vectores singulares derechos. El número de vectores singulares izquierdo y derecho independientes coincide, y estos vectores singulares aparecen en las mismas columnas de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V}$ correspondientes a elementos diagonales de ⁠ ⁠ $\mathbf {\Sigma }$ todos con el mismo valor ⁠ ⁠ $\sigma .$

Como excepción, los vectores singulares izquierdo y derecho de valor singular 0 comprenden todos los vectores unitarios en cokernel y kernel , respectivamente, de ⁠ ⁠ $\mathbf {M} ,$ que, según el teorema de rango-nulidad, no pueden tener la misma dimensión si ⁠ ⁠ $m\neq n.$ Incluso si todos los valores singulares son distintos de cero, si ⁠ ⁠ $m>n$ entonces el cokernel no es trivial, en cuyo caso ⁠ ⁠ $\mathbf {U}$ se rellena con ⁠ ⁠ $m-n$ vectores ortogonales del cokernel. Por el contrario, si ⁠ ⁠ $m<n,$ entonces ⁠ ⁠ $\mathbf {V}$ se rellena con ⁠ ⁠ $n-m$ vectores ortogonales del núcleo. Sin embargo, si el valor singular de ⁠ ⁠ $0$ existe, las columnas adicionales de ⁠ ⁠ $\mathbf {U}$ o ⁠ ⁠ $\mathbf {V}$ ya aparecen como vectores singulares izquierdo o derecho.

Los valores singulares no degenerados siempre tienen vectores singulares izquierdo y derecho únicos, hasta la multiplicación por un factor de fase unitaria ⁠ ⁠ $e^{i\varphi }$ (para el caso real hasta un signo). En consecuencia, si todos los valores singulares de una matriz cuadrada ⁠ ⁠ $\mathbf {M}$ son no degenerados y distintos de cero, entonces su descomposición en valores singulares es única, hasta la multiplicación de una columna de ⁠ ⁠ $\mathbf {U}$ por un factor de fase unitaria y la multiplicación simultánea del correspondiente columna de ⁠ ⁠ $\mathbf {V}$ por el mismo factor de fase unitaria. En general, el SVD es único hasta transformaciones unitarias arbitrarias aplicadas uniformemente a los vectores columna de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V}$ que abarcan los subespacios de cada valor singular, y hasta transformaciones unitarias arbitrarias en vectores de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V}$ que abarcan el núcleo y cokernel, respectivamente, de ⁠ ⁠ $\mathbf {M} .$

Relación con la descomposición de valores propios

La descomposición en valores singulares es muy general en el sentido de que se puede aplicar a cualquier matriz , $m\times n$ mientras que la descomposición en valores propios solo se puede aplicar a matrices cuadradas diagonalizables . Sin embargo, las dos descomposiciones están relacionadas.

Si ⁠ ⁠ $\mathbf {M}$ tiene SVD ⁠ ⁠ $\mathbf {M} =\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*},$ se cumplen las dos relaciones siguientes:

${\begin{aligned}\mathbf {M} ^{*}\mathbf {M} &=\mathbf {V} \mathbf {\Sigma } ^{*}\mathbf {U} ^{*}\,\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}=\mathbf {V} (\mathbf {\Sigma } ^{*}\mathbf {\Sigma } )\mathbf {V} ^{*},\\[3mu]\mathbf {M} \mathbf {M} ^{*}&=\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}\,\mathbf {V} \mathbf {\Sigma } ^{*}\mathbf {U} ^{*}=\mathbf {U} (\mathbf {\Sigma } \mathbf {\Sigma } ^{*})\mathbf {U} ^{*}.\end{aligned}}$

Los lados derechos de estas relaciones describen las descomposiciones de valores propios de los lados izquierdos. Como consecuencia:

Las columnas de ⁠ ⁠ $\mathbf {V}$ (denominadas vectores singulares derechos) son vectores propios de ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M} .$
Las columnas de ⁠ ⁠ $\mathbf {U}$ (denominadas vectores singulares izquierdos) son vectores propios de ⁠ ⁠ $\mathbf {M} \mathbf {M} ^{*}.$
Los elementos distintos de cero de ⁠ ⁠ $\mathbf {\Sigma }$ (valores singulares distintos de cero) son las raíces cuadradas de los valores propios distintos de cero de ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M}$ o ⁠ ⁠ $\mathbf {M} \mathbf {M} ^{*}.$

En el caso especial de ser una $\mathbf {M}$ matriz normal y, por tanto , también cuadrada, el teorema espectral garantiza que se puede diagonalizar unitariamente utilizando una base de vectores propios y , por lo tanto , descomponerse como para alguna matriz unitaria y matriz diagonal . con elementos complejos ⁠ ⁠ a lo largo de la diagonal. Cuando ⁠ ⁠ es semidefinido positivo , ⁠ ⁠ serán números reales no negativos, de modo que la descomposición ⁠ ⁠ también es una descomposición en valor singular. De lo contrario, se puede reformular como un SVD moviendo la fase ⁠ ⁠ de cada ⁠ ⁠ a su correspondiente ⁠ ⁠ o ⁠ ⁠. La conexión natural del SVD con matrices no normales es a través del teorema de descomposición polar : ⁠ ⁠ donde ⁠ ⁠ es semidefinida positiva y normal, y ⁠ ⁠ es unitaria. $\mathbf {M} =\mathbf {U} \mathbf {D} \mathbf {U} ^{*}$ $\mathbf {U}$ $\mathbf {D}$ $\sigma _{i}$ $\mathbf {M}$ $\sigma _{i}$ $\mathbf {M} =\mathbf {U} \mathbf {D} \mathbf {U} ^{*}$ $e^{i\varphi }$ $\sigma _{i}$ $\mathbf {V} _{i}$ $\mathbf {U} _{i}.$ $\mathbf {M} =\mathbf {S} \mathbf {R} ,$ $\mathbf {S} =\mathbf {U} \mathbf {\Sigma } \mathbf {U} ^{*}$ $\mathbf {R} =\mathbf {U} \mathbf {V} ^{*}$

Por lo tanto, a excepción de las matrices semidefinidas positivas, la descomposición de valores propios y la SVD de ⁠ ⁠, $\mathbf {M} ,$ aunque están relacionadas, difieren: la descomposición de valores propios es ⁠ ⁠ ${1}$ donde ⁠ ⁠ $\mathbf {U}$ no es necesariamente unitaria y ⁠ ⁠ $\mathbf {D}$ no es necesariamente semidefinida positiva, mientras que la SVD es ⁠ ⁠ ${1}$ donde ⁠ ⁠ $\mathbf {\Sigma }$ es diagonal y semidefinida positiva, y ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V}$ son matrices unitarias que no están necesariamente relacionadas excepto a través de la matriz ⁠ ⁠ $\mathbf {M} .$ Si bien solo las matrices cuadradas no defectuosas tienen una descomposición de valores propios, cualquier ⁠ ⁠ $m\times n$ matriz tiene una SVD.

Aplicaciones de la SVD

Pseudoinverso

La descomposición en valores singulares se puede utilizar para calcular la pseudoinversa de una matriz. La pseudoinversa de la matriz ⁠ ⁠ $\mathbf {M}$ con descomposición en valores singulares ⁠ ⁠ $\mathbf {M} =\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}$ es,

$\mathbf {M} ^{+}=\mathbf {V} {\boldsymbol {\Sigma }}^{+}\mathbf {U} ^{\ast },$

donde está el pseudoinverso de , que se forma reemplazando cada entrada diagonal distinta de cero por su recíproco y transponiendo la matriz resultante. La pseudoinversa es una forma de resolver problemas de mínimos cuadrados lineales . ${\boldsymbol {\Sigma }}^{+}$ ${\boldsymbol {\Sigma }}$

Resolver ecuaciones lineales homogéneas.

Un conjunto de ecuaciones lineales homogéneas se puede escribir como ⁠ ⁠ $\mathbf {A} \mathbf {x} =\mathbf {0}$ para una matriz ⁠ ⁠ $\mathbf {A}$ y un vector ⁠ ⁠. $\mathbf {x} .$ Una situación típica es que ⁠ ⁠ $\mathbf {A}$ se conoce y se debe determinar un valor distinto de cero ⁠ ⁠ $\mathbf {x}$ que satisfaga la ecuación. Tal ⁠ ⁠ $\mathbf {x}$ pertenece al espacio nulo de ⁠ ⁠ $\mathbf {A}$ y a veces se le llama vector nulo (derecho) de ⁠ ⁠. El vector ⁠ ⁠ se puede caracterizar como un vector singular derecho correspondiente a un valor singular de ⁠ ⁠ que es cero. Esta observación significa que si ⁠ ⁠ es una matriz cuadrada y no tiene un valor singular evanescente, la ecuación no tiene un valor distinto de cero ⁠ ⁠ como solución. También significa que si hay varios valores singulares que desaparecen, cualquier combinación lineal de los vectores singulares correctos correspondientes es una solución válida. De manera análoga a la definición de un vector nulo (derecho), un ⁠ ⁠ distinto de cero que satisface ⁠ ⁠ con ⁠ ⁠ que denota la transpuesta conjugada de ⁠ ⁠ se llama vector nulo izquierdo de ⁠ ⁠ $\mathbf {A} .$ $\mathbf {x}$ $\mathbf {A}$ $\mathbf {A}$ $\mathbf {x}$ $\mathbf {x}$ $\mathbf {x} ^{*}\mathbf {A} =\mathbf {0}$ $\mathbf {x} ^{*}$ $\mathbf {x} ,$ $\mathbf {A} .$

Minimización de mínimos cuadrados totales

Un problema de mínimos cuadrados totales busca el vector ⁠ ⁠ $\mathbf {x}$ que minimiza la norma 2 de un vector ⁠ ⁠ $\mathbf {A} \mathbf {x}$ bajo la restricción. La solución resulta ser el vector singular derecho de ⁠ ⁠ correspondiente al valor singular más pequeño. $\|\mathbf {x} \|=1.$ $\mathbf {A}$

Rango, espacio nulo y rango

Otra aplicación del SVD es que proporciona una representación explícita del rango y el espacio nulo de una matriz ⁠ ⁠ $\mathbf {M} .$ Los vectores singulares derechos correspondientes a valores singulares evanescentes de ⁠ ⁠ $\mathbf {M}$ abarcan el espacio nulo de ⁠ ⁠ $\mathbf {M}$ y los vectores singulares izquierdos correspondientes a los valores singulares distintos de cero de ⁠ ⁠ $\mathbf {M}$ abarcan el rango de ⁠ ⁠ $\mathbf {M} .$ Por ejemplo, en el ejemplo anterior, el espacio nulo está abarcado por la última fila de ⁠ ⁠ $\mathbf {V} ^{*}$ y el rango está abarcado por las primeras tres columnas de ⁠ ⁠ $\mathbf {U} .$

Como consecuencia, el rango de ⁠ ⁠ $\mathbf {M}$ es igual al número de valores singulares distintos de cero, que es el mismo que el número de elementos diagonales distintos de cero en . En álgebra lineal numérica, los valores singulares se pueden utilizar para determinar el rango efectivo de una matriz, ya que el error de redondeo puede conducir a valores singulares pequeños pero distintos de cero en una matriz con rango deficiente. Se supone que los valores singulares más allá de una brecha significativa son numéricamente equivalentes a cero. $\mathbf {\Sigma }$

Aproximación matricial de bajo rango

Algunas aplicaciones prácticas necesitan resolver el problema de aproximar una matriz ⁠ ⁠ $\mathbf {M}$ con otra matriz , llamada truncada, que tiene un rango específico ⁠ ⁠ . En el caso de que la aproximación se base en minimizar la norma de Frobenius de la diferencia entre ⁠ ⁠ y ⁠ ⁠ bajo la restricción de que resulta que la solución está dada por el SVD de ⁠ ⁠ es decir ${\tilde {\mathbf {M} }}$ $r$ $\mathbf {M}$ ${\tilde {\mathbf {M} }}$ $\operatorname {rank} {\bigl (}{\tilde {\mathbf {M} }}{\bigr )}=r,$ $\mathbf {M} ,$

${\tilde {\mathbf {M} }}=\mathbf {U} {\tilde {\mathbf {\Sigma } }}\mathbf {V} ^{*},$

donde es la misma matriz excepto que contiene solo los ⁠ ⁠ valores singulares más grandes (los otros valores singulares se reemplazan por cero). Esto se conoce como teorema de Eckart-Young , como lo demostraron esos dos autores en 1936 (aunque más tarde se descubrió que lo conocían autores anteriores; véase Stewart 1993). ${\tilde {\mathbf {\Sigma } }}$ $\mathbf {\Sigma }$ $r$

Modelos separables

Se puede considerar que el SVD descompone una matriz en una suma ordenada y ponderada de matrices separables. Por separable, queremos decir que una matriz ⁠ ⁠ $\mathbf {A}$ se puede escribir como un producto externo de dos vectores ⁠ ⁠ $\mathbf {A} =\mathbf {u} \otimes \mathbf {v} ,$ o, en coordenadas, ⁠ ⁠ $A_{ij}=u_{i}v_{j}.$ Específicamente, la matriz ⁠ ⁠ $\mathbf {M}$ se puede descomponer como,

$\mathbf {M} =\sum _{i}\mathbf {A} _{i}=\sum _{i}\sigma _{i}\mathbf {U} _{i}\otimes \mathbf {V} _{i}.$

Aquí ⁠ ⁠ $\mathbf {U} _{i}$ y ⁠ ⁠ $\mathbf {V} _{i}$ son las ⁠ ⁠ $i$ -ésimas columnas de las matrices SVD correspondientes, ⁠ ⁠ $\sigma _{i}$ son los valores singulares ordenados y cada ⁠ ⁠ $\mathbf {A} _{i}$ es separable. El SVD se puede utilizar para encontrar la descomposición de un filtro de procesamiento de imágenes en filtros horizontales y verticales separables. Tenga en cuenta que el número de ⁠ ⁠ $\sigma _{i}$ distinto de cero es exactamente el rango de la matriz. ^{[ cita necesaria ]} Los modelos separables a menudo surgen en sistemas biológicos, y la factorización SVD es útil para analizar dichos sistemas. Por ejemplo, los campos receptivos de algunas células simples del área visual V1 pueden describirse bien ^[1] mediante un filtro de Gabor en el dominio espacial multiplicado por una función de modulación en el dominio del tiempo. Por lo tanto, dado un filtro lineal evaluado mediante, por ejemplo, correlación inversa , se pueden reorganizar las dos dimensiones espaciales en una dimensión, produciendo así un filtro bidimensional (espacio, tiempo) que se puede descomponer mediante SVD. La primera columna de ⁠ ⁠ $\mathbf {U}$ en la factorización SVD es entonces un Gabor, mientras que la primera columna de ⁠ ⁠ $\mathbf {V}$ representa la modulación del tiempo (o viceversa). Entonces se puede definir un índice de separabilidad

$\alpha ={\frac {\sigma _{1}^{2}}{\sum _{i}\sigma _{i}^{2}}},$

que es la fracción de la potencia en la matriz M que corresponde a la primera matriz separable en la descomposición. ^[2]

Matriz ortogonal más cercana

Es posible utilizar el SVD de una matriz cuadrada ⁠ ⁠ $\mathbf {A}$ para determinar la matriz ortogonal ⁠ ⁠ $\mathbf {O}$ más cercana a ⁠ ⁠ $\mathbf {A} .$ La cercanía del ajuste se mide mediante la norma de Frobenius de ⁠ ⁠ $\mathbf {O} -\mathbf {A} .$ La solución es el producto ⁠ ⁠ $\mathbf {U} \mathbf {V} ^{*}.$ ^[3] Esto intuitivamente hace tiene sentido porque una matriz ortogonal tendría la descomposición ⁠ ⁠ $\mathbf {U} \mathbf {I} \mathbf {V} ^{*}$ donde ⁠ ⁠ $\mathbf {I}$ es la matriz identidad, de modo que si ⁠ ⁠ $\mathbf {A} =\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}$ entonces el producto ⁠ ⁠ $\mathbf {A} =\mathbf {U} \mathbf {V} ^{*}$ equivale a reemplazar los valores singulares por unos. De manera equivalente, la solución es la matriz unitaria ⁠ ⁠ $\mathbf {R} =\mathbf {U} \mathbf {V} ^{*}$ de la descomposición polar en cualquier orden de estiramiento y rotación, como se describió anteriormente. $\mathbf {M} =\mathbf {R} \mathbf {P} =\mathbf {P} '\mathbf {R}$

Un problema similar, con aplicaciones interesantes en el análisis de formas , es el problema de Procrustes ortogonal , que consiste en encontrar una matriz ortogonal ⁠ ⁠ $\mathbf {O}$ que se corresponda más estrechamente ⁠ ⁠ $\mathbf {A}$ con ⁠ ⁠ $\mathbf {B} .$ Específicamente,

$\mathbf {O} ={\underset {\Omega }{\operatorname {argmin} }}\|\mathbf {A} {\boldsymbol {\Omega }}-\mathbf {B} \|_{F}\quad {\text{subject to}}\quad {\boldsymbol {\Omega }}^{\operatorname {T} }{\boldsymbol {\Omega }}=\mathbf {I} ,$

donde denota la norma de Frobenius. $\|\cdot \|_{F}$

Este problema equivale a encontrar la matriz ortogonal más cercana a una matriz dada . $\mathbf {M} =\mathbf {A} ^{\operatorname {T} }\mathbf {B}$

El algoritmo de Kabsch

El algoritmo de Kabsch (llamado problema de Wahba en otros campos) utiliza SVD para calcular la rotación óptima (con respecto a la minimización de mínimos cuadrados) que alineará un conjunto de puntos con un conjunto de puntos correspondiente. Se utiliza, entre otras aplicaciones, para comparar las estructuras de las moléculas.

Procesamiento de la señal

La SVD y la pseudoinversa se han aplicado con éxito al procesamiento de señales , ^[4] al procesamiento de imágenes ^[5] y a big data (por ejemplo, en el procesamiento de señales genómicas). ^[6]^[7]^[8]^[9]

Otros ejemplos

El SVD también se aplica ampliamente al estudio de problemas lineales inversos y es útil en el análisis de métodos de regularización como el de Tikhonov . Es muy utilizado en estadística, donde se relaciona con el análisis de componentes principales y con el análisis de correspondencias , y en el procesamiento de señales y el reconocimiento de patrones . También se utiliza en análisis modal de solo salida, donde las formas de modo sin escala se pueden determinar a partir de vectores singulares. Otro uso más es la indexación semántica latente en el procesamiento de textos en lenguaje natural.

En el cálculo numérico general que involucra sistemas lineales o linealizados, existe una constante universal que caracteriza la regularidad o singularidad de un problema, que es el "número de condición" del sistema . A menudo controla la tasa de error o la tasa de convergencia de un esquema computacional determinado en dichos sistemas. ^[10]^[11] $\kappa :=\sigma _{\text{max}}/\sigma _{\text{min}}$

La SVD también desempeña un papel crucial en el campo de la información cuántica , en una forma a menudo denominada descomposición de Schmidt . A través de él, los estados de dos sistemas cuánticos se descomponen naturalmente, proporcionando una condición necesaria y suficiente para que se entrelacen : si el rango de la matriz es mayor que uno. $\mathbf {\Sigma }$

Una aplicación de SVD a matrices bastante grandes es la predicción numérica del tiempo , donde los métodos de Lanczos se utilizan para estimar las pocas perturbaciones de crecimiento más rápido lineal en la predicción numérica central del tiempo durante un período de tiempo inicial determinado; es decir, los vectores singulares correspondientes a los valores singulares más grandes del propagador linealizado para el clima global durante ese intervalo de tiempo. Los vectores singulares de salida en este caso son sistemas meteorológicos completos. Luego, estas perturbaciones se analizan a través del modelo no lineal completo para generar un pronóstico conjunto , que da una idea de parte de la incertidumbre que debería permitirse en torno a la predicción central actual.

SVD también se ha aplicado al modelado de orden reducido. El objetivo del modelado de orden reducido es reducir el número de grados de libertad en un sistema complejo que se va a modelar. SVD se combinó con funciones de base radial para interpolar soluciones a problemas de flujo inestable tridimensionales. ^[12]

Curiosamente, SVD se ha utilizado para mejorar el modelado de formas de ondas gravitacionales mediante el interferómetro de ondas gravitacionales aLIGO. ^[13] SVD puede ayudar a aumentar la precisión y la velocidad de la generación de formas de onda para respaldar las búsquedas de ondas gravitacionales y actualizar dos modelos de formas de onda diferentes.

La descomposición de valores singulares se utiliza en los sistemas de recomendación para predecir las calificaciones de los artículos de las personas. ^[14] Se han desarrollado algoritmos distribuidos con el fin de calcular el SVD en grupos de máquinas de productos básicos. ^[15]

Se ha aplicado SVD de bajo rango para la detección de puntos críticos a partir de datos espaciotemporales con aplicación a la detección de brotes de enfermedades . ^[16] También se ha aplicado una combinación de SVD y SVD de orden superior para la detección de eventos en tiempo real a partir de flujos de datos complejos (datos multivariados con dimensiones de espacio y tiempo) en la vigilancia de enfermedades . ^[17]

En astrodinámica , el SVD y sus variantes se utilizan como una opción para determinar direcciones de maniobra adecuadas para el diseño de trayectorias de transferencia ^[18] y el mantenimiento de estaciones orbitales . ^[19]

Prueba de existencia

Un valor propio ⁠ ⁠ $\lambda$ de una matriz ⁠ ⁠ $\mathbf {M}$ se caracteriza por la relación algebraica ⁠ ⁠ $\mathbf {M} \mathbf {u} =\lambda \mathbf {u} .$ Cuando ⁠ ⁠ $\mathbf {M}$ es hermitiano , también está disponible una caracterización variacional. Sea ⁠ ⁠ una matriz $\mathbf {M}$ ⁠ ⁠ $n\times n$ simétrica real . Definir

$f:\left\{{\begin{aligned}\mathbb {R} ^{n}&\to \mathbb {R} \\\mathbf {x} &\mapsto \mathbf {x} ^{\operatorname {T} }\mathbf {M} \mathbf {x} \end{aligned}}\right.$

Según el teorema del valor extremo , esta función continua alcanza un máximo en algún ⁠ ⁠ $\mathbf {u}$ cuando se restringe a la esfera unitaria. Según el teorema de los multiplicadores de Lagrange , ⁠ ⁠ satisface necesariamente $\{\|\mathbf {x} \|=1\}.$ $\mathbf {u}$

$\nabla \mathbf {u} ^{\operatorname {T} }\mathbf {M} \mathbf {u} -\lambda \cdot \nabla \mathbf {u} ^{\operatorname {T} }\mathbf {u} =0$

para algún número real ⁠ ⁠ $\lambda .$ El símbolo nabla, ⁠ ⁠ $\nabla$ , es el operador del (diferenciación con respecto a ⁠ ⁠ $\mathbf {x}$ ). Usando la simetría de ⁠ ⁠ $\mathbf {M}$ obtenemos

$\nabla \mathbf {x} ^{\operatorname {T} }\mathbf {M} \mathbf {x} -\lambda \cdot \nabla \mathbf {x} ^{\operatorname {T} }\mathbf {x} =2(\mathbf {M} -\lambda \mathbf {I} )\mathbf {x} .$

Por lo tanto ⁠ ⁠ $\mathbf {M} \mathbf {u} =\lambda \mathbf {u} ,$ entonces ⁠ ⁠ $\mathbf {u}$ es un vector propio de longitud unitaria de ⁠ ⁠ $\mathbf {M} .$ Para cada vector propio de longitud unitaria ⁠ ⁠ $\mathbf {v}$ de ⁠ ⁠ $\mathbf {M}$ su valor propio es ⁠ ⁠ $f(\mathbf {v} ),$ entonces ⁠ ⁠ $\lambda$ es el valor propio más grande de ⁠ ⁠ $\mathbf {M} .$ El mismo cálculo realizado en el complemento ortogonal de ⁠ ⁠ $\mathbf {u}$ da el siguiente valor propio más grande y así sucesivamente. El complejo caso hermitiano es similar; allí ⁠ ⁠ $f(\mathbf {x} )=\mathbf {x} ^{*}\mathbf {M} \mathbf {x}$ hay una función de valor real de ⁠ ⁠ $2n$ variables reales.

Los valores singulares son similares en que pueden describirse algebraicamente o a partir de principios variacionales. Aunque, a diferencia del caso de valores propios, ya no se requiere la hermiticidad o simetría de ⁠ ⁠ . $\mathbf {M}$

Esta sección presenta estos dos argumentos a favor de la existencia de la descomposición en valores singulares.

Basado en el teorema espectral

Sea una ⁠ ⁠ matriz compleja. Dado que es semidefinida positiva y hermitiana, según el teorema espectral , existe una matriz unitaria tal que $\mathbf {M}$ $m\times n$ $\mathbf {M} ^{*}\mathbf {M}$ $n\times n$ $\mathbf {V}$

$\mathbf {V} ^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} ={\bar {\mathbf {D} }}={\begin{bmatrix}\mathbf {D} &0\\0&0\end{bmatrix}},$

donde es diagonal y definida positiva, de dimensión , con el número de valores propios distintos de cero de (que se puede demostrar que verifica ). Tenga en cuenta que aquí, por definición, se trata de una matriz cuya -ésima columna es el -ésimo vector propio de , correspondiente al valor propio . Además, la -ésima columna de , para , es un vector propio de con valor propio . Esto se puede expresar escribiendo como , donde las columnas de y por lo tanto contienen los vectores propios de correspondientes a valores propios distintos de cero y cero, respectivamente. Usando esta reescritura de , la ecuación se convierte en: $\mathbf {D}$ $\ell \times \ell$ $\ell$ $\mathbf {M} ^{*}\mathbf {M}$ $\ell \leq \min(n,m)$ $\mathbf {V}$ $i$ $i$ $\mathbf {M} ^{*}\mathbf {M}$ ${\bar {\mathbf {D} }}_{ii}$ $j$ $\mathbf {V}$ $j>\ell$ $\mathbf {M} ^{*}\mathbf {M}$ ${\bar {\mathbf {D} }}_{jj}=0$ $\mathbf {V}$ $\mathbf {V} ={\begin{bmatrix}\mathbf {V} _{1}&\mathbf {V} _{2}\end{bmatrix}}$ $\mathbf {V} _{1}$ $\mathbf {V} _{2}$ $\mathbf {M} ^{*}\mathbf {M}$ $\mathbf {V}$

${\begin{bmatrix}\mathbf {V} _{1}^{*}\\\mathbf {V} _{2}^{*}\end{bmatrix}}\mathbf {M} ^{*}\mathbf {M} \,{\begin{bmatrix}\mathbf {V} _{1}&\!\!\mathbf {V} _{2}\end{bmatrix}}={\begin{bmatrix}\mathbf {V} _{1}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{1}&\mathbf {V} _{1}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{2}\\\mathbf {V} _{2}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{1}&\mathbf {V} _{2}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{2}\end{bmatrix}}={\begin{bmatrix}\mathbf {D} &0\\0&0\end{bmatrix}}.$

Esto implica que

$\mathbf {V} _{1}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{1}=\mathbf {D} ,\quad \mathbf {V} _{2}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{2}=\mathbf {0} .$

Además, la segunda ecuación implica . ^[20] Finalmente, la unicidad de se traduce, en términos de y , en las siguientes condiciones: $\mathbf {M} \mathbf {V} _{2}=\mathbf {0}$ $\mathbf {V}$ $\mathbf {V} _{1}$ $\mathbf {V} _{2}$

${\begin{aligned}\mathbf {V} _{1}^{*}\mathbf {V} _{1}&=\mathbf {I} _{1},\\\mathbf {V} _{2}^{*}\mathbf {V} _{2}&=\mathbf {I} _{2},\\\mathbf {V} _{1}\mathbf {V} _{1}^{*}+\mathbf {V} _{2}\mathbf {V} _{2}^{*}&=\mathbf {I} _{12},\end{aligned}}$

donde los subíndices de las matrices identidad se utilizan para señalar que son de diferentes dimensiones.

Definamos ahora

$\mathbf {U} _{1}=\mathbf {M} \mathbf {V} _{1}\mathbf {D} ^{-{\frac {1}{2}}}.$

Entonces,

$\mathbf {U} _{1}\mathbf {D} ^{\frac {1}{2}}\mathbf {V} _{1}^{*}=\mathbf {M} \mathbf {V} _{1}\mathbf {D} ^{-{\frac {1}{2}}}\mathbf {D} ^{\frac {1}{2}}\mathbf {V} _{1}^{*}=\mathbf {M} (\mathbf {I} -\mathbf {V} _{2}\mathbf {V} _{2}^{*})=\mathbf {M} -(\mathbf {M} \mathbf {V} _{2})\mathbf {V} _{2}^{*}=\mathbf {M} ,$

ya que esto también puede verse como una consecuencia inmediata del hecho de que . Esto es equivalente a la observación de que si es el conjunto de vectores propios de correspondiente a valores propios que no desaparecen , entonces es un conjunto de vectores ortogonales y es un conjunto (generalmente no completo) de vectores ortonormales . Esto coincide con el formalismo matricial utilizado anteriormente que denota con la matriz cuyas columnas son , con la matriz cuyas columnas son los vectores propios de con valor propio que desaparece y la matriz cuyas columnas son los vectores . $\mathbf {M} \mathbf {V} _{2}=\mathbf {0} .$ $\mathbf {M} \mathbf {V} _{1}\mathbf {V} _{1}^{*}=\mathbf {M}$ $\{{\boldsymbol {v}}_{i}\}_{i=1}^{\ell }$ $\mathbf {M} ^{*}\mathbf {M}$ $\{\lambda _{i}\}_{i=1}^{\ell }$ $\{\mathbf {M} {\boldsymbol {v}}_{i}\}_{i=1}^{\ell }$ ${\bigl \{}\lambda _{i}^{-1/2}\mathbf {M} {\boldsymbol {v}}_{i}{\bigr \}}{\vphantom {|}}_{i=1}^{\ell }$ $\mathbf {V} _{1}$ $\{{\boldsymbol {v}}_{i}\}_{i=1}^{\ell }$ $\mathbf {V} _{2}$ $\mathbf {M} ^{*}\mathbf {M}$ $\mathbf {U} _{1}$ ${\bigl \{}\lambda _{i}^{-1/2}\mathbf {M} {\boldsymbol {v}}_{i}{\bigr \}}{\vphantom {|}}_{i=1}^{\ell }$

Vemos que este es casi el resultado deseado, excepto que y en general no son unitarios, ya que es posible que no sean cuadrados. Sin embargo, sí sabemos que el número de filas de no es menor que el número de columnas, ya que las dimensiones de no son mayores que y . Además, desde $\mathbf {U} _{1}$ $\mathbf {V} _{1}$ $\mathbf {U} _{1}$ $\mathbf {D}$ $m$ $n$

$\mathbf {U} _{1}^{*}\mathbf {U} _{1}=\mathbf {D} ^{-{\frac {1}{2}}}\mathbf {V} _{1}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{1}\mathbf {D} ^{-{\frac {1}{2}}}=\mathbf {D} ^{-{\frac {1}{2}}}\mathbf {D} \mathbf {D} ^{-{\frac {1}{2}}}=\mathbf {I_{1}} ,$

las columnas son ortonormales y se pueden extender a una base ortonormal. Esto significa que podemos elegir uno que sea unitario. $\mathbf {U} _{1}$ $\mathbf {U} _{2}$ $\mathbf {U} ={\begin{bmatrix}\mathbf {U} _{1}&\mathbf {U} _{2}\end{bmatrix}}$

Para ⁠ ⁠ $\mathbf {V} _{1}$ ya tenemos ⁠ ⁠ $\mathbf {V} _{2}$ para hacerlo unitario. Ahora, define

$\mathbf {\Sigma } ={\begin{bmatrix}{\begin{bmatrix}\mathbf {D} ^{\frac {1}{2}}&0\\0&0\end{bmatrix}}\\0\end{bmatrix}},$

donde se agregan o eliminan filas de cero adicionales para que el número de filas de cero sea igual al número de columnas de ⁠ ⁠ $\mathbf {U} _{2},$ y, por lo tanto, las dimensiones generales de igual a . Entonces $\mathbf {\Sigma }$ $m\times n$

${\begin{bmatrix}\mathbf {U} _{1}&\mathbf {U} _{2}\end{bmatrix}}{\begin{bmatrix}{\begin{bmatrix}\mathbf {} D^{\frac {1}{2}}&0\\0&0\end{bmatrix}}\\0\end{bmatrix}}{\begin{bmatrix}\mathbf {V} _{1}&\mathbf {V} _{2}\end{bmatrix}}^{*}={\begin{bmatrix}\mathbf {U} _{1}&\mathbf {U} _{2}\end{bmatrix}}{\begin{bmatrix}\mathbf {D} ^{\frac {1}{2}}\mathbf {V} _{1}^{*}\\0\end{bmatrix}}=\mathbf {U} _{1}\mathbf {D} ^{\frac {1}{2}}\mathbf {V} _{1}^{*}=\mathbf {M} ,$

cual es el resultado deseado:

$\mathbf {M} =\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}.$

Observe que el argumento podría comenzar diagonalizando ⁠ ⁠ $\mathbf {M} \mathbf {M} ^{*}$ en lugar de ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M}$ (esto muestra directamente que ⁠ ⁠ $\mathbf {M} \mathbf {M} ^{*}$ y ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M}$ tienen los mismos valores propios distintos de cero).

Basado en caracterización variacional.

Los valores singulares también se pueden caracterizar como los máximos de ⁠ ⁠ $\mathbf {u} ^{\mathrm {T} }\mathbf {M} \mathbf {v} ,$ considerados como una función de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ,$ sobre subespacios particulares. Los vectores singulares son los valores de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V}$ donde se alcanzan estos máximos.

Sea ⁠ ⁠ $\mathbf {M}$ una ⁠ ⁠ $m\times n$ matriz con entradas reales. Sea ⁠ ⁠ $S^{k-1}$ la esfera unitaria en , y defina $(k-1)$ $\mathbb {R} ^{k}$ $\sigma (\mathbf {u} ,\mathbf {v} )=\mathbf {u} ^{\operatorname {T} }\mathbf {M} \mathbf {v} ,$ $\mathbf {u} \in S^{m-1},$ $\mathbf {v} \in S^{n-1}.$

Considere la función ⁠ ⁠ $\sigma$ restringida a ⁠ ⁠ $S^{m-1}\times S^{n-1}.$ Dado que tanto ⁠ ⁠ $S^{m-1}$ como ⁠ ⁠ $S^{n-1}$ son conjuntos compactos , su producto también es compacto. Además, dado que ⁠ ⁠ $\sigma$ es continuo, alcanza un valor máximo para al menos un par de vectores ⁠ ⁠ $\mathbf {u}$ en ⁠ ⁠ $S^{m-1}$ y ⁠ ⁠ $\mathbf {v}$ en ⁠ ⁠ $S^{n-1}.$ Este valor máximo se denota ⁠ ⁠ $\sigma _{1}$ y los vectores correspondientes se denotan ⁠ ⁠ $\mathbf {u} _{1}$ y ⁠ ⁠ $\mathbf {v} _{1}.$ Dado que ⁠ ⁠ $\sigma _{1}$ es el valor más grande de ⁠ ⁠ $\sigma (\mathbf {u} ,\mathbf {v} )$ y no debe ser negativo. Si fuera negativo, cambiar el signo de ⁠ ⁠ $\mathbf {u} _{1}$ o ⁠ ⁠ $\mathbf {v} _{1}$ lo haría positivo y, por lo tanto, más grande.

Declaración. ⁠ ⁠ $\mathbf {u} _{1}$ y ⁠ ⁠ $\mathbf {v} _{1}$ son vectores singulares izquierdo y derecho de ⁠ ⁠ $\mathbf {M}$ con el valor singular correspondiente ⁠ ⁠ $\sigma _{1}.$

Prueba. De manera similar al caso de los valores propios, se supone que los dos vectores satisfacen la ecuación multiplicadora de Lagrange:

$\nabla \sigma =\nabla \mathbf {u} ^{\operatorname {T} }\mathbf {M} \mathbf {v} -\lambda _{1}\cdot \nabla \mathbf {u} ^{\operatorname {T} }\mathbf {u} -\lambda _{2}\cdot \nabla \mathbf {v} ^{\operatorname {T} }\mathbf {v}$

Después de un poco de álgebra, esto se convierte en

${\begin{aligned}\mathbf {M} \mathbf {v} _{1}&=2\lambda _{1}\mathbf {u} _{1}+0,\\\mathbf {M} ^{\operatorname {T} }\mathbf {u} _{1}&=0+2\lambda _{2}\mathbf {v} _{1}.\end{aligned}}$

Multiplicando la primera ecuación de la izquierda por ⁠ ⁠ $\mathbf {u} _{1}^{\textrm {T}}$ y la segunda ecuación de la izquierda por ⁠ ⁠ $\mathbf {v} _{1}^{\textrm {T}}$ y teniendo en cuenta da $\|\mathbf {u} \|=\|\mathbf {v} \|=1$

$\sigma _{1}=2\lambda _{1}=2\lambda _{2}.$

Al conectar esto al par de ecuaciones anteriores, tenemos

${\begin{aligned}\mathbf {M} \mathbf {v} _{1}&=\sigma _{1}\mathbf {u} _{1},\\\mathbf {M} ^{\operatorname {T} }\mathbf {u} _{1}&=\sigma _{1}\mathbf {v} _{1}.\end{aligned}}$

Esto prueba la afirmación.

Se pueden encontrar más vectores singulares y valores singulares maximizando ⁠ ⁠ $\sigma (\mathbf {u} ,\mathbf {v} )$ sobre normalizado ⁠ ⁠ $\mathbf {u}$ y ⁠ ⁠ $\mathbf {v}$ que son ortogonales a ⁠ ⁠ $\mathbf {u} _{1}$ y ⁠ ⁠ $\mathbf {v} _{1},$ respectivamente.

El paso de real a complejo es similar al caso de valores propios.

Calculando la SVD

Algoritmo de Jacobi unilateral

El algoritmo de Jacobi unilateral es un algoritmo iterativo, ^[21] donde una matriz se transforma iterativamente en una matriz con columnas ortogonales. La iteración elemental se da como una rotación de Jacobi ,

$M\leftarrow MJ(p,q,\theta ),$

donde el ángulo de la matriz de rotación de Jacobi se elige de manera que después de la rotación las columnas con números se vuelvan ortogonales. Los índices se barren cíclicamente, donde es el número de columnas. $\theta$ $J(p,q,\theta )$ $p$ $q$ $(p,q)$ $(p=1\dots m,q=p+1\dots m)$ $m$

Una vez que el algoritmo ha convergido, la descomposición del valor singular se recupera de la siguiente manera: la matriz es la acumulación de matrices de rotación de Jacobi, la matriz se obtiene normalizando las columnas de la matriz transformada y los valores singulares se dan como las normas de las columnas. de la matriz transformada . $M=USV^{T}$ $V$ $U$ $M$ $M$

Algoritmo de Jacobi de dos caras

El algoritmo SVD de Jacobi de dos caras, una generalización del algoritmo de valores propios de Jacobi , es un algoritmo iterativo en el que una matriz cuadrada se transforma iterativamente en una matriz diagonal. Si la matriz no es cuadrada, primero se realiza la descomposición QR y luego se aplica el algoritmo a la matriz. La iteración elemental pone a cero un par de elementos fuera de la diagonal aplicando primero una rotación de Givens para simetrizar el par de elementos y luego aplicando una transformación de Jacobi para ponerlos a cero. $R$

$M\leftarrow J^{T}GMJ$

donde está la matriz de rotación de Givens con el ángulo elegido de manera que el par dado de elementos fuera de la diagonal se vuelvan iguales después de la rotación, y dónde está la matriz de transformación de Jacobi que pone a cero estos elementos fuera de la diagonal. Las iteraciones se desarrollan exactamente como en el algoritmo de valores propios de Jacobi: mediante barridos cíclicos sobre todos los elementos fuera de la diagonal. $G$ $J$

Una vez que el algoritmo ha convergido, la matriz diagonal resultante contiene los valores singulares. Las matrices y se acumulan de la siguiente manera: , . $U$ $V$ $U\leftarrow UG^{T}J$ $V\leftarrow VJ$

Enfoque numérico

La descomposición del valor singular se puede calcular utilizando las siguientes observaciones:

Los vectores singulares izquierdos de ⁠ ⁠ $\mathbf {M}$ son un conjunto de vectores propios ortonormales de ⁠ ⁠ . $\mathbf {M} \mathbf {M} ^{*}$
Los vectores singulares derechos de ⁠ ⁠ $\mathbf {M}$ son un conjunto de vectores propios ortonormales de ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M}$ .
Los valores singulares distintos de cero de ⁠ ⁠ $\mathbf {M}$ (que se encuentran en las entradas diagonales de ) son las raíces cuadradas de los valores propios distintos de cero de ⁠ ⁠ y ⁠ ⁠ . $\mathbf {\Sigma }$ $\mathbf {M} ^{*}\mathbf {M}$ $\mathbf {M} \mathbf {M} ^{*}$

El SVD de una matriz ⁠ ⁠ $\mathbf {M}$ normalmente se calcula mediante un procedimiento de dos pasos. En el primer paso, la matriz se reduce a una matriz bidiagonal . Esto requiere orden ⁠ ⁠ $O(mn^{2})$ operaciones de punto flotante (flop), asumiendo que ⁠ ⁠ $m\geq n.$ El segundo paso es calcular el SVD de la matriz bidiagonal. Este paso sólo se puede realizar con un método iterativo (como con los algoritmos de valores propios ). Sin embargo, en la práctica basta con calcular el SVD con cierta precisión, como la máquina épsilon . Si esta precisión se considera constante, entonces el segundo paso requiere ⁠ ⁠ $O(n)$ iteraciones, cada una de las cuales cuesta ⁠ ⁠ $O(n)$ fracasos. Por lo tanto, el primer paso es más caro y el costo total es de ⁠ $O(mn^{2})$ fracasos (Trefethen y Bau III 1997, Conferencia 31).

El primer paso se puede realizar utilizando reflexiones de Householder por un costo de ⁠ ⁠ $4mn^{2}-4n^{3}/3$ flops, suponiendo que solo se necesitan los valores singulares y no los vectores singulares. Si ⁠ ⁠ $m$ es mucho mayor que ⁠ ⁠ $n$ entonces es ventajoso reducir primero la matriz ⁠ ⁠ $\mathbf {M}$ a una matriz triangular con la descomposición QR y luego usar reflexiones de Householder para reducir aún más la matriz a forma bidiagonal; el costo combinado es de ⁠ ⁠ $2mn^{2}+2n^{3}$ fracasos (Trefethen y Bau III 1997, Conferencia 31).

El segundo paso se puede realizar mediante una variante del algoritmo QR para el cálculo de valores propios, que fue descrito por primera vez por Golub y Kahan (1965). La subrutina LAPACK DBDSQR ^[22] implementa este método iterativo, con algunas modificaciones para cubrir el caso donde los valores singulares son muy pequeños (Demmel & Kahan 1990). Junto con un primer paso que utiliza reflexiones de Householder y, si corresponde, descomposición QR, esto forma la rutina DGESVD ^[23] para el cálculo de la descomposición del valor singular.

El mismo algoritmo se implementa en la Biblioteca Científica GNU (GSL). El GSL también ofrece un método alternativo que utiliza una ortogonalización de Jacobi unilateral en el paso 2 (GSL Team 2007). Este método calcula el SVD de la matriz bidiagonal resolviendo una secuencia de ⁠ ⁠ $2\times 2$ problemas de SVD, similar a cómo el algoritmo de valores propios de Jacobi resuelve una secuencia de ⁠ ⁠ $2\times 2$ métodos de valores propios (Golub & Van Loan 1996, §8.6.3). Otro método más para el paso 2 utiliza la idea de algoritmos de valores propios de divide y vencerás (Trefethen y Bau III 1997, Conferencia 31).

Existe una forma alternativa que no utiliza explícitamente la descomposición de valores propios. ^[24] Por lo general, el problema de valores singulares de una matriz ⁠ ⁠ $\mathbf {M}$ se convierte en un problema de valores propios simétrico equivalente como ⁠ ⁠ $\mathbf {M} \mathbf {M} ^{*},$ ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M} ,$ o

${\begin{bmatrix}\mathbf {0} &\mathbf {M} \\\mathbf {M} ^{*}&\mathbf {0} \end{bmatrix}}.$

Los enfoques que utilizan descomposiciones de valores propios se basan en el algoritmo QR , que está bien desarrollado para ser estable y rápido. Tenga en cuenta que los valores singulares son reales y que los vectores singulares derecho e izquierdo no son necesarios para formar transformaciones de similitud. Se puede alternar iterativamente entre la descomposición QR y la descomposición LQ para encontrar las matrices hermitianas diagonales reales . La descomposición QR da ⁠ ⁠ $\mathbf {M} \Rightarrow \mathbf {Q} \mathbf {R}$ y la descomposición LQ de ⁠ ⁠ $\mathbf {R}$ da ⁠ ⁠ $\mathbf {R} \Rightarrow \mathbf {L} \mathbf {P} ^{*}.$ Por lo tanto, en cada iteración, ⁠ ⁠ $\mathbf {M} \Rightarrow \mathbf {Q} \mathbf {L} \mathbf {P} ^{*},$ actualizamos ⁠ ⁠ $\mathbf {M} \Leftarrow \mathbf {L}$ y repetimos las ortogonalizaciones. Finalmente, ^{[ se necesita aclaración ]} esta iteración entre la descomposición QR y la descomposición LQ produce matrices singulares unitarias izquierda y derecha. Este enfoque no puede acelerarse fácilmente, como puede hacerlo el algoritmo QR con cambios espectrales o deflación. Esto se debe a que el método de desplazamiento no se define fácilmente sin utilizar transformaciones de similitud. Sin embargo, este enfoque iterativo es muy sencillo de implementar, por lo que es una buena opción cuando la velocidad no importa. Este método también proporciona información sobre cómo las transformaciones puramente ortogonales/unitarias pueden obtener la SVD.

Resultado analítico del 2 × 2 SVD

Los valores singulares de una ⁠ ⁠ $2\times 2$ matriz se pueden encontrar analíticamente. Sea la matriz $\mathbf {M} =z_{0}\mathbf {I} +z_{1}\sigma _{1}+z_{2}\sigma _{2}+z_{3}\sigma _{3}$

donde están los números complejos que parametrizan la matriz, ⁠ ⁠ es la matriz identidad, y denotan las matrices de Pauli . Entonces sus dos valores singulares están dados por $z_{i}\in \mathbb {C}$ $\mathbf {I}$ $\sigma _{i}$

${\begin{aligned}\sigma _{\pm }&={\sqrt {|z_{0}|^{2}+|z_{1}|^{2}+|z_{2}|^{2}+|z_{3}|^{2}\pm {\sqrt {{\bigl (}|z_{0}|^{2}+|z_{1}|^{2}+|z_{2}|^{2}+|z_{3}|^{2}{\bigr )}^{2}-|z_{0}^{2}-z_{1}^{2}-z_{2}^{2}-z_{3}^{2}|^{2}}}}}\\&={\sqrt {|z_{0}|^{2}+|z_{1}|^{2}+|z_{2}|^{2}+|z_{3}|^{2}\pm 2{\sqrt {(\operatorname {Re} z_{0}z_{1}^{*})^{2}+(\operatorname {Re} z_{0}z_{2}^{*})^{2}+(\operatorname {Re} z_{0}z_{3}^{*})^{2}+(\operatorname {Im} z_{1}z_{2}^{*})^{2}+(\operatorname {Im} z_{2}z_{3}^{*})^{2}+(\operatorname {Im} z_{3}z_{1}^{*})^{2}}}}}\end{aligned}}$

SVD reducidas

En aplicaciones es bastante inusual que se requiera el SVD completo, incluida una descomposición unitaria completa del espacio nulo de la matriz. En cambio, suele ser suficiente (además de más rápido y más económico para el almacenamiento) calcular una versión reducida del SVD. Para una ⁠ ⁠ $m\times n$ matriz ⁠ ⁠ $\mathbf {M}$ de rango ⁠ ⁠ $r$ se puede distinguir lo siguiente :

SVD delgada

La SVD delgada, o de tamaño económico, de una matriz ⁠ ⁠ $\mathbf {M}$ viene dada por ^[25]

$\mathbf {M} =\mathbf {U} _{k}\mathbf {\Sigma } _{k}\mathbf {V} _{k}^{*},$

donde las matrices ⁠ ⁠ y ⁠ ⁠ contienen solo las primeras columnas ⁠ ⁠ de ⁠ ⁠ y ⁠ ⁠ y ⁠ ⁠ contienen solo los primeros valores singulares ⁠ ⁠ de ⁠ ⁠ La matriz ⁠ ⁠ es así ⁠ ⁠ ⁠ ⁠ ⁠ ⁠ ⁠ ⁠ ⁠ ⁠ ⁠ diagonal, diagonal, diagonal,, diagonal,, diagonal,, diagonal, diagonal, y ⁠ ⁠ es ⁠ ⁠ $k=\min(m,n),$ $\mathbf {U} _{k}$ $\mathbf {V} _{k}$ $k$ $\mathbf {U}$ $\mathbf {V} ,$ $\mathbf {\Sigma } _{k}$ $k$ $\mathbf {\Sigma } .$ $\mathbf {U} _{k}$ $m\times k,$ $\mathbf {\Sigma } _{k}$ $k\times k$ $\mathbf {V} _{k}^{*}$ $k\times n.$

El SVD delgado utiliza significativamente menos espacio y tiempo de cálculo si ⁠ ⁠ $k\ll \max(m,n).$ La primera etapa en su cálculo suele ser una descomposición QR de ⁠ ⁠, $\mathbf {M} ,$ lo que puede hacer que el cálculo sea significativamente más rápido en este caso.

SVD compacto

El SVD compacto de una matriz ⁠ ⁠ $\mathbf {M}$ viene dado por

$\mathbf {M} =\mathbf {U} _{r}\mathbf {\Sigma } _{r}\mathbf {V} _{r}^{*}.$

Solo se calculan los ⁠ ⁠ $r$ vectores de columna de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $r$ los vectores de fila de ⁠ ⁠ $\mathbf {V} ^{*}$ correspondientes a los valores singulares distintos de cero ⁠ ⁠ $\mathbf {\Sigma } _{r}$ . Los vectores restantes de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ^{*}$ no se calculan. Esto es más rápido y económico que el SVD delgado si ⁠ ⁠ $r\ll \min(m,n).$ La matriz ⁠ ⁠ $\mathbf {U} _{r}$ es ⁠ ⁠ $m\times r,$ ⁠ ⁠ $\mathbf {\Sigma } _{r}$ es ⁠ ⁠ $r\times r$ diagonal y ⁠ ⁠ $\mathbf {V} _{r}^{*}$ es ⁠ ⁠ $r\times n.$

SVD truncada

En muchas aplicaciones, el número ⁠ ⁠ $r$ de valores singulares distintos de cero es grande, lo que hace que incluso el SVD compacto sea poco práctico de calcular. En tales casos, es posible que sea necesario truncar los valores singulares más pequeños para calcular solo ⁠ ⁠ $t\ll r$ valores singulares distintos de cero. La SVD truncada ya no es una descomposición exacta de la matriz original ⁠ ⁠ $\mathbf {M} ,$ sino que proporciona la aproximación óptima de una matriz de rango bajo ⁠ ⁠ ${\tilde {\mathbf {M} }}$ mediante cualquier matriz de rango fijo ⁠ ⁠ $t$

${\tilde {\mathbf {M} }}=\mathbf {U} _{t}\mathbf {\Sigma } _{t}\mathbf {V} _{t}^{*},$

donde la matriz ⁠ ⁠ $\mathbf {U} _{t}$ es ⁠ ⁠ $m\times t,$ ⁠ ⁠ $\mathbf {\Sigma } _{t}$ es ⁠ ⁠ $t\times t$ diagonal y ⁠ ⁠ $\mathbf {V} _{t}^{*}$ es ⁠ ⁠ $t\times n.$ Solo se calculan los ⁠ ⁠ $t$ vectores de columna de ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $t$ los vectores de fila de ⁠ ⁠ $\mathbf {V} ^{*}$ correspondientes a los ⁠ ⁠ $t$ valores singulares más grandes ⁠ ⁠ $\mathbf {\Sigma } _{t}$ . Esto puede ser mucho más rápido y económico que el SVD compacto si ⁠ ⁠, $t\ll r,$ pero requiere un conjunto de herramientas de solucionador numérico completamente diferente.

En aplicaciones que requieren una aproximación a la inversa de Moore-Penrose de la matriz ⁠ ⁠ $\mathbf {M} ,$ son de interés los valores singulares más pequeños de ⁠ ⁠ $\mathbf {M}$ , que son más difíciles de calcular en comparación con los más grandes.

La SVD truncada se emplea en la indexación semántica latente . ^[26]

Normas

Normas de Ky Fan

La suma de los ⁠ ⁠ $k$ valores singulares más grandes de ⁠ ⁠ $\mathbf {M}$ es una norma matricial , la norma Ky Fan ⁠ ⁠ $k$ de ⁠ ⁠ $\mathbf {M} .$ ^[27]

La primera de las normas de Ky Fan, la norma Ky Fan 1, es la misma que la norma del operador de ⁠ ⁠ $\mathbf {M}$ como operador lineal con respecto a las normas euclidianas de ⁠ ⁠ $K^{m}$ y ⁠ ⁠ $K^{n}.$ En otras palabras, la norma Ky Fan 1- norma es la norma del operador inducida por el producto interno euclidiano estándar. Por esta razón, también se le llama operador 2-norma. Se puede verificar fácilmente la relación entre la norma Ky Fan 1 y los valores singulares. Es cierto en general, para un operador acotado ⁠ ⁠ en espacios de Hilbert (posiblemente de dimensión infinita) $\ell ^{2}$ $\mathbf {M}$

$\|\mathbf {M} \|=\|\mathbf {M} ^{*}\mathbf {M} \|^{\frac {1}{2}}$

Pero, en el caso de la matriz, ⁠ ⁠ $(\mathbf {M} ^{*}\mathbf {M} )^{1/2}$ es una matriz normal , también lo es el valor propio más grande de ⁠ ⁠, es decir, el valor singular más grande de ⁠ ⁠ $\|\mathbf {M} ^{*}\mathbf {M} \|^{1/2}$ $(\mathbf {M} ^{*}\mathbf {M} )^{1/2},$ $\mathbf {M} .$

La última de las normas de Ky Fan, la suma de todos los valores singulares, es la norma de traza (también conocida como 'norma nuclear'), definida por (los valores propios de ⁠ ⁠ son los cuadrados de los valores singulares). $\|\mathbf {M} \|=\operatorname {Tr} (\mathbf {M} ^{*}\mathbf {M} )^{1/2}$ $\mathbf {M} ^{*}\mathbf {M}$

Norma de Hilbert-Schmidt

Los valores singulares están relacionados con otra norma sobre el espacio de operadores. Considere el producto interno de Hilbert-Schmidt en las matrices ⁠ ⁠ $n\times n$ , definido por

$\langle \mathbf {M} ,\mathbf {N} \rangle =\operatorname {tr} \left(\mathbf {N} ^{*}\mathbf {M} \right).$

Entonces la norma inducida es

$\|\mathbf {M} \|={\sqrt {\langle \mathbf {M} ,\mathbf {M} \rangle }}={\sqrt {\operatorname {tr} \left(\mathbf {M} ^{*}\mathbf {M} \right)}}.$

Dado que la traza es invariante bajo equivalencia unitaria, esto muestra

$\|\mathbf {M} \|={\sqrt {{\vphantom {\bigg |}}\sum _{i}\sigma _{i}^{2}}}$

donde ⁠ ⁠ $\sigma _{i}$ son los valores singulares de ⁠ ⁠ $\mathbf {M} .$ Esto se llama norma de Frobenius , norma Schatten 2 o norma Hilbert-Schmidt de ⁠ ⁠ $\mathbf {M} .$ El cálculo directo muestra que la norma de Frobenius de ⁠ ⁠ $\mathbf {M} =(m_{i}j)$ coincide con:

${\sqrt {{\vphantom {\bigg |}}\sum _{ij}|m_{ij}|^{2}}}.$

Además, la norma de Frobenius y la norma de traza (la norma nuclear) son casos especiales de la norma de Schatten .

Variaciones y generalizaciones.

SVD invariante de escala

Los valores singulares de una matriz ⁠ ⁠ $\mathbf {A}$ están definidos de forma única y son invariantes con respecto a las transformaciones unitarias izquierda y/o derecha de ⁠ ⁠ $\mathbf {A} .$ En otras palabras, los valores singulares de ⁠ ⁠ $\mathbf {U} \mathbf {A} \mathbf {V} ,$ para matrices unitarias ⁠ ⁠ $\mathbf {U}$ y ⁠ ⁠ $\mathbf {V} ,$ son iguales al singular valores de ⁠ ⁠ $\mathbf {A} .$ Esta es una propiedad importante para aplicaciones en las que es necesario preservar las distancias euclidianas y la invariancia con respecto a las rotaciones.

El SVD invariante de escala, o SI-SVD, ^[28] es análogo al SVD convencional excepto que sus valores singulares determinados de forma única son invariantes con respecto a las transformaciones diagonales de ⁠ ⁠ $\mathbf {A} .$ En otras palabras, los valores singulares de ⁠ ⁠ $\mathbf {D} \mathbf {A} \mathbf {E} ,$ para invertibles las matrices diagonales ⁠ ⁠ $\mathbf {D}$ y ⁠ ⁠ $\mathbf {E} ,$ son iguales a los valores singulares de ⁠ ⁠. $\mathbf {A} .$ Esta es una propiedad importante para aplicaciones en las que se necesita invariancia en la elección de unidades de variables (por ejemplo, unidades métricas versus imperiales).

Operadores acotados en espacios de Hilbert

La factorización ⁠ ⁠ $\mathbf {M} =\mathbf {U} \mathbf {\Sigma } \mathbf {V} ^{*}$ se puede extender a un operador acotado ⁠ ⁠ $\mathbf {M}$ en un espacio de Hilbert separable ⁠ ⁠ $H.$ Es decir, para cualquier operador acotado ⁠ ⁠ $\mathbf {M} ,$ existe una isometría parcial ⁠ ⁠ $\mathbf {U} ,$ un unitario ⁠ ⁠ $\mathbf {V} ,$ un espacio de medida ⁠ ⁠ $(X,\mu ),$ y un medible no negativo ⁠ ⁠ $f$ tal que

$\mathbf {M} =\mathbf {U} T_{f}\mathbf {V} ^{*}$

donde ⁠ ⁠ $T_{f}$ es la multiplicación por ⁠ ⁠ $f$ en ⁠ ⁠ $L^{2}(X,\mu ).$

Esto se puede demostrar imitando el argumento algebraico lineal para el caso matricial anterior. ⁠ ⁠ $\mathbf {V} T_{f}\mathbf {V} ^{*}$ es la única raíz cuadrada positiva de ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M} ,$ dada por el cálculo funcional de Borel para operadores autoadjuntos . La razón por la que ⁠ ⁠ $\mathbf {U}$ no necesita ser unitario es que, a diferencia del caso de dimensión finita, dada una isometría ⁠ ⁠ $U_{1}$ con núcleo no trivial, no se puede encontrar un ⁠ ⁠ $U_{2}$ adecuado tal que

${\begin{bmatrix}U_{1}\\U_{2}\end{bmatrix}}$

es un operador unitario.

En cuanto a las matrices, la factorización de valores singulares equivale a la descomposición polar de los operadores: simplemente podemos escribir

$\mathbf {M} =\mathbf {U} \mathbf {V} ^{*}\cdot \mathbf {V} T_{f}\mathbf {V} ^{*}$

y observe que ⁠ ⁠ $\mathbf {U} \mathbf {V} ^{*}$ sigue siendo una isometría parcial mientras que ⁠ ⁠ $\mathbf {V} T_{f}\mathbf {V} ^{*}$ es positiva.

Valores singulares y operadores compactos.

La noción de valores singulares y vectores singulares izquierdo/derecho se puede extender al operador compacto en el espacio de Hilbert, ya que tienen un espectro discreto. Si ⁠ ⁠ es compacto, todo $T$ ⁠ ⁠ $\lambda$ distinto de cero en su espectro es un valor propio. Además, un operador autoadjunto compacto puede diagonalizarse mediante sus vectores propios. Si ⁠ ⁠ $\mathbf {M}$ es compacto, también lo es ⁠ ⁠ $\mathbf {M} ^{*}\mathbf {M}$ . Aplicando el resultado de la diagonalización, la imagen unitaria de su raíz cuadrada positiva ⁠ ⁠ $T_{f}$ tiene un conjunto de vectores propios ortonormales ⁠ ⁠ $\{e_{i}\}$ correspondientes a valores propios estrictamente positivos ⁠ ⁠ $\{\sigma _{i}\}$ . Para cualquier ⁠ ⁠ $\psi$ en ⁠ ⁠ $H,$

$\mathbf {M} \psi =\mathbf {U} T_{f}\mathbf {V} ^{*}\psi =\sum _{i}\left\langle \mathbf {U} T_{f}\mathbf {V} ^{*}\psi ,\mathbf {U} e_{i}\right\rangle \mathbf {U} e_{i}=\sum _{i}\sigma _{i}\left\langle \psi ,\mathbf {V} e_{i}\right\rangle \mathbf {U} e_{i},$

donde la serie converge en la topología normal en ⁠ ⁠ $H.$ Observe cómo esto se parece a la expresión del caso de dimensión finita. ⁠ ⁠ $\sigma _{i}$ se denominan valores singulares de ⁠ ⁠ $\mathbf {M} .$ ⁠ ⁠ $\{\mathbf {U} e_{i}\}$ (resp. ⁠ ⁠ $\{\mathbf {U} e_{i}\}$ ) pueden considerarse los vectores singular izquierdo (resp. singular derecho) de ⁠ ⁠ $\mathbf {M} .$

Los operadores compactos en un espacio de Hilbert son el cierre de operadores de rango finito en la topología de operador uniforme. La expresión de la serie anterior da una representación explícita de este tipo. Una consecuencia inmediata de esto es:

Teorema. ⁠ ⁠

\mathbf {M}

es compacto si y sólo si ⁠ ⁠

\mathbf {M} ^{*}\mathbf {M}

es compacto.

Historia

La descomposición del valor singular fue desarrollada originalmente por geómetras diferenciales , que deseaban determinar si una forma bilineal real podía igualarse a otra mediante transformaciones ortogonales independientes de los dos espacios en los que actúa. Eugenio Beltrami y Camille Jordan descubrieron de forma independiente, en 1873 y 1874 respectivamente, que los valores singulares de las formas bilineales, representados como una matriz, forman un conjunto completo de invariantes para formas bilineales bajo sustituciones ortogonales. James Joseph Sylvester también llegó a la descomposición de valores singulares para matrices cuadradas reales en 1889, aparentemente independientemente de Beltrami y Jordan. Sylvester llamó a los valores singulares los multiplicadores canónicos de la matriz ⁠ ⁠ $\mathbf {A} .$ El cuarto matemático en descubrir la descomposición de valores singulares de forma independiente es Autonne en 1915, quien llegó a ella mediante la descomposición polar . La primera prueba de la descomposición en valores singulares para matrices rectangulares y complejas parece ser la de Carl Eckart y Gale J. Young en 1936; ^[29] lo vieron como una generalización de la transformación del eje principal para matrices hermitianas .

En 1907, Erhard Schmidt definió un análogo de valores singulares para operadores integrales (que son compactos, bajo algunos supuestos técnicos débiles); parece que desconocía el trabajo paralelo sobre valores singulares de matrices finitas. Esta teoría fue desarrollada aún más por Émile Picard en 1910, quien es el primero en llamar a los números valores singulares (o en francés, valeurs singulières ). $\sigma _{k}$

Los métodos prácticos para calcular el SVD se remontan a Kogbetliantz en 1954-1955 y Hestenes en 1958, ^[30] y se parecen mucho al algoritmo de valores propios de Jacobi , que utiliza rotaciones planas o rotaciones de Givens . Sin embargo, estos fueron reemplazados por el método de Gene Golub y William Kahan publicado en 1965, ^[31] que utiliza transformaciones o reflexiones de Householder. En 1970, Golub y Christian Reinsch ^[32] publicaron una variante del algoritmo Golub/Kahan que sigue siendo el más utilizado en la actualidad.

Ver también

Notas

^ DeAngelis, GC; Ohzawa, I.; Freeman, RD (octubre de 1995). "Dinámica del campo receptivo en las vías visuales centrales". Tendencias Neurociencias . 18 (10): 451–8. doi :10.1016/0166-2236(95)94496-R. PMID 8545912. S2CID 12827601.
^ Depireux, DA; Simón, JZ; Klein, DJ; Shamma, SA (marzo de 2001). "Caracterización del campo de respuesta espectro-temporal con ondas dinámicas en la corteza auditiva primaria del hurón". J. Neurofisiol . 85 (3): 1220–34. doi :10.1152/junio.2001.85.3.1220. PMID 11247991.
^ La descomposición de valores singulares en ortogonalización simétrica (Lowdin) y compresión de datos
^ Sahidullah, Maryland; Kinnunen, Tomi (marzo de 2016). "Características de variabilidad espectral local para la verificación de locutores". Procesamiento de señales digitales . 50 : 1–11. doi :10.1016/j.dsp.2015.10.011.
^ Mademlis, Ioannis; Tefas, Anastasio; Pitas, Ioannis (2018). "Prominencia de fotogramas de vídeo regularizados basados en SVD para resumen de vídeos de actividades no supervisadas". Conferencia internacional IEEE 2018 sobre acústica, habla y procesamiento de señales (ICASSP). IEEE. págs. 2691–2695. doi :10.1109/ICASSP.2018.8462274. ISBN 978-1-5386-4658-8. S2CID 52286352 . Consultado el 19 de enero de 2023 .
^ O. Alter, PO Brown y D. Botstein (septiembre de 2000). "Descomposición de valores singulares para el modelado y procesamiento de datos de expresión de todo el genoma". PNAS . 97 (18): 10101–10106. Código bibliográfico : 2000PNAS...9710101A. doi : 10.1073/pnas.97.18.10101 . PMC 27718 . PMID 10963673.
^ O. Alterar; GH Golub (noviembre de 2004). "El análisis integrativo de datos a escala del genoma mediante el uso de proyección pseudoinversa predice una nueva correlación entre la replicación del ADN y la transcripción del ARN". PNAS . 101 (47): 16577–16582. Código bibliográfico : 2004PNAS..10116577A. doi : 10.1073/pnas.0406767101 . PMC 534520 . PMID 15545604.
^ O. Alterar; GH Golub (agosto de 2006). "La descomposición de valores singulares de la distribución de longitudes de ARNm a escala del genoma revela asimetría en la ampliación de la banda de electroforesis en gel de ARN". PNAS . 103 (32): 11828–11833. Código bibliográfico : 2006PNAS..10311828A. doi : 10.1073/pnas.0604756103 . PMC 1524674 . PMID 16877539.
^ Bertagnolli, Nuevo México; Drake, JA; Tennessee, JM; Alter, O. (noviembre de 2013). "SVD identifica funciones de distribución de longitud de transcripción a partir de datos de microarrays de ADN y revela fuerzas evolutivas que afectan globalmente el metabolismo de GBM". MÁS UNO . 8 (11): e78913. Código Bib : 2013PLoSO...878913B. doi : 10.1371/journal.pone.0078913 . PMC 3839928 . PMID 24282503. Resaltar.
^ Edelman, Alan (1992). "Sobre la distribución de un número de condición escalado" (PDF) . Matemáticas. comp . 58 (197): 185-190. Código Bib : 1992MaCom..58..185E. doi : 10.1090/S0025-5718-1992-1106966-2 .
^ Shen, Jianhong (Jackie) (2001). "Sobre los valores singulares de las matrices aleatorias gaussianas". Álg. lineal. Aplica . 326 (1–3): 1–14. doi : 10.1016/S0024-3795(00)00322-0 .
^ Walton, S.; Hassan, O.; Morgan, K. (2013). "Modelado de orden reducido para flujo de fluido inestable utilizando descomposición ortogonal adecuada y funciones de base radial". Modelado Matemático Aplicado . 37 (20–21): 8930–8945. doi : 10.1016/j.apm.2013.04.025 .
^ Setyawati, Y.; Ohme, F.; Khan, S. (2019). "Mejora del modelo de forma de onda gravitacional mediante calibración dinámica". Revisión física D. 99 (2): 024010. arXiv : 1810.07060 . Código Bib : 2019PhRvD..99b4010S. doi : 10.1103/PhysRevD.99.024010. S2CID 118935941.
^ Sarwar, Badrul; Karypis, George; Konstan, Joseph A. y Riedl, John T. (2000). "Aplicación de la reducción de dimensionalidad en el sistema de recomendación: un estudio de caso" (PDF) . Universidad de Minnesota . {{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Bosagh Zadeh, Reza; Carlsson, Gunnar (2013). "Dimensión cuadrada de matriz independiente utilizando MapReduce" (PDF) . arXiv : 1304.1467 . Código Bib : 2013arXiv1304.1467B. {{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Hadi Fanaee Tork; João Gama (septiembre de 2014). "Método del espacio propio para la detección de puntos críticos espaciotemporales". Sistemas expertos . 32 (3): 454–464. arXiv : 1406.3506 . Código Bib : 2014arXiv1406.3506F. doi :10.1111/exsy.12088. S2CID 15476557.
^ Hadi Fanaee Tork; João Gama (mayo de 2015). "EigenEvent: un algoritmo para la detección de eventos a partir de flujos de datos complejos en vigilancia sindrómica". Análisis inteligente de datos . 19 (3): 597–616. arXiv : 1406.3496 . doi :10.3233/IDA-150734. S2CID 17966555.
^ Muralidharan, Vivek; Howell, Kathleen (2023). "Direcciones de estiramiento en el espacio cislunar: Aplicaciones para diseño de salidas y transferencias". Astrodinámica . 7 (2): 153–178. Código Bib : 2023AsDyn...7..153M. doi :10.1007/s42064-022-0147-z. S2CID 252637213.
^ Muralidharan, Vivek; Howell, Kathleen (2022). "Aprovechando las direcciones de estiramiento para el mantenimiento de la posición en órbitas de halo Tierra-Luna". Avances en la investigación espacial . 69 (1): 620–646. Código Bib : 2022AdSpR..69..620M. doi :10.1016/j.asr.2021.10.028. S2CID 239490016.
^ Para ver esto, sólo tenemos que notarlo y recordarlo . $\operatorname {Tr} (\mathbf {V} _{2}^{*}\mathbf {M} ^{*}\mathbf {M} \mathbf {V} _{2})=\|\mathbf {M} \mathbf {V} _{2}\|^{2}$ $\|A\|=0\Leftrightarrow A=0$
^ Rijk, PPM de (1989). "Un algoritmo de Jacobi unilateral para calcular la descomposición del valor singular en una computadora vectorial". SIAM J. Ciencias. Estadística. Computación . 10 : 359.
^ Netlib.org
^ Netlib.org
^ mathworks.co.kr/matlabcentral/fileexchange/12674-simple-svd
^ Demmel, James (2000). "Descomposiciones". Plantillas para la solución de problemas algebraicos de valores propios. Por Bai, Zhaojun; Demmel, James; Dongarra, Jack J.; Ruhe, Axel; van der Vorst, Henk A. Sociedad de Matemáticas Industriales y Aplicadas. doi :10.1137/1.9780898719581. ISBN 978-0-89871-471-5.
^ Chicco, D; Masseroli, M (2015). "Paquete de software para búsqueda de similitudes y predicción de anotaciones de genes y proteínas". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 12 (4): 837–843. doi :10.1109/TCBB.2014.2382127. hdl : 11311/959408 . PMID 26357324. S2CID 14714823.
^ Fan, Kentucky (1951). "Propiedades máximas y desigualdades para los valores propios de operadores completamente continuos". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 37 (11): 760–766. Código bibliográfico : 1951PNAS...37..760F. doi : 10.1073/pnas.37.11.760 . PMC 1063464 . PMID 16578416.
^ Uhlmann, Jeffrey (2018), Una matriz inversa generalizada que es consistente con respecto a las transformaciones diagonales (PDF) , Revista SIAM sobre análisis matricial, vol. 239, págs. 781–800, archivado desde el original (PDF) el 17 de junio de 2019
^ Eckart, C .; Joven, G. (1936). "La aproximación de una matriz por otra de rango inferior". Psicometrika . 1 (3): 211–8. doi :10.1007/BF02288367. S2CID 10163399.
^ Hestenes, señor (1958). "Inversión de matrices por biortogonalización y resultados relacionados". Revista de la Sociedad de Matemáticas Industriales y Aplicadas . 6 (1): 51–90. doi :10.1137/0106005. JSTOR 2098862. SEÑOR 0092215.
^ (Golub y Kahan 1965)
^ Golub, GH ; Reinsch, C. (1970). "Descomposición de valores singulares y soluciones de mínimos cuadrados". Matemática numérica . 14 (5): 403–420. doi :10.1007/BF02163027. SEÑOR 1553974. S2CID 123532178.

Referencias

Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística , Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
Bisgard, James (2021). Análisis y álgebra lineal: descomposición y aplicaciones de valores singulares . Biblioteca de Matemáticas para Estudiantes (1ª ed.). AMS. ISBN 978-1-4704-6332-8.
Chicco, D; Masseroli, M (2015). "Paquete de software para búsqueda de similitudes y predicción de anotaciones de genes y proteínas". Transacciones IEEE/ACM sobre biología computacional y bioinformática . 12 (4): 837–843. doi :10.1109/TCBB.2014.2382127. hdl : 11311/959408 . PMID 26357324. S2CID 14714823.
Trefethen, Lloyd N .; BauIII, David (1997). Álgebra lineal numérica . Filadelfia: Sociedad de Matemáticas Industriales y Aplicadas. ISBN 978-0-89871-361-9.
Demmel, James ; Kahan, William (1990). "Valores singulares precisos de matrices bidiagonales". Revista SIAM de Computación Científica y Estadística . 11 (5): 873–912. CiteSeerX 10.1.1.48.3740 . doi :10.1137/0911052.
Golub, Gene H .; Kahan, William (1965). "Cálculo de los valores singulares y pseudoinversos de una matriz". Revista de la Sociedad de Matemáticas Industriales y Aplicadas, Serie B: Análisis numérico . 2 (2): 205–224. Código Bib : 1965SJNA....2..205G. doi :10.1137/0702016. JSTOR 2949777.
Golub, Gene H .; Préstamo de Van, Charles F. (1996). Cálculos matriciales (3ª ed.). Johns Hopkins. ISBN 978-0-8018-5414-9.
Equipo GSL (2007). "§14.4 Descomposición de valores singulares". Biblioteca científica GNU. Manual de referencia .
Halldor, Bjornsson y Venegas, Silvia A. (1997). "Un manual para análisis de datos climáticos EOF y SVD". Universidad McGill, Informe CCGCR No. 97-1, Montreal, Québec, 52pp.
Hansen, ordenador personal (1987). "La SVD truncada como método de regularización". POCO . 27 (4): 534–553. doi :10.1007/BF01937276. S2CID 37591557.
Cuerno, Roger A.; Johnson, Charles R. (1985). "Sección 7.3". Análisis matricial . Prensa de la Universidad de Cambridge. ISBN 978-0-521-38632-6.
Cuerno, Roger A.; Johnson, Charles R. (1991). "Capítulo 3" . Temas de análisis matricial . Prensa de la Universidad de Cambridge. ISBN 978-0-521-46713-1.
Samet, H. (2006). Fundamentos de estructuras de datos métricas y multidimensionales . Morgan Kaufman. ISBN 978-0-12-369446-1.
Strang G. (1998). "Sección 6.7". Introducción al álgebra lineal (3ª ed.). Prensa de Wellesley-Cambridge. ISBN 978-0-9614088-5-5.
Stewart, GW (1993). "Sobre la historia temprana de la descomposición del valor singular". Revisión SIAM . 35 (4): 551–566. CiteSeerX 10.1.1.23.1831 . doi :10.1137/1035134. hdl : 1903/566. JSTOR 2132388.
Muro, Michael E.; Rechtsteiner, Andreas; Rocha, Luis M. (2003). "Descomposición de valores singulares y análisis de componentes principales". En DP Berrar; W. Dubitzky; M. Granzow (eds.). Un enfoque práctico para el análisis de datos de microarrays . Norwell, MA: Kluwer. págs. 91-109.
Prensa, WH; Teukolsky, SA; Vetterling, WT; Flannery, BP (2007), "Sección 2.6", Recetas numéricas: el arte de la informática científica (3.ª ed.), Nueva York: Cambridge University Press, ISBN 978-0-521-88068-8

enlaces externos

Calculadora SVD en línea