Proyección (álgebra lineal)

En álgebra lineal y análisis funcional , una proyección es una transformación lineal de un espacio vectorial a sí mismo (un endomorfismo ) tal que . Es decir, siempre que se aplica dos veces a cualquier vector, da el mismo resultado que si se aplicara una vez (es decir, es idempotente ). Deja su imagen sin cambios. ^[1] Esta definición de "proyección" formaliza y generaliza la idea de proyección gráfica . También se puede considerar el efecto de una proyección sobre un objeto geométrico examinando el efecto de la proyección sobre puntos del objeto. $P$ $P\circ P=P$ $P$ $P$

Definiciones

Una proyección sobre un espacio vectorial es un operador lineal tal que . $V$ $P\dos puntos V\a V$ $P^{2}=P$

Cuando tiene un producto interno y es completo , es decir, cuando es un espacio de Hilbert , se puede utilizar el concepto de ortogonalidad . Una proyección sobre un espacio de Hilbert se llama proyección ortogonal si satisface para todos . Una proyección sobre un espacio de Hilbert que no es ortogonal se llama proyección oblicua . $V$ $V$ $P$ $V$ $\langle P\mathbf {x} ,\mathbf {y} \rangle =\langle \mathbf {x} ,P\mathbf {y} \rangle$ $\mathbf {x} ,\mathbf {y} \en V$

Matriz de proyección

Una matriz cuadrada se llama matriz de proyección si es igual a su cuadrado, es decir, si . ^[2]^{: pág. 38} $P$ $P^{2}=P$
Una matriz cuadrada se llama matriz de proyección ortogonal si se trata de una matriz real y, respectivamente, de una matriz compleja , donde denota la transpuesta de y denota la transpuesta adjunta o hermitiana de . ^[2]^{: pág. 223} $P$ $P^{2}=P=P^{\mathrm {T} }$ $P^{2}=P=P^{*}$ $P^{\mathrm {T} }$ $P$ $P^{*}$ $P$
Una matriz de proyección que no es una matriz de proyección ortogonal se llama matriz de proyección oblicua .

Los valores propios de una matriz de proyección deben ser 0 o 1.

Ejemplos

Proyección ortogonal

Por ejemplo, la función que asigna el punto en el espacio tridimensional al punto es una proyección ortogonal sobre el plano xy . Esta función está representada por la matriz. $(x,y,z)$ $\mathbb {R} ^{3}$ $(x,y,0)$ $P={\begin{bmatrix}1&0&0\\0&1&0\\0&0&0\end{bmatrix}}.$

La acción de esta matriz sobre un vector arbitrario es $P{\begin{bmatrix}x\\y\\z\end{bmatrix}}={\begin{bmatrix}x\\y\\0\end{bmatrix}}.$

Para ver que de hecho es una proyección, es decir , calculamos $P$ $P=P^{2}$ $P^{2}{\begin{bmatrix}x\\y\\z\end{bmatrix}}=P{\begin{bmatrix}x\\y\\0\end{bmatrix}}={\begin{bmatrix}x\\y\\0\end{bmatrix}}=P{\begin{bmatrix}x\\y\\z\end{bmatrix}}.$

Observar eso muestra que la proyección es una proyección ortogonal. $P^{\mathrm {T} }=P$

Proyección oblicua

Un ejemplo simple de una proyección no ortogonal (oblicua) es $P={\begin{bmatrix}0&0\\\alpha &1\end{bmatrix}}.$

A través de la multiplicación de matrices , se ve que mostrar eso es de hecho una proyección. $P^{2}={\begin{bmatrix}0&0\\\alpha &1\end{bmatrix}}{\begin{bmatrix}0&0\\\alpha &1\end{bmatrix}}={\begin{bmatrix}0&0\\\alpha &1\end{bmatrix}}=P.$ $P$

La proyección es ortogonal si y sólo si porque sólo entonces $P$ $\alpha =0$ $P^{\mathrm {T} }=P.$

Propiedades y clasificación

Idempotencia

Por definición, una proyección es idempotente (es decir ). $P$ $P^{2}=P$

Abrir mapa

Cada proyección es un mapa abierto , lo que significa que asigna cada conjunto abierto en el dominio a un conjunto abierto en la topología subespacial de la imagen . ^{[ cita necesaria ]} Es decir, para cualquier vector y cualquier bola (con radio positivo) centrada en , existe una bola (con radio positivo) centrada en que está completamente contenida en la imagen . $\mathbf {x}$ $B_{\mathbf {x} }$ $\mathbf {x}$ $B_{P\mathbf {x} }$ $P\mathbf {x}$ $P(B_{\mathbf {x} })$

Complementariedad de imagen y núcleo.

Sea un espacio vectorial de dimensión finita y una proyección sobre . Supongamos que los subespacios y son la imagen y el núcleo de respectivamente. Entonces tiene las siguientes propiedades: $W$ $P$ $W$ $U$ $V$ $P$ $P$

$P$ es el operador de identidad en : $I$ $U$ $\forall \mathbf {x} \in U:P\mathbf {x} =\mathbf {x} .$
Tenemos una suma directa . Cada vector se puede descomponer de forma única como con y , y donde $W=U\oplus V$ $\mathbf {x} \in W$ $\mathbf {x} =\mathbf {u} +\mathbf {v}$ $\mathbf {u} =P\mathbf {x}$ $\mathbf {v} =\mathbf {x} -P\mathbf {x} =\left(I-P\right)\mathbf {x}$ $\mathbf {u} \in U,\mathbf {v} \in V.$

La imagen y el núcleo de una proyección son complementarios , al igual que y . El operador es también una proyección, ya que la imagen y el núcleo de se convierten en el núcleo y la imagen de y viceversa. Decimos que es una proyección sobre ( núcleo/imagen) y es una proyección sobre . $P$ $Q=I-P$ $Q$ $P$ $Q$ $P$ $V$ $U$ $Q$ $U$ $V$

Espectro

En espacios vectoriales de dimensión infinita, el espectro de una proyección está contenido en como Sólo 0 o 1 puede ser un valor propio de una proyección. Esto implica que una proyección ortogonal es siempre una matriz semidefinida positiva . En general, los espacios propios correspondientes son (respectivamente) el núcleo y el rango de la proyección. La descomposición de un espacio vectorial en sumas directas no es única. Por lo tanto, dado un subespacio , puede haber muchas proyecciones cuyo rango (o núcleo) sea . $\{0,1\}$ $(\lambda I-P)^{-1}={\frac {1}{\lambda }}I+{\frac {1}{\lambda (\lambda -1)}}P.$ $P$ $V$ $V$

Si una proyección no es trivial, tiene un polinomio mínimo , que se factoriza en factores lineales distintos y, por tanto, es diagonalizable . $x^{2}-x=x(x-1)$ $P$

Producto de proyecciones

El producto de proyecciones no es en general una proyección, aunque sean ortogonales. Si dos proyecciones conmutan entonces su producto es una proyección, pero lo contrario es falso: el producto de dos proyecciones que no conmutan puede ser una proyección.

Si dos proyecciones ortogonales conmutan, entonces su producto es una proyección ortogonal. Si el producto de dos proyecciones ortogonales es una proyección ortogonal, entonces las dos proyecciones ortogonales conmutan (de manera más general: dos endomorfismos autoadjuntos conmutan si y sólo si su producto es autoadjunto).

Proyecciones ortogonales

Cuando el espacio vectorial tiene un producto interno y es completo (es un espacio de Hilbert ) se puede utilizar el concepto de ortogonalidad . Una proyección ortogonal es una proyección para la cual el rango y el núcleo son subespacios ortogonales . Así, para cada y en , . Equivalentemente: $W$ $U$ $V$ $\mathbf {x}$ $\mathbf {y}$ $W$ $\langle P\mathbf {x} ,(\mathbf {y} -P\mathbf {y} )\rangle =\langle (\mathbf {x} -P\mathbf {x} ),P\mathbf {y} \rangle =0$ $\langle \mathbf {x} ,P\mathbf {y} \rangle =\langle P\mathbf {x} ,P\mathbf {y} \rangle =\langle P\mathbf {x} ,\mathbf {y} \rangle .$

Una proyección es ortogonal si y sólo si es autojunta . Usando las propiedades autoadjuntas e idempotentes de , para cualquiera y en tenemos , y donde está el producto interno asociado con . Por tanto, y son proyecciones ortogonales. ^[3] La otra dirección, es decir, que si es ortogonal entonces es autoadjunto, se sigue de la implicación de a para cada y en ; de este modo . $P$ $\mathbf {x}$ $\mathbf {y}$ $W$ $P\mathbf {x} \in U$ $\mathbf {y} -P\mathbf {y} \in V$ $\langle P\mathbf {x} ,\mathbf {y} -P\mathbf {y} \rangle =\langle \mathbf {x} ,\left(P-P^{2}\right)\mathbf {y} \rangle =0$ $\langle \cdot ,\cdot \rangle$ $W$ $P$ $I-P$ $P$ $\langle (\mathbf {x} -P\mathbf {x} ),P\mathbf {y} \rangle =\langle P\mathbf {x} ,(\mathbf {y} -P\mathbf {y} )\rangle =0$ $\langle \mathbf {x} ,P\mathbf {y} \rangle =\langle P\mathbf {x} ,P\mathbf {y} \rangle =\langle P\mathbf {x} ,\mathbf {y} \rangle =\langle \mathbf {x} ,P^{*}\mathbf {y} \rangle$ $x$ $y$ $W$ $P=P^{*}$

La existencia de una proyección ortogonal sobre un subespacio cerrado se deriva del teorema de proyección de Hilbert .

Propiedades y casos especiales

Una proyección ortogonal es un operador acotado . Esto se debe a que para cada en el espacio vectorial tenemos, por la desigualdad de Cauchy-Schwarz : Por lo tanto . $\mathbf {v}$ $\left\|P\mathbf {v} \right\|^{2}=\langle P\mathbf {v} ,P\mathbf {v} \rangle =\langle P\mathbf {v} ,\mathbf {v} \rangle \leq \left\|P\mathbf {v} \right\|\cdot \left\|\mathbf {v} \right\|$ $\left\|P\mathbf {v} \right\|\leq \left\|\mathbf {v} \right\|$

Para espacios vectoriales reales o complejos de dimensión finita, el producto interno estándar se puede sustituir por . $\langle \cdot ,\cdot \rangle$

Fórmulas

Un caso simple ocurre cuando la proyección ortogonal es sobre una recta. Si es un vector unitario en la recta, entonces la proyección viene dada por el producto exterior (si tiene un valor complejo, la transpuesta en la ecuación anterior se reemplaza por una transpuesta hermitiana). Este operador deja u invariante y aniquila todos los vectores ortogonales a , demostrando que de hecho es la proyección ortogonal sobre la línea que contiene a u . ^[4] Una forma sencilla de ver esto es considerar un vector arbitrario como la suma de un componente de la recta (es decir, el vector proyectado que buscamos) y otro perpendicular a ella, . Aplicando la proyección, obtenemos las propiedades del producto escalar de vectores paralelos y perpendiculares. $\mathbf {u}$ $P_{\mathbf {u} }=\mathbf {u} \mathbf {u} ^{\mathsf {T}}.$ $\mathbf {u}$ $\mathbf {u}$ $\mathbf {x}$ $\mathbf {x} =\mathbf {x} _{\parallel }+\mathbf {x} _{\perp }$ $P_{\mathbf {u} }\mathbf {x} =\mathbf {u} \mathbf {u} ^{\mathsf {T}}\mathbf {x} _{\parallel }+\mathbf {u} \mathbf {u} ^{\mathsf {T}}\mathbf {x} _{\perp }=\mathbf {u} \left(\operatorname {sgn} \left(\mathbf {u} ^{\mathsf {T}}\mathbf {x} _{\parallel }\right)\left\|\mathbf {x} _{\parallel }\right\|\right)+\mathbf {u} \cdot \mathbf {0} =\mathbf {x} _{\parallel }$

Esta fórmula se puede generalizar a proyecciones ortogonales sobre un subespacio de dimensión arbitraria . Sea una base ortonormal del subespacio , suponiendo que el número entero , y denotemos la matriz cuyas columnas son , es decir ,. Entonces la proyección viene dada por: ^[5] que puede reescribirse como $\mathbf {u} _{1},\ldots ,\mathbf {u} _{k}$ $U$ $k\geq 1$ $A$ $n\times k$ $\mathbf {u} _{1},\ldots ,\mathbf {u} _{k}$ $A={\begin{bmatrix}\mathbf {u} _{1}&\cdots &\mathbf {u} _{k}\end{bmatrix}}$ $P_{A}=AA^{\mathsf {T}}$ $P_{A}=\sum _{i}\langle \mathbf {u} _{i},\cdot \rangle \mathbf {u} _{i}.$

La matriz es la isometría parcial que desaparece en el complemento ortogonal de y es la isometría que se incrusta en el espacio vectorial subyacente. El rango de es por tanto el espacio final de . También está claro que es el operador de identidad en . $A^{\mathsf {T}}$ $U$ $A$ $U$ $P_{A}$ $A$ $AA^{\mathsf {T}}$ $U$

También se puede eliminar la condición de ortonormalidad. Si es una base (no necesariamente ortonormal) con y es la matriz con estos vectores como columnas, entonces la proyección es: ^[6]^[7] $\mathbf {u} _{1},\ldots ,\mathbf {u} _{k}$ $k\geq 1$ $A$ $P_{A}=A\left(A^{\mathsf {T}}A\right)^{-1}A^{\mathsf {T}}.$

La matriz todavía se incrusta en el espacio vectorial subyacente pero ya no es una isometría en general. La matriz es un "factor normalizador" que recupera la norma. Por ejemplo, el operador de rango -1 no es una proyección si después de dividir por obtenemos la proyección sobre el subespacio abarcado por . $A$ $U$ $\left(A^{\mathsf {T}}A\right)^{-1}$ $\mathbf {u} \mathbf {u} ^{\mathsf {T}}$ $\left\|\mathbf {u} \right\|\neq 1.$ $\mathbf {u} ^{\mathsf {T}}\mathbf {u} =\left\|\mathbf {u} \right\|^{2},$ $\mathbf {u} \left(\mathbf {u} ^{\mathsf {T}}\mathbf {u} \right)^{-1}\mathbf {u} ^{\mathsf {T}}$ $u$

En el caso general, podemos tener una matriz definida positiva arbitraria que define un producto interno y la proyección viene dada por . Entonces $D$ $\langle x,y\rangle _{D}=y^{\dagger }Dx$ $P_{A}$ ${\textstyle P_{A}x=\operatorname {argmin} _{y\in \operatorname {range} (A)}\left\|x-y\right\|_{D}^{2}}$ $P_{A}=A\left(A^{\mathsf {T}}DA\right)^{-1}A^{\mathsf {T}}D.$

Cuando el espacio de rango de la proyección es generado por un marco (es decir, el número de generadores es mayor que su dimensión), la fórmula para la proyección toma la forma: . Aquí representa el pseudoinverso de Moore-Penrose . Esta es sólo una de las muchas formas de construir el operador de proyección. $P_{A}=AA^{+}$ $A^{+}$

Si es una matriz no singular y (es decir, es la matriz espacial nula de ), ^[8] se cumple lo siguiente: ${\begin{bmatrix}A&B\end{bmatrix}}$ $A^{\mathsf {T}}B=0$ $B$ $A$ ${\begin{aligned}I&={\begin{bmatrix}A&B\end{bmatrix}}{\begin{bmatrix}A&B\end{bmatrix}}^{-1}{\begin{bmatrix}A^{\mathsf {T}}\\B^{\mathsf {T}}\end{bmatrix}}^{-1}{\begin{bmatrix}A^{\mathsf {T}}\\B^{\mathsf {T}}\end{bmatrix}}\\&={\begin{bmatrix}A&B\end{bmatrix}}\left({\begin{bmatrix}A^{\mathsf {T}}\\B^{\mathsf {T}}\end{bmatrix}}{\begin{bmatrix}A&B\end{bmatrix}}\right)^{-1}{\begin{bmatrix}A^{\mathsf {T}}\\B^{\mathsf {T}}\end{bmatrix}}\\&={\begin{bmatrix}A&B\end{bmatrix}}{\begin{bmatrix}A^{\mathsf {T}}A&O\\O&B^{\mathsf {T}}B\end{bmatrix}}^{-1}{\begin{bmatrix}A^{\mathsf {T}}\\B^{\mathsf {T}}\end{bmatrix}}\\[4pt]&=A\left(A^{\mathsf {T}}A\right)^{-1}A^{\mathsf {T}}+B\left(B^{\mathsf {T}}B\right)^{-1}B^{\mathsf {T}}\end{aligned}}$

Si la condición ortogonal se mejora a no singular, se cumple lo siguiente: $A^{\mathsf {T}}WB=A^{\mathsf {T}}W^{\mathsf {T}}B=0$ $W$ $I={\begin{bmatrix}A&B\end{bmatrix}}{\begin{bmatrix}\left(A^{\mathsf {T}}WA\right)^{-1}A^{\mathsf {T}}\\\left(B^{\mathsf {T}}WB\right)^{-1}B^{\mathsf {T}}\end{bmatrix}}W.$

Todas estas fórmulas también son válidas para espacios de productos internos complejos, siempre que se utilice la transpuesta conjugada en lugar de la transpuesta. Se pueden encontrar más detalles sobre las sumas de los proyectores en Banerjee y Roy (2014). ^[9] Véase también Banerjee (2004) ^[10] para la aplicación de sumas de proyectores en trigonometría esférica básica .

Proyecciones oblicuas

El término proyecciones oblicuas se utiliza a veces para referirse a proyecciones no ortogonales. Estas proyecciones también se utilizan para representar figuras espaciales en dibujos bidimensionales (ver proyección oblicua ), aunque no con tanta frecuencia como las proyecciones ortogonales. Mientras que calcular el valor ajustado de una regresión de mínimos cuadrados ordinarios requiere una proyección ortogonal, calcular el valor ajustado de una regresión de variables instrumentales requiere una proyección oblicua.

Una proyección se define por su núcleo y los vectores base utilizados para caracterizar su rango (que es un complemento del núcleo). Cuando estos vectores base son ortogonales al núcleo, entonces la proyección es ortogonal. Cuando estos vectores base no son ortogonales al núcleo, la proyección es una proyección oblicua, o simplemente una proyección.

Una fórmula de representación matricial para un operador de proyección distinto de cero

Sea un operador lineal, tal que y supongamos que no es el operador cero. Deje que los vectores formen una base para el rango de y ensamble estos vectores en la matriz . Por lo tanto, el número entero , de lo contrario , y es el operador cero. El rango y el núcleo son espacios complementarios, por lo que el núcleo tiene dimensión . De ello se deduce que el complemento ortogonal del núcleo tiene dimensión . Formemos una base para el complemento ortogonal del núcleo de la proyección y juntemos estos vectores en la matriz . Entonces la proyección (con la condición ) viene dada por $P$ $P:V\to V,$ $P^{2}=P$ $P:V\to V$ $\mathbf {u} _{1},\ldots ,\mathbf {u} _{k}$ $P$ $n\times k$ $A$ $k\geq 1$ $k=0$ $P$ $n-k$ $k$ $\mathbf {v} _{1},\ldots ,\mathbf {v} _{k}$ $B$ $P$ $k\geq 1$ $P=A\left(B^{\mathsf {T}}A\right)^{-1}B^{\mathsf {T}}.$

Esta expresión generaliza la fórmula para proyecciones ortogonales dada anteriormente. ^[11]^[12] Una prueba estándar de esta expresión es la siguiente. Para cualquier vector en el espacio vectorial , podemos descomponerlo , donde el vector está en la imagen de y el vector So , y luego está en el núcleo de , que es el espacio nulo de En otras palabras, el vector está en el espacio columna de entonces, para algún vector de dimensión , el vector satisface mediante la construcción de . Juntamos estas condiciones y encontramos un vector tal que . Dado que las matrices y tienen rango completo según su construcción, la matriz -es invertible. Entonces la ecuación da el vector. De esta manera, para cualquier vector y por tanto . $\mathbf {x}$ $V$ $\mathbf {x} =\mathbf {x} _{1}+\mathbf {x} _{2}$ $\mathbf {x} _{1}=P(\mathbf {x} )$ $P$ $\mathbf {x} _{2}=\mathbf {x} -P(\mathbf {x} ).$ $P(\mathbf {x} _{2})=P(\mathbf {x} )-P^{2}(\mathbf {x} )=\mathbf {0}$ $\mathbf {x} _{2}$ $P$ $A.$ $\mathbf {x} _{1}$ $A,$ $\mathbf {x} _{1}=A\mathbf {w}$ $k$ $\mathbf {w}$ $\mathbf {x} _{2}$ $B^{\mathsf {T}}\mathbf {x} _{2}=\mathbf {0}$ $B$ $\mathbf {w}$ $B^{\mathsf {T}}(\mathbf {x} -A\mathbf {w} )=\mathbf {0}$ $A$ $B$ $k$ $k\times k$ $B^{\mathsf {T}}A$ $B^{\mathsf {T}}(\mathbf {x} -A\mathbf {w} )=\mathbf {0}$ $\mathbf {w} =(B^{\mathsf {T}}A)^{-1}B^{\mathsf {T}}\mathbf {x} .$ $P\mathbf {x} =\mathbf {x} _{1}=A\mathbf {w} =A(B^{\mathsf {T}}A)^{-1}B^{\mathsf {T}}\mathbf {x}$ $\mathbf {x} \in V$ $P=A(B^{\mathsf {T}}A)^{-1}B^{\mathsf {T}}$

En el caso de que sea una proyección ortogonal, podemos tomar y se deduce que . Al utilizar esta fórmula, uno puede comprobarlo fácilmente . En general, si el espacio vectorial está sobre un campo de números complejos, se usa la transpuesta hermitiana y se tiene la fórmula . Recuerde que se puede definir la inversa de Moore-Penrose de la matriz porque tiene rango de columna completo, por lo que . $P$ $A=B$ $P=A\left(A^{\mathsf {T}}A\right)^{-1}A^{\mathsf {T}}$ $P=P^{\mathsf {T}}$ $A^{*}$ $P=A\left(A^{*}A\right)^{-1}A^{*}$ $A$ $A^{+}=(A^{*}A)^{-1}A^{*}$ $A$ $P=AA^{+}$

Valores singulares

Tenga en cuenta que también es una proyección oblicua. Los valores singulares de y se pueden calcular mediante una base ortonormal de . Sea una base ortonormal de y sea el complemento ortogonal de . Denota los valores singulares de la matriz por los valores positivos . Con esto, los valores singulares de son: ^[13] y los valores singulares de son. Esto implica que los valores singulares más grandes de y son iguales, y por tanto que la norma matricial de las proyecciones oblicuas son las mismas. Sin embargo, el número de condición satisface la relación y, por lo tanto, no es necesariamente igual. $I-P$ $P$ $I-P$ $A$ $Q_{A}$ $A$ $Q_{A}^{\perp }$ $Q_{A}$ $Q_{A}^{T}A(B^{T}A)^{-1}B^{T}Q_{A}^{\perp }$ $\gamma _{1}\geq \gamma _{2}\geq \ldots \geq \gamma _{k}$ $P$ $\sigma _{i}={\begin{cases}{\sqrt {1+\gamma _{i}^{2}}}&1\leq i\leq k\\0&{\text{otherwise}}\end{cases}}$ $I-P$ $\sigma _{i}={\begin{cases}{\sqrt {1+\gamma _{i}^{2}}}&1\leq i\leq k\\1&k+1\leq i\leq n-k\\0&{\text{otherwise}}\end{cases}}$ $P$ $I-P$ $\kappa (I-P)={\frac {\sigma _{1}}{1}}\geq {\frac {\sigma _{1}}{\sigma _{k}}}=\kappa (P)$

Encontrar proyección con un producto interno.

Sea un espacio vectorial (en este caso un plano) atravesado por vectores ortogonales . Sea un vector. Se puede definir una proyección de sobre como donde se suman índices repetidos ( notación de suma de Einstein ). El vector se puede escribir como una suma ortogonal tal que . Tenga en cuenta que a veces se indica como . Existe un teorema en álgebra lineal que establece que esta es la distancia más pequeña (la distancia ortogonal ) desde a y se usa comúnmente en áreas como el aprendizaje automático . $V$ $\mathbf {u} _{1},\mathbf {u} _{2},\dots ,\mathbf {u} _{p}$ $y$ $\mathbf {y}$ $V$ $\operatorname {proj} _{V}\mathbf {y} ={\frac {\mathbf {y} \cdot \mathbf {u} ^{i}}{\mathbf {u} ^{i}\cdot \mathbf {u} ^{i}}}\mathbf {u} ^{i}$ $\mathbf {y}$ $\mathbf {y} =\operatorname {proj} _{V}\mathbf {y} +\mathbf {z}$ $\operatorname {proj} _{V}\mathbf {y}$ ${\hat {\mathbf {y} }}$ $\mathbf {z}$ $\mathbf {y}$ $V$

Formas canónicas

Cualquier proyección sobre un espacio vectorial de dimensión sobre un campo es una matriz diagonalizable , ya que su polinomio mínimo divide , el cual se divide en distintos factores lineales. Por lo tanto existe una base en la que tiene la forma $P=P^{2}$ $d$ $x^{2}-x$ $P$

P=I_{r}\oplus 0_{d-r}

¿Dónde está el rango de ? Aquí está la matriz identidad de tamaño , es la matriz cero de tamaño y es el operador de suma directa . Si el espacio vectorial es complejo y está equipado con un producto interno , entonces existe una base ortonormal en la que la matriz de P es ^[14] $r$ $P$ $I_{r}$ $r$ $0_{d-r}$ $d-r$ $\oplus$

P={\begin{bmatrix}1&\sigma _{1}\\0&0\end{bmatrix}}\oplus \cdots \oplus {\begin{bmatrix}1&\sigma _{k}\\0&0\end{bmatrix}}\oplus I_{m}\oplus 0_{s}.

dónde . Los números enteros y reales están determinados de forma única. Tenga en cuenta que . El factor corresponde al subespacio invariante máximo sobre el que actúa como proyección ortogonal (de modo que P en sí es ortogonal si y sólo si ) y los bloques corresponden a los componentes oblicuos . $\sigma _{1}\geq \sigma _{2}\geq \dots \geq \sigma _{k}>0$ $k,s,m$ $\sigma _{i}$ $2k+s+m=d$ $I_{m}\oplus 0_{s}$ $P$ $k=0$ $\sigma _{i}$

Proyecciones sobre espacios vectoriales normados

Cuando el espacio vectorial subyacente es un espacio vectorial normado (no necesariamente de dimensión finita) , es necesario considerar cuestiones analíticas, irrelevantes en el caso de dimensión finita. Supongamos ahora que es un espacio de Banach . $X$ $X$

Muchos de los resultados algebraicos discutidos anteriormente sobreviven al paso a este contexto. Una descomposición de suma directa dada en subespacios complementarios todavía especifica una proyección, y viceversa. Si es la suma directa , entonces el operador definido por sigue siendo una proyección con rango y núcleo . También está claro que . Por el contrario, si se proyecta sobre , es decir , entonces se verifica fácilmente que . En otras palabras, también es una proyección. La relación implica y es la suma directa . $X$ $X$ $X=U\oplus V$ $P(u+v)=u$ $U$ $V$ $P^{2}=P$ $P$ $X$ $P^{2}=P$ $(1-P)^{2}=(1-P)$ $1-P$ $P^{2}=P$ $1=P+(1-P)$ $X$ $\operatorname {rg} (P)\oplus \operatorname {rg} (1-P)$

Sin embargo, a diferencia del caso de dimensión finita, las proyecciones no necesitan ser continuas en general. Si un subespacio de no está cerrado en la topología normal, entonces la proyección no es continua. En otras palabras, el alcance de una proyección continua debe ser un subespacio cerrado. Además, el núcleo de una proyección continua (de hecho, un operador lineal continuo en general) es cerrado. Así, una proyección continua da una descomposición de en dos subespacios cerrados complementarios: . $U$ $X$ $U$ $P$ $P$ $X$ $X=\operatorname {rg} (P)\oplus \ker(P)=\ker(1-P)\oplus \ker(P)$

Lo contrario también es válido, con un supuesto adicional. Supongamos que es un subespacio cerrado de . Si existe un subespacio cerrado tal que X = U ⊕ V , entonces la proyección con rango y núcleo es continua. Esto se desprende del teorema del grafo cerrado . Supongamos que x _n → x y Px _n → y . Hay que demostrarlo . Como es cerrado y { Px _n } ⊂ U , y se encuentra en , es decir, Py = y . Además, x _n − Px _n = ( I − P ) x _n → x − y . Como es cerrado y {( I − P ) x _n } ⊂ V , tenemos , es decir , lo que prueba la afirmación. $U$ $X$ $V$ $P$ $U$ $V$ $Px=y$ $U$ $U$ $V$ $x-y\in V$ $P(x-y)=Px-Py=Px-y=0$

El argumento anterior hace uso del supuesto de que ambos y son cerrados. En general, dado un subespacio cerrado , no es necesario que exista un subespacio cerrado complementario , aunque para los espacios de Hilbert esto siempre se puede hacer tomando el complemento ortogonal . Para los espacios de Banach, un subespacio unidimensional siempre tiene un subespacio complementario cerrado. Ésta es una consecuencia inmediata del teorema de Hahn-Banach . Sea el tramo lineal de . Por Hahn-Banach, existe un funcional lineal acotado tal que φ ( u ) = 1 . El operador satisface , es decir, es una proyección. La acotación de implica continuidad de y por lo tanto es un subespacio complementario cerrado de . $U$ $V$ $U$ $V$ $U$ $u$ $\varphi$ $P(x)=\varphi (x)u$ $P^{2}=P$ $\varphi$ $P$ $\ker(P)=\operatorname {rg} (I-P)$ $U$

Aplicaciones y consideraciones adicionales

Las proyecciones (ortogonales y de otro tipo) juegan un papel importante en los algoritmos para ciertos problemas de álgebra lineal:

Descomposición QR (ver Transformación de cabeza de familia y Descomposición de Gram-Schmidt );
Valor singular de descomposición
Reducción a la forma de Hessenberg (el primer paso en muchos algoritmos de valores propios )
Regresión lineal
Los elementos proyectivos de álgebras matriciales se utilizan en la construcción de ciertos grupos K en la teoría K del operador

Como se indicó anteriormente, las proyecciones son un caso especial de idempotentes. Analíticamente, las proyecciones ortogonales son generalizaciones no conmutativas de funciones características . Los idempotentes se utilizan para clasificar, por ejemplo, álgebras semisimples , mientras que la teoría de la medida comienza considerando funciones características de conjuntos mensurables . Por lo tanto, como se puede imaginar, las proyecciones se encuentran muy a menudo en el contexto de las álgebras de operadores . En particular, un álgebra de von Neumann se genera mediante su red completa de proyecciones.

Generalizaciones

De manera más general, dado un mapa entre espacios vectoriales normados, se puede pedir de manera análoga que este mapa sea una isometría en el complemento ortogonal del núcleo: que sea una isometría (compárese con Isometría parcial ); en particular debe estar en . El caso de una proyección ortogonal es cuando W es un subespacio de V. En geometría de Riemann , esto se utiliza en la definición de inmersión de Riemann . $T\colon V\to W,$ $(\ker T)^{\perp }\to W$

Ver también

Matriz de centrado , que es un ejemplo de matriz de proyección.
Algoritmo de proyección de Dykstra para calcular la proyección en una intersección de conjuntos
Subespacio invariante
Análisis espectral de mínimos cuadrados
Ortogonalización
Propiedades de la traza

Notas

^ Meyer, págs. 386+387
^ ab Horn, Roger A.; Johnson, Charles R. (2013). Análisis matricial, segunda edición . Prensa de la Universidad de Cambridge. ISBN 9780521839402.
^ Meyer, pág. 433
^ Meyer, pág. 431
^ Meyer, ecuación (5.13.4)
^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística, Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
^ Meyer, ecuación (5.13.3)
^ Ver también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados .
^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística, Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
^ Banerjee, Sudipto (2004), "Revisando la trigonometría esférica con proyectores ortogonales", The College Mathematics Journal , 35 (5): 375–381, doi :10.1080/07468342.2004.11922099, S2CID 122277398
^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística, Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
^ Meyer, ecuación (7.10.39)
^ Brust, JJ; Marcia, RF; Petra, CG (2020), "Descomposiciones computacionalmente eficientes de matrices de proyección oblicua", Revista SIAM sobre análisis y aplicaciones de matrices , 41 (2): 852–870, doi :10.1137/19M1288115, OSTI 1680061, S2CID 219921214
^ Doković, D. Ž. (Agosto de 1991). "Similitud unitaria de proyectores". Aecuaciones Mathematicae . 42 (1): 220–224. doi :10.1007/BF01818492. S2CID 122704926.

Referencias

Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística , Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
Dunford, N.; Schwartz, JT (1958). Operadores lineales, Parte I: Teoría general . Interciencia.
Meyer, Carl D. (2000). Análisis matricial y álgebra lineal aplicada. Sociedad de Matemática Industrial y Aplicada. ISBN 978-0-89871-454-8.

enlaces externos

Conferencia de álgebra lineal del MIT sobre matrices de proyección en YouTube , del MIT OpenCourseWare
Álgebra lineal 15d: la transformación de proyección en YouTube , por Pavel Grinfeld .
Tutorial de proyecciones geométricas planas: un tutorial fácil de seguir que explica los diferentes tipos de proyecciones geométricas planas.