stringtranslate.com

Proyección (álgebra lineal)

La transformación P es la proyección ortogonal sobre la recta m .

En álgebra lineal y análisis funcional , una proyección es una transformación lineal de un espacio vectorial a sí mismo (un endomorfismo ) tal que . Es decir, siempre que se aplica dos veces a cualquier vector, da el mismo resultado que si se aplicara una vez (es decir, es idempotente ). Deja su imagen sin cambios. [1] Esta definición de "proyección" formaliza y generaliza la idea de proyección gráfica . También se puede considerar el efecto de una proyección sobre un objeto geométrico examinando el efecto de la proyección sobre puntos del objeto.

Definiciones

Una proyección sobre un espacio vectorial es un operador lineal tal que .

Cuando tiene un producto interno y es completo , es decir, cuando es un espacio de Hilbert , se puede utilizar el concepto de ortogonalidad . Una proyección sobre un espacio de Hilbert se llama proyección ortogonal si satisface para todos . Una proyección sobre un espacio de Hilbert que no es ortogonal se llama proyección oblicua .

Matriz de proyección

Los valores propios de una matriz de proyección deben ser 0 o 1.

Ejemplos

Proyección ortogonal

Por ejemplo, la función que asigna el punto en el espacio tridimensional al punto es una proyección ortogonal sobre el plano xy . Esta función está representada por la matriz.

La acción de esta matriz sobre un vector arbitrario es

Para ver que de hecho es una proyección, es decir, calculamos

Observar eso muestra que la proyección es una proyección ortogonal.

Proyección oblicua

Un ejemplo simple de una proyección no ortogonal (oblicua) es

Mediante la multiplicación de matrices , se ve que

La proyección es ortogonal si y sólo si porque sólo entonces

Propiedades y clasificación

La transformación T es la proyección a lo largo de k sobre m . El rango de T es my el núcleo es k .

Idempotencia

Por definición, una proyección es idempotente (es decir ).

Abrir mapa

Cada proyección es un mapa abierto , lo que significa que asigna cada conjunto abierto en el dominio a un conjunto abierto en la topología subespacial de la imagen . [ cita necesaria ] Es decir, para cualquier vector y cualquier bola (con radio positivo) centrada en , existe una bola (con radio positivo) centrada en que está completamente contenida en la imagen .

Complementariedad de imagen y núcleo.

Sea un espacio vectorial de dimensión finita y una proyección sobre . Supongamos que los subespacios y son la imagen y el núcleo de respectivamente. Entonces tiene las siguientes propiedades:

  1. es el operador de identidad en :
  2. Tenemos una suma directa . Cada vector se puede descomponer de forma única como con y , y donde

La imagen y el núcleo de una proyección son complementarios , al igual que y . El operador es también una proyección, ya que la imagen y el núcleo de se convierten en el núcleo y la imagen de y viceversa. Decimos que es una proyección sobre (núcleo/imagen) y es una proyección sobre .

Espectro

En espacios vectoriales de dimensión infinita, el espectro de una proyección está contenido en como

valores propiosmatriz semidefinida positivaespacios propios

Si una proyección no es trivial, tiene un polinomio mínimo , que se factoriza en factores lineales distintos y, por tanto, es diagonalizable .

Producto de proyecciones

El producto de proyecciones no es en general una proyección, aunque sean ortogonales. Si dos proyecciones conmutan entonces su producto es una proyección, pero lo contrario es falso: el producto de dos proyecciones que no conmutan puede ser una proyección.

Si dos proyecciones ortogonales conmutan, entonces su producto es una proyección ortogonal. Si el producto de dos proyecciones ortogonales es una proyección ortogonal, entonces las dos proyecciones ortogonales conmutan (de manera más general: dos endomorfismos autoadjuntos conmutan si y sólo si su producto es autoadjunto).

Proyecciones ortogonales

Cuando el espacio vectorial tiene un producto interno y es completo (es un espacio de Hilbert ) se puede utilizar el concepto de ortogonalidad . Una proyección ortogonal es una proyección para la cual el rango y el núcleo son subespacios ortogonales . Así, para cada y en , . Equivalentemente:

Una proyección es ortogonal si y sólo si es autojunta . Usando las propiedades autoadjuntas e idempotentes de , para cualquiera y en tenemos , y

[3]

La existencia de una proyección ortogonal sobre un subespacio cerrado se deriva del teorema de proyección de Hilbert .

Propiedades y casos especiales.

Una proyección ortogonal es un operador acotado . Esto se debe a que para cada en el espacio vectorial tenemos, según la desigualdad de Cauchy-Schwarz :

Para espacios vectoriales reales o complejos de dimensión finita, el producto interno estándar se puede sustituir por .

Fórmulas

Un caso simple ocurre cuando la proyección ortogonal es sobre una recta. Si es un vector unitario en la recta, entonces la proyección viene dada por el producto exterior

ua u[4]
producto escalar

Esta fórmula se puede generalizar a proyecciones ortogonales sobre un subespacio de dimensión arbitraria . Sea una base ortonormal del subespacio , suponiendo que el número entero , y denotemos la matriz cuyas columnas son , es decir ,. Entonces la proyección viene dada por: [5]

La matriz es la isometría parcial que desaparece en el complemento ortogonal de y es la isometría que se incrusta en el espacio vectorial subyacente. El rango de es por tanto el espacio final de . También está claro que es el operador de identidad en .

También se puede eliminar la condición de ortonormalidad. Si es una base (no necesariamente ortonormal) con y es la matriz con estos vectores como columnas, entonces la proyección es: [6] [7]

La matriz todavía se incrusta en el espacio vectorial subyacente pero ya no es una isometría en general. La matriz es un "factor normalizador" que recupera la norma. Por ejemplo, el operador de rango -1 no es una proyección si después de dividir por obtenemos la proyección sobre el subespacio abarcado por .

En el caso general, podemos tener una matriz definida positiva arbitraria que define un producto interno y la proyección viene dada por . Entonces

Cuando el espacio de rango de la proyección es generado por un marco (es decir, el número de generadores es mayor que su dimensión), la fórmula para la proyección toma la forma: . Aquí representa la pseudoinversa de Moore-Penrose . Esta es sólo una de las muchas formas de construir el operador de proyección.

Si es una matriz no singular y (es decir, es la matriz espacial nula de ), [8] se cumple lo siguiente:

Si la condición ortogonal se mejora a no singular, se cumple lo siguiente:

Todas estas fórmulas también son válidas para espacios de productos internos complejos, siempre que se utilice la transpuesta conjugada en lugar de la transpuesta. Se pueden encontrar más detalles sobre las sumas de los proyectores en Banerjee y Roy (2014). [9] Véase también Banerjee (2004) [10] para la aplicación de sumas de proyectores en trigonometría esférica básica .

Proyecciones oblicuas

El término proyecciones oblicuas se utiliza a veces para referirse a proyecciones no ortogonales. Estas proyecciones también se utilizan para representar figuras espaciales en dibujos bidimensionales (ver proyección oblicua ), aunque no con tanta frecuencia como las proyecciones ortogonales. Mientras que calcular el valor ajustado de una regresión de mínimos cuadrados ordinarios requiere una proyección ortogonal, calcular el valor ajustado de una regresión de variables instrumentales requiere una proyección oblicua.

Una proyección se define por su núcleo y los vectores base utilizados para caracterizar su rango (que es un complemento del núcleo). Cuando estos vectores base son ortogonales al núcleo, entonces la proyección es ortogonal. Cuando estos vectores base no son ortogonales al núcleo, la proyección es una proyección oblicua, o simplemente una proyección.

Una fórmula de representación matricial para un operador de proyección distinto de cero

Sea un operador lineal, tal que y supongamos que no es el operador cero. Deje que los vectores formen una base para el rango de y ensamble estos vectores en la matriz . Por lo tanto, el número entero , de lo contrario , y es el operador cero. El rango y el núcleo son espacios complementarios, por lo que el núcleo tiene dimensión . De ello se deduce que el complemento ortogonal del núcleo tiene dimensión . Formemos una base para el complemento ortogonal del núcleo de la proyección y juntemos estos vectores en la matriz . Entonces la proyección (con la condición ) viene dada por

Esta expresión generaliza la fórmula para proyecciones ortogonales dada anteriormente. [11] [12] Una prueba estándar de esta expresión es la siguiente. Para cualquier vector en el espacio vectorial , podemos descomponerlo , donde el vector está en la imagen de y el vector So , y luego está en el núcleo de , que es el espacio nulo de En otras palabras, el vector está en el espacio columna de entonces, para algún vector de dimensión , el vector satisface mediante la construcción de . Juntamos estas condiciones y encontramos un vector tal que . Dado que las matrices y tienen rango completo según su construcción, la matriz -es invertible. Entonces la ecuación da el vector. De esta manera, para cualquier vector y por tanto .

En el caso de que sea una proyección ortogonal, podemos tomar y se deduce que . Al utilizar esta fórmula, uno puede comprobarlo fácilmente . En general, si el espacio vectorial está sobre un campo de números complejos, se usa la transpuesta hermitiana y se tiene la fórmula . Recuerde que se puede definir la inversa de Moore-Penrose de la matriz porque tiene rango de columna completo, por lo que .

Valores singulares

Tenga en cuenta que también es una proyección oblicua. Los valores singulares de y se pueden calcular mediante una base ortonormal de . Sea una base ortonormal de y sea el complemento ortogonal de . Denota los valores singulares de la matriz por los valores positivos . Con esto, los valores singulares de son: [13]

norma matricialnúmero de condición

Encontrar proyección con un producto interno.

Sea un espacio vectorial (en este caso un plano) atravesado por vectores ortogonales . Sea un vector. Se puede definir una proyección de sobre como

notación de suma de Einsteindistancia ortogonalel aprendizaje automático
y se proyecta sobre el espacio vectorial V .

Formas canónicas

Cualquier proyección sobre un espacio vectorial de dimensión sobre un campo es una matriz diagonalizable , ya que su polinomio mínimo divide , el cual se divide en distintos factores lineales. Por lo tanto existe una base en la que tiene la forma

¿ Dónde está el rango de ? Aquí está la matriz identidad de tamaño , es la matriz cero de tamaño y es el operador de suma directa . Si el espacio vectorial es complejo y está equipado con un producto interno , entonces existe una base ortonormal en la que la matriz de P es [14]

dónde . Los números enteros y reales están determinados de forma única. Tenga en cuenta que . El factor corresponde al subespacio invariante máximo sobre el que actúa como proyección ortogonal (de modo que P en sí es ortogonal si y sólo si ) y los bloques corresponden a los componentes oblicuos .

Proyecciones sobre espacios vectoriales normados

Cuando el espacio vectorial subyacente es un espacio vectorial normado (no necesariamente de dimensión finita) , es necesario considerar cuestiones analíticas, irrelevantes en el caso de dimensión finita. Supongamos ahora que es un espacio de Banach .

Muchos de los resultados algebraicos discutidos anteriormente sobreviven al paso a este contexto. Una descomposición de suma directa dada en subespacios complementarios todavía especifica una proyección, y viceversa. Si es la suma directa , entonces el operador definido por sigue siendo una proyección con rango y núcleo . También está claro que . Por el contrario, si se proyecta sobre , es decir , entonces se verifica fácilmente que . En otras palabras, también es una proyección. La relación implica y es la suma directa .

Sin embargo, a diferencia del caso de dimensión finita, las proyecciones no necesitan ser continuas en general. Si un subespacio de no está cerrado en la topología normal, entonces la proyección no es continua. En otras palabras, el alcance de una proyección continua debe ser un subespacio cerrado. Además, el núcleo de una proyección continua (de hecho, un operador lineal continuo en general) es cerrado. Así, una proyección continua da una descomposición de en dos subespacios cerrados complementarios : .

Lo contrario también es válido, con un supuesto adicional. Supongamos que es un subespacio cerrado de . Si existe un subespacio cerrado tal que X = UV , entonces la proyección con rango y núcleo es continua. Esto se desprende del teorema del grafo cerrado . Supongamos que x nx y Px ny . Hay que demostrarlo . Como es cerrado y { Px n } ⊂ U , y se encuentra en , es decir, Py = y . Además, x nPx n = ( IP ) x nxy . Como es cerrado y {( IP ) x n } ⊂ V , tenemos , es decir , lo que prueba la afirmación.

El argumento anterior hace uso del supuesto de que ambos y son cerrados. En general, dado un subespacio cerrado , no es necesario que exista un subespacio cerrado complementario , aunque para los espacios de Hilbert esto siempre se puede hacer tomando el complemento ortogonal . Para los espacios de Banach, un subespacio unidimensional siempre tiene un subespacio complementario cerrado. Ésta es una consecuencia inmediata del teorema de Hahn-Banach . Sea el tramo lineal de . Según Hahn-Banach, existe un funcional lineal acotado tal que φ ( u ) = 1 . El operador satisface , es decir, es una proyección. La acotación de implica continuidad de y por lo tanto es un subespacio complementario cerrado de .

Aplicaciones y consideraciones adicionales

Las proyecciones (ortogonales y de otro tipo) juegan un papel importante en los algoritmos para ciertos problemas de álgebra lineal:

Como se indicó anteriormente, las proyecciones son un caso especial de idempotentes. Analíticamente, las proyecciones ortogonales son generalizaciones no conmutativas de funciones características . Los idempotentes se utilizan para clasificar, por ejemplo, álgebras semisimples , mientras que la teoría de la medida comienza considerando funciones características de conjuntos mensurables . Por lo tanto, como se puede imaginar, las proyecciones se encuentran muy a menudo en el contexto de las álgebras de operadores . En particular, un álgebra de von Neumann se genera mediante su red completa de proyecciones.

Generalizaciones

De manera más general, dado un mapa entre espacios vectoriales normados, se puede pedir de manera análoga que este mapa sea una isometría en el complemento ortogonal del núcleo: que sea una isometría (compárese con Isometría parcial ); en particular debe estar en . El caso de una proyección ortogonal es cuando W es un subespacio de V. En geometría de Riemann , esto se utiliza en la definición de inmersión de Riemann .

Ver también

Notas

  1. ^ Meyer, págs. 386+387
  2. ^ ab Horn, Roger A.; Johnson, Charles R. (2013). Análisis matricial, segunda edición . Prensa de la Universidad de Cambridge. ISBN 9780521839402.
  3. ^ Meyer, pág. 433
  4. ^ Meyer, pág. 431
  5. ^ Meyer, ecuación (5.13.4)
  6. ^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística, Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
  7. ^ Meyer, ecuación (5.13.3)
  8. ^ Ver también Mínimos cuadrados lineales (matemáticas) § Propiedades de los estimadores de mínimos cuadrados .
  9. ^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística, Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
  10. ^ Banerjee, Sudipto (2004), "Revisando la trigonometría esférica con proyectores ortogonales", The College Mathematics Journal , 35 (5): 375–381, doi :10.1080/07468342.2004.11922099, S2CID  122277398
  11. ^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística, Textos de ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
  12. ^ Meyer, ecuación (7.10.39)
  13. ^ Brust, JJ; Marcia, RF; Petra, CG (2020), "Descomposiciones computacionalmente eficientes de matrices de proyección oblicua", Revista SIAM sobre análisis y aplicaciones de matrices , 41 (2): 852–870, doi :10.1137/19M1288115, OSTI  1680061, S2CID  219921214
  14. ^ Doković, D. Ž. (Agosto de 1991). "Similitud unitaria de proyectores". Aecuaciones Mathematicae . 42 (1): 220–224. doi :10.1007/BF01818492. S2CID  122704926.

Referencias

enlaces externos