Teorema del eje principal

En geometría y álgebra lineal , un eje principal es una determinada línea en un espacio euclidiano asociada a un elipsoide o hiperboloide , generalizando los ejes mayor y menor de una elipse o hipérbola . El teorema del eje principal establece que los ejes principales son perpendiculares y proporciona un procedimiento constructivo para encontrarlos.

Matemáticamente, el teorema del eje principal es una generalización del método de completar el cuadrado del álgebra elemental . En álgebra lineal y análisis funcional , el teorema del eje principal es una contraparte geométrica del teorema espectral . Tiene aplicaciones a la estadística de análisis de componentes principales y la descomposición de valores singulares . En física , el teorema es fundamental para los estudios del momento angular y la birrefringencia .

Motivación

Las ecuaciones en el plano cartesiano R ² :

{\begin{alineado}{\frac {x^{2}}{9}}+{\frac {y^{2}}{25}}&=1\\[3pt]{\frac { x^{2}}{9}}-{\frac {y^{2}}{25}}&=1\end{aligned}}

definen, respectivamente, una elipse y una hipérbola. En cada caso, los ejes xey son los ejes principales . Esto se ve fácilmente, dado que no hay términos cruzados que involucren productos xy en ninguna de las expresiones. Sin embargo, la situación es más complicada para ecuaciones como

5x^{2}+8xy+5y^{2}=1.

Aquí se requiere algún método para determinar si se trata de una elipse o una hipérbola . La observación básica es que si, al completar el cuadrado, la expresión cuadrática se puede reducir a una suma de dos cuadrados, entonces la ecuación define una elipse, mientras que si se reduce a una diferencia de dos cuadrados, entonces la ecuación representa una hipérbola:

{\begin{alineado}u(x,y)^{2}+v(x,y)^{2}&=1\qquad {\text{(elipse)}}\\u(x, y)^{2}-v(x,y)^{2}&=1\qquad {\text{(hipérbola)}}.\end{aligned}}

Por lo tanto, en nuestra expresión de ejemplo, el problema es cómo absorber el coeficiente del término cruzado 8 xy en las funciones u y v . Formalmente, este problema es similar al problema de diagonalización de matrices , donde se intenta encontrar un sistema de coordenadas adecuado en el que la matriz de una transformación lineal sea diagonal. El primer paso es encontrar una matriz en la que se pueda aplicar la técnica de diagonalización.

El truco consiste en escribir la forma cuadrática como

5x^{2}+8xy+5y^{2}={\begin{bmatrix}x&y\end{bmatrix}}{\begin{bmatrix}5&4\\4&5\end{bmatrix}}{\begin{ bmatrix}x\\y\end{bmatrix}}=\mathbf {x} ^{\textsf {T}}A\mathbf {x}

donde el término cruzado se ha dividido en dos partes iguales. La matriz A en la descomposición anterior es una matriz simétrica . En particular, según el teorema espectral , tiene valores propios reales y es diagonalizable mediante una matriz ortogonal ( ortogonalmente diagonalizable ).

Para diagonalizar ortogonalmente A , primero se deben encontrar sus valores propios y luego encontrar una base propia ortonormal . El cálculo revela que los valores propios de A son

\lambda _{1}=1,\quad \lambda _{2}=9

con sus correspondientes vectores propios

\mathbf {v} _{1}={\begin{bmatrix}1\\-1\end{bmatrix}},\quad \mathbf {v} _{2}={\begin{bmatrix}1 \\1\end{bmatriz}}.

Al dividirlos por sus respectivas longitudes se obtiene una base propia ortonormal:

\mathbf {u} _{1}={\begin{bmatrix}1/{\sqrt {2}}\\-1/{\sqrt {2}}\end{bmatrix}},\quad \ mathbf {u} _{2}={\begin{bmatrix}1/{\sqrt {2}}\\1/{\sqrt {2}}\end{bmatrix}}.

Ahora la matriz S = [ u ₁ u ₂ ] es una matriz ortogonal, ya que tiene columnas ortonormales, y A está diagonalizada por:

A=SDS^{-1}=SDS^{\textsf {T}}={\begin{bmatrix}1/{\sqrt {2}}&1/{\sqrt {2}}\\-1 /{\sqrt {2}}&1/{\sqrt {2}}\end{bmatrix}}{\begin{bmatrix}1&0\\0&9\end{bmatrix}}{\begin{bmatrix}1/{\sqrt {2}}&-1/{\sqrt {2}}\\1/{\sqrt {2}}&1/{\sqrt {2}}\end{bmatrix}}.

Esto se aplica al problema actual de "diagonalizar" la forma cuadrática mediante la observación de que

5x^{2}+8xy+5y^{2}=\mathbf {x} ^{\textsf {T}}A\mathbf {x} =\mathbf {x} ^{\textsf {T}} \left(SDS^{\textsf {T}}\right)\mathbf {x} =\left(S^{\textsf {T}}\mathbf {x} \right)^{\textsf {T}}D \left(S^{\textsf {T}}\mathbf {x} \right)=1\left({\frac {xy}{\sqrt {2}}}\right)^{2}+9\left ({\frac {x+y}{\sqrt {2}}}\right)^{2}.

Así, la ecuación es la de una elipse, ya que el lado izquierdo se puede escribir como la suma de dos cuadrados. $5x^{2}+8xy+5y^{2}=1$

Es tentador simplificar esta expresión quitando factores de 2. Sin embargo, es importante no hacerlo. Las cantidades

c_{1}={\frac {xy}{\sqrt {2}}},\quad c_{2}={\frac {x+y}{\sqrt {2}}}

tiene un significado geométrico. Determinan un sistema de coordenadas ortonormales en R ² . En otras palabras, se obtienen a partir de las coordenadas originales mediante la aplicación de una rotación (y posiblemente una reflexión). En consecuencia, se pueden utilizar las coordenadas c ₁ y c ₂ para hacer afirmaciones sobre longitudes y ángulos (particularmente longitud), que de otro modo serían más difíciles en una elección diferente de coordenadas (cambiándolas de escala, por ejemplo). Por ejemplo, la distancia máxima desde el origen en la elipse c ₁² + 9 c ₂² = 1 ocurre cuando c ₂ = 0, entonces en los puntos c ₁ = ±1. De manera similar, la distancia mínima es donde c ₂ = ±1/3.

Ahora es posible leer los ejes mayor y menor de esta elipse. Estos son precisamente los espacios propios individuales de la matriz A , ya que en ellos es donde c ₂ = 0 o c ₁ = 0. Simbólicamente, los ejes principales son

E_{1}={\text{span}}\left({\begin{bmatrix}1/{\sqrt {2}}\\-1/{\sqrt {2}}\end{bmatrix} }\right),\quad E_{2}={\text{span}}\left({\begin{bmatrix}1/{\sqrt {2}}\\1/{\sqrt {2}}\end {bmatriz}}\derecha).

Para resumir:

La ecuación es para una elipse, ya que ambos valores propios son positivos. (De lo contrario, si uno fuera positivo y el otro negativo, sería una hipérbola).
Los ejes principales son las líneas atravesadas por los vectores propios.
Las distancias mínima y máxima al origen se pueden leer en la ecuación en forma diagonal.

Con esta información es posible obtener una imagen geométrica clara de la elipse: por ejemplo, graficarla.

Declaración formal

El teorema del eje principal se refiere a las formas cuadráticas en R ⁿ , que son polinomios homogéneos de grado 2. Cualquier forma cuadrática se puede representar como

Q(\mathbf {x} )=\mathbf {x} ^{\textsf {T}}A\mathbf {x}

donde A es una matriz simétrica.

La primera parte del teorema está contenida en los siguientes enunciados garantizados por el teorema espectral:

Los valores propios de A son reales.
A es diagonalizable y los espacios propios de A son mutuamente ortogonales.

En particular, A es diagonalizable ortogonalmente , ya que se puede tomar una base de cada espacio propio y aplicar el proceso de Gram-Schmidt por separado dentro del espacio propio para obtener una base propia ortonormal.

Para la segunda parte, supongamos que los valores propios de A son λ ₁ , ..., λ _n (posiblemente repetidos según sus multiplicidades algebraicas ) y la base propia ortonormal correspondiente es u ₁ , ..., u _n . Entonces,

\mathbf {c} =[\mathbf {u} _{1},\ldots ,\mathbf {u} _{n}]^{\textsf {T}}\mathbf {x} ,

Q(\mathbf {x} )=\lambda _{1}c_{1}^{2}+\lambda _{2}c_{2}^{2}+\dots +\lambda _{n }c_{n}^{2},

donde ci _es la i -ésima entrada de c . Además,

El i - ésimo eje principal es la recta determinada igualando c _j =0 para todos . El i -ésimo eje principal es el tramo del vector u _i .

j=1,\ldots,i-1,i+1,\ldots,n

Ver también

Ley de inercia de Sylvester

Referencias

Strang, Gilbert (1994). Introducción al Álgebra Lineal . Prensa de Wellesley-Cambridge. ISBN 0-9614088-5-5.