stringtranslate.com

Teorema del eje principal

En geometría y álgebra lineal , un eje principal es una determinada línea en un espacio euclidiano asociada a un elipsoide o hiperboloide , generalizando los ejes mayor y menor de una elipse o hipérbola . El teorema del eje principal establece que los ejes principales son perpendiculares y proporciona un procedimiento constructivo para encontrarlos.

Matemáticamente, el teorema del eje principal es una generalización del método de completar el cuadrado del álgebra elemental . En álgebra lineal y análisis funcional , el teorema del eje principal es una contraparte geométrica del teorema espectral . Tiene aplicaciones a la estadística de análisis de componentes principales y la descomposición de valores singulares . En física , el teorema es fundamental para los estudios del momento angular y la birrefringencia .

Motivación

Las ecuaciones en el plano cartesiano R 2 :

definen, respectivamente, una elipse y una hipérbola. En cada caso, los ejes xey son los ejes principales . Esto se ve fácilmente, dado que no hay términos cruzados que involucren productos xy en ninguna de las expresiones. Sin embargo, la situación es más complicada para ecuaciones como

Aquí se requiere algún método para determinar si se trata de una elipse o una hipérbola . La observación básica es que si, al completar el cuadrado, la expresión cuadrática se puede reducir a una suma de dos cuadrados, entonces la ecuación define una elipse, mientras que si se reduce a una diferencia de dos cuadrados, entonces la ecuación representa una hipérbola:

Por lo tanto, en nuestra expresión de ejemplo, el problema es cómo absorber el coeficiente del término cruzado 8 xy en las funciones u y v . Formalmente, este problema es similar al problema de diagonalización de matrices , donde se intenta encontrar un sistema de coordenadas adecuado en el que la matriz de una transformación lineal sea diagonal. El primer paso es encontrar una matriz en la que se pueda aplicar la técnica de diagonalización.

El truco consiste en escribir la forma cuadrática como

donde el término cruzado se ha dividido en dos partes iguales. La matriz A en la descomposición anterior es una matriz simétrica . En particular, según el teorema espectral , tiene valores propios reales y es diagonalizable mediante una matriz ortogonal ( ortogonalmente diagonalizable ).

Para diagonalizar ortogonalmente A , primero se deben encontrar sus valores propios y luego encontrar una base propia ortonormal . El cálculo revela que los valores propios de A son

con sus correspondientes vectores propios

Al dividirlos por sus respectivas longitudes se obtiene una base propia ortonormal:

Ahora la matriz S = [ u 1 u 2 ] es una matriz ortogonal, ya que tiene columnas ortonormales, y A está diagonalizada por:

Esto se aplica al problema actual de "diagonalizar" la forma cuadrática mediante la observación de que

Así, la ecuación es la de una elipse, ya que el lado izquierdo se puede escribir como la suma de dos cuadrados.

Es tentador simplificar esta expresión quitando factores de 2. Sin embargo, es importante no hacerlo. Las cantidades

tiene un significado geométrico. Determinan un sistema de coordenadas ortonormales en R 2 . En otras palabras, se obtienen a partir de las coordenadas originales mediante la aplicación de una rotación (y posiblemente una reflexión). En consecuencia, se pueden utilizar las coordenadas c 1 y c 2 para hacer afirmaciones sobre longitudes y ángulos (particularmente longitud), que de otro modo serían más difíciles en una elección diferente de coordenadas (cambiándolas de escala, por ejemplo). Por ejemplo, la distancia máxima desde el origen en la elipse c 1 2 + 9 c 2 2 = 1 ocurre cuando c 2 = 0, entonces en los puntos c 1 = ±1. De manera similar, la distancia mínima es donde c 2 = ±1/3.

Ahora es posible leer los ejes mayor y menor de esta elipse. Estos son precisamente los espacios propios individuales de la matriz A , ya que en ellos es donde c 2 = 0 o c 1 = 0. Simbólicamente, los ejes principales son

Para resumir:

Con esta información es posible obtener una imagen geométrica clara de la elipse: por ejemplo, graficarla.

Declaración formal

El teorema del eje principal se refiere a las formas cuadráticas en R n , que son polinomios homogéneos de grado 2. Cualquier forma cuadrática se puede representar como

donde A es una matriz simétrica.

La primera parte del teorema está contenida en los siguientes enunciados garantizados por el teorema espectral:

En particular, A es diagonalizable ortogonalmente , ya que se puede tomar una base de cada espacio propio y aplicar el proceso de Gram-Schmidt por separado dentro del espacio propio para obtener una base propia ortonormal.

Para la segunda parte, supongamos que los valores propios de A son λ 1 , ..., λ n (posiblemente repetidos según sus multiplicidades algebraicas ) y la base propia ortonormal correspondiente es u 1 , ..., u n . Entonces,

y

donde ci es la i -ésima entrada de c . Además,

El i - ésimo eje principal es la recta determinada igualando c j =0 para todos . El i -ésimo eje principal es el tramo del vector u i .

Ver también

Referencias