stringtranslate.com

Teorema del eje principal

En geometría y álgebra lineal , un eje principal es una determinada línea en un espacio euclidiano asociada a un elipsoide o hiperboloide , que generaliza los ejes mayor y menor de una elipse o hipérbola . El teorema del eje principal establece que los ejes principales son perpendiculares y proporciona un procedimiento constructivo para encontrarlos.

Matemáticamente, el teorema del eje principal es una generalización del método de completar el cuadrado del álgebra elemental . En álgebra lineal y análisis funcional , el teorema del eje principal es una contraparte geométrica del teorema espectral . Tiene aplicaciones en las estadísticas del análisis de componentes principales y la descomposición en valores singulares . En física , el teorema es fundamental para los estudios del momento angular y la birrefringencia .

Motivación

Las ecuaciones en el plano cartesiano definen , respectivamente, una elipse y una hipérbola. En cada caso, los ejes x e y son los ejes principales. Esto se ve fácilmente, dado que no hay términos cruzados que involucren productos xy en ninguna de las expresiones. Sin embargo, la situación es más complicada para ecuaciones como

Aquí se requiere algún método para determinar si se trata de una elipse o una hipérbola . La observación básica es que si, al completar el cuadrado , la expresión cuadrática se puede reducir a una suma de dos cuadrados, entonces la ecuación define una elipse, mientras que si se reduce a una diferencia de dos cuadrados, entonces la ecuación representa una hipérbola:

Así, en nuestra expresión de ejemplo, el problema es cómo absorber el coeficiente del término cruzado 8 xy en las funciones u y v . Formalmente, este problema es similar al problema de diagonalización de matrices , donde se intenta encontrar un sistema de coordenadas adecuado en el que la matriz de una transformación lineal sea diagonal . El primer paso es encontrar una matriz en la que se pueda aplicar la técnica de diagonalización.

El truco consiste en escribir la forma cuadrática como donde el término cruzado se ha dividido en dos partes iguales. La matriz A en la descomposición anterior es una matriz simétrica . En particular, por el teorema espectral , tiene valores propios reales y es diagonalizable mediante una matriz ortogonal ( diagonalizable ortogonalmente ).

Para diagonalizar ortogonalmente A , primero hay que encontrar sus valores propios y luego encontrar una base propia ortonormal . El cálculo revela que los valores propios de A son

con vectores propios correspondientes

Dividiéndolos por sus respectivas longitudes se obtiene una base propia ortonormal:

Ahora la matriz S = [ u 1 u 2 ] es una matriz ortogonal, ya que tiene columnas ortonormales, y A está diagonalizada por:

Esto se aplica al problema actual de "diagonalizar" la forma cuadrática a través de la observación de que

Por tanto, la ecuación es la de una elipse, ya que el lado izquierdo puede escribirse como la suma de dos cuadrados.

Es tentador simplificar esta expresión extrayendo factores de 2. Sin embargo, es importante no hacerlo. Las cantidades tienen un significado geométrico. Determinan un sistema de coordenadas ortonormales en En otras palabras, se obtienen a partir de las coordenadas originales mediante la aplicación de una rotación (y posiblemente una reflexión). En consecuencia, se pueden usar las coordenadas c 1 y c 2 para hacer afirmaciones sobre la longitud y los ángulos (particularmente la longitud), que de otro modo serían más difíciles en una elección diferente de coordenadas (reescalándolas, por ejemplo). Por ejemplo, la distancia máxima desde el origen en la elipse ocurre cuando c 2 = 0 , por lo que en los puntos c 1 = ±1 . De manera similar, la distancia mínima es donde c 2 = ±1/3 .

Ahora es posible leer los ejes mayor y menor de esta elipse. Éstos son precisamente los espacios propios individuales de la matriz A , ya que son donde c 2 = 0 o c 1 = 0 . Simbólicamente, los ejes principales son

Para resumir:

Con esta información es posible obtener una imagen geométrica clara de la elipse: por ejemplo, graficarla.

Declaración formal

El teorema del eje principal se refiere a las formas cuadráticas en ⁠ ⁠ que son polinomios homogéneos de grado 2. Cualquier forma cuadrática puede representarse como donde A es una matriz simétrica.

La primera parte del teorema está contenida en las siguientes afirmaciones garantizadas por el teorema espectral:

En particular, A es diagonalizable ortogonalmente , ya que se puede tomar una base de cada espacio propio y aplicar el proceso de Gram-Schmidt por separado dentro del espacio propio para obtener una base propia ortonormal.

Para la segunda parte, supongamos que los valores propios de A son λ 1 , ..., λ n (posiblemente repetidos de acuerdo con sus multiplicidades algebraicas ) y la base propia ortonormal correspondiente es u 1 , ..., u n . Entonces, y

donde c i es la i -ésima entrada de c . Además,

El i -ésimo eje principal es la línea determinada al igualar c j = 0 para todo j = 1, ..., i − 1, i + 1, ..., n . El i -ésimo eje principal es el arco del vector u i .

Véase también

Referencias