stringtranslate.com

Teorema de Cayley-Hamilton

Arthur Cayley , FRS (1821–1895) es ampliamente considerado como el principal matemático puro británico del siglo XIX. Cayley en 1848 fue a Dublín para asistir a conferencias sobre cuaterniones impartidas por Hamilton, su descubridor. Posteriormente Cayley lo impresionó al ser el segundo en publicar trabajos sobre ellos. [1] Cayley estableció el teorema para matrices de dimensión 3 o menos y publicó una prueba para el caso bidimensional.
William Rowan Hamilton (1805–1865), físico, astrónomo y matemático irlandés, primer miembro extranjero de la Academia Nacional de Ciencias de Estados Unidos . Si bien mantuvo una posición opuesta sobre cómo se debía estudiar la geometría , Hamilton siempre mantuvo la mejor relación con Cayley. [1]

Hamilton demostró que para una función lineal de cuaterniones existe una determinada ecuación, dependiendo de la función lineal, que es satisfecha por la propia función lineal. [2] [3] [4]

En álgebra lineal , el teorema de Cayley-Hamilton (llamado así por los matemáticos Arthur Cayley y William Rowan Hamilton ) establece que toda matriz cuadrada sobre un anillo conmutativo (como los números reales o complejos o los enteros ) satisface su propia ecuación característica .

Si A es una matriz dada de n  ×  n e In es la matriz identidad de n  ×  n , entonces el polinomio característico de A se define como [5] , donde det es la operación determinante y λ es una variable para un elemento escalar de la anillo base . Dado que las entradas de la matriz son polinomios (lineales o constantes) en λ, el determinante también es un polinomio mónico de grado -n en λ . Se puede crear un polinomio análogo en la matriz A en lugar de la variable escalar λ , definida como The Cayley. –El teorema de Hamilton establece que esta expresión polinómica es igual a la matriz cero , es decir, es decir , el polinomio es un polinomio aniquilador para El teorema permite expresar An como una combinación lineal de las potencias matriciales inferiores de A. Cuando el anillo es un campo , el teorema de Cayley-Hamilton equivale a la afirmación de que el polinomio mínimo de una matriz cuadrada divide su polinomio característico.

Hamilton demostró por primera vez un caso especial del teorema en 1853 [6] en términos de inversas de funciones lineales de cuaterniones . [2] [3] [4] Esto corresponde al caso especial de ciertas matrices 4 × 4 reales o 2 × 2 complejas. Cayley en 1858 declaró el resultado para matrices de 3 × 3 y más pequeñas, pero sólo publicó una prueba para el caso de 2 × 2 . [7] [8] En cuanto a las matrices n  ×  n , Cayley afirmó “..., no he creído necesario emprender el trabajo de una demostración formal del teorema en el caso general de una matriz de cualquier grado”. El caso general fue demostrado por primera vez por Ferdinand Frobenius en 1878. [9]

Ejemplos

matrices 1 × 1

Para una matriz de 1 × 1 A = ( a ) , el polinomio característico viene dado por p ( λ ) = λa , por lo que p ( A ) = ( a ) − a (1) = 0 es trivial.

matrices 2 × 2

Como ejemplo concreto, dejemos

El teorema de Cayley-Hamilton afirma que, si definimos

Para una matriz genérica de 2 × 2 ,

el polinomio característico viene dado por p ( λ ) = λ 2 − ( a + d ) λ + ( adbc ) , por lo que el teorema de Cayley-Hamilton establece que

A 2
Prueba

Aplicaciones

Matriz determinante e inversa

Para una matriz A invertible de n ×  n  general , es decir, una con determinante distinto de cero, A −1 puede escribirse como una expresión polinómica de orden ( n − 1) en A : Como se indicó, el teorema de Cayley-Hamilton equivale a identidad

Los coeficientes ci están dados por los polinomios simétricos elementales de los valores propios de A. Usando identidades de Newton , los polinomios simétricos elementales pueden a su vez expresarse en términos de polinomios simétricos de suma de potencias de los valores propios:

tr( A k )trazaA kcipotenciasA.

En general, la fórmula para los coeficientes c i se da en términos de polinomios de Bell exponenciales completos como [nb 1]

En particular, el determinante de A es igual a (−1) n c 0 . Por tanto, el determinante se puede escribir como la identidad de la traza :

Asimismo, el polinomio característico se puede escribir como

A −1−(−1) n = (−1) n −1inversoA

Otro método para obtener estos coeficientes c k para una matriz general n  ×  n , siempre que ninguna raíz sea cero, se basa en la siguiente expresión alternativa para el determinante ,

serie de Mercator
soloλ np ( λ )nλnúmeros racionalesLa diferenciaciónλnm  ×  m[nb 2]
Ejemplos

Por ejemplo, los primeros polinomios de Bell son B 0 = 1, B 1 ( x 1 ) = x 1 , B 2 ( x 1 , x 2 ) = x2
1
+ x 2
y B 3 ( x 1 , x 2 , x 3 ) = x3
1
+ 3 x 1 x 2 + x 3
.

Al usarlos para especificar los coeficientes ci del polinomio característico de una matriz de 2 × 2 se obtiene

El coeficiente c 0 da el determinante de la matriz 2 × 2 , c 1 menos su traza, mientras que su inversa viene dada por

De la fórmula general para c nk , expresada en términos de polinomios de Bell, se desprende que las expresiones

Siempre dé los coeficientes c n −1 de λ n −1 y c n −2 de λ n −2 en el polinomio característico de cualquier matriz n  ×  n , respectivamente. Entonces, para una matriz A de 3 × 3 , el enunciado del teorema de Cayley-Hamilton también se puede escribir como

de 3 × 3n = 3
c n −3λ n −3

De manera similar, se puede escribir para una matriz A de 4 × 4 ,

donde ahora el determinante es c n −4 ,

y así sucesivamente para matrices más grandes. Las expresiones cada vez más complejas para los coeficientes c k se pueden deducir de las identidades de Newton o del algoritmo de Faddeev-LeVerrier .

n -ésima potencia de la matriz

El teorema de Cayley-Hamilton siempre proporciona una relación entre las potencias de A (aunque no siempre es la más simple), lo que permite simplificar expresiones que involucran tales potencias y evaluarlas sin tener que calcular la potencia An o cualquier potencia superior de A. .

Como ejemplo, para el teorema da

Luego, para calcular A 4 , observe

Observe que hemos podido escribir la potencia matricial como la suma de dos términos. De hecho, la potencia matricial de cualquier orden k se puede escribir como un polinomio matricial de grado como máximo n − 1 , donde n es el tamaño de una matriz cuadrada. Este es un ejemplo en el que se puede utilizar el teorema de Cayley-Hamilton para expresar una función matricial, que analizaremos sistemáticamente a continuación.

Funciones matriciales

Dada una función analítica

p ( x )nA de n  ×  n
q ( x )r ( x )0 ≤ grados r ( x ) < n

Según el teorema de Cayley-Hamilton, reemplazar x por la matriz A da p ( A ) = 0 , por lo que se tiene

Por tanto, la función analítica de la matriz A se puede expresar como un polinomio matricial de grado menor que n .

Sea el polinomio restante

p ( λ ) = 0f ( x )nA
n ecuaciones linealesci

Cuando los valores propios se repiten, es decir, λ i = λ j para algunos i ≠ j , dos o más ecuaciones son idénticas; y por tanto las ecuaciones lineales no pueden resolverse de forma única. Para tales casos, para un valor propio λ con multiplicidad m , las primeras m – 1 derivadas de p ( x ) desaparecen en el valor propio. Esto conduce a m – 1 soluciones linealmente independientes adicionales.

nc i

Encontrar un polinomio que pase por los puntos ( λ i ,   f  ( λ i )) es esencialmente un problema de interpolación y puede resolverse utilizando técnicas de interpolación de Lagrange o Newton , lo que conduce a la fórmula de Sylvester .

Por ejemplo, supongamos que la tarea es encontrar la representación polinómica de

El polinomio característico es p ( x ) = ( x − 1)( x − 3) = x 2 − 4 x + 3 , y los valores propios son λ = 1, 3 . Sea r ( x ) = c 0 + c 1 x . Al evaluar f ( λ ) = r ( λ ) en los valores propios, se obtienen dos ecuaciones lineales, e t = c 0 + c 1 y e 3 t = c 0 + 3 c 1 .

Al resolver las ecuaciones se obtiene c 0 = (3 e te 3 t )/2 y c 1 = ( e 3 te t )/2 . Así, se deduce que

Si, en cambio, la función fuera f ( A ) = sin At , entonces los coeficientes habrían sido c 0 = (3 sin t − sin 3 t )/2 y c 1 = (sin 3 t − sin t )/2 ; por eso

Como ejemplo adicional, al considerar

p ( x ) = x 2  + 1λ = ± i

Como antes, evaluar la función en los valores propios nos da las ecuaciones lineales e it = c 0 + ic 1 y e it = c 0ic 1 ; cuya solución da, c 0 = ( e it + e it )/2 = cos  t y c 1 = ( e ite it )/2 i = sin  t . Así, para este caso,

matriz de rotación

Un ejemplo estándar de tal uso es el mapa exponencial del álgebra de Lie de una matriz del grupo de Lie en el grupo. Está dada por una matriz exponencial ,

SU(2)
σmatrices de PauliSO(3)
la fórmula de rotación de Rodriguesla nota del grupo de rotación 3D#A sobre álgebras de Lie

Más recientemente, han aparecido expresiones para otros grupos, como el grupo de Lorentz SO(3, 1) , [10] O(4, 2) [11] y SU(2, 2) , [12] así como GL( n , R ) . [13] El grupo O(4, 2) es el grupo conforme del espacio-tiempo , SU(2, 2) su cubierta simplemente conexa (para ser precisos, la cubierta simplemente conexa del componente conectado SO + (4, 2) de O (4, 2) ). Las expresiones obtenidas se aplican a la representación estándar de estos grupos. Requieren conocimiento de (algunos de) los valores propios de la matriz para exponenciar. Para SU(2) (y por tanto para SO(3) ), se han obtenido expresiones cerradas para todas las representaciones irreducibles, es decir, de cualquier espín. [14]

Ferdinand Georg Frobenius (1849-1917), matemático alemán. Sus principales intereses eran las funciones elípticas , las ecuaciones diferenciales y, más tarde, la teoría de grupos .
En 1878 presentó la primera demostración completa del teorema de Cayley-Hamilton. [9]

Teoría algebraica de números

El teorema de Cayley-Hamilton es una herramienta eficaz para calcular el polinomio mínimo de números enteros algebraicos . Por ejemplo, dada una extensión finita de y un entero algebraico que es una combinación lineal distinta de cero de podemos calcular el polinomio mínimo de encontrando una matriz que represente la transformación lineal

[15]

Pruebas

El teorema de Cayley-Hamilton es una consecuencia inmediata de la existencia de la forma normal de Jordan para matrices sobre campos algebraicamente cerrados , ver Forma normal de Jordan § Teorema de Cayley-Hamilton . En esta sección se presentan pruebas directas.

Como muestran los ejemplos anteriores, obtener el enunciado del teorema de Cayley-Hamilton para una matriz n  ×  n

cit del

y luego estos coeficientes se utilizan en una combinación lineal de potencias de A que se equipara a la matriz cero n  ×  n :

El lado izquierdo se puede resolver en una matriz n  ×  n cuyas entradas son expresiones polinómicas (enormes) en el conjunto de entradas a i , j de A , por lo que el teorema de Cayley-Hamilton establece que cada una de estas n 2 expresiones es igual 0 . Para cualquier valor fijo de n , estas identidades se pueden obtener mediante manipulaciones algebraicas tediosas pero sencillas. Sin embargo, ninguno de estos cálculos puede mostrar por qué el teorema de Cayley-Hamilton debería ser válido para matrices de todos los tamaños posibles n , por lo que se necesita una prueba uniforme para todos los n .

Preliminares

Si un vector v de tamaño n es un vector propio de A con valor propio λ , en otras palabras, si Av = λv , entonces

p ( λ ) = 0Araícesp ( t )λAbaseAdiagonalizableA

Consideremos ahora la función que asigna matrices n  ×  n a matrices n  ×  n dadas por la fórmula , es decir, que toma una matriz y la reemplaza en su propio polinomio característico. No todas las matrices son diagonalizables, pero para matrices con coeficientes complejos muchas de ellas lo son: el conjunto de matrices cuadradas complejas diagonalizables de un tamaño dado es denso en el conjunto de todas esas matrices cuadradas [16] (para que una matriz sea diagonalizable basta por ejemplo que su polinomio característico no tenga raíces múltiples ). Ahora vista como una función (dado que las matrices tienen entradas) vemos que esta función es continua . Esto es cierto porque las entradas de la imagen de una matriz están dadas por polinomios en las entradas de la matriz. Desde

y dado que el conjunto es denso, por continuidad esta función debe asignar todo el conjunto de matrices n  ×  n a la matriz cero. Por lo tanto, el teorema de Cayley-Hamilton es válido para números complejos y, por lo tanto, también debe ser válido para matrices con valores - o - .

Si bien esto proporciona una prueba válida, el argumento no es muy satisfactorio, ya que las identidades representadas por el teorema no dependen de ninguna manera de la naturaleza de la matriz (diagonalizable o no), ni del tipo de entradas permitidas (para matrices con entradas reales (las diagonalizables no forman un conjunto denso, y parece extraño que haya que considerar matrices complejas para ver que el teorema de Cayley-Hamilton se cumple para ellas). Por lo tanto, ahora consideraremos sólo argumentos que prueban el teorema directamente para cualquier matriz utilizando únicamente manipulaciones algebraicas; estos también tienen la ventaja de funcionar para matrices con entradas en cualquier anillo conmutativo .

Existe una gran variedad de demostraciones de este tipo del teorema de Cayley-Hamilton, de las cuales se darán varias aquí. Varían en la cantidad de nociones algebraicas abstractas necesarias para comprender la demostración. Las demostraciones más simples utilizan sólo aquellas nociones necesarias para formular el teorema (matrices, polinomios con entradas numéricas, determinantes), pero implican cálculos técnicos que hacen un tanto misterioso el hecho de que conduzcan precisamente a la conclusión correcta. Es posible evitar tales detalles, pero al precio de involucrar nociones algebraicas más sutiles: polinomios con coeficientes en un anillo no conmutativo o matrices con tipos inusuales de entradas.

Matrices adjuntas

Todas las pruebas a continuación utilizan la noción de matriz adjunta adj ( M ) de una matriz M de n  ×  n , la transpuesta de su matriz cofactor . Esta es una matriz cuyos coeficientes están dados por expresiones polinómicas en los coeficientes de M (de hecho, por ciertos ( n − 1) × ( n − 1) determinantes), de tal manera que se cumplen las siguientes relaciones fundamentales,

( i , j )jMijdet( M )i = j

Al ser una consecuencia de la manipulación de expresiones algebraicas, estas relaciones son válidas para matrices con entradas en cualquier anillo conmutativo (se debe asumir la conmutatividad para que los determinantes se definan en primer lugar). Es importante tener esto en cuenta aquí, porque estas relaciones se aplicarán a continuación para matrices con entradas no numéricas, como polinomios.

Una prueba algebraica directa

Esta prueba utiliza exactamente el tipo de objetos necesarios para formular el teorema de Cayley-Hamilton: matrices con polinomios como entradas. La matriz t I nA cuyo determinante es el polinomio característico de A es una de esas matrices, y dado que los polinomios forman un anillo conmutativo, tiene un conjugado

Dado que B también es una matriz con polinomios en t como entradas, se pueden, para cada i , recopilar los coeficientes de ti en cada entrada para formar una matriz B i de números, de modo que se tenga

Bt n −1parecenti se

Ahora, se puede expandir el producto matricial en nuestra ecuación por bilinealidad:

Escribiendo

t

Tal igualdad sólo puede ser válida si en cualquier posición de la matriz la entrada que se multiplica por una potencia dada ti es la misma en ambos lados; de ello se deduce que las matrices constantes con coeficiente t i en ambas expresiones deben ser iguales. Al escribir estas ecuaciones para i desde n hasta 0, se encuentra

Finalmente, multiplica la ecuación de los coeficientes de ti desde la izquierda por Ai y suma:

Los lados de la izquierda forman una suma telescópica y se cancelan por completo; los lados derechos suman :

Una prueba usando polinomios con coeficientes matriciales.

Esta prueba es similar a la primera, pero intenta dar significado a la noción de polinomio con coeficientes matriciales que fue sugerida por las expresiones que aparecen en esa prueba. Esto requiere mucho cuidado, ya que es algo inusual considerar polinomios con coeficientes en un anillo no conmutativo, y no todo el razonamiento válido para polinomios conmutativos se puede aplicar en este contexto.

En particular, si bien la aritmética de polinomios sobre un anillo conmutativo modela la aritmética de funciones polinómicas , este no es el caso sobre un anillo no conmutativo (de hecho, no existe una noción obvia de función polinómica en este caso que esté cerrada bajo multiplicación). Entonces, al considerar polinomios en t con coeficientes matriciales, la variable t no debe considerarse como una "incógnita", sino como un símbolo formal que debe manipularse de acuerdo con reglas dadas; en particular, no se puede simplemente establecer t en un valor específico.

Sea el anillo de matrices n  ×  n con entradas en algún anillo R (como los números reales o complejos) que tiene A como elemento. Las matrices con polinomios como coeficientes en t , como o su adjunto B en la primera prueba, son elementos de .

Al recopilar potencias similares de t , dichas matrices se pueden escribir como "polinomios" en t con matrices constantes como coeficientes; escriba para el conjunto de tales polinomios. Dado que este conjunto está en biyección con , se definen las operaciones aritméticas en él de manera correspondiente, en particular la multiplicación viene dada por

Así, la identidad

En este punto, es tentador simplemente establecer t igual a la matriz A , lo que hace que el primer factor de la izquierda sea igual a la matriz cero y el lado derecho sea igual a p ( A ) ; sin embargo, esta no es una operación permitida cuando los coeficientes no conmutan. Es posible definir un "mapa de evaluación de la derecha" ev A  : M [ t  ] → M , que reemplaza cada ti por la potencia de la matriz Ai de A , donde se estipula que la potencia siempre debe multiplicarse por la derecha al coeficiente correspondiente. Pero esta aplicación no es un homomorfismo en anillo : la evaluación correcta de un producto difiere en general del producto de las evaluaciones correctas. Esto es así porque la multiplicación de polinomios con coeficientes matriciales no modela la multiplicación de expresiones que contienen incógnitas: un producto se define suponiendo que t conmuta con N , pero esto puede fallar si t se reemplaza por la matriz A.

Se puede solucionar esta dificultad en la situación particular que nos ocupa, ya que el mapa de evaluación derecha anterior se convierte en un homomorfismo de anillo si la matriz A está en el centro del anillo de coeficientes, de modo que conmuta con todos los coeficientes de los polinomios. (El argumento que demuestra esto es sencillo, exactamente porque conmutar t con coeficientes ahora se justifica después de la evaluación).

Ahora bien, A no siempre está en el centro de M , pero podemos reemplazar M con un anillo más pequeño siempre que contenga todos los coeficientes de los polinomios en cuestión: , A , y los coeficientes del polinomio B. La elección obvia para tal subanillo es el centralizador Z de A , el subanillo de todas las matrices que conmutan con A ; por definición A está en el centro de Z.

Este centralizador obviamente contiene , y A , pero hay que demostrar que contiene las matrices . Para ello, se combinan las dos relaciones fundamentales para los conjugados, escribiendo el conjugado B como un polinomio:

La equiparación de los coeficientes muestra que para cada i , tenemos AB i = B i A como se desea. Habiendo encontrado la configuración adecuada en la que ev A es de hecho un homomorfismo de anillos, se puede completar la prueba como se sugirió anteriormente:

Una síntesis de las dos primeras pruebas.

En la primera prueba, se pudieron determinar los coeficientes B i de B basándose en la relación fundamental de la derecha únicamente para el conjugado. De hecho, las primeras n ecuaciones derivadas pueden interpretarse como la determinación del cociente B de la división euclidiana del polinomio p ( t ) In a la izquierda por el polinomio mónico In tA , mientras que la ecuación final expresa el hecho de que el el resto es cero. Esta división se realiza en el anillo de polinomios con coeficientes matriciales. De hecho, incluso en un anillo no conmutativo, la división euclidiana por un polinomio mónico P está definida y siempre produce un único cociente y resto con la misma condición de grado que en el caso conmutativo, siempre que se especifique en qué lado se desea que P ser un factor (aquí eso está a la izquierda).

Para ver que el cociente y el resto son únicos (que es la parte importante del enunciado aquí), basta escribir como y observar que como P es mónico, P ( QQ ′) no puede tener un grado menor que el de P , a menos que Q = Q .

Pero el dividendo p ( t ) I n y el divisor In tA utilizados aquí se encuentran en el subanillo ( R [ A ]) [ t ] , donde R [ A ] es el subanillo del anillo de matriz M ( n , R ) generado por A : el R -spano lineal de todas las potencias de A . Por lo tanto, la división euclidiana se puede realizar dentro de ese anillo polinómico conmutativo y, por supuesto, da el mismo cociente B y resto 0 que en el anillo más grande; en particular, esto muestra que B de hecho se encuentra en ( R [ A ]) [ t ] .

Pero, en este escenario conmutativo, es válido establecer t en A en la ecuación

es decir, aplicar el mapa de evaluación

que es un homomorfismo de anillo, dando

como en la segunda prueba, como se desee.

Además de demostrar el teorema, el argumento anterior nos dice que los coeficientes B i de B son polinomios en A , mientras que por la segunda prueba sólo sabíamos que se encuentran en el centralizador Z de A ; en general , Z es un subanillo más grande que R [ A ] y no necesariamente conmutativo. En particular, el término constante B 0 = adj(− A ) se encuentra en R [ A ] . Dado que A es una matriz cuadrada arbitraria, esto demuestra que adj( A ) siempre se puede expresar como un polinomio en A (con coeficientes que dependen de A ) .

De hecho, las ecuaciones encontradas en la primera prueba permiten expresar sucesivamente como polinomios en A , lo que conduce a la identidad

válido para todas las matrices n  ×  n , donde

A

Tenga en cuenta que esta identidad también implica el enunciado del teorema de Cayley-Hamilton: uno puede mover adj(− A ) hacia el lado derecho, multiplicar la ecuación resultante (a la izquierda o a la derecha) por A y usar el hecho de que

Una prueba utilizando matrices de endomorfismos.

Como se mencionó anteriormente, la matriz p ( A ) en el enunciado del teorema se obtiene evaluando primero el determinante y luego sustituyendo la matriz A por t ; hacer esa sustitución en la matriz antes de evaluar el determinante no tiene sentido. Sin embargo, es posible dar una interpretación donde p ( A ) se obtenga directamente como el valor de un determinado determinante, pero esto requiere un escenario más complicado, uno de matrices sobre un anillo en el que se puedan interpretar ambas entradas de A , y todo el propio A. Se podría tomar para esto el anillo M ( n , R ) de matrices n  ×  n sobre R , donde la entrada se realiza como , y A como sí mismo. Pero considerar matrices con matrices como entradas podría causar confusión con matrices de bloques , lo cual no es intencionado, ya que da una noción errónea de determinante (recordemos que el determinante de una matriz se define como la suma de los productos de sus entradas, y en el caso de una matriz de bloques, esto generalmente no es lo mismo que la correspondiente suma de productos de sus bloques). Es más claro distinguir A del endomorfismo φ de un espacio vectorial n - dimensional V (o módulo R libre si R no es un campo) definido por él en una base , y tomar matrices sobre el anillo End( V ) de todos esos endomorfismos. Entonces φ ∈ End( V ) es una posible entrada matricial, mientras que A designa el elemento de M ( n , End( V )) cuya entrada i ,  j es el endomorfismo de la multiplicación escalar por ; de manera similar se interpretará como elemento de M ( n , End( V )) . Sin embargo, dado que End( V ) no es un anillo conmutativo, no se define ningún determinante en M ( n , End( V )) ; esto solo se puede hacer para matrices sobre un subanillo conmutativo de End( V ) . Ahora todas las entradas de la matriz se encuentran en el subanillo. R [ φ ] generado por la identidad y φ , que es conmutativo. Luego se defineun mapa determinante M ( n , R [ φ ]) → R [ φ ] , y se evalúa como el valor p ( φ ) del polinomio característico de A en φ (esto se cumple independientemente de la relación entre A y φ ) ; el teorema de Cayley-Hamilton establece que p ( φ ) es el endomorfismo nulo.

De esta forma, se puede obtener la siguiente prueba de la de Atiyah y MacDonald (1969, Prop. 2.4) (que de hecho es la afirmación más general relacionada con el lema de Nakayama ; se toma como ideal en esa proposición el anillo completo R ). El hecho de que A sea la matriz de φ en la base e 1 , ..., e n significa que

nV nM ( n , End( V )) × V nV nψ ∈ End( V )vV
ie ie 1 , ..., e nV
transpuestaM ( n , R [ φ ]))pφp ( φ ) = 0 ∈ End( V )matriz conjugadaM ( n , R [ φ ] )
asociatividadip ( φ )( e i ) = 0 ∈ Vp ( φ )los e iVp ( φ ) = 0 ∈ End( V )

Un hecho adicional que se desprende de esta prueba es que la matriz A cuyo polinomio característico se toma no necesita ser idéntica al valor φ sustituido en ese polinomio; basta con que φ sea un endomorfismo de V que satisfaga las ecuaciones iniciales

algunae 1 , ..., e nVnRmódulo libre

Una "prueba" falsa: p ( A ) = det( AI n − A ) = det( A − A ) = 0

Un argumento persistente elemental pero incorrecto [17] a favor del teorema es "simplemente" tomar la definición

Aλ

Hay muchas maneras de ver por qué este argumento es incorrecto. Primero, en el teorema de Cayley-Hamilton, p ( A ) es una matriz de n × n . Sin embargo, el lado derecho de la ecuación anterior es el valor de un determinante, que es un escalar . Por lo tanto, no pueden equipararse a menos que n = 1 (es decir, A sea simplemente un escalar). En segundo lugar, en la expresión , la variable λ en realidad ocurre en las entradas diagonales de la matriz . Para ilustrar, considere nuevamente el polinomio característico del ejemplo anterior:

Si se sustituye toda la matriz A por λ en esas posiciones, se obtiene

en el que la expresión "matriz" simplemente no es válida. Tenga en cuenta, sin embargo, que si en lo anterior se restan múltiplos escalares de matrices identidad en lugar de escalares, es decir, si la sustitución se realiza como

entonces el determinante es efectivamente cero, pero la matriz expandida en cuestión no se evalúa como ; ni su determinante (un escalar) puede compararse con p ( A ) (una matriz). Entonces el argumento que aún no se aplica.

En realidad, si tal argumento es válido, también debería serlo cuando se utilizan otras formas multilineales en lugar de determinantes. Por ejemplo, si consideramos la función permanente y definimos , entonces, con el mismo argumento, deberíamos poder "probar" que q ( A ) = 0 . Pero esta afirmación es claramente errónea: en el caso bidimensional, por ejemplo, el permanente de una matriz viene dado por

Entonces, para la matriz A del ejemplo anterior,

Sin embargo, se puede comprobar que

Una de las demostraciones anteriores del teorema de Cayley-Hamilton tiene cierta similitud con el argumento de que . Al introducir una matriz con coeficientes no numéricos, se puede dejar que A viva dentro de una entrada de la matriz, pero luego no es igual a A y se llega a la conclusión de manera diferente.

Pruebas utilizando métodos de álgebra abstracta.

Gatto y Salehyan (2016, §4) han utilizado las propiedades básicas de las derivaciones de Hasse-Schmidt en el álgebra exterior de algún B - módulo M (supuestamente libre y de rango finito) para demostrar el teorema de Cayley-Hamilton. Véase también Gatto y Scherbak (2015).

Abstracción y generalizaciones

Las pruebas anteriores muestran que el teorema de Cayley-Hamilton se cumple para matrices con entradas en cualquier anillo conmutativo R , y que p ( φ ) = 0 se cumplirá siempre que φ sea un endomorfismo de un R -módulo generado por elementos e 1 ,... , y que satisface

Esta versión más general del teorema es la fuente del célebre lema de Nakayama en álgebra conmutativa y geometría algebraica .

El teorema de Cayley-Hamilton también se cumple para matrices sobre los cuaterniones , un anillo no conmutativo . [18] [nota 3]

Ver también

Observaciones

  1. ^ Ver sección. 2 de Krivoruchenko (2016). Kondratyuk y Krivoruchenko (1992) proporcionan una expresión explícita para los coeficientes ci :
    donde la suma se toma sobre los conjuntos de todas las particiones enteras k l ≥ 0 que satisfacen la ecuación
  2. ^ Véase, por ejemplo, pág. 54 de Brown 1994, que resuelve la fórmula de Jacobi ,
    donde B es la matriz adjunta de la siguiente sección. También existe un algoritmo recursivo relacionado equivalente introducido por Urbain Le Verrier y Dmitry Konstantinovich Faddeev : el algoritmo Faddeev-LeVerrier , que dice
    (ver, por ejemplo, Gantmacher 1960, p. 88.) Observe A −1 = − M n / c 0 cuando termina la recursividad. Consulte la prueba algebraica en la siguiente sección, que se basa en los modos del conjugado, B kM nk . Específicamente, y la derivada anterior de p cuando se rastrea produce
    (Hou 1998), y las recursiones anteriores, a su vez.
  3. ^ Debido a la naturaleza no conmutativa de la operación de multiplicación de cuaterniones y construcciones relacionadas, se debe tener cuidado con las definiciones, sobre todo en este contexto, del determinante. El teorema también es válido para los cuaterniones divididos que se comportan ligeramente menos bien , ver Alagös, Oral & Yüce (2012). Los anillos de cuaterniones y cuaterniones divididos pueden representarse mediante ciertas matrices complejas de 2 × 2 . (Cuando se restringe a la norma unitaria, estos son los grupos SU(2) y SU(1,1) respectivamente). Por lo tanto, no es sorprendente que el teorema se cumpla.
    No existe tal representación matricial para los octoniones , ya que la operación de multiplicación no es asociativa en este caso. Sin embargo, un teorema de Cayley-Hamilton modificado todavía es válido para los octoniones, ver Tian (2000).

Notas

  1. ^ ab Crilly 1998
  2. ^ ab Hamilton 1864a
  3. ^ ab Hamilton 1864b
  4. ^ ab Hamilton 1862
  5. ^ Atiyah y MacDonald 1969
  6. ^ Hamilton 1853, pag. 562
  7. ^ Cayley 1858, págs. 17-37
  8. ^ Cayley 1889, págs. 475–496
  9. ^ ab Frobenius 1878
  10. ^ Zeni y Rodrigues 1992
  11. ^ Barut, Zeni y Laufer 1994a
  12. ^ Barut, Zeni y Laufer 1994b
  13. ^ Laufer 1997
  14. ^ Curtright, Fairlie y Zachos 2014
  15. ^ Stein, William. Teoría algebraica de números, un enfoque computacional (PDF) . pag. 29.
  16. ^ Bhatia 1997, pag. 7
  17. ^ Garrett 2007, pag. 381
  18. ^ Zhang 1997

Referencias

enlaces externos