En álgebra lineal , la traza de una matriz cuadrada A , denotada tr( A ) , [1] se define como la suma de elementos en la diagonal principal ( de la parte superior izquierda a la inferior derecha) de A. La traza solo se define para una matriz cuadrada ( n × n ).
En los textos de física matemática, si tr( A ) = 0 entonces se dice que la matriz no tiene trazas . Este es un nombre inapropiado, pero ampliamente utilizado, como en las Matrices de Pauli .
Se puede demostrar que la traza de una matriz es la suma de sus valores propios (contados con multiplicidades). También se puede demostrar que tr( AB ) = tr( BA ) para dos matrices cualesquiera A y B de tamaños apropiados. Esto implica que matrices similares tienen la misma traza. Como consecuencia, se puede definir la traza de un operador lineal que mapea un espacio vectorial de dimensión finita en sí mismo, ya que todas las matrices que describen dicho operador con respecto a una base son similares.
La traza está relacionada con la derivada del determinante (ver fórmula de Jacobi ).
La traza de una matriz cuadrada A de n × n se define como [1] [2] [3] : 34 donde a ii denota la entrada en la i- ésima fila y la i -ésima columna de A. Las entradas de A pueden ser números reales , números complejos o, más generalmente, elementos de un campo F. La traza no está definida para matrices no cuadradas.
Sea A una matriz, con
Entonces
La traza es un mapeo lineal . Es decir, [1] [2] para todas las matrices cuadradas A y B , y todos los escalares c . [3] : 34
Una matriz y su transpuesta tienen la misma traza: [1] [2] [3] : 34
Esto se desprende inmediatamente del hecho de que la transposición de una matriz cuadrada no afecta a los elementos a lo largo de la diagonal principal.
La traza de una matriz cuadrada que es el producto de dos matrices se puede reescribir como la suma de los productos por entradas de sus elementos, es decir, como la suma de todos los elementos de su producto de Hadamard . Dicho directamente, si A y B son dos matrices m × n , entonces:
Si uno ve cualquier matriz real de m × n como un vector de longitud mn (una operación llamada vectorización ), entonces la operación anterior en A y B coincide con el producto escalar estándar . Según la expresión anterior, tr( A ⊤ A ) es una suma de cuadrados y, por tanto, no es negativa, igual a cero si y sólo si A es cero. [4] : 7 Además, como se indica en la fórmula anterior, tr( A ⊤ B ) = tr( B ⊤ A ) . Estos demuestran la definición positiva y la simetría requeridas de un producto interno ; es común llamar a tr( A ⊤ B ) el producto interno de Frobenius de A y B. Este es un producto interno natural en el espacio vectorial de todas las matrices reales de dimensiones fijas. La norma derivada de este producto interno se llama norma de Frobenius y satisface una propiedad submultiplicativa, como se puede demostrar con la desigualdad de Cauchy-Schwarz : si A y B son matrices semidefinidas positivas reales del mismo tamaño. El producto interno y la norma de Frobenius surgen con frecuencia en el cálculo matricial y la estadística .
El producto interno de Frobenius puede extenderse a un producto interno hermitiano en el espacio vectorial complejo de todas las matrices complejas de un tamaño fijo, reemplazando B por su conjugado complejo .
La simetría del producto interno de Frobenius se puede expresar de manera más directa de la siguiente manera: las matrices en la traza de un producto se pueden cambiar sin cambiar el resultado. Si A y B son m × n y n × m matrices reales o complejas, respectivamente, entonces [1] [2] [3] : 34 [nota 1]
Esto es notable tanto por el hecho de que AB no suele ser igual a BA , como también porque la traza de cualquiera de los dos no suele ser igual a tr( A )tr( B ) . [nota 2] La invariancia de similitud de la traza, lo que significa que tr( A ) = tr( P −1 AP ) para cualquier matriz cuadrada A y cualquier matriz invertible P de las mismas dimensiones, es una consecuencia fundamental. Esto se demuestra por que la invariancia de similitud es la propiedad crucial de la traza para poder analizar las trazas de transformaciones lineales como se muestra a continuación.
Además, para vectores de columna reales y , la traza del producto exterior es equivalente al producto interior:
De manera más general, la traza es invariante bajo cambios circulares , es decir,
Esto se conoce como propiedad cíclica .
No se permiten permutaciones arbitrarias: en general,
Sin embargo, si se consideran productos de tres matrices simétricas se permite cualquier permutación, ya que: donde la primera igualdad es porque las trazas de una matriz y su transpuesta son iguales. Tenga en cuenta que esto no es cierto en general para más de tres factores.
La traza del producto de Kronecker de dos matrices es el producto de sus trazas:
Las siguientes tres propiedades: caracterizan la traza hasta un múltiplo escalar en el siguiente sentido: Si es un funcional lineal en el espacio de matrices cuadradas que satisfacen entonces y son proporcionales. [nota 3]
Para matrices, imponer la normalización iguala la traza.
Dada cualquier matriz A de n × n , existe
donde λ 1 , ..., λ n son los valores propios de A contados con multiplicidad. Esto es válido incluso si A es una matriz real y algunos (o todos) los valores propios son números complejos. Esto puede considerarse como una consecuencia de la existencia de la forma canónica de Jordan , junto con la similitud-invariancia de la traza discutida anteriormente.
Cuando tanto A como B son matrices n × n , la traza del conmutador (teórico de anillo) de A y B desaparece: tr([ A , B ]) = 0 , porque tr( AB ) = tr( BA ) y tr es lineal. Se puede afirmar esto como "la traza es un mapa de álgebras de Lie gl n → k de operadores a escalares", ya que el conmutador de escalares es trivial (es un álgebra de Lie abeliana ). En particular, utilizando la invariancia de similitud, se deduce que la matriz identidad nunca es similar al conmutador de ningún par de matrices.
Por el contrario, cualquier matriz cuadrada con traza cero es una combinación lineal de los conmutadores de pares de matrices. [nota 4] Además, cualquier matriz cuadrada con traza cero es unitariamente equivalente a una matriz cuadrada con una diagonal compuesta exclusivamente de ceros.
Esto lleva a generalizaciones de dimensión utilizando trace .
Cuando la característica del campo base es cero, lo contrario también se cumple: si tr( A k ) = 0 para todo k , entonces A es nilpotente.
Cuando la característica n > 0 es positiva, la identidad en n dimensiones es un contraejemplo, como , pero la identidad no es nilpotente.La traza de una matriz es el coeficiente de en el polinomio característico , posiblemente cambiado de signo, según la convención en la definición del polinomio característico.
Si A es un operador lineal representado por una matriz cuadrada con entradas reales o complejas y si λ 1 , ..., λ n son los valores propios de A (enumerados según sus multiplicidades algebraicas ), entonces
Esto se desprende del hecho de que A es siempre similar a su forma de Jordan , una matriz triangular superior que tiene λ 1 , ..., λ n en la diagonal principal. En contraste, el determinante de A es el producto de sus valores propios; eso es,
Todo lo expuesto en la presente sección se aplica también a cualquier matriz cuadrada con coeficientes en un campo algebraicamente cerrado .
Si ΔA es una matriz cuadrada con entradas pequeñas e I denota la matriz identidad , entonces tenemos aproximadamente
Precisamente esto significa que la traza es la derivada de la función determinante en la matriz identidad. la fórmula de jacobi
es más general y describe el diferencial del determinante en una matriz cuadrada arbitraria, en términos de la traza y el adjunto de la matriz.
De esto (o de la conexión entre la traza y los valores propios), se puede derivar una relación entre la función traza, la función exponencial matricial y el determinante:
Una caracterización relacionada de la traza se aplica a los campos vectoriales lineales . Dada una matriz A , defina un campo vectorial F en R n mediante F ( x ) = Ax . Los componentes de este campo vectorial son funciones lineales (dadas por las filas de A ). Su divergencia div F es una función constante, cuyo valor es igual a tr( A ) .
Según el teorema de divergencia , se puede interpretar esto en términos de flujos: si F ( x ) representa la velocidad de un fluido en la ubicación x y U es una región en R n , el flujo neto del fluido que sale de U viene dado por tr ( A ) · vol( U ) , donde vol( U ) es el volumen de U .
La traza es un operador lineal, por lo tanto conmuta con la derivada:
En general, dado algún mapa lineal f : V → V (donde V es un espacio vectorial de dimensión finita ), podemos definir la traza de este mapa considerando la traza de una representación matricial de f , es decir, eligiendo una base para V y describiendo f como una matriz relativa a esta base, y tomando la traza de esta matriz cuadrada. El resultado no dependerá de la base elegida, ya que diferentes bases darán lugar a matrices similares , permitiendo la posibilidad de una definición independiente de la base para la traza de un mapa lineal.
Tal definición se puede dar usando el isomorfismo canónico entre el espacio End( V ) de aplicaciones lineales en V y V ⊗ V * , donde V * es el espacio dual de V . Sea v en V y g en V * . Entonces la traza del elemento indescomponible v ⊗ g se define como g ( v ) ; la traza de un elemento general está definida por la linealidad. La traza de una aplicación lineal f : V → V puede entonces definirse como la traza, en el sentido anterior, del elemento de V ⊗ V * correspondiente a f según el isomorfismo canónico mencionado anteriormente. Usando una base explícita para V y la base dual correspondiente para V * , se puede demostrar que esto da la misma definición de la traza que se dio anteriormente.
La traza puede estimarse de forma imparcial mediante el "truco de Hutchinson": [5]
Dada cualquier matriz y cualquier aleatorio con , tenemos . (Prueba: amplíe la expectativa directamente).
Por lo general, el vector aleatorio se toma como muestra de (distribución normal) o ( distribución de Rademacher ).
Se han desarrollado estimadores estocásticos de traza más sofisticados. [6]
Si una matriz real de 2 x 2 tiene traza cero, su cuadrado es una matriz diagonal .
La traza de una matriz compleja de 2 × 2 se utiliza para clasificar las transformaciones de Möbius . Primero, la matriz se normaliza para que su determinante sea igual a uno. Entonces, si el cuadrado de la traza es 4, la transformación correspondiente es parabólica . Si el cuadrado está en el intervalo [0,4) , es elíptico . Finalmente, si el cuadrado es mayor que 4, la transformación es loxodrómica . Ver clasificación de las transformaciones de Möbius .
La traza se utiliza para definir caracteres de representaciones de grupo . Dos representaciones A , B : G → GL ( V ) de un grupo G son equivalentes (hasta el cambio de base en V ) si tr( A ( g )) = tr( B ( g )) para todo g ∈ G .
La traza también juega un papel central en la distribución de formas cuadráticas .
La traza es un mapa de álgebras de Lie desde el álgebra de Lie de operadores lineales en un espacio n -dimensional ( n × n matrices con entradas en ) hasta el álgebra de Lie K de escalares; como K es abeliano (el corchete de Lie desaparece), el hecho de que este sea un mapa de álgebras de Lie es exactamente la afirmación de que la traza de un corchete desaparece:
A menudo se dice que el núcleo de este mapa, una matriz cuya traza es cero , essin rastro otrace free , y estas matrices forman elálgebra de Lie simple , que es elálgebra de Liedelgrupo lineal especialde matrices con determinante 1. El grupo lineal especial consta de matrices que no cambian de volumen, mientras que elálgebra de Lie lineal especiales el matrices que no alteran el volumen deconjuntosinfinitesimales
De hecho, existe una descomposición interna de suma directa de operadores/matrices en operadores/matrices sin rastro y operadores/matrices escalares. El mapa de proyección sobre operadores escalares se puede expresar en términos de traza, concretamente como:
Formalmente, se puede componer la traza (el mapa de unidades ) con el mapa de unidades de "inclusión de escalares " para obtener un mapeo de mapas en escalares y multiplicar por n . Dividir por n hace que esto sea una proyección, lo que produce la fórmula anterior.
En términos de secuencias cortas exactas , se tiene cuál es análogo a (dónde ) para los grupos de Lie . Sin embargo, la traza se divide naturalmente (a través de escalares multiplicados) , pero la división del determinante sería como la raíz enésima multiplicada por escalares, y esto en general no define una función, por lo que el determinante no se divide y el grupo lineal general no se descompone:
La forma bilineal (donde X , Y son matrices cuadradas) se llama forma Killing , que se utiliza para la clasificación de álgebras de Lie.
La traza define una forma bilineal:
La forma es simétrica, no degenerada [nota 5] y asociativa en el sentido de que:
Para un álgebra de Lie simple y compleja (como n ), cada forma bilineal es proporcional entre sí; en particular, a la forma Killing [ cita necesaria ] .
Se dice que dos matrices X e Y son traza ortogonales si
Existe una generalización a una representación general de un álgebra de Lie , tal que es un homomorfismo de álgebras de Lie. La forma de traza se define como anteriormente . La forma bilineal es simétrica e invariante debido al carácter cíclico.
El concepto de traza de una matriz se generaliza a la clase de traza de operadores compactos en espacios de Hilbert , y el análogo de la norma de Frobenius se llama norma de Hilbert-Schmidt .
Si K es un operador de clase de traza, entonces, para cualquier base ortonormal , la traza viene dada por y es finita e independiente de la base ortonormal. [7]
La traza parcial es otra generalización de la traza valorada por el operador. La traza de un operador lineal Z que vive en un espacio producto A ⊗ B es igual a las trazas parciales sobre A y B :
Para obtener más propiedades y una generalización de la traza parcial, consulte categorías monoidales trazadas .
Si A es un álgebra asociativa general sobre un campo k , entonces una traza en A a menudo se define como cualquier aplicación tr: A ↦ k que desaparece en los conmutadores; tr([ a , b ]) = 0 para todo a , b ∈ A . Semejante rastro no está definido de manera única; siempre puede al menos modificarse mediante la multiplicación por un escalar distinto de cero.
Una supertraza es la generalización de una traza al entorno de superálgebras .
La operación de contracción tensorial generaliza la traza a tensores arbitrarios.
Dado un espacio vectorial V , existe un mapa bilineal natural V × V ∗ → F dado enviando ( v , φ) al escalar φ( v ) . La propiedad universal del producto tensorial V ⊗ V ∗ implica automáticamente que este mapa bilineal es inducido por un funcional lineal en V ⊗ V ∗ . [8]
De manera similar, existe un mapa bilineal natural V × V ∗ → Hom( V , V ) dado enviando ( v , φ) al mapa lineal w ↦ φ( w ) v . La propiedad universal del producto tensorial, tal como se usó anteriormente, dice que esta aplicación bilineal es inducida por una aplicación lineal V ⊗ V ∗ → Hom( V , V ) . Si V es de dimensión finita, entonces este mapa lineal es un isomorfismo lineal . [8] Este hecho fundamental es una consecuencia directa de la existencia de una base (finita) de V , y también puede expresarse como si dijera que cualquier aplicación lineal V → V puede escribirse como la suma de (finitos) rango uno mapas lineales. Componer la inversa del isomorfismo con el funcional lineal obtenido anteriormente da como resultado un funcional lineal en Hom( V , V ) . Esta funcional lineal es exactamente igual que la traza.
Utilizando la definición de traza como la suma de elementos diagonales, la fórmula matricial tr( AB ) = tr( BA ) es sencilla de probar y se proporcionó anteriormente. En la perspectiva actual, se consideran aplicaciones lineales S y T , y se las ve como sumas de aplicaciones de rango uno, de modo que hay funcionales lineales φ i y ψ j y vectores distintos de cero v i y w j tales que S ( u ) = Σ φ i ( u ) v i y T ( u ) = Σ ψ j ( u ) w j para cualquier u en V . Entonces
para cualquier u en V . El mapa lineal de rango uno u ↦ ψ j ( u ) φ i ( w j ) v i tiene traza ψ j ( v i ) φ i ( w j ) y así
Siguiendo el mismo procedimiento con S y T invertidos, se encuentra exactamente la misma fórmula, demostrando que tr( S ∘ T ) es igual a tr( T ∘ S ) .
Se puede considerar que la prueba anterior se basa en productos tensoriales, dado que la identidad fundamental de End( V ) con V ⊗ V ∗ es equivalente a la expresabilidad de cualquier aplicación lineal como suma de aplicaciones lineales de rango uno. Como tal, la prueba puede escribirse en notación de productos tensoriales. Entonces se puede considerar el mapa multilineal V × V ∗ × V × V ∗ → V ⊗ V ∗ dado enviando ( v , φ , w , ψ ) a φ ( w ) v ⊗ ψ . Una composición adicional con el mapa de seguimiento da como resultado φ ( w ) ψ ( v ) , y esto no cambia si uno hubiera comenzado con ( w , ψ , v , φ ) en su lugar. También se puede considerar el mapa bilineal End( V ) × End( V ) → End( V ) dado enviando ( f , g ) a la composición f ∘ g , que luego es inducida por un mapa lineal End( V ) ⊗ End ( V ) → Fin( V ) . Se puede ver que esto coincide con el mapa lineal V ⊗ V ∗ ⊗ V ⊗ V ∗ → V ⊗ V ∗ . La simetría establecida al componerse con el mapa de huellas establece entonces la igualdad de las dos huellas. [8]
Para cualquier espacio vectorial de dimensión finita V , existe una aplicación lineal natural F → V ⊗ V ' ; en el lenguaje de aplicaciones lineales, asigna a un escalar c la aplicación lineal c ⋅id V . A veces esto se llama mapa de coevaluación , y la traza V ⊗ V ' → F se llama mapa de evaluación . [8] Estas estructuras pueden axiomatizarse para definir rastros categóricos en el marco abstracto de la teoría de categorías .