la fórmula de jacobi

En cálculo matricial , la fórmula de Jacobi expresa la derivada del determinante de una matriz A en términos del conjugado de A y la derivada de A. ^[1]

Si $A$ es un mapa diferenciable de los números reales a matrices $n \times n$ , entonces

{\frac {d}{dt}}\det A(t)=\operatorname {tr} \left(\operatorname {adj} (A(t))\,{\frac {dA(t)} {dt}}\right)=\left(\det A(t)\right)\cdot \operatorname {tr} \left(A(t)^{-1}\cdot \,{\frac {dA(t) )}{dt}}\derecha)

donde $tr(X)$ es la traza de la matriz $X$ . (La última igualdad sólo se cumple si A ( t ) es invertible ).

Como caso especial,

{\partial \det(A) \over \partial A_{ij}}=\operatorname {adj} (A)_{ji}.

De manera equivalente, si $dA$ representa el diferencial de $A$ , la fórmula general es

d\det(A)=\operatorname {tr} (\operatorname {adj} (A)\,dA).

La fórmula lleva el nombre del matemático Carl Gustav Jacob Jacobi .

Derivación

A través de la computación matricial

Primero demostramos un lema preliminar:

Lema. Sean A y B un par de matrices cuadradas de la misma dimensión n . Entonces

\sum _{i}\sum _{j}A_{ij}B_{ij}=\operatorname {tr} (A^{\rm {T}}B).

Prueba. El producto AB del par de matrices tiene componentes

(AB)_{jk}=\sum _ {i}A_ {ji}B_ {ik}.

Reemplazar la matriz A por su transpuesta A ^T equivale a permutar los índices de sus componentes:

(A^{\rm {T}}B)_{jk}=\sum _{i}A_{ij}B_{ik}.

El resultado se obtiene tomando la traza de ambos lados:

\operatorname {tr} (A^{\rm {T}}B)=\sum _{j}(A^{\rm {T}}B)_{jj}=\sum _{j} \sum _{i}A_{ij}B_{ij}=\sum _{i}\sum _{j}A_{ij}B_{ij}.\ \square

Teorema. (Fórmula de Jacobi) Para cualquier mapa A diferenciable de los números reales a matrices n × n ,

d\det(A)=\operatorname {tr} (\operatorname {adj} (A)\,dA).

Prueba. La fórmula de Laplace para el determinante de una matriz A se puede expresar como

\det(A)=\sum _{j}A_{ij}\operatorname {adj} ^{\rm {T}}(A)_{ij}.

Observe que la suma se realiza sobre alguna fila arbitraria i de la matriz.

El determinante de A puede considerarse una función de los elementos de A :

\det(A)=F\,(A_{11},A_{12},\ldots ,A_{21},A_{22},\ldots ,A_{nn})

de modo que, por la regla de la cadena , su diferencial es

d\det(A)=\sum _{i}\sum _{j}{\partial F \over \partial A_{ij}}\,dA_{ij}.

Esta suma se realiza sobre todos los n × n elementos de la matriz.

Para encontrar ∂ F /∂ A _ij considere que en el lado derecho de la fórmula de Laplace, el índice i se puede elegir a voluntad. (Para optimizar los cálculos: cualquier otra opción eventualmente produciría el mismo resultado, pero podría ser mucho más difícil). En particular, se puede elegir que coincida con el primer índice de ∂ / ∂ A _ij :

{\partial \det(A) \over \partial A_{ij}}={\partial \sum _{k}A_{ik}\operatorname {adj} ^{\rm {T}}(A) _{ik} \over \partial A_{ij}}=\sum _{k}{\partial (A_{ik}\operatorname {adj} ^{\rm {T}}(A)_{ik}) \ sobre \partial A_{ij}}

Así, por la regla del producto,

{\partial \det(A) \over \partial A_{ij}}=\sum _{k}{\partial A_{ik} \over \partial A_{ij}}\operatorname {adj} ^{ \rm {T}}(A)_{ik}+\sum _{k}A_{ik}{\partial \operatorname {adj} ^{\rm {T}}(A)_{ik} \over \ A parcial_ {ij}}.

Ahora bien, si un elemento de una matriz A _ij y un cofactor adj ^T ( A ) _ik del elemento A _ik se encuentran en la misma fila (o columna), entonces el cofactor no será función de A _ij , porque el cofactor de A _ik se expresa en términos de elementos que no están en su propia fila (ni columna). De este modo,

{\partial \operatorname {adj} ^{\rm {T}}(A)_{ik} \over \partial A_{ij}}=0,

entonces

{\partial \det(A) \over \partial A_{ij}}=\sum _{k}\operatorname {adj} ^{\rm {T}}(A)_{ik}{\partial A_{ik} \sobre \partial A_{ij}}.

Todos los elementos de A son independientes entre sí, es decir

{\partial A_{ik} \over \partial A_{ij}}=\delta _{jk},

donde δ es el delta de Kronecker , entonces

{\partial \det(A) \over \partial A_{ij}}=\sum _{k}\operatorname {adj} ^{\rm {T}}(A)_{ik}\delta _{jk}=\operatorname {adj} ^{\rm {T}}(A)_{ij}.

Por lo tanto,

d(\det(A))=\sum _{i}\sum _{j}\operatorname {adj} ^{\rm {T}}(A)_{ij}\,dA_{ij},

y aplicando el Lema se obtiene

d(\det(A))=\operatorname {tr} (\operatorname {adj} (A)\,dA).\ \square

A través de la regla de la cadena

Lema 1. , donde está el diferencial de . $\det '(I)=\mathrm {tr}$ $\det '$ $\det$

Esta ecuación significa que el diferencial de , evaluado en la matriz identidad, es igual a la traza. El diferencial es un operador lineal que asigna una matriz n × n a un número real. $\det$ $\det '(I)$

Prueba. Usando la definición de derivada direccional junto con una de sus propiedades básicas para funciones diferenciables, tenemos

\det '(I)(T)=\nabla _{T}\det(I)=\lim _{\varepsilon \to 0}{\frac {\det(I+\varepsilon T)-\det I}{\varepsilon }}

$\det(I+\varepsilon T)$ es un polinomio de orden n . Está estrechamente relacionado con el polinomio característico de . El término constante en ese polinomio (el término con ) es 1, mientras que el término lineal en es . $\varepsilon$ $T$ $\varepsilon =0$ $\varepsilon$ $\mathrm {tr} \ T$

Lema 2. Para una matriz invertible A , tenemos: . $\det '(A)(T)=\det A\;\mathrm {tr} (A^{-1}T)$

Prueba. Considere la siguiente función de X :

\det X=\det(AA^{-1}X)=\det(A)\ \det(A^{-1}X)

Calculamos el diferencial de y lo evaluamos usando el Lema 1, la ecuación anterior y la regla de la cadena: $\det X$ $X=A$

\det '(A)(T)=\det A\ \det '(I)(A^{-1}T)=\det A\ \mathrm {tr} (A^{-1}T)

Teorema. (fórmula de Jacobi) ${\frac {d}{dt}}\det A=\mathrm {tr} \left(\mathrm {adj} \ A{\frac {dA}{dt}}\right)$

Prueba. Si es invertible, por el Lema 2, con $A$ $T=dA/dt$

{\frac {d}{dt}}\det A=\det A\;\mathrm {tr} \left(A^{-1}{\frac {dA}{dt}}\right)=\mathrm {tr} \left(\mathrm {adj} \ A\;{\frac {dA}{dt}}\right)

usando la ecuación que relaciona el conjugado de con . Ahora bien, la fórmula es válida para todas las matrices, ya que el conjunto de matrices lineales invertibles es denso en el espacio de matrices. $A$ $A^{-1}$

Vía Diagonalización

Ambos lados de la fórmula de Jacobi son polinomios en los coeficientes matriciales de $A$ y $A'$ . Por tanto, es suficiente verificar la identidad polinómica en el subconjunto denso donde los valores propios de $A$ son distintos y distintos de cero.

Si $A$ factoriza diferenciablemente como , entonces $A=BC$

\mathrm {tr} (A^{-1}A')=\mathrm {tr} ((BC)^{-1}(BC)')=\mathrm {tr} (B^{-1}B')+\mathrm {tr} (C^{-1}C').

En particular, si $L$ es invertible, entonces y $I=L^{-1}L$

0=\mathrm {tr} (I^{-1}I')=\mathrm {tr} (L(L^{-1})')+\mathrm {tr} (L^{-1}L').

Dado que $A$ tiene valores propios distintos, existe una matriz invertible compleja diferenciable $L$ tal que y $D$ es diagonal. Entonces $A=L^{-1}DL$

\mathrm {tr} (A^{-1}A')=\mathrm {tr} (L(L^{-1})')+\mathrm {tr} (D^{-1}D')+\mathrm {tr} (L^{-1}L')=\mathrm {tr} (D^{-1}D').

Sean , los valores propios de $A$ . Entonces $\lambda _{i}$ $i=1,\ldots ,n$

{\frac {\det(A)'}{\det(A)}}=\sum _{i=1}^{n}\lambda _{i}'/\lambda _{i}=\mathrm {tr} (D^{-1}D')=\mathrm {tr} (A^{-1}A'),

que es la fórmula de Jacobi para matrices $A$ con valores propios distintos de cero.

Corolario

La siguiente es una relación útil que conecta la traza con el determinante de la matriz exponencial asociada :

$\det e^{B}=e^{\operatorname {tr} \left(B\right)}$

Esta afirmación es clara para las matrices diagonales y a continuación se muestra una prueba de la afirmación general.

Para cualquier matriz invertible , en la sección anterior "Vía la regla de la cadena", mostramos que $A(t)$

{\frac {d}{dt}}\det A(t)=\det A(t)\;\operatorname {tr} \left(A(t)^{-1}\,{\frac {d}{dt}}A(t)\right)

Considerando en esta ecuación se obtiene: $A(t)=\exp(tB)$

{\frac {d}{dt}}\det e^{tB}=\operatorname {tr} (B)\det e^{tB}

El resultado deseado es la solución de esta ecuación diferencial ordinaria.

Aplicaciones

Varias formas de la fórmula subyacen al algoritmo de Faddeev-LeVerrier para calcular el polinomio característico y aplicaciones explícitas del teorema de Cayley-Hamilton . Por ejemplo, a partir de la siguiente ecuación, que se demostró anteriormente:

{\frac {d}{dt}}\det A(t)=\det A(t)\ \operatorname {tr} \left(A(t)^{-1}\,{\frac {d}{dt}}A(t)\right)

y usando , obtenemos: $A(t)=tI-B$

{\frac {d}{dt}}\det(tI-B)=\det(tI-B)\operatorname {tr} [(tI-B)^{-1}]=\operatorname {tr} [\operatorname {adj} (tI-B)]

donde adj denota la matriz adjunta .

Observaciones

^ Magnus y Neudecker (1999, págs. 149-150), tercera parte, sección 8.3

Referencias

Magnus, enero R.; Neudecker, Heinz (1999). Cálculo diferencial matricial con aplicaciones en estadística y econometría (edición revisada). Wiley. ISBN 0-471-98633-X.
Bellman, Richard (1997). Introducción al análisis matricial. SIAM. ISBN 0-89871-399-4.