matriz de bloques

En matemáticas , una matriz de bloques o una matriz particionada es una matriz que se interpreta como dividida en secciones llamadas bloques o submatrices . ^[1] Intuitivamente, una matriz interpretada como una matriz de bloques se puede visualizar como la matriz original con una colección de líneas horizontales y verticales, que la dividen, o la dividen , en una colección de matrices más pequeñas. ^[2] Cualquier matriz puede interpretarse como una matriz de bloques de una o más maneras, y cada interpretación se define por cómo se dividen sus filas y columnas.

Esta noción se puede hacer más precisa para una matriz by dividiéndola en una colección y luego dividiéndola en una colección . La matriz original se considera entonces como el "total" de estos grupos, en el sentido de que la entrada de la matriz original corresponde de forma 1 a 1 con alguna entrada compensada de some , donde y . $n$ $m$ $M$ $n$ ${\text{grupos de filas}}$ $m$ ${\text{colgrupos}}$ $(i,j)$ $(s,t)$ $(x,y)$ $x\in {\text{grupos de filas}}$ $y\in {\text{colgroups}}$

El álgebra matricial de bloques surge en general a partir de biproductos en categorías de matrices. ^[3]

Ejemplo

Una matriz de bloques de elementos de 168 × 168 con submatrices de 12 × 12, 12 × 24, 24 × 12 y 24 × 24. Los elementos distintos de cero están en azul, los elementos cero están en gris.

La matriz

\mathbf {P} ={\begin{bmatrix}1&2&2&7\\1&5&6&2\\3&3&4&5\\3&3&6&7\end{bmatrix}}

se puede dividir en cuatro bloques de 2×2

\mathbf {P} _{11}={\begin{bmatrix}1&2\\1&5\end{bmatrix}},\quad \mathbf {P} _{12}={\begin{bmatrix}2&7\ \6&2\end{bmatrix}},\quad \mathbf {P} _{21}={\begin{bmatrix}3&3\\3&3\end{bmatrix}},\quad \mathbf {P} _{22}= {\begin{bmatrix}4&5\\6&7\end{bmatrix}}.

La matriz particionada se puede escribir entonces como

\mathbf {P} ={\begin{bmatrix}\mathbf {P} _{11}&\mathbf {P} _{12}\\\mathbf {P} _{21}&\mathbf {P } _{22}\end{bmatriz}}.

Multiplicación de matrices de bloques

Es posible utilizar un producto matricial dividido en bloques que involucre solo álgebra en submatrices de los factores. Sin embargo, la partición de los factores no es arbitraria y requiere " particiones conformes " ^[4] entre dos matrices y tales que todos los productos de submatriz que se utilizarán estén definidos. ^[5] Dada una matriz con particiones de filas y particiones de columnas $A$ $B$ $(m\times p)$ $\mathbf {A}$ $q$ $s$

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{11}&\mathbf {A} _{12}&\cdots &\mathbf {A} _{1s}\\\mathbf {A} _{21}&\mathbf {A} _{22}&\cdots &\mathbf {A} _{2s}\\\vdots &\vdots &\ddots &\vdots \\\mathbf {A} _{q1}&\mathbf {A} _{q2}&\cdots &\mathbf {A} _{qs}\end{bmatrix}}

y una matriz con particiones de filas y particiones de columnas $(p\times n)$ $\mathbf {B}$ $s$ $r$

\mathbf {B} ={\begin{bmatrix}\mathbf {B} _{11}&\mathbf {B} _{12}&\cdots &\mathbf {B} _{1r}\\\mathbf {B} _{21}&\mathbf {B} _{22}&\cdots &\mathbf {B} _{2r}\\\vdots &\vdots &\ddots &\vdots \\\mathbf {B} _{s1}&\mathbf {B} _{s2}&\cdots &\mathbf {B} _{sr}\end{bmatrix}},

que sean compatibles con las particiones de , el producto matricial $A$

\mathbf {C} =\mathbf {A} \mathbf {B}

se puede realizar en bloques, dando como resultado una matriz con particiones de filas y particiones de columnas. Las matrices de la matriz resultante se calculan multiplicando: $\mathbf {C}$ $(m\times n)$ $q$ $r$ $\mathbf {C}$

\mathbf {C} _{qr}=\sum _{i=1}^{s}\mathbf {A} _{qi}\mathbf {B} _{ir}.

O, usando la notación de Einstein que implícitamente suma índices repetidos:

\mathbf {C} _{qr}=\mathbf {A} _{qi}\mathbf {B} _{ir}.

Inversión de matriz de bloques

Si una matriz se divide en cuatro bloques, se puede invertir en bloques de la siguiente manera:

\mathbf {P} ={\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {C} &\mathbf {D} \end{bmatrix}}^{-1}={\begin{bmatrix}\mathbf {A} ^{-1}+\mathbf {A} ^{-1}\mathbf {B} \left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\mathbf {CA} ^{-1}&-\mathbf {A} ^{-1}\mathbf {B} \left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\\-\left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\mathbf {CA} ^{-1}&\left(\mathbf {D} -\mathbf {CA} ^{-1}\mathbf {B} \right)^{-1}\end{bmatrix}},

donde A y D son bloques cuadrados de tamaño arbitrario, y B y C son compatibles con ellos para la partición. Además, A y el complemento de Schur de A en P : P / A = D − CA ⁻¹B deben ser invertibles. ^[6]

De manera equivalente, permutando los bloques:

\mathbf {P} ={\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {C} &\mathbf {D} \end{bmatrix}}^{-1}={\begin{bmatrix}\left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}&-\left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}\mathbf {BD} ^{-1}\\-\mathbf {D} ^{-1}\mathbf {C} \left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}&\quad \mathbf {D} ^{-1}+\mathbf {D} ^{-1}\mathbf {C} \left(\mathbf {A} -\mathbf {BD} ^{-1}\mathbf {C} \right)^{-1}\mathbf {BD} ^{-1}\end{bmatrix}}.

Aquí, D y el complemento de Schur de D en P : P / D = A − BD ⁻¹C deben ser invertibles.

Si A y D son ambos invertibles, entonces:

{\begin{bmatrix}\mathbf {A} &\mathbf {B} \\\mathbf {C} &\mathbf {D} \end{bmatrix}}^{-1}={\begin{bmatrix}\left(\mathbf {A} -\mathbf {B} \mathbf {D} ^{-1}\mathbf {C} \right)^{-1}&\mathbf {0} \\\mathbf {0} &\left(\mathbf {D} -\mathbf {C} \mathbf {A} ^{-1}\mathbf {B} \right)^{-1}\end{bmatrix}}{\begin{bmatrix}\mathbf {I} &-\mathbf {B} \mathbf {D} ^{-1}\\-\mathbf {C} \mathbf {A} ^{-1}&\mathbf {I} \end{bmatrix}}.

Según la identidad de Weinstein-Aronszajn , una de las dos matrices en la matriz diagonal de bloques es invertible exactamente cuando la otra lo es.

Determinante de matriz de bloques

La fórmula anterior para el determinante de una matriz sigue siendo válida, bajo supuestos adicionales apropiados, para una matriz compuesta de cuatro submatrices . La fórmula más sencilla, que puede demostrarse utilizando la fórmula de Leibniz o una factorización que incluya el complemento de Schur , es $2\times 2$ $A,B,C,D$

\det {\begin{pmatrix}A&0\\C&D\end{pmatrix}}=\det(A)\det(D)=\det {\begin{pmatrix}A&B\\0&D\end{pmatrix}}.

Usando esta fórmula, podemos derivar que los polinomios característicos de y son iguales e iguales al producto de los polinomios característicos de y . Además, si o es diagonalizable , entonces y también lo son. Lo contrario es falso; simplemente verifique . ${\begin{pmatrix}A&0\\C&D\end{pmatrix}}$ ${\begin{pmatrix}A&B\\0&D\end{pmatrix}}$ $A$ $D$ ${\begin{pmatrix}A&0\\C&D\end{pmatrix}}$ ${\begin{pmatrix}A&B\\0&D\end{pmatrix}}$ $A$ $D$ ${\begin{pmatrix}1&1\\0&1\end{pmatrix}}$

Si es invertible (y de manera similar si es invertible ^[7] ), se tiene $A$ $D$

\det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(A)\det \left(D-CA^{-1}B\right).

Si es una matriz, esto se simplifica a . $D$ $1\times 1$ $\det(A)(D-CA^{-1}B)$

Si los bloques son matrices cuadradas del mismo tamaño, se cumplen más fórmulas. Por ejemplo, si y conmutan (es decir, ), entonces $C$ $D$ $CD=DC$

\det {\begin{pmatrix}A&B\\C&D\end{pmatrix}}=\det(AD-BC).

^[8]

Esta fórmula se ha generalizado a matrices compuestas por más de bloques, nuevamente bajo condiciones de conmutatividad apropiadas entre los bloques individuales. ^[9] $2\times 2$

Para y , la siguiente fórmula es válida (incluso si y no conmutan) ^[^{cita necesaria}^] $A=D$ $B=C$ $A$ $B$

\det {\begin{pmatrix}A&B\\B&A\end{pmatrix}}=\det(A-B)\det(A+B).

Matrices diagonales de bloques

Una matriz diagonal de bloques es una matriz de bloques que es una matriz cuadrada tal que los bloques de la diagonal principal son matrices cuadradas y todos los bloques fuera de la diagonal son matrices cero. Es decir, una matriz diagonal de bloques A tiene la forma

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{1}&\mathbf {0} &\cdots &\mathbf {0} \\\mathbf {0} &\mathbf {A} _{2}&\cdots &\mathbf {0} \\\vdots &\vdots &\ddots &\vdots \\\mathbf {0} &\mathbf {0} &\cdots &\mathbf {A} _{n}\end{bmatrix}}

donde A _k es una matriz cuadrada para todo k = 1, ..., n . En otras palabras, la matriz A es la suma directa de A ₁ , ... _, An . También se puede indicar como A ₁ ⊕ A ₂ ⊕ ... ⊕ A _n o diag( A ₁ , A ₂ , ..., An ₎ (siendo este último el mismo formalismo utilizado para una matriz diagonal ). Cualquier matriz cuadrada puede considerarse trivialmente una matriz diagonal de bloques con un solo bloque.

Para el determinante y la traza , se cumplen las siguientes propiedades

{\begin{aligned}\det \mathbf {A} &=\det \mathbf {A} _{1}\times \cdots \times \det \mathbf {A} _{n},\\\operatorname {tr} \mathbf {A} &=\operatorname {tr} \mathbf {A} _{1}+\cdots +\operatorname {tr} \mathbf {A} _{n}.\end{aligned}}

Una matriz diagonal de bloques es invertible si y sólo si cada uno de sus bloques de la diagonal principal es invertible, y en este caso su inversa es otra matriz diagonal de bloques dada por

{\begin{bmatrix}\mathbf {A} _{1}&\mathbf {0} &\cdots &\mathbf {0} \\\mathbf {0} &\mathbf {A} _{2}&\cdots &\mathbf {0} \\\vdots &\vdots &\ddots &\vdots \\\mathbf {0} &\mathbf {0} &\cdots &\mathbf {A} _{n}\end{bmatrix}}^{-1}={\begin{bmatrix}\mathbf {A} _{1}^{-1}&\mathbf {0} &\cdots &\mathbf {0} \\\mathbf {0} &\mathbf {A} _{2}^{-1}&\cdots &\mathbf {0} \\\vdots &\vdots &\ddots &\vdots \\\mathbf {0} &\mathbf {0} &\cdots &\mathbf {A} _{n}^{-1}\end{bmatrix}}.

Los valores propios y vectores propios de son simplemente los de s combinados. $\mathbf {A}$ $\mathbf {A} _{k}$

Bloquear matrices tridiagonales

Una matriz tridiagonal de bloques es otra matriz de bloques especial, que es como la matriz diagonal de bloques una matriz cuadrada , que tiene matrices cuadradas (bloques) en la diagonal inferior, la diagonal principal y la diagonal superior, siendo todos los demás bloques matrices cero. Es esencialmente una matriz tridiagonal pero tiene submatrices en lugar de escalares. Una matriz tridiagonal de bloques A tiene la forma

\mathbf {A} ={\begin{bmatrix}\mathbf {B} _{1}&\mathbf {C} _{1}&&&\cdots &&\mathbf {0} \\\mathbf {A} _{2}&\mathbf {B} _{2}&\mathbf {C} _{2}&&&&\\&\ddots &\ddots &\ddots &&&\vdots \\&&\mathbf {A} _{k}&\mathbf {B} _{k}&\mathbf {C} _{k}&&\\\vdots &&&\ddots &\ddots &\ddots &\\&&&&\mathbf {A} _{n-1}&\mathbf {B} _{n-1}&\mathbf {C} _{n-1}\\\mathbf {0} &&\cdots &&&\mathbf {A} _{n}&\mathbf {B} _{n}\end{bmatrix}}

donde A _k , B _k y C _k son submatrices cuadradas de la diagonal inferior, principal y superior respectivamente.

Las matrices tridiagonales de bloques se encuentran a menudo en soluciones numéricas de problemas de ingeniería (p. ej., dinámica de fluidos computacional ). Se encuentran disponibles métodos numéricos optimizados para la factorización LU y, por lo tanto, algoritmos de solución eficientes para sistemas de ecuaciones con una matriz tridiagonal de bloques como matriz de coeficientes. El algoritmo de Thomas , utilizado para la solución eficiente de sistemas de ecuaciones que involucran una matriz tridiagonal , también se puede aplicar usando operaciones matriciales para bloquear matrices tridiagonales (consulte también Descomposición de LU en bloque ).

Bloquear matrices de Toeplitz

Una matriz de Toeplitz de bloques es otra matriz de bloques especial, que contiene bloques que se repiten en las diagonales de la matriz, ya que una matriz de Toeplitz tiene elementos repetidos en la diagonal.

Una matriz de Toeplitz A en bloques tiene la forma

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&&\cdots &\mathbf {A} _{(1,n-1)}&\mathbf {A} _{(1,n)}\\\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&&&\mathbf {A} _{(1,n-1)}\\&\ddots &\ddots &\ddots &&&\vdots \\&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&\\\vdots &&&\ddots &\ddots &\ddots &\\\mathbf {A} _{(n-1,1)}&&&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}\\\mathbf {A} _{(n,1)}&\mathbf {A} _{(n-1,1)}&\cdots &&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}\end{bmatrix}}.

Transponer bloque

También se puede definir una forma especial de transposición de matrices para matrices de bloques, donde los bloques individuales se reordenan pero no se transponen. Sea una matriz de bloques con bloques , la transpuesta de bloques es la matriz de bloques con bloques . ^[10] $A=(B_{ij})$ $k\times l$ $m\times n$ $B_{ij}$ $A$ $l\times k$ $A^{\mathcal {B}}$ $m\times n$ $\left(A^{\mathcal {B}}\right)_{ij}=B_{ji}$

Al igual que con el operador de traza convencional, la transposición de bloque es un mapeo lineal tal que . Sin embargo, en general la propiedad no se mantiene a menos que las cuadras de y conmuten. $(A+C)^{\mathcal {B}}=A^{\mathcal {B}}+C^{\mathcal {B}}$ $(AC)^{\mathcal {B}}=C^{\mathcal {B}}A^{\mathcal {B}}$ $A$ $C$

Suma directa

Para cualquier matriz arbitraria A (de tamaño m × n ) y B (de tamaño p × q ), tenemos la suma directa de A y B , denotada por A B y definida como $\oplus$

\mathbf {A} \oplus \mathbf {B} ={\begin{bmatrix}a_{11}&\cdots &a_{1n}&0&\cdots &0\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\a_{m1}&\cdots &a_{mn}&0&\cdots &0\\0&\cdots &0&b_{11}&\cdots &b_{1q}\\\vdots &\ddots &\vdots &\vdots &\ddots &\vdots \\0&\cdots &0&b_{p1}&\cdots &b_{pq}\end{bmatrix}}.

Por ejemplo,

{\begin{bmatrix}1&3&2\\2&3&1\end{bmatrix}}\oplus {\begin{bmatrix}1&6\\0&1\end{bmatrix}}={\begin{bmatrix}1&3&2&0&0\\2&3&1&0&0\\0&0&0&1&6\\0&0&0&0&1\end{bmatrix}}.

Esta operación se generaliza naturalmente a matrices dimensionadas arbitrariamente (siempre que A y B tengan el mismo número de dimensiones).

Tenga en cuenta que cualquier elemento en la suma directa de dos espacios vectoriales de matrices podría representarse como una suma directa de dos matrices.

Solicitud

En términos de álgebra lineal , el uso de una matriz de bloques corresponde a tener un mapeo lineal pensado en términos de 'grupos' correspondientes de vectores base . Esto nuevamente coincide con la idea de haber distinguido descomposiciones de suma directa del dominio y rango . Siempre es particularmente significativo si un bloque es la matriz cero ; que transporta la información que un sumando asigna a una subsuma.

Dada la interpretación mediante asignaciones lineales y sumas directas, existe un tipo especial de matriz de bloques que ocurre para matrices cuadradas (el caso m = n ). Para aquellos, podemos asumir una interpretación como un endomorfismo de un espacio V de n dimensiones ; la estructura de bloques en la que el agrupamiento de filas y columnas es el mismo es importante porque corresponde a tener una única descomposición de suma directa en V (en lugar de dos). En ese caso, por ejemplo, los bloques diagonales en el sentido obvio son todos cuadrados. Este tipo de estructura es necesaria para describir la forma normal de Jordan .

Esta técnica se utiliza para reducir los cálculos de matrices, expansiones de filas de columnas y muchas aplicaciones informáticas , incluido el diseño de chips VLSI . Un ejemplo es el algoritmo de Strassen para la multiplicación rápida de matrices , así como la codificación Hamming(7,4) para la detección y recuperación de errores en las transmisiones de datos.

La técnica también se puede utilizar cuando los elementos de las matrices A, B, C y D no requieren todos el mismo campo para sus elementos. Por ejemplo, la matriz A puede estar sobre el campo de números complejos, mientras que la matriz D puede estar sobre el campo de números reales. Esto puede conducir a operaciones válidas que involucran las matrices, al tiempo que simplifica las operaciones dentro de una de las matrices. Por ejemplo, si D solo tiene elementos reales, encontrar su inverso requiere menos cálculos que si se deben considerar elementos complejos. Pero los reales son un subcampo de los números complejos (además se puede considerar una proyección), por lo que las operaciones con matrices pueden estar bien definidas.

Ver también

Producto de Kronecker (producto directo de matriz que da como resultado una matriz de bloques)

Notas

^ Evas, Howard (1980). Teoría de matrices elementales (reimpresión ed.). Nueva York: Dover. pag. 37.ISBN _ 0-486-63946-0. Consultado el 24 de abril de 2013 . Encontraremos que a veces resulta conveniente subdividir una matriz en bloques rectangulares de elementos. Esto nos lleva a considerar las llamadas matrices particionadas o de bloques .
^ Antón, Howard (1994). Álgebra lineal elemental (7ª ed.). Nueva York: John Wiley. pag. 30.ISBN _ 0-471-58742-7. Una matriz se puede subdividir o dividir en matrices más pequeñas insertando reglas horizontales y verticales entre las filas y columnas seleccionadas.
^ Macedo, HD; Oliveira, JN (2013). "Escribiendo álgebra lineal: un enfoque orientado a biproductos". Ciencia de la programación informática . 78 (11): 2160–2191. arXiv : 1312.4818 . doi :10.1016/j.scico.2012.07.012.
^ Evas, Howard (1980). Teoría de matrices elementales (reimpresión ed.). Nueva York: Dover. pag. 37.ISBN _ 0-486-63946-0. Consultado el 24 de abril de 2013 . Una partición como la del teorema 1.9.4 se denomina partición conforme de A y B.
^ Antón, Howard (1994). Álgebra lineal elemental (7ª ed.). Nueva York: John Wiley. pag. 36.ISBN _ 0-471-58742-7. ...siempre que los tamaños de las submatrices de A y B sean tales que se puedan realizar las operaciones indicadas.
^ Bernstein, Dennis (2005). Matemáticas matriciales . Prensa de la Universidad de Princeton. pag. 44.ISBN _ 0-691-11802-7.
^ Taboga, Marco (2021). "Determinante de una matriz de bloques", Conferencias sobre álgebra matricial.
^ Silvester, JR (2000). "Determinantes de matrices de bloques" (PDF) . Matemáticas. Gaz . 84 (501): 460–467. doi :10.2307/3620776. JSTOR 3620776. Archivado desde el original (PDF) el 18 de marzo de 2015 . Consultado el 25 de junio de 2021 .
^ Sothanaphan, Nat (enero de 2017). "Determinantes de matrices de bloques con bloques no conmutantes". Álgebra lineal y sus aplicaciones . 512 : 202–218. arXiv : 1805.06027 . doi :10.1016/j.laa.2016.10.004. S2CID 119272194.
^ Mackey, D. Steven (2006). Linealizaciones estructuradas para polinomios matriciales (PDF) (Tesis). Universidad de Manchester. ISSN 1749-9097. OCLC 930686781.

Referencias

Strang, Gilbert (1999). "Tema 3: Multiplicación y matrices inversas". Software de curso abierto del MIT. 18:30–21:10.