En matemáticas , en el campo de la teoría de control , una ecuación de Sylvester es una ecuación matricial de la forma: [1]
Recibe su nombre del matemático inglés James Joseph Sylvester . Entonces, dadas las matrices A , B y C , el problema es encontrar las posibles matrices X que obedecen a esta ecuación. Se supone que todas las matrices tienen coeficientes en los números complejos . Para que la ecuación tenga sentido, las matrices deben tener tamaños apropiados, por ejemplo, todas podrían ser matrices cuadradas del mismo tamaño. Pero, de manera más general, A y B deben ser matrices cuadradas de tamaños n y m respectivamente, y luego X y C tienen ambas n filas y m columnas.
Una ecuación de Sylvester tiene una solución única para X exactamente cuando no hay valores propios comunes de A y − B . De manera más general, la ecuación AX + XB = C se ha considerado como una ecuación de operadores acotados en un espacio de Banach (posiblemente de dimensión infinita) . En este caso, la condición para la unicidad de una solución X es casi la misma: existe una solución única X exactamente cuando los espectros de A y − B son disjuntos . [2]
Existencia y unicidad de las soluciones
Usando la notación del producto de Kronecker y el operador de vectorización , podemos reescribir la ecuación de Sylvester en la forma
donde es de dimensión , es de dimensión , de dimensión y es la matriz identidad . En esta forma, la ecuación puede verse como un sistema lineal de dimensión . [3]
Teorema.
Dadas las matrices y , la ecuación de Sylvester tiene una solución única para cualquier si y solo si y no comparten ningún valor propio.
Demostración.
La ecuación es un sistema lineal con incógnitas y el mismo número de ecuaciones. Por lo tanto, es únicamente resoluble para cualquier ecuación dada si y solo si la ecuación homogénea
admite solo la solución trivial .
(i) Supongamos que y no comparten ningún valor propio. Sea una solución de la ecuación homogénea mencionada anteriormente. Entonces , que puede elevarse a
para cada uno
por inducción matemática. En consecuencia,
para cualquier polinomio . En particular, sea el polinomio característico de . Entonces
debido al teorema de Cayley-Hamilton ; mientras tanto, el teorema de aplicación espectral nos dice
donde denota el espectro de una matriz. Como y no comparten ningún valor propio, no contiene cero y, por lo tanto, no es singular. Por lo tanto, como se deseaba. Esto prueba la parte "si" del teorema.
(ii) Supongamos ahora que y comparten un valor propio . Sea un vector propio derecho correspondiente para , un vector propio izquierdo correspondiente para , y . Entonces , y
Por lo tanto es una solución no trivial para la ecuación homogénea antes mencionada, lo que justifica la parte "sólo si" del teorema. QED
Como alternativa al teorema de mapeo espectral , la no singularidad de en la parte (i) de la prueba también se puede demostrar mediante la identidad de Bézout para polinomios coprimos. Sea el polinomio característico de . Puesto que y no comparten ningún valor propio, y son coprimos. Por lo tanto, existen polinomios y tales que . Por el teorema de Cayley-Hamilton , . Por lo tanto , lo que implica que es no singular.
El teorema sigue siendo válido para matrices reales con la salvedad de que se deben tener en cuenta sus valores propios complejos. La prueba de la parte "si" sigue siendo aplicable; para la parte "solo si", observe que tanto y satisfacen la ecuación homogénea , y no pueden ser cero simultáneamente.
Regla de remoción de Roth
Dadas dos matrices complejas cuadradas A y B , de tamaño n y m , y una matriz C de tamaño n por m , entonces uno puede preguntar cuándo las siguientes dos matrices cuadradas de tamaño n + m son similares entre sí: y . La respuesta es que estas dos matrices son similares exactamente cuando existe una matriz X tal que AX − XB = C . En otras palabras, X es una solución a una ecuación de Sylvester. Esto se conoce como regla de remoción de Roth . [4]
Se puede comprobar fácilmente una dirección: si AX − XB = C entonces
La regla de eliminación de Roth no se generaliza a operadores acotados de dimensión infinita en un espacio de Banach. [5] Sin embargo, la regla de eliminación de Roth se generaliza a los sistemas de ecuaciones de Sylvester. [6]
Soluciones numéricas
Un algoritmo clásico para la solución numérica de la ecuación de Sylvester es el algoritmo de Bartels–Stewart , que consiste en transformar y en forma de Schur mediante un algoritmo QR , y luego resolver el sistema triangular resultante mediante sustitución hacia atrás . Este algoritmo, cuyo costo computacional son operaciones aritméticas, [ cita requerida ] es utilizado, entre otros, por LAPACK y la función en GNU Octave . [7] Véase también la función en ese lenguaje. [8] [9] En algunas aplicaciones específicas de procesamiento de imágenes, la ecuación de Sylvester derivada tiene una solución en forma cerrada. [10]lyap
sylvester
Véase también
Notas
- ^ Esta ecuación también se escribe comúnmente en la forma equivalente de AX − XB = C .
- ^ Bhatia y Rosenthal, 1997
- ^ Sin embargo, no se recomienda reescribir la ecuación en esta forma para la solución numérica ya que esta versión es costosa de resolver y puede estar mal condicionada .
- ^ Gerrish, F; Ward, AGB (noviembre de 1998). "Ecuación matricial de Sylvester y regla de eliminación de Roth". The Mathematical Gazette . 82 (495): 423–430. doi :10.2307/3619888. JSTOR 3619888. S2CID 126229881.
- ^ Bhatia y Rosenthal, pág. 3
- ^ Dmytryshyn, Andrii; Kågström, Bo (2015). "Ecuaciones matriciales acopladas de tipo Sylvester y diagonalización de bloques". Revista SIAM sobre análisis de matrices y aplicaciones . 36 (2): 580–593. CiteSeerX 10.1.1.710.6894 . doi :10.1137/151005907.
- ^ "Referencia de función: Lyap".
- ^ "Funciones de una matriz (GNU Octave (versión 4.4.1))".
- ^ El
syl
comando está obsoleto desde GNU Octave versión 4.0 - ^ Wei, Q.; Dobigeon, N.; Tourneret, J.-Y. (2015). "Fusión rápida de imágenes multibanda basada en la resolución de una ecuación de Sylvester". IEEE . 24 (11): 4109–4121. arXiv : 1502.03121 . Bibcode :2015ITIP...24.4109W. doi :10.1109/TIP.2015.2458572. PMID 26208345. S2CID 665111.
Referencias
- Sylvester, J. (1884). "Sobre las ecuaciones en matrices ". CR Acad. Ciencia. París . 99 (2): 67–71, 115–116.
- Bartels, RH; Stewart, GW (1972). "Solución de la ecuación matricial A X + X B = C {\displaystyle AX+XB=C}". Comm. ACM . 15 (9): 820–826. doi : 10.1145/361573.361582 . S2CID 12957010.
- Bhatia, R.; Rosenthal, P. (1997). "¿Cómo y por qué resolver la ecuación del operador ?". Bull. London Math. Soc. 29 (1): 1–21. doi :10.1112/S0024609396001828. S2CID 122259404.
- Dmytryshyn, Andrii; Kågström, Bo (2015). "Ecuaciones matriciales acopladas de tipo Sylvester y diagonalización de bloques". Revista SIAM sobre análisis de matrices y aplicaciones . 36 (2): 580–593. CiteSeerX 10.1.1.710.6894 . doi :10.1137/151005907.
- Lee, S.-G.; Vu, Q.-P. (2011). "Soluciones simultáneas de ecuaciones de Sylvester y matrices idempotentes que separan el espectro conjunto". Linear Algebra Appl. 435 (9): 2097–2109. doi : 10.1016/j.laa.2010.09.034 .
- Wei, Q.; Dobigeon, N.; Tourneret, J.-Y. (2015). "Fusión rápida de imágenes multibanda basada en la resolución de una ecuación de Sylvester". IEEE Transactions on Image Processing . 24 (11): 4109–4121. arXiv : 1502.03121 . Bibcode :2015ITIP...24.4109W. doi :10.1109/TIP.2015.2458572. PMID 26208345. S2CID 665111.
- Birkhoff y MacLane. Un estudio del álgebra moderna . Macmillan. págs. 213, 299.
Enlaces externos
- Solucionador en línea para matrices de cualquier tamaño. Archivado el 9 de julio de 2013 en Wayback Machine.
- Función de Mathematica para resolver la ecuación de Sylvester
- Función MATLAB para resolver la ecuación de Sylvester