stringtranslate.com

Rango (álgebra lineal)

En álgebra lineal , el rango de una matriz A es la dimensión del espacio vectorial generado (o abarcado ) por sus columnas. [1] [2] [3] Esto corresponde al número máximo de columnas linealmente independientes de A. Esto, a su vez, es idéntico a la dimensión del espacio vectorial abarcado por sus filas. [4] El rango es, por tanto, una medida de la " no degeneración " del sistema de ecuaciones lineales y transformación lineal codificado por A. Existen múltiples definiciones equivalentes de rango. El rango de una matriz es una de sus características más fundamentales.

El rango se denota comúnmente por rango( A ) o rk( A ) ; [2] a veces los paréntesis no se escriben, como en rango A . [i]

Definiciones principales

En esta sección, damos algunas definiciones del rango de una matriz. Hay muchas definiciones posibles; consulte las definiciones alternativas para varias de ellas.

El rango de columna de A es la dimensión del espacio de columna de A , mientras que el rango de fila de A es la dimensión del espacio de fila de A.

Un resultado fundamental en álgebra lineal es que el rango de columna y el rango de fila son siempre iguales. (Se dan tres pruebas de este resultado en § Pruebas de que el rango de columna = rango de fila, a continuación). Este número (es decir, el número de filas o columnas linealmente independientes) se denomina simplemente el rango de A .

Se dice que una matriz tiene rango completo si su rango es igual al mayor posible para una matriz de las mismas dimensiones, que es el menor entre el número de filas y columnas. Se dice que una matriz tiene rango deficiente si no tiene rango completo. El rango deficiente de una matriz es la diferencia entre el menor entre el número de filas y columnas y el rango.

El rango de un mapa o un operador lineal se define como la dimensión de su imagen : [5] [6] [7] [8] donde es la dimensión de un espacio vectorial y es la imagen de un mapa.

Ejemplos

La matriz tiene rango 2: las dos primeras columnas son linealmente independientes , por lo que el rango es al menos 2, pero como la tercera es una combinación lineal de las dos primeras (la primera columna más la segunda), las tres columnas son linealmente dependientes, por lo que el rango debe ser menor que 3.

La matriz tiene rango 1: hay columnas distintas de cero, por lo que el rango es positivo, pero cualquier par de columnas es linealmente dependiente. De manera similar, la transpuesta de A tiene rango 1. De hecho, dado que los vectores columna de A son los vectores fila de la transpuesta de A , la afirmación de que el rango columna de una matriz es igual a su rango fila es equivalente a la afirmación de que el rango de una matriz es igual al rango de su transpuesta, es decir, rango( A ) = rango( A T ) .

Calcular el rango de una matriz

Rango a partir de formularios escalonados por filas

Un enfoque común para encontrar el rango de una matriz es reducirla a una forma más simple, generalmente la forma escalonada por filas , mediante operaciones elementales por filas . Las operaciones por filas no cambian el espacio de filas (por lo tanto, no cambian el rango de filas) y, al ser invertibles, asignan el espacio de columnas a un espacio isomorfo (por lo tanto, no cambian el rango de columnas). Una vez en forma escalonada por filas, el rango es claramente el mismo tanto para el rango de filas como para el rango de columnas, y es igual al número de pivotes (o columnas básicas) y también al número de filas distintas de cero.

Por ejemplo, la matriz A dada por se puede poner en forma escalonada reducida mediante las siguientes operaciones elementales de fila: La matriz final (en forma escalonada reducida) tiene dos filas distintas de cero y, por lo tanto, el rango de la matriz A es 2.

Cálculo

Cuando se aplica a los cálculos de punto flotante en las computadoras, la eliminación gaussiana básica ( descomposición LU ) puede ser poco confiable, y se debe utilizar en su lugar una descomposición que revele el rango. Una alternativa eficaz es la descomposición en valores singulares (SVD), pero existen otras opciones menos costosas computacionalmente, como la descomposición QR con pivoteo (la llamada factorización QR que revela el rango ), que aún son numéricamente más robustas que la eliminación gaussiana. La determinación numérica del rango requiere un criterio para decidir cuándo un valor, como un valor singular de la SVD, debe tratarse como cero, una elección práctica que depende tanto de la matriz como de la aplicación.

Pruebas de que el rango de columna = rango de fila

Prueba mediante reducción de filas

El hecho de que los rangos de columnas y filas de cualquier matriz sean formas iguales es fundamental en álgebra lineal. Se han dado muchas demostraciones. Una de las más elementales se ha esbozado en § Rango a partir de formas escalonadas por filas. A continuación se presenta una variante de esta demostración:

Es fácil demostrar que ni el rango de fila ni el rango de columna se modifican mediante una operación elemental de fila . A medida que la eliminación gaussiana procede mediante operaciones elementales de fila, la forma escalonada reducida de fila de una matriz tiene el mismo rango de fila y el mismo rango de columna que la matriz original. Otras operaciones elementales de columna permiten poner la matriz en la forma de una matriz identidad posiblemente delimitada por filas y columnas de ceros. Nuevamente, esto no cambia ni el rango de fila ni el rango de columna. Es inmediato que tanto el rango de fila como el de columna de esta matriz resultante es el número de sus entradas distintas de cero.

Presentamos otras dos pruebas de este resultado. La primera utiliza sólo propiedades básicas de combinaciones lineales de vectores y es válida para cualquier cuerpo . La prueba se basa en Wardlaw (2005). [9] La segunda utiliza ortogonalidad y es válida para matrices sobre los números reales ; se basa en Mackiw (1995). [4] Ambas pruebas se pueden encontrar en el libro de Banerjee y Roy (2014). [10]

Demostración mediante combinaciones lineales

Sea A una matriz m × n . Sea r el rango de columna de A y c 1 , ..., c r cualquier base para el espacio de columnas de A. Coloquemos estas como las columnas de una matriz m × r C . Cada columna de A se puede expresar como una combinación lineal de las r columnas de C . Esto significa que hay una matriz r × n R tal que A = CR . R es la matriz cuya i ésima columna se forma a partir de los coeficientes que dan la i ésima columna de A como una combinación lineal de las r columnas de C . En otras palabras, R es la matriz que contiene los múltiplos de las bases del espacio de columnas de A (que es C ), que luego se usan para formar A como un todo. Ahora, cada fila de A está dada por una combinación lineal de las r filas de R . Por lo tanto, las filas de R forman un conjunto generador del espacio de filas de A y, por el lema de intercambio de Steinitz , el rango de fila de A no puede exceder r . Esto demuestra que el rango de fila de A es menor o igual que el rango de columna de A . Este resultado se puede aplicar a cualquier matriz, por lo que se aplica el resultado a la transpuesta de A . Dado que el rango de fila de la transpuesta de A es el rango de columna de A y el rango de columna de la transpuesta de A es el rango de fila de A , esto establece la desigualdad inversa y obtenemos la igualdad del rango de fila y el rango de columna de A . (Véase también Factorización por rangos .)

Demostración mediante ortogonalidad

Sea A una matriz m  ×  n con entradas en los números reales cuyo rango de fila es r . Por lo tanto, la dimensión del espacio fila de A es r . Sea x 1 , x 2 , …, x r una base del espacio fila de A . Afirmamos que los vectores A x 1 , A x 2 , …, A x r son linealmente independientes . Para ver por qué, considere una relación homogénea lineal que involucra estos vectores con coeficientes escalares c 1 , c 2 , …, c r : donde v = c 1 x 1 + c 2 x 2 + ⋯ + c r x r . Hacemos dos observaciones: (a) v es una combinación lineal de vectores en el espacio fila de A , lo que implica que v pertenece al espacio fila de A , y (b) dado que A v = 0 , el vector v es ortogonal a cada vector fila de A y, por lo tanto, es ortogonal a cada vector en el espacio fila de A . Los hechos (a) y (b) juntos implican que v es ortogonal a sí mismo, lo que prueba que v = 0 o, por la definición de v , Pero recordemos que las x i se eligieron como base del espacio fila de A y, por lo tanto, son linealmente independientes. Esto implica que c 1 = c 2 = ⋯ = c r = 0 . De ello se deduce que A x 1 , A x 2 , …, A x r son linealmente independientes.

Ahora, cada A x i es obviamente un vector en el espacio columna de A . Entonces, A x 1 , A x 2 , …, A x r es un conjunto de r vectores linealmente independientes en el espacio columna de A y, por lo tanto, la dimensión del espacio columna de A (es decir, el rango columna de A ) debe ser al menos tan grande como r . Esto demuestra que el rango fila de A no es mayor que el rango columna de A . Ahora aplique este resultado a la transpuesta de A para obtener la desigualdad inversa y concluya como en la prueba anterior.

Definiciones alternativas

En todas las definiciones de esta sección, la matriz A se toma como una matriz m × n sobre un campo arbitrario F .

Dimensión de la imagen

Dada la matriz , existe una aplicación lineal asociada definida por El rango de es la dimensión de la imagen de . Esta definición tiene la ventaja de que se puede aplicar a cualquier aplicación lineal sin necesidad de una matriz específica.

Rango en términos de nulidad

Dado el mismo mapeo lineal f que el anterior, el rango es n menos la dimensión del núcleo de f . El teorema de rango-nulidad establece que esta definición es equivalente a la anterior.

Rango de columna: dimensión del espacio de columna

El rango de A es el número máximo de columnas linealmente independientes de A ; esta es la dimensión del espacio columna de A (el espacio columna es el subespacio de F m generado por las columnas de A , que de hecho es solo la imagen de la función lineal f asociada a A ).

Rango de fila: dimensión del espacio de fila

El rango de A es el número máximo de filas linealmente independientes de A ; esta es la dimensión del espacio de filas de A.

Rango de descomposición

El rango de A es el entero k más pequeño tal que A se puede factorizar como , donde C es una matriz m × k y R es una matriz k × n . De hecho, para todos los enteros k , los siguientes son equivalentes:

  1. el rango de la columna A es menor o igual a k ,
  2. Existen k columnas de tamaño m tales que cada columna de A es una combinación lineal de ,
  3. existe una matriz C y una matriz R tales que (cuando k es el rango, se trata de una factorización de rango de A ),
  4. Existen k filas de tamaño n tales que cada fila de A es una combinación lineal de ,
  5. el rango de fila de A es menor o igual a k .

De hecho, las siguientes equivalencias son obvias: . Por ejemplo, para demostrar (3) a partir de (2), tome C como la matriz cuyas columnas son de (2). Para demostrar (2) a partir de (3), tome como las columnas de C .

De la equivalencia se deduce que el rango de fila es igual al rango de columna.

Al igual que en el caso de la caracterización de la "dimensión de la imagen", esto se puede generalizar a una definición del rango de cualquier función lineal: el rango de una función lineal f  : VW es la dimensión mínima k de un espacio intermedio X tal que f se puede escribir como la composición de una función VX y una función XW . Desafortunadamente, esta definición no sugiere una manera eficiente de calcular el rango (para lo cual es mejor usar una de las definiciones alternativas). Consulte la factorización de rango para obtener más detalles.

Rango en términos de valores singulares

El rango de A es igual al número de valores singulares distintos de cero , que es el mismo que el número de elementos diagonales distintos de cero en Σ en la descomposición en valores singulares .

Rango determinante: tamaño del menor no nulo más grande

El rango de A es el orden más grande de cualquier menor distinto de cero en A. (El orden de un menor es la longitud del lado de la submatriz cuadrada de la que es determinante). Al igual que la caracterización del rango de descomposición, esto no proporciona una forma eficiente de calcular el rango, pero es útil teóricamente: un solo menor distinto de cero atestigua un límite inferior (es decir, su orden) para el rango de la matriz, lo que puede ser útil (por ejemplo) para demostrar que ciertas operaciones no reducen el rango de una matriz.

Una p -menor no nula ( submatriz p × p con determinante distinto de cero) muestra que las filas y columnas de esa submatriz son linealmente independientes y, por lo tanto, esas filas y columnas de la matriz completa son linealmente independientes (en la matriz completa), por lo que el rango de fila y columna son al menos tan grandes como el rango determinante; sin embargo, lo inverso es menos sencillo. La equivalencia del rango determinante y el rango de columna es un fortalecimiento de la afirmación de que si el lapso de n vectores tiene dimensión p , entonces p de esos vectores abarcan el espacio (equivalentemente, que uno puede elegir un conjunto generador que sea un subconjunto de los vectores): la equivalencia implica que un subconjunto de las filas y un subconjunto de las columnas definen simultáneamente una submatriz invertible (equivalentemente, si el lapso de n vectores tiene dimensión p , entonces p de estos vectores abarcan el espacio y hay un conjunto de coordenadas p en las que son linealmente independientes).

Rango tensorial: número mínimo de tensores simples

El rango de A es el número k más pequeño tal que A puede escribirse como una suma de k matrices de rango 1, donde una matriz se define como de rango 1 si y solo si puede escribirse como un producto distinto de cero de un vector columna c y un vector fila r . Esta noción de rango se denomina rango tensorial ; puede generalizarse en la interpretación de modelos separables de la descomposición en valores singulares .

Propiedades

Suponemos que A es una matriz m × n , y definimos la función lineal f por f ( x ) = A x como arriba.

Aplicaciones

Una aplicación útil del cálculo del rango de una matriz es el cálculo del número de soluciones de un sistema de ecuaciones lineales . Según el teorema de Rouché-Capelli , el sistema es inconsistente si el rango de la matriz aumentada es mayor que el rango de la matriz de coeficientes . Si, por otro lado, los rangos de estas dos matrices son iguales, entonces el sistema debe tener al menos una solución. La solución es única si y solo si el rango es igual al número de variables. De lo contrario, la solución general tiene k parámetros libres donde k es la diferencia entre el número de variables y el rango. En este caso (y suponiendo que el sistema de ecuaciones está en números reales o complejos) el sistema de ecuaciones tiene infinitas soluciones.

En la teoría de control , el rango de una matriz se puede utilizar para determinar si un sistema lineal es controlable u observable .

En el campo de la complejidad de la comunicación , el rango de la matriz de comunicación de una función da límites a la cantidad de comunicación necesaria para que dos partes calculen la función.

Generalización

Existen diferentes generalizaciones del concepto de rango para matrices sobre anillos arbitrarios , donde el rango de columna, el rango de fila, la dimensión del espacio de columna y la dimensión del espacio de fila de una matriz pueden ser diferentes de los demás o pueden no existir.

Al pensar en las matrices como tensores , el rango del tensor se generaliza a tensores arbitrarios; para tensores de orden mayor que 2 (las matrices son tensores de orden 2), el rango es muy difícil de calcular, a diferencia de lo que ocurre con las matrices.

Existe una noción de rango para aplicaciones suaves entre variedades suaves . Es igual al rango lineal de la derivada .

Matrices como tensores

El rango de la matriz no debe confundirse con el orden tensorial , que se denomina rango tensorial. El orden tensorial es la cantidad de índices necesarios para escribir un tensor y, por lo tanto, todas las matrices tienen un orden tensorial 2. Más precisamente, las matrices son tensores de tipo (1,1), que tienen un índice de fila y un índice de columna, también llamados orden covariante 1 y orden contravariante 1; consulte Tensor (definición intrínseca) para obtener más detalles.

El rango tensorial de una matriz también puede significar el número mínimo de tensores simples necesarios para expresar la matriz como una combinación lineal, y esta definición concuerda con el rango matricial como se analiza aquí.

Véase también

Notas

  1. ^ La notación alternativa incluye las de Katznelson y Katznelson (2008, pág. 52, §2.5.1) y Halmos (1974, pág. 90, § 50).
  2. ^ Prueba: Aplicar el teorema de rango-nulidad a la desigualdad
  3. ^ Demostración. La función está bien definida y es inyectiva. Obtenemos así la desigualdad en términos de dimensiones de kernel, que luego puede convertirse en la desigualdad en términos de rangos mediante el teorema de rango-nulidad . Alternativamente, si es un subespacio lineal entonces ; apliquemos esta desigualdad al subespacio definido por el complemento ortogonal de la imagen de en la imagen de , cuya dimensión es ; su imagen bajo tiene dimensión .

Referencias

  1. ^ Axler (2015) págs. 111-112, §§ 3.115, 3.119
  2. ^ ab Roman (2005) pág. 48, § 1.16
  3. ^ Bourbaki, Álgebra , cap. II, §10.12, pág. 359
  4. ^ ab Mackiw, G. (1995), "Una nota sobre la igualdad del rango de columna y fila de una matriz", Mathematics Magazine , 68 (4): 285–286, doi :10.1080/0025570X.1995.11996337
  5. ^ Hefferon (2020) pág. 200, cap. 3, Definición 2.1
  6. ^ Katznelson y Katznelson (2008) pág. 52, § 2.5.1
  7. ^ Valenza (1993) pág. 71, § 4.3
  8. ^ Halmos (1974) pág. 90, § 50
  9. ^ Wardlaw, William P. (2005), "El rango de fila es igual al rango de columna", Mathematics Magazine , 78 (4): 316–318, doi :10.1080/0025570X.2005.11953349, S2CID  218542661
  10. ^ Banerjee, Sudipto; Roy, Anindya (2014), Álgebra lineal y análisis matricial para estadística , Textos en ciencia estadística (1.ª ed.), Chapman y Hall/CRC, ISBN 978-1420095388
  11. ^ Mirsky, Leonid (1955). Introducción al álgebra lineal . Publicaciones de Dover. ISBN 978-0-486-66434-7.

Fuentes

Lectura adicional