stringtranslate.com

Base (álgebra lineal)

El mismo vector se puede representar en dos bases diferentes (flechas moradas y rojas).

En matemáticas , un conjunto B de vectores en un espacio vectorial V se denomina base ( pl.: bases ) si cada elemento de V puede escribirse de manera única como una combinación lineal finita de elementos de B. Los coeficientes de esta combinación lineal se denominan componentes o coordenadas del vector con respecto a B. Los elementos de una base se denominanvectores base .

De manera equivalente, un conjunto B es una base si sus elementos son linealmente independientes y cada elemento de V es una combinación lineal de elementos de B. [1] En otras palabras, una base es un conjunto generador linealmente independiente .

Un espacio vectorial puede tener varias bases; sin embargo, todas las bases tienen el mismo número de elementos, llamado dimensión del espacio vectorial.

Este artículo trata principalmente de espacios vectoriales de dimensión finita. Sin embargo, muchos de los principios también son válidos para espacios vectoriales de dimensión infinita.

Los vectores base encuentran aplicaciones en el estudio de estructuras cristalinas y marcos de referencia .

Definición

Una base B de un espacio vectorial V sobre un cuerpo F (como los números reales R o los números complejos C ) es un subconjunto linealmente independiente de V que abarca V . Esto significa que un subconjunto B de V es una base si satisface las dos condiciones siguientes:

independencia lineal
para cada subconjunto finito de B , si para alguno en F , entonces ;
propiedad que abarca
para cada vector v en V , se puede elegir en F y en B tales que .

Los escalares se denominan coordenadas del vector v con respecto a la base B , y por la primera propiedad están determinados de forma única.

Un espacio vectorial que tiene una base finita se denomina finito-dimensional . En este caso, el subconjunto finito puede tomarse como B para comprobar la independencia lineal en la definición anterior.

A menudo resulta conveniente o incluso necesario disponer de un ordenamiento de los vectores base, por ejemplo, cuando se habla de orientación , o cuando se consideran los coeficientes escalares de un vector con respecto a una base sin hacer referencia explícita a los elementos base. En este caso, el ordenamiento es necesario para asociar cada coeficiente al elemento base correspondiente. Este ordenamiento se puede realizar numerando los elementos base. Para enfatizar que se ha elegido un orden, se habla de una base ordenada , que por tanto no es simplemente un conjunto no estructurado , sino una secuencia , una familia indexada o algo similar; véase § Bases y coordenadas ordenadas más abajo.

Ejemplos

Esta imagen ilustra la base estándar en R 2 . Los vectores azul y naranja son los elementos de la base; el vector verde se puede dar en términos de los vectores base y, por lo tanto, depende linealmente de ellos.

El conjunto R 2 de los pares ordenados de números reales es un espacio vectorial bajo las operaciones de adición por componentes y multiplicación escalar donde es cualquier número real. Una base simple de este espacio vectorial consta de los dos vectores e 1 = (1, 0) y e 2 = (0, 1) . Estos vectores forman una base (llamada base estándar ) porque cualquier vector v = ( a , b ) de R 2 puede escribirse de forma única como Cualquier otro par de vectores linealmente independientes de R 2 , como (1, 1) y (−1, 2) , también forma una base de R 2 .

De manera más general, si F es un cuerpo , el conjunto de n -tuplas de elementos de F es un espacio vectorial para la adición y la multiplicación escalar definidas de manera similar. Sea la n -tupla con todos los componentes iguales a 0, excepto el i -ésimo, que es 1. Entonces es una base de la cual se llama base estándar de

Un ejemplo diferente lo dan los anillos polinómicos . Si F es un cuerpo, la colección F [ X ] de todos los polinomios en un indeterminado X con coeficientes en F es un espacio vectorial F. Una base para este espacio es la base monomial B , que consiste en todos los monomios : Cualquier conjunto de polinomios tal que haya exactamente un polinomio de cada grado (como los polinomios de base de Bernstein o los polinomios de Chebyshev ) también es una base. (Un conjunto de polinomios de este tipo se llama secuencia polinómica ). Pero también hay muchas bases para F [ X ] que no son de esta forma.

Propiedades

Muchas propiedades de las bases finitas resultan del lema de intercambio de Steinitz , que establece que, para cualquier espacio vectorial V , dado un conjunto generador finito S y un conjunto linealmente independiente L de n elementos de V , se pueden reemplazar n elementos bien elegidos de S por los elementos de L para obtener un conjunto generador que contenga a L , que tenga sus otros elementos en S y que tenga el mismo número de elementos que S.

La mayoría de las propiedades resultantes del lema de intercambio de Steinitz siguen siendo verdaderas cuando no hay un conjunto generador finito, pero sus demostraciones en el caso infinito generalmente requieren el axioma de elección o una forma más débil del mismo, como el lema del ultrafiltro .

Si V es un espacio vectorial sobre un cuerpo F , entonces:

Si V es un espacio vectorial de dimensión n , entonces:

Coordenadas

Sea V un espacio vectorial de dimensión finita n sobre un cuerpo F , y sea una base de V . Por definición de una base, cada v en V puede escribirse, de manera única, como donde los coeficientes son escalares (es decir, elementos de F ), que se denominan coordenadas de v sobre B . Sin embargo, si se habla del conjunto de los coeficientes, se pierde la correspondencia entre coeficientes y elementos de la base, y varios vectores pueden tener el mismo conjunto de coeficientes. Por ejemplo, y tienen el mismo conjunto de coeficientes {2, 3} , y son diferentes. Por lo tanto, a menudo es conveniente trabajar con una base ordenada ; esto se hace típicamente indexando los elementos de la base por los primeros números naturales. Entonces, las coordenadas de un vector forman una secuencia indexada de manera similar, y un vector está completamente caracterizado por la secuencia de coordenadas. Una base ordenada, especialmente cuando se usa junto con un origen , también se llama marco de coordenadas o simplemente marco (por ejemplo, un marco cartesiano o un marco afín ).

Sea, como es habitual, el conjunto de las n -tuplas de elementos de F . Este conjunto es un espacio vectorial F , con adición y multiplicación escalar definidas componente por componente. La función es un isomorfismo lineal del espacio vectorial sobre V . En otras palabras, es el espacio de coordenadas de V , y la n -tupla es el vector de coordenadas de v .

La imagen inversa de de es la n -tupla cuyos componentes son todos 0, excepto el i -ésimo que es 1. La forma una base ordenada de , que se llama su base estándar o base canónica . La base ordenada B es la imagen de de la base canónica de .

De lo que precede se sigue que toda base ordenada es la imagen por un isomorfismo lineal de la base canónica de , y que todo isomorfismo lineal de sobre V puede definirse como el isomorfismo que proyecta la base canónica de sobre una base ordenada dada de V . En otras palabras, es equivalente a definir una base ordenada de V , o un isomorfismo lineal de sobre V .

Cambio de base

Sea V un espacio vectorial de dimensión n sobre un cuerpo F . Dadas dos bases (ordenadas) y de V , a menudo es útil expresar las coordenadas de un vector x con respecto a en términos de las coordenadas con respecto a Esto se puede hacer mediante la fórmula de cambio de base , que se describe a continuación. Se han elegido los subíndices "viejo" y "nuevo" porque es habitual referirse a y como la base antigua y la base nueva , respectivamente. Es útil describir las coordenadas antiguas en términos de las nuevas, porque, en general, uno tiene expresiones que involucran las coordenadas antiguas, y si uno quiere obtener expresiones equivalentes en términos de las nuevas coordenadas; esto se obtiene reemplazando las coordenadas antiguas por sus expresiones en términos de las nuevas coordenadas.

Normalmente, los nuevos vectores base se dan por sus coordenadas sobre la base anterior, es decir, si y son las coordenadas de un vector x sobre la base anterior y la nueva respectivamente, la fórmula de cambio de base es para i = 1, ..., n .

Esta fórmula se puede escribir de forma concisa en notación matricial . Sea A la matriz de , y los vectores columna de las coordenadas de v en la base antigua y la nueva respectivamente, entonces la fórmula para cambiar las coordenadas es

La fórmula se puede demostrar considerando la descomposición del vector x en las dos bases: una tiene y

La fórmula de cambio de base resulta entonces de la unicidad de la descomposición de un vector sobre una base, aquí ; es decir para i = 1, ..., n .

Nociones relacionadas

Módulo gratuito

Si se reemplaza el cuerpo que aparece en la definición de un espacio vectorial por un anillo , se obtiene la definición de un módulo . Para los módulos, la independencia lineal y los conjuntos generadores se definen exactamente como para los espacios vectoriales, aunque se utiliza más comúnmente " conjunto generador " que "conjunto generador".

Al igual que en el caso de los espacios vectoriales, una base de un módulo es un subconjunto linealmente independiente que también es un conjunto generador. Una diferencia importante con la teoría de los espacios vectoriales es que no todos los módulos tienen una base. Un módulo que tiene una base se denomina módulo libre . Los módulos libres desempeñan un papel fundamental en la teoría de módulos, ya que pueden utilizarse para describir la estructura de módulos no libres mediante resoluciones libres .

Un módulo sobre los números enteros es exactamente lo mismo que un grupo abeliano . Por lo tanto, un módulo libre sobre los números enteros también es un grupo abeliano libre. Los grupos abelianos libres tienen propiedades específicas que no comparten los módulos sobre otros anillos. Específicamente, cada subgrupo de un grupo abeliano libre es un grupo abeliano libre y, si G es un subgrupo de un grupo abeliano libre finitamente generado H (es decir, un grupo abeliano que tiene una base finita), entonces existe una base de H y un número entero 0 ≤ kn tal que es una base de G , para algunos números enteros distintos de cero . Para más detalles, consulte Grupo abeliano libre § Subgrupos .

Análisis

En el contexto de espacios vectoriales de dimensión infinita sobre números reales o complejos, el términoLa base de Hamel (nombrada en honor aGeorg Hamel[2]) obase algebraicase puede utilizar para referirse a una base como se define en este artículo. Esto es para hacer una distinción con otras nociones de "base" que existen cuando los espacios vectoriales de dimensión infinita están dotados de estructura adicional. Las alternativas más importantes sonlas bases ortogonalesenespacios de Hilbert,las bases de Schauderylas bases de Markushevichenespacios lineales normados. En el caso de los números realesRvistos como un espacio vectorial sobre el cuerpoQde números racionales, las bases de Hamel son incontables y tienen específicamente lacardinalidaddel continuo, que es elnúmero cardinal ,donde(aleph-cero) es el cardinal infinito más pequeño, el cardinal de los enteros.

La característica común de las otras nociones es que permiten tomar infinitas combinaciones lineales de los vectores base para generar el espacio. Esto, por supuesto, requiere que se definan sumas infinitas de manera significativa en estos espacios, como es el caso de los espacios vectoriales topológicos , una gran clase de espacios vectoriales que incluye, por ejemplo, los espacios de Hilbert , los espacios de Banach o los espacios de Fréchet .

La preferencia de otros tipos de bases para espacios de dimensión infinita se justifica por el hecho de que la base de Hamel se vuelve "demasiado grande" en los espacios de Banach: si X es un espacio vectorial normado de dimensión infinita que es completo (es decir, X es un espacio de Banach ), entonces cualquier base de Hamel de X es necesariamente incontable . Esto es una consecuencia del teorema de la categoría de Baire . La completitud, así como la dimensión infinita, son supuestos cruciales en la afirmación anterior. De hecho, los espacios de dimensión finita tienen por definición bases finitas y hay espacios normados de dimensión infinita ( no completos ) que tienen bases de Hamel contables. Considérese , el espacio de las sucesiones de números reales que tienen solo un número finito de elementos distintos de cero, con la norma . Su base estándar , que consiste en las sucesiones que tienen solo un elemento distinto de cero, que es igual a 1, es una base de Hamel contable.

Ejemplo

En el estudio de las series de Fourier , se aprende que las funciones {1} ∪ { sin( nx ), cos( nx ): n = 1, 2, 3, ...} son una "base ortogonal" del espacio vectorial (real o complejo) de todas las funciones (reales o complejas) en el intervalo [0, 2π] que son integrables al cuadrado en este intervalo, es decir, funciones f que satisfacen

Las funciones {1} ∪ { sin( nx ), cos( nx ) : n = 1, 2, 3, ... } son linealmente independientes, y cada función f que sea integrable al cuadrado en [0, 2π] es una "combinación lineal infinita" de ellas, en el sentido de que

para coeficientes adecuados (reales o complejos) a k , b k . Pero muchas [3] funciones integrables al cuadrado no pueden representarse como combinaciones lineales finitas de estas funciones base, que por lo tanto no comprenden una base de Hamel. Cada base de Hamel de este espacio es mucho más grande que este conjunto meramente numerable e infinito de funciones. Las bases de Hamel de espacios de este tipo normalmente no son útiles, mientras que las bases ortonormales de estos espacios son esenciales en el análisis de Fourier .

Geometría

Las nociones geométricas de espacio afín , espacio proyectivo , conjunto convexo y cono tienen nociones relacionadas de base . [4] Una base afín para un espacio afín n -dimensional son los puntos en posición lineal general .La base proyectiva sonpuntos en posición general, en un espacio proyectivo de dimensiónn.La base convexa de unpolitopoes el conjunto de los vértices de suenvoltura convexa.La base del cono [5]consiste en un punto por borde de un cono poligonal. Véase tambiénbase de Hilbert (programación lineal).

Base aleatoria

Para una distribución de probabilidad en R n con una función de densidad de probabilidad , como la equidistribución en una bola n -dimensional con respecto a la medida de Lebesgue, se puede demostrar que n vectores elegidos aleatoriamente e independientemente formarán una base con probabilidad uno , lo que se debe al hecho de que n vectores linealmente dependientes x 1 , ..., x n en R n deben satisfacer la ecuación det[ x 1x n ] = 0 (determinante cero de la matriz con columnas x i ), y el conjunto de ceros de un polinomio no trivial tiene medida cero. Esta observación ha llevado a técnicas para aproximar bases aleatorias. [6] [7]

Distribución empírica de longitudes N de cadenas de vectores casi ortogonales por pares que se toman de forma aleatoria e independiente del cubo n -dimensional [−1, 1] n en función de la dimensión, n . Los diagramas de caja muestran el segundo y tercer cuartil de estos datos para cada n , las barras rojas corresponden a las medianas y las estrellas azules indican las medias. La curva roja muestra el límite teórico dado por la ecuación (1) y la curva verde muestra una estimación refinada. [7]

Es difícil comprobar numéricamente la dependencia lineal o la ortogonalidad exacta. Por lo tanto, se utiliza el concepto de ε-ortogonalidad. Para espacios con producto interno , x es ε-ortogonal a y si (es decir, el coseno del ángulo entre x e y es menor que ε ).

En dimensiones altas, dos vectores aleatorios independientes son con alta probabilidad casi ortogonales, y el número de vectores aleatorios independientes, que son todos con una probabilidad dada alta casi ortogonales por pares, crece exponencialmente con la dimensión. Más precisamente, considere la equidistribución en una bola n -dimensional. Elija N vectores aleatorios independientes de una bola (son independientes y se distribuyen de manera idéntica ). Sea θ un número positivo pequeño. Entonces, para

Los N vectores aleatorios son todos ε-ortogonales por pares con probabilidad 1 − θ . [7] Este N crece exponencialmente con dimensión n y para n suficientemente grande . Esta propiedad de las bases aleatorias es una manifestación del llamado fenómeno de concentración de medidas . [8]

La figura (derecha) ilustra la distribución de longitudes N de cadenas de vectores casi ortogonales por pares que se muestrean aleatoriamente de forma independiente del cubo n -dimensional [−1, 1] n en función de la dimensión, n . Primero se selecciona aleatoriamente un punto en el cubo. El segundo punto se elige aleatoriamente en el mismo cubo. Si el ángulo entre los vectores estaba dentro de π/2 ± 0,037π/2, entonces se conserva el vector. En el siguiente paso se genera un nuevo vector en el mismo hipercubo y se evalúan sus ángulos con los vectores generados previamente. Si estos ángulos están dentro de π/2 ± 0,037π/2 , entonces se conserva el vector. El proceso se repite hasta que se rompe la cadena de casi ortogonalidad y se registra el número de dichos vectores casi ortogonales por pares (longitud de la cadena). Para cada n , se construyeron numéricamente 20 cadenas casi ortogonales por pares para cada dimensión. Se presenta la distribución de la longitud de estas cadenas.

Prueba de que todo espacio vectorial tiene una base

Sea V cualquier espacio vectorial sobre algún cuerpo F. Sea X el conjunto de todos los subconjuntos linealmente independientes de V.

El conjunto X no es vacío ya que el conjunto vacío es un subconjunto independiente de V , y está parcialmente ordenado por inclusión, lo que se denota, como es habitual, por .

Sea Y un subconjunto de X que está totalmente ordenado por , y sea L Y la unión de todos los elementos de Y (que son en sí mismos ciertos subconjuntos de V ).

Como ( Y , ⊆) está totalmente ordenado, cada subconjunto finito de L Y es un subconjunto de un elemento de Y , que es un subconjunto linealmente independiente de V , y por lo tanto L Y es linealmente independiente. Por lo tanto , L Y es un elemento de X . Por lo tanto, L Y es una cota superior para Y en ( X , ⊆) : es un elemento de X , que contiene a cada elemento de Y .

Como X no es vacío, y todo subconjunto totalmente ordenado de ( X , ⊆) tiene un límite superior en X , el lema de Zorn afirma que X tiene un elemento maximalista. En otras palabras, existe algún elemento L max de X que satisface la condición de que siempre que L max ⊆ L para algún elemento L de X , entonces L = L max .

Queda por demostrar que L max es una base de V . Como L max pertenece a X , ya sabemos que L max es un subconjunto linealmente independiente de V .

Si hubiera algún vector w de V que no esté en el lapso de L max , entonces w tampoco sería un elemento de L max . Sea L w = L max ∪ { w } . Este conjunto es un elemento de X , es decir, es un subconjunto linealmente independiente de V (porque w no está en el lapso de L max , y L max es independiente). Como L max ⊆ L w , y L max ≠ L w (porque L w contiene al vector w que no está contenido en L max ), esto contradice la maximalidad de L max . Por lo tanto, esto demuestra que L max genera V .

Por lo tanto, L max es linealmente independiente y abarca V . Por lo tanto, es una base de V , y esto demuestra que todo espacio vectorial tiene una base.

Esta prueba se basa en el lema de Zorn, que es equivalente al axioma de elección . A la inversa, se ha demostrado que si todo espacio vectorial tiene una base, entonces el axioma de elección es verdadero. [9] Por lo tanto, las dos afirmaciones son equivalentes.

Véase también

Notas

  1. ^ Halmos, Paul Richard (1987). Espacios vectoriales de dimensión finita (4.ª ed.). Nueva York: Springer. pág. 10. ISBN 978-0-387-90093-3.
  2. ^ Hamel 1905
  3. ^ Nótese que no se puede decir "la mayoría" porque las cardinalidades de los dos conjuntos (funciones que pueden y no pueden representarse con un número finito de funciones base) son las mismas.
  4. ^ Rees, Elmer G. (2005). Notas sobre geometría. Berlín: Springer. pág. 7. ISBN 978-3-540-12053-7.
  5. ^ Kuczma, Marek (1970). "Algunas observaciones sobre funciones aditivas en conos". Aecuaciones Mathematicae . 4 (3): 303–306. doi :10.1007/BF01844160. S2CID  189836213.
  6. ^ Igelnik, B.; Pao, Y.-H. (1995). "Elección estocástica de funciones base en la aproximación de funciones adaptativas y la red de enlace funcional". IEEE Trans. Neural Netw . 6 (6): 1320–1329. doi :10.1109/72.471375. PMID  18263425.
  7. ^ abc Gorban, Alexander N. ; Tyukin, Ivan Y.; Prokhorov, Danil V.; Sofeikov, Konstantin I. (2016). "Aproximación con bases aleatorias: pro y contra". Ciencias de la información . 364–365: 129–145. arXiv : 1506.04631 . doi :10.1016/j.ins.2015.09.021. S2CID  2239376.
  8. ^ Artstein, Shiri (2002). "Fenómenos de concentración proporcional de la esfera" (PDF) . Revista israelí de matemáticas . 132 (1): 337–358. CiteSeerX 10.1.1.417.2375 . doi : 10.1007/BF02784520 . S2CID  8095719. 
  9. ^ Blass 1984

Referencias

Referencias generales

Referencias históricas

Enlaces externos