Notación de Einstein

En matemáticas , especialmente el uso del álgebra lineal en física matemática y geometría diferencial , la notación de Einstein (también conocida como convención de suma de Einstein o notación de suma de Einstein ) es una convención de notación que implica la suma de un conjunto de términos indexados en una fórmula, logrando así brevedad. Como parte de las matemáticas, es un subconjunto notacional del cálculo de Ricci ; sin embargo, se utiliza a menudo en aplicaciones de física que no distinguen entre espacios tangentes y cotangentes . Fue introducido en la física por Albert Einstein en 1916. ^[1]

Introducción

Declaración de convención

Según esta convención, cuando una variable de índice aparece dos veces en un solo término y no está definida de otra manera (ver Variables libres y ligadas ), implica la suma de ese término sobre todos los valores del índice. Entonces, cuando los índices pueden abarcar el conjunto ${1, 2, 3}$ , la convención lo simplifica a: $y=\sum _{i=1}^{3}c_{i}x^{i}=c_{1}x^{1}+c_{2}x^{2}+c_{3 }x^{3}$ $y=c_{i}x^{i}$

Los índices superiores no son exponentes sino que son índices de coordenadas, coeficientes o vectores base . Es decir, en este contexto $x 2$ debe entenderse como el segundo componente de $x$ y no como el cuadrado de $x$ (esto en ocasiones puede generar ambigüedad). La posición superior del índice en $x i$ se debe a que, normalmente, un índice aparece una vez en una posición superior (superíndice) y una vez en una posición inferior (subíndice) en un término (consulte § Aplicación a continuación). Normalmente, $(x 1 x 2 x 3)$ sería equivalente al tradicional $(x y z)$ .

En la relatividad general , una convención común es que

el alfabeto griego se utiliza para los componentes de espacio y tiempo, donde los índices toman valores 0, 1, 2 o 3 (las letras utilizadas con frecuencia son $μ, ν, ...$ ),
el alfabeto latino se usa solo para componentes espaciales, donde los índices toman valores 1, 2 o 3 (las letras más utilizadas son $i, j,...$ ),

En general, los índices pueden abarcar cualquier conjunto de indexación , incluido un conjunto infinito . Esto no debe confundirse con una convención tipográficamente similar utilizada para distinguir entre la notación de índice tensor y la notación de índice abstracto estrechamente relacionada pero distinta e independiente de la base .

Un índice que se suma es un índice de suma , en este caso " $i$ ". También se le llama índice ficticio ya que cualquier símbolo puede reemplazar " $i$ " sin cambiar el significado de la expresión (siempre que no colisione con otros símbolos de índice en el mismo término).

Un índice que no se suma es un índice libre y debe aparecer sólo una vez por término. Si dicho índice aparece, normalmente también aparece en cada dos términos de una ecuación. Un ejemplo de índice libre es la " $i$ " de la ecuación , que es equivalente a la ecuación . $v_{i}=a_{i}b_{j}x^{j}$ ${\textstyle v_{i}=\sum _{j}(a_{i}b_{j}x^{j})}$

Solicitud

La notación de Einstein se puede aplicar de formas ligeramente diferentes. Normalmente, cada índice aparece una vez en una posición superior (superíndice) y una vez en una posición inferior (subíndice) de un término; sin embargo, la convención se puede aplicar de manera más general a cualquier índice repetido dentro de un término. ^[2] Cuando se trata de vectores covariantes y contravariantes , donde la posición de un índice indica el tipo de vector, generalmente se aplica el primer caso; un vector covariante sólo puede contraerse con un vector contravariante, correspondiente a la suma de los productos de coeficientes. Por otro lado, cuando hay una base de coordenadas fija (o cuando no se consideran vectores de coordenadas), se puede optar por utilizar sólo subíndices; consulte § Superíndices y subíndices versus solo subíndices a continuación.

Representaciones vectoriales

Superíndices y subíndices versus solo subíndices

En términos de covarianza y contravarianza de vectores ,

los índices superiores representan componentes de vectores contravariantes ( vectores ),
los índices inferiores representan componentes de vectores covariantes ( covectores ).

Se transforman de forma contravariante o covariante, respectivamente, con respecto al cambio de base .

En reconocimiento de este hecho, la siguiente notación utiliza el mismo símbolo tanto para un vector o covector como para sus componentes , como en: ${\begin{aligned}v=v^{i}e_{i}={\begin{bmatrix}e_{1}&e_{2}&\cdots &e_{n}\end{bmatrix}}{\begin{bmatrix}v^{1}\\v^{2}\\\vdots \\v^{n}\end{bmatrix}}\\w=w_{i}e^{i}={\begin{bmatrix}w_{1}&w_{2}&\cdots &w_{n}\end{bmatrix}}{\begin{bmatrix}e^{1}\\e^{2}\\\vdots \\e^{n}\end{bmatrix}}\end{aligned}}$

donde $v$ es el vector y $vi son$ sus componentes (no el $i-$ ésimo covector $v$ ), $w$ es el covector y $wi son$ sus componentes. Los elementos del vector base son vectores de cada columna y los elementos base del covector son covectores de cada fila. (Ver también § Descripción abstracta; dualidad , a continuación y los ejemplos ) $e_{i}$ $e^{i}$

En presencia de una forma no degenerada (un isomorfismo $V \to V *$ , por ejemplo una métrica de Riemann o una métrica de Minkowski ), se pueden subir y bajar índices .

Una base da esa forma (a través de la base dual ), por lo tanto, cuando se trabaja en $R n$ con una métrica euclidiana y una base ortonormal fija , se tiene la opción de trabajar solo con subíndices.

Sin embargo, si uno cambia las coordenadas, la forma en que cambian los coeficientes depende de la varianza del objeto y no se puede ignorar la distinción; véase Covarianza y contravarianza de vectores .

Mnemotécnica

En el ejemplo anterior, los vectores se representan como matrices $n \times 1$ (vectores de columna), mientras que los covectores se representan como matrices $1 \times$ $n$ (covectores de fila).

Cuando se utiliza la convención de vectores de columna:

" Los índices superiores van de arriba a abajo; los índices inferiores van de izquierda a derecha".
" Los tensores covariantes son vectores de fila que tienen índices que están debajo ( co-row-below )".
Los covectores son vectores de fila: por lo tanto, el índice inferior indica en qué columna se encuentra. ${\begin{bmatrix}w_{1}&\cdots &w_{k}\end{bmatrix}}.$
Los vectores contravariantes son vectores de columna: por lo tanto, el índice superior indica en qué fila se encuentra. ${\begin{bmatrix}v^{1}\\\vdots \\v^{k}\end{bmatrix}}$

Descripción abstracta

La virtud de la notación de Einstein es que representa las cantidades invariantes con una notación simple.

En física, un escalar es invariante bajo transformaciones de base. En particular, un escalar de Lorentz es invariante bajo una transformación de Lorentz . Los términos individuales de la suma no lo son. Cuando se cambia la base, los componentes de un vector cambian mediante una transformación lineal descrita por una matriz. Esto llevó a Einstein a proponer la convención de que los índices repetidos implican que se debe realizar la suma.

En cuanto a los covectores, cambian según la matriz inversa . Esto está diseñado para garantizar que la función lineal asociada con el covector, la suma anterior, sea la misma sin importar cuál sea la base.

El valor de la convención de Einstein es que se aplica a otros espacios vectoriales construidos a partir de $V$ utilizando el producto tensorial y la dualidad . Por ejemplo, $V \otimes V$ , el producto tensorial de $V$ consigo mismo, tiene una base que consta de tensores de la forma $e ij = e i \otimes e j$ . Cualquier tensor $T$ en $V \otimes V$ se puede escribir como: $\mathbf {T} =T^{ij}\mathbf {e} _{ij}.$

$V *$ , el dual de $V$ , tiene una base $e 1$ , $e 2$ , ..., $e n$ que obedece a la regla donde $δ$ es el delta de Kronecker . Como las coordenadas de fila/columna en una matriz corresponden a los índices superior/inferior del producto tensorial. $\mathbf {e} ^{i}(\mathbf {e} _{j})=\delta _{j}^{i}.$ $\operatorname {Hom} (V,W)=V^{*}\otimes W$

Operaciones comunes en esta notación

En la notación de Einstein, la referencia de elemento habitual para la -ésima fila y la -ésima columna de la matriz es . Luego podemos escribir las siguientes operaciones en notación de Einstein de la siguiente manera. $A_{mn}$ $m$ $n$ $A$ ${A^{m}}_{n}$

Producto Interno

Usando una base ortogonal , el producto interno ( producto escalar vectorial ) es la suma de los componentes correspondientes multiplicados entre sí: $\mathbf {u} \cdot \mathbf {v} =u_{j}v^{j}$

Esto también se puede calcular multiplicando el covector por el vector.

Producto cruzado vectorial

Nuevamente usando una base ortogonal (en 3 dimensiones), el producto cruzado involucra intrínsecamente sumas sobre permutaciones de componentes: donde $\mathbf {u} \times \mathbf {v} ={\varepsilon ^{i}}_{jk}u^{j}v^{k}\mathbf {e} _{i}$ ${\varepsilon ^{i}}_{jk}=\delta ^{il}\varepsilon _{ljk}$

$ε ijk$ es el símbolo de Levi-Civita , y $δ il$ es el delta de Kronecker generalizado. Según esta definición de $ε$ , no hay diferencia entre $ε i jk$ y $ε ijk$ sino la posición de los índices.

Multiplicación matriz-vector

El producto de una matriz $A ij$ por un vector columna $v j$ es: equivalente a $\mathbf {u} _{i}=(\mathbf {A} \mathbf {v} )_{i}=\sum _{j=1}^{N}A_{ij}v_{j}$ $u^{i}={A^{i}}_{j}v^{j}$

Este es un caso especial de multiplicación de matrices.

Multiplicación de matrices

El producto matricial de dos matrices $A ij$ y $B jk$ es: $\mathbf {C} _{ik}=(\mathbf {A} \mathbf {B} )_{ik}=\sum _{j=1}^{N}A_{ij}B_{jk}$

equivalente a ${C^{i}}_{k}={A^{i}}_{j}{B^{j}}_{k}$

Rastro

Para una matriz cuadrada $A i j$ , la traza es la suma de los elementos diagonales, por lo tanto la suma sobre un índice común $A i i$ .

Producto exterior

El producto exterior del vector columna $u i$ por el vector fila $v j$ produce una matriz $A$ $m \times n$ : ${A^{i}}_{j}=u^{i}v_{j}={(uv)^{i}}_{j}$

Dado que $i$ y $j$ representan dos índices diferentes , no hay suma y los índices no se eliminan mediante la multiplicación.

Subir y bajar índices

Dado un tensor , uno puede aumentar o disminuir un índice contrayendo el tensor con el tensor métrico , $g μν$ . Por ejemplo, tomando el tensor $T α β$ , se puede reducir un índice: $g_{\mu \sigma }{T^{\sigma }}_{\beta }=T_{\mu \beta }$

O se puede elevar un índice: $g^{\mu \sigma }{T_{\sigma }}^{\alpha }=T^{\mu \alpha }$

Ver también

Notas

Esto se aplica sólo a los índices numéricos. La situación es la opuesta para los índices abstractos . Luego, los propios vectores llevan índices abstractos superiores y los covectores llevan índices abstractos inferiores, como en el ejemplo de la introducción de este artículo. Los elementos de una base de vectores pueden llevar un índice numérico inferior y un índice abstracto superior .

Referencias

^ Einstein, Alberto (1916). "El fundamento de la teoría general de la relatividad". Annalen der Physik . 354 (7): 769. Código bibliográfico : 1916AnP...354..769E. doi : 10.1002/andp.19163540702. Archivado desde el original ( PDF ) el 29 de agosto de 2006 . Consultado el 3 de septiembre de 2006 .
^ "Resumen de Einstein". Wolfram MathWorld . Consultado el 13 de abril de 2011 .

Bibliografía

Kuptsov, LP (2001) [1994], "Regla de Einstein", Enciclopedia de Matemáticas , EMS Press.

enlaces externos

El Wikilibro de Relatividad General tiene una página sobre el tema: Notación de suma de Einstein

Rawlings, Steve (1 de febrero de 2007). "Conferencia 10: Convención de suma de Einstein e identidades vectoriales". Universidad de Oxford. Archivado desde el original el 6 de enero de 2017 . Consultado el 2 de julio de 2008 .
"Comprensión del einsum de NumPy". Desbordamiento de pila .