En matemáticas , especialmente el uso del álgebra lineal en física matemática y geometría diferencial , la notación de Einstein (también conocida como convención de suma de Einstein o notación de suma de Einstein ) es una convención de notación que implica la suma de un conjunto de términos indexados en una fórmula, logrando así brevedad. Como parte de las matemáticas, es un subconjunto notacional del cálculo de Ricci ; sin embargo, se utiliza a menudo en aplicaciones de física que no distinguen entre espacios tangentes y cotangentes . Fue introducido en la física por Albert Einstein en 1916. [1]
Según esta convención, cuando una variable de índice aparece dos veces en un solo término y no está definida de otra manera (ver Variables libres y ligadas ), implica la suma de ese término sobre todos los valores del índice. Entonces, cuando los índices pueden abarcar el conjunto {1, 2, 3} , la convención lo simplifica a:
Los índices superiores no son exponentes sino que son índices de coordenadas, coeficientes o vectores base . Es decir, en este contexto x 2 debe entenderse como el segundo componente de x y no como el cuadrado de x (esto en ocasiones puede generar ambigüedad). La posición superior del índice en x i se debe a que, normalmente, un índice aparece una vez en una posición superior (superíndice) y una vez en una posición inferior (subíndice) en un término (consulte § Aplicación a continuación). Normalmente, ( x 1 x 2 x 3 ) sería equivalente al tradicional ( x y z ) .
En la relatividad general , una convención común es que
En general, los índices pueden abarcar cualquier conjunto de indexación , incluido un conjunto infinito . Esto no debe confundirse con una convención tipográficamente similar utilizada para distinguir entre la notación de índice tensor y la notación de índice abstracto estrechamente relacionada pero distinta e independiente de la base .
Un índice que se suma es un índice de suma , en este caso " i ". También se le llama índice ficticio ya que cualquier símbolo puede reemplazar " i " sin cambiar el significado de la expresión (siempre que no colisione con otros símbolos de índice en el mismo término).
Un índice que no se suma es un índice libre y debe aparecer sólo una vez por término. Si dicho índice aparece, normalmente también aparece en cada dos términos de una ecuación. Un ejemplo de índice libre es la " i " de la ecuación , que es equivalente a la ecuación .
La notación de Einstein se puede aplicar de formas ligeramente diferentes. Normalmente, cada índice aparece una vez en una posición superior (superíndice) y una vez en una posición inferior (subíndice) de un término; sin embargo, la convención se puede aplicar de manera más general a cualquier índice repetido dentro de un término. [2] Cuando se trata de vectores covariantes y contravariantes , donde la posición de un índice indica el tipo de vector, generalmente se aplica el primer caso; un vector covariante sólo puede contraerse con un vector contravariante, correspondiente a la suma de los productos de coeficientes. Por otro lado, cuando hay una base de coordenadas fija (o cuando no se consideran vectores de coordenadas), se puede optar por utilizar sólo subíndices; consulte § Superíndices y subíndices versus solo subíndices a continuación.
En términos de covarianza y contravarianza de vectores ,
Se transforman de forma contravariante o covariante, respectivamente, con respecto al cambio de base .
En reconocimiento de este hecho, la siguiente notación utiliza el mismo símbolo tanto para un vector o covector como para sus componentes , como en:
donde v es el vector y vi son sus componentes (no el i- ésimo covector v ), w es el covector y wi son sus componentes. Los elementos del vector base son vectores de cada columna y los elementos base del covector son covectores de cada fila. (Ver también § Descripción abstracta; dualidad , a continuación y los ejemplos )
En presencia de una forma no degenerada (un isomorfismo V → V ∗ , por ejemplo una métrica de Riemann o una métrica de Minkowski ), se pueden subir y bajar índices .
Una base da esa forma (a través de la base dual ), por lo tanto, cuando se trabaja en R n con una métrica euclidiana y una base ortonormal fija , se tiene la opción de trabajar solo con subíndices.
Sin embargo, si uno cambia las coordenadas, la forma en que cambian los coeficientes depende de la varianza del objeto y no se puede ignorar la distinción; véase Covarianza y contravarianza de vectores .
En el ejemplo anterior, los vectores se representan como matrices n × 1 (vectores de columna), mientras que los covectores se representan como matrices 1 × n (covectores de fila).
Cuando se utiliza la convención de vectores de columna:
La virtud de la notación de Einstein es que representa las cantidades invariantes con una notación simple.
En física, un escalar es invariante bajo transformaciones de base. En particular, un escalar de Lorentz es invariante bajo una transformación de Lorentz . Los términos individuales de la suma no lo son. Cuando se cambia la base, los componentes de un vector cambian mediante una transformación lineal descrita por una matriz. Esto llevó a Einstein a proponer la convención de que los índices repetidos implican que se debe realizar la suma.
En cuanto a los covectores, cambian según la matriz inversa . Esto está diseñado para garantizar que la función lineal asociada con el covector, la suma anterior, sea la misma sin importar cuál sea la base.
El valor de la convención de Einstein es que se aplica a otros espacios vectoriales construidos a partir de V utilizando el producto tensorial y la dualidad . Por ejemplo, V ⊗ V , el producto tensorial de V consigo mismo, tiene una base que consta de tensores de la forma e ij = e i ⊗ e j . Cualquier tensor T en V ⊗ V se puede escribir como:
V * , el dual de V , tiene una base e 1 , e 2 , ..., e n que obedece a la regla donde δ es el delta de Kronecker . Como las coordenadas de fila/columna en una matriz corresponden a los índices superior/inferior del producto tensorial.
En la notación de Einstein, la referencia de elemento habitual para la -ésima fila y la -ésima columna de la matriz es . Luego podemos escribir las siguientes operaciones en notación de Einstein de la siguiente manera.
Usando una base ortogonal , el producto interno ( producto escalar vectorial ) es la suma de los componentes correspondientes multiplicados entre sí:
Esto también se puede calcular multiplicando el covector por el vector.
Nuevamente usando una base ortogonal (en 3 dimensiones), el producto cruzado involucra intrínsecamente sumas sobre permutaciones de componentes: donde
ε ijk es el símbolo de Levi-Civita , y δ il es el delta de Kronecker generalizado. Según esta definición de ε , no hay diferencia entre ε i jk y ε ijk sino la posición de los índices.
El producto de una matriz A ij por un vector columna v j es: equivalente a
Este es un caso especial de multiplicación de matrices.
El producto matricial de dos matrices A ij y B jk es:
equivalente a
Para una matriz cuadrada A i j , la traza es la suma de los elementos diagonales, por lo tanto la suma sobre un índice común A i i .
El producto exterior del vector columna u i por el vector fila v j produce una matriz A m × n :
Dado que i y j representan dos índices diferentes , no hay suma y los índices no se eliminan mediante la multiplicación.
Dado un tensor , uno puede aumentar o disminuir un índice contrayendo el tensor con el tensor métrico , g μν . Por ejemplo, tomando el tensor T α β , se puede reducir un índice:
O se puede elevar un índice: