En física , el espacio de Minkowski (o espacio-tiempo de Minkowski ) ( / m ɪ ŋˈ k ɔː f s k i , -ˈ k ɒ f - / [1] ) es la principal descripción matemática del espacio-tiempo en ausencia de gravitación . Combina variedades de espacio inercial y tiempo en un modelo de cuatro dimensiones .
El modelo ayuda a mostrar cómo un intervalo de espacio-tiempo entre dos eventos cualesquiera es independiente del marco de referencia inercial en el que se registran. El matemático Hermann Minkowski lo desarrolló a partir del trabajo de Hendrik Lorentz , Henri Poincaré y otros dijeron que "fue cultivado sobre bases físicas experimentales".
El espacio de Minkowski está estrechamente asociado con las teorías de la relatividad especial y la relatividad general de Einstein y es la estructura matemática más común mediante la cual se formaliza la relatividad especial. Mientras que los componentes individuales en el espacio y el tiempo euclidianos pueden diferir debido a la contracción de la longitud y la dilatación del tiempo , en el espacio-tiempo de Minkowski todos los marcos de referencia coincidirán en el intervalo total en el espacio-tiempo entre eventos. [nb 1] El espacio de Minkowski se diferencia del espacio euclidiano de cuatro dimensiones en que trata el tiempo de manera diferente a las tres dimensiones espaciales.
En el espacio euclidiano tridimensional , el grupo de isometría (mapas que preservan la distancia euclidiana regular ) es el grupo euclidiano . Se genera por rotaciones , reflexiones y traslaciones . Cuando se añade el tiempo como cuarta dimensión, se añaden las transformaciones posteriores de las traslaciones en el tiempo y los impulsos de Lorentz , y el grupo de todas estas transformaciones se denomina grupo de Poincaré . El modelo de Minkowski sigue la relatividad especial, donde el movimiento causa dilatación del tiempo cambiando la escala aplicada al marco en movimiento y cambia la fase de la luz.
El espacio-tiempo está equipado con una forma bilineal indefinida no degenerada , llamada métrica de Minkowski , [2] norma de Minkowski al cuadrado o producto interno de Minkowski según el contexto. [nb 2] El producto interno de Minkowski se define de manera que produzca el intervalo de espacio-tiempo entre dos eventos cuando se le da su vector de diferencia de coordenadas como argumento. [3] Equipado con este producto interno, el modelo matemático del espacio-tiempo se llama espacio de Minkowski. El grupo de transformaciones para el espacio de Minkowski que preserva el intervalo espacio-temporal (a diferencia de la distancia espacial euclidiana) es el grupo de Poincaré (a diferencia del grupo galileano ).
En su artículo sobre la segunda relatividad de 1905, Henri Poincaré demostró [4] cómo, al tomar el tiempo como una cuarta coordenada espacio-temporal imaginaria ict , donde c es la velocidad de la luz e i es la unidad imaginaria , las transformaciones de Lorentz pueden visualizarse como rotaciones ordinarias. de la esfera euclidiana de cuatro dimensiones. El espacio-tiempo de cuatro dimensiones se puede visualizar como un espacio de cuatro dimensiones, en el que cada punto representa un evento en el espacio-tiempo. Las transformaciones de Lorentz pueden considerarse entonces como rotaciones en este espacio de cuatro dimensiones, donde el eje de rotación corresponde a la dirección del movimiento relativo entre los dos observadores y el ángulo de rotación está relacionado con su velocidad relativa.
Para comprender este concepto, se deben considerar las coordenadas de un evento en el espacio-tiempo representado como un cuatro vectores ( t , x , y , z ) . Una transformación de Lorentz está representada por una matriz que actúa sobre los cuatro vectores, cambiando sus componentes. Esta matriz puede considerarse como una matriz de rotación en un espacio de cuatro dimensiones, que hace girar los cuatro vectores alrededor de un eje particular.
Las rotaciones en planos abarcados por dos vectores unitarios espaciales aparecen en el espacio de coordenadas así como en el espacio-tiempo físico como rotaciones euclidianas y se interpretan en el sentido ordinario. La "rotación" en un plano abarcado por un vector unitario de espacio y un vector unitario de tiempo, aunque formalmente sigue siendo una rotación en el espacio de coordenadas, es un impulso de Lorentz en el espacio-tiempo físico con coordenadas inerciales reales . La analogía con las rotaciones euclidianas es sólo parcial ya que el radio de la esfera es en realidad imaginario, lo que convierte las rotaciones en rotaciones en el espacio hiperbólico (ver rotación hiperbólica ).
Esta idea, que Poincaré mencionó sólo brevemente, fue elaborada por Minkowski en un artículo en alemán publicado en 1908 llamado "Las ecuaciones fundamentales para procesos electromagnéticos en cuerpos en movimiento". [5] Reformuló las ecuaciones de Maxwell como un conjunto simétrico de ecuaciones en las cuatro variables ( x , y , z , ict ) combinadas con variables vectoriales redefinidas para cantidades electromagnéticas, y pudo mostrar directa y muy simplemente su invariancia bajo la transformación de Lorentz. . También hizo otras contribuciones importantes y utilizó la notación matricial por primera vez en este contexto. A partir de su reformulación, concluyó que el tiempo y el espacio debían tratarse por igual, y así surgió su concepto de eventos que tienen lugar en un continuo espacio-temporal unificado de cuatro dimensiones .
En un desarrollo posterior en su conferencia "Espacio y tiempo" de 1908, [6] Minkowski dio una formulación alternativa de esta idea que utilizaba una coordenada en tiempo real en lugar de una imaginaria, representando las cuatro variables ( x , y , z , t ) del espacio y el tiempo en forma de coordenadas en un espacio vectorial real de cuatro dimensiones . Los puntos en este espacio corresponden a eventos en el espacio-tiempo. En este espacio, hay un cono de luz definido asociado con cada punto, y los eventos que no están en el cono de luz se clasifican por su relación con el vértice como espaciales o temporales . Es principalmente esta visión del espacio-tiempo la que está vigente hoy en día, aunque la visión más antigua que implicaba el tiempo imaginario también ha influido en la relatividad especial.
En la traducción al inglés del artículo de Minkowski, la métrica de Minkowski, tal como se define a continuación, se denomina elemento lineal . El producto interno de Minkowski a continuación aparece sin nombre cuando se refiere a la ortogonalidad (que él llama normalidad ) de ciertos vectores, y la norma de Minkowski al cuadrado se denomina (de manera algo críptica, tal vez esto dependa de la traducción) como "suma".
La herramienta principal de Minkowski es el diagrama de Minkowski , y lo utiliza para definir conceptos y demostrar propiedades de las transformaciones de Lorentz (p. ej., contracción de longitud y tiempo adecuados ) y para proporcionar interpretación geométrica a la generalización de la mecánica newtoniana a la mecánica relativista . Para estos temas especiales, consulte los artículos referenciados, ya que la presentación a continuación se limitará principalmente a la estructura matemática (métrica de Minkowski y de ella cantidades derivadas y el grupo de Poincaré como grupo de simetría del espacio-tiempo) que se deriva de la invariancia del intervalo del espacio-tiempo en el La variedad espaciotemporal es consecuencia de los postulados de la relatividad especial, no de una aplicación o derivación específica de la invariancia del intervalo espaciotemporal. Esta estructura proporciona el contexto de fondo de todas las teorías relativistas actuales, salvo la relatividad general, para la cual el espacio-tiempo plano de Minkowski todavía proporciona un trampolín, ya que el espacio-tiempo curvo es localmente lorentziano.
Minkowski, consciente de la reformulación fundamental de la teoría que había formulado, dijo
Las visiones del espacio y del tiempo que deseo exponerles han surgido del suelo de la física experimental, y ahí radica su fuerza. Son radicales. De ahora en adelante, el espacio en sí y el tiempo en sí están condenados a desvanecerse en meras sombras, y sólo una especie de unión de ambos preservará una realidad independiente.
— Hermann Minkowski, 1908, 1909 [6]
Aunque Minkowski dio un paso importante para la física, Albert Einstein vio su limitación:
En una época en la que Minkowski daba la interpretación geométrica de la relatividad especial extendiendo el triespacio euclidiano a un cuasi-espacio euclidiano que incluía el tiempo, Einstein ya era consciente de que esto no es válido, porque excluye el fenómeno de la gravitación . Estaba todavía lejos del estudio de las coordenadas curvilíneas y de la geometría riemanniana , y del pesado aparato matemático que conllevaba. [7]
Para obtener más información histórica, consulte las referencias Galison (1979), Corry (1997) y Walter (1999).
Donde v es la velocidad, x , y y z son coordenadas cartesianas en un espacio tridimensional, c es la constante que representa el límite de velocidad universal y t es el tiempo, el vector de cuatro dimensiones v = ( ct , x , y , z ) = ( ct , r ) se clasifica según el signo de c 2 t 2 − r 2 . Un vector es temporal si c 2 t 2 > r 2 , espacial si c 2 t 2 < r 2 , y nulo o luminoso si c 2 t 2 = r 2 . Esto se puede expresar en términos del signo de η ( v , v ) , también llamado producto escalar, que depende de la firma. La clasificación de cualquier vector será la misma en todos los marcos de referencia que estén relacionados por una transformación de Lorentz (pero no por una transformación general de Poincaré porque entonces el origen puede desplazarse) debido a la invariancia del intervalo espacio-temporal bajo la transformación de Lorentz.
El conjunto de todos los vectores nulos en un evento [nb 3] del espacio de Minkowski constituye el cono de luz de ese evento. Dado un vector temporal v , hay una línea mundial de velocidad constante asociada a él, representada por una línea recta en un diagrama de Minkowski.
Una vez que se elige una dirección del tiempo, [nb 4] los vectores nulos y temporales se pueden descomponer en varias clases. Para vectores temporales, se tiene
Los vectores nulos se dividen en tres clases:
Junto con los vectores espaciales, hay 6 clases en total.
Una base ortonormal para el espacio de Minkowski consta necesariamente de un vector unitario temporal y tres vectores unitarios espaciales. Si se desea trabajar con bases no ortonormales, es posible tener otras combinaciones de vectores. Por ejemplo, se puede construir fácilmente una base (no ortonormal) que consta enteramente de vectores nulos, llamada base nula .
Los campos vectoriales se denominan temporales, espaciales o nulos si los vectores asociados son temporales, espaciales o nulos en cada punto donde se define el campo.
Los vectores temporales tienen especial importancia en la teoría de la relatividad ya que corresponden a eventos accesibles al observador en (0, 0, 0, 0) con una velocidad menor que la de la luz. De mayor interés son los vectores temporales que están dirigidos de manera similar , es decir, todos en los conos delanteros o traseros. Estos vectores tienen varias propiedades que no comparten los vectores espaciales. Estos surgen porque tanto los conos delanteros como los traseros son convexos, mientras que la región espacial no es convexa.
El producto escalar de dos vectores temporales u 1 = ( t 1 , x 1 , y 1 , z 1 ) y u 2 = ( t 2 , x 2 , y 2 , z 2 ) es
Positividad del producto escalar : una propiedad importante es que el producto escalar de dos vectores temporales dirigidos de manera similar siempre es positivo. Esto se puede ver en la desigualdad de Cauchy-Schwarz invertida que aparece a continuación. De ello se deduce que si el producto escalar de dos vectores es cero, entonces uno de ellos, al menos, debe ser espacial. El producto escalar de dos vectores espaciales puede ser positivo o negativo, como se puede ver al considerar el producto de dos vectores espaciales que tienen componentes espaciales ortogonales y tiempos de signo diferente o igual.
Usando la propiedad de positividad de los vectores temporales, es fácil verificar que una suma lineal con coeficientes positivos de vectores temporales dirigidos de manera similar también es similar al tiempo (la suma permanece dentro del cono de luz debido a la convexidad).
La norma de un vector temporal u = ( ct , x , y , z ) se define como
La desigualdad de Cauchy invertida es otra consecuencia de la convexidad de cualquiera de los conos de luz. [8] Para dos vectores distintos similares a tiempo dirigidos de manera similar u 1 y u 2 esta desigualdad es o algebraicamente,
De esto se desprende la propiedad positiva del producto escalar.
Para dos vectores u y w similares a tiempos dirigidos de manera similar , la desigualdad es [9] donde la igualdad se cumple cuando los vectores son linealmente dependientes .
La prueba utiliza la definición algebraica con la desigualdad de Cauchy invertida: [10]
El resultado ahora se obtiene sacando la raíz cuadrada en ambos lados.
A continuación se supone que el espacio-tiempo está dotado de un sistema de coordenadas correspondiente a un sistema inercial . Esto proporciona un origen , que es necesario para modelar el espacio-tiempo como un espacio vectorial. Esta adición no es necesaria y tratamientos más complejos, análogos a un espacio afín, pueden eliminar la estructura adicional. Sin embargo, esta no es la convención introductoria y no se trata aquí.
Para obtener una descripción general, el espacio de Minkowski es un espacio vectorial real de 4 dimensiones equipado con una forma bilineal simétrica y no degenerada en el espacio tangente en cada punto del espacio-tiempo, aquí llamado simplemente producto interno de Minkowski , con firma métrica ( + − − −) o (− + + +) . El espacio tangente en cada evento es un espacio vectorial de la misma dimensión que el espaciotiempo, 4 .
En la práctica, no es necesario preocuparse por los espacios tangentes. La estructura del espacio vectorial del espacio de Minkowski permite la identificación canónica de vectores en espacios tangentes en puntos (eventos) con vectores (puntos, eventos) en el propio espacio de Minkowski. Véase, por ejemplo, Lee (2003, Proposición 3.8.) o Lee (2012, Proposición 3.13.). Estas identificaciones se realizan de forma rutinaria en matemáticas. Se pueden expresar formalmente en coordenadas cartesianas como [11] con vectores base en los espacios tangentes definidos por
Aquí, p y q son dos eventos cualesquiera, y la identificación del segundo vector de base se denomina transporte paralelo . La primera identificación es la identificación canónica de vectores en el espacio tangente en cualquier punto con vectores en el espacio mismo. La aparición de vectores de base en espacios tangentes como operadores diferenciales de primer orden se debe a esta identificación. Está motivado por la observación de que un vector tangente geométrico puede asociarse de manera uno a uno con un operador derivativo direccional en el conjunto de funciones suaves. Esto se promueve a una definición de vectores tangentes en variedades que no necesariamente están incluidos en R n . Esta definición de vectores tangentes no es la única posible, ya que también se pueden utilizar n -tuplas ordinarias.
Se puede definir un vector tangente en un punto p , aquí especializado en coordenadas cartesianas en marcos de Lorentz, como vectores columna v de 4 × 1 asociados a cada marco de Lorentz relacionado mediante la transformación de Lorentz Λ tal que el vector v en un marco relacionado con algún marco por Λ se transforma según v → Λ v . Esta es la misma forma en que se transforman las coordenadas x μ . Explícitamente,
Esta definición es equivalente a la definición dada anteriormente bajo un isomorfismo canónico.
Para algunos propósitos, es deseable identificar vectores tangentes en un punto p con vectores de desplazamiento en p , lo cual es, por supuesto, admisible esencialmente mediante la misma identificación canónica. [12] Las identificaciones de vectores mencionadas anteriormente en el entorno matemático se pueden encontrar correspondientemente en un entorno más físico y explícitamente geométrico en Misner, Thorne y Wheeler (1973). Ofrecen varios grados de sofisticación (y rigor) dependiendo de qué parte del material se elija leer.
La firma métrica se refiere a qué signo produce el producto interno de Minkowski cuando se le da espacio ( espacial para ser específico, definido más adelante) y vectores de base temporal ( temporal ) como argumentos. La discusión adicional sobre esta elección teóricamente intrascendente pero prácticamente necesaria para propósitos de consistencia interna y conveniencia se pospone al recuadro oculto a continuación. Consulte también la página que trata la convención de signos en Relatividad.
En general, pero con varias excepciones, los matemáticos y los relativistas generales prefieren que los vectores espaciales produzcan un signo positivo, (− + + +) , mientras que los físicos de partículas tienden a preferir los vectores temporales que produzcan un signo positivo, (+ − − −) . Los autores que cubren varias áreas de la física, por ejemplo, Steven Weinberg y Landau y Lifshitz ( (− + + +) y (+ − − −) respectivamente) se atienen a una opción independientemente del tema. Los argumentos a favor de la primera convención incluyen la "continuidad" del caso euclidiano correspondiente al límite no relativista c → ∞ . Los argumentos a favor de esto último incluyen que los signos menos, que de otro modo serían omnipresentes en la física de partículas, desaparecen. Sin embargo, otros autores, especialmente de textos introductorios, por ejemplo Kleppner y Kolenkow (1978), no eligen ninguna firma, sino que optan por coordinar el espacio-tiempo de manera que la coordenada temporal (¡pero no el tiempo mismo!) sea imaginaria. Esto elimina la necesidad de la introducción explícita de un tensor métrico (que puede parecer una carga adicional en un curso introductorio), y no es necesario preocuparse por los vectores covariantes y contravariantes (o la subida y bajada de índices) que se describirán a continuación. En cambio , el producto interno se ve afectado por una extensión directa del producto escalar en R 3 a R 3 × C. Esto funciona en el espacio-tiempo plano de la relatividad especial, pero no en el espacio-tiempo curvo de la relatividad general, ver Misner, Thorne & Wheeler (1973, Cuadro 2.1, Adiós a las tic ) (quienes, por cierto, usan (− + + +) ) . MTW también sostiene que oculta la verdadera naturaleza indefinida de la métrica y la verdadera naturaleza de los impulsos de Lorentz, que no son rotaciones. También complica innecesariamente el uso de herramientas de geometría diferencial que, de otro modo, estarían inmediatamente disponibles y serían útiles para la descripción y el cálculo geométricos, incluso en el espacio-tiempo plano de la relatividad especial, por ejemplo, el campo electromagnético.
Matemáticamente asociado con la forma bilineal hay un tensor de tipo (0,2) en cada punto del espacio-tiempo, llamado métrica de Minkowski . [nb 5] La métrica de Minkowski, la forma bilineal y el producto interno de Minkowski son todos el mismo objeto; es una función bilineal que acepta dos vectores (contravariantes) y devuelve un número real. En coordenadas, esta es la matriz de 4×4 que representa la forma bilineal.
A modo de comparación, en la relatividad general , una variedad de Lorentz L también está equipada con un tensor métrico g , que es una forma bilineal simétrica no degenerada en el espacio tangente T p L en cada punto p de L. En coordenadas, puede representarse mediante una matriz de 4 × 4 dependiendo de la posición del espacio-tiempo . El espacio de Minkowski es, por tanto, un caso especial comparativamente simple de una variedad de Lorentz . Su tensor métrico está en coordenadas con la misma matriz simétrica en cada punto de M y sus argumentos pueden, como se indicó anteriormente, tomarse como vectores en el propio espacio-tiempo.
Al introducir más terminología (pero no más estructura), el espacio de Minkowski es, por tanto, un espacio pseudoeuclidiano con dimensión total n = 4 y firma (3, 1) o (1, 3) . Los elementos del espacio de Minkowski se denominan eventos . El espacio de Minkowski a menudo se denomina R 3,1 o R 1,3 para enfatizar la firma elegida, o simplemente M. Es un ejemplo de variedad pseudo-riemanniana .
Entonces, matemáticamente, la métrica es una forma bilineal en un espacio vectorial real abstracto de cuatro dimensiones V , es decir, donde η tiene firma (−, +, +, +) , y la firma es una propiedad invariante de coordenadas de η . El espacio de mapas bilineales forma un espacio vectorial que puede identificarse con , y η puede verse de manera equivalente como un elemento de este espacio. Al elegir la base ortonormal , se puede identificar con el espacio . La notación pretende enfatizar el hecho de que M y no son sólo espacios vectoriales sino que tienen una estructura adicional. .
Un ejemplo interesante de coordenadas no inerciales para (parte del) espacio-tiempo de Minkowski son las coordenadas de Born . Otro conjunto útil de coordenadas son las coordenadas del cono de luz .
El producto interno de Minkowski no es un producto interno , ya que no es definido positivo , es decir, la forma cuadrática η ( v , v ) no necesita ser positiva para v distinto de cero . La condición positiva definida ha sido reemplazada por la condición más débil de no degeneración. La forma bilineal se dice que es indefinida . La métrica de Minkowski η es el tensor métrico del espacio de Minkowski. Es una métrica pseudoeuclidiana o, más generalmente, una métrica pseudoriemanniana constante en coordenadas cartesianas. Como tal, es una forma bilineal simétrica no degenerada, un tensor de tipo (0, 2) . Acepta dos argumentos u p , v p , vectores en T p M , p ∈ M , el espacio tangente en p en M . Debido a la identificación canónica mencionada anteriormente de T p M con M en sí, acepta argumentos u , v tanto con u como con v en M .
Como convención de notación, los vectores v en M , llamados 4-vectores , se indican en cursiva y no, como es común en el entorno euclidiano, con negrita v . Este último generalmente se reserva para la parte de 3 vectores (que se presentará más adelante) de un 4 vectores.
La definición [13] produce una estructura similar a un producto interno en M , anteriormente y también en adelante, llamada producto interno de Minkowski , similar al producto interno euclidiano , pero describe una geometría diferente. También se le llama producto escalar relativista . Si los dos argumentos son iguales, la cantidad resultante se llamará norma de Minkowski al cuadrado . El producto interno de Minkowski satisface las siguientes propiedades.
Las dos primeras condiciones implican bilinealidad. La diferencia definitoria entre un producto pseudo-interno y un producto interno propiamente dicho es que no es necesario que el primero sea definido positivo, es decir, se permite η ( u , u ) <0 .
La característica más importante del producto interno y la norma al cuadrado es que se trata de cantidades que no se ven afectadas por las transformaciones de Lorentz . De hecho, puede tomarse como la propiedad definitoria de una transformación de Lorentz en el sentido de que preserva el producto interno (es decir, el valor de la forma bilineal correspondiente en dos vectores). Este enfoque se adopta de manera más general para todos los grupos clásicos definibles de esta manera en el grupo clásico . Allí, la matriz Φ es idéntica en el caso O(3, 1) (el grupo de Lorentz) a la matriz η que se mostrará a continuación.
Se dice que dos vectores v y w son ortogonales si η ( v , w ) = 0 . Para una interpretación geométrica de la ortogonalidad en el caso especial, cuando η ( v , v ) ≤ 0 y η ( w , w ) ≥ 0 (o viceversa), consulte ortogonalidad hiperbólica .
Un vector e se llama vector unitario si η ( e , e ) = ±1 . Una base para M que consta de vectores unitarios mutuamente ortogonales se llama base ortonormal . [14]
Para un sistema inercial dado , una base ortonormal en el espacio, combinada con el vector de tiempo unitario, forma una base ortonormal en el espacio de Minkowski. El número de vectores unitarios positivos y negativos en cualquier base de este tipo es un par fijo de números igual a la firma de la forma bilineal asociada con el producto interno. Esta es la ley de inercia de Sylvester .
Más terminología (pero no más estructura): la métrica de Minkowski es una métrica pseudo-riemanniana , más específicamente, una métrica de Lorentz , incluso más específicamente, la métrica de Lorentz, reservada para el espacio-tiempo plano de 4 dimensiones y la ambigüedad restante es solo la convención de firma. .
Del segundo postulado de la relatividad especial , junto con la homogeneidad del espacio-tiempo y la isotropía del espacio, se deduce que el intervalo espacio-temporal entre dos eventos arbitrarios llamados 1 y 2 es: [15] Esta cantidad no se nombra consistentemente en la literatura. A veces se hace referencia al intervalo como raíz cuadrada del intervalo tal como se define aquí. [16] [17]
La invariancia del intervalo bajo transformaciones de coordenadas entre marcos inerciales se deriva de la invariancia de siempre que las transformaciones sean lineales. Esta forma cuadrática se puede utilizar para definir una forma bilineal mediante la identidad de polarización . Esta forma bilineal a su vez se puede escribir como donde [ η ] es una matriz asociada con η . Aunque posiblemente sea confuso, es una práctica común denotar [ η ] solo con η . La matriz se lee a partir de la forma bilineal explícita y ahora se identifica la forma bilineal con la que esta sección comenzó asumiendo su existencia.
Para mayor precisión y una presentación más breve, se adopta la firma (− + + +) a continuación. Esta elección (u otra posible elección) no tiene implicaciones físicas (conocidas). El grupo de simetría que conserva la forma bilineal con una elección de firma es isomorfo (según el mapa que se proporciona aquí ) y el grupo de simetría conserva la otra elección de firma. Esto significa que ambas opciones están de acuerdo con los dos postulados de la relatividad. Cambiar entre las dos convenciones es sencillo. Si el tensor métrico η se ha utilizado en una derivación, regrese al punto más antiguo donde se usó, sustituya η por − η y avance hasta la fórmula deseada con la firma métrica deseada.
Una base estándar u ortonormal para el espacio de Minkowski es un conjunto de cuatro vectores mutuamente ortogonales { e 0 , e 1 , e 2 , e 3 } tales que y para los cuales cuando
Estas condiciones se pueden escribir de forma compacta en la forma
En relación con una base estándar, los componentes de un vector v se escriben ( v 0 , v 1 , v 2 , v 3 ) donde se usa la notación de Einstein para escribir v = v μ e μ . El componente v 0 se llama componente temporal de v mientras que los otros tres componentes se llaman componentes espaciales . Los componentes espaciales de un v de 4 vectores se pueden identificar con un v de 3 vectores = ( v 1 , v 2 , v 3 ) .
En términos de componentes, el producto interno de Minkowski entre dos vectores v y w viene dado por
y
Se utilizó aquí la reducción del índice con la métrica.
Hay muchas opciones posibles de base estándar que obedecen la condición. Dos bases cualesquiera de este tipo están relacionadas en algún sentido mediante una transformación de Lorentz, ya sea mediante una matriz de cambio de base , una matriz real de 4 × 4 que satisface o Λ , un mapa lineal en la espacio vectorial abstracto satisfactorio, para cualquier par de vectores u , v ,
Entonces, si existen dos bases diferentes, { e 0 , e 1 , e 2 , e 3 } y { e ′ 0 , e ′ 1 , e ′ 2 , e ′ 3 } , se pueden representar como o . Si bien puede resultar tentador pensar que y Λ son la misma cosa, matemáticamente son elementos de espacios diferentes y actúan sobre el espacio de bases estándar desde lados diferentes.
Técnicamente, una forma bilineal no degenerada proporciona un mapa entre un espacio vectorial y su dual; en este contexto, el mapa está entre los espacios tangentes de M y los espacios cotangentes de M . En un punto de M , los espacios tangente y cotangente son espacios vectoriales duales (por lo que la dimensión del espacio cotangente en un evento también es 4 ). Así como un auténtico producto interno en un espacio vectorial con un argumento fijo, según el teorema de representación de Riesz , puede expresarse como la acción de un funcional lineal en el espacio vectorial, lo mismo se aplica al producto interno de Minkowski del espacio de Minkowski. [19]
Así, si v μ son los componentes de un vector en el espacio tangente, entonces η μν v μ = v ν son los componentes de un vector en el espacio cotangente (un funcional lineal). Debido a la identificación de vectores en espacios tangentes con vectores en el propio M , esto se ignora en su mayoría y los vectores con índices más bajos se denominan vectores covariantes . En esta última interpretación, los vectores covariantes se identifican (casi siempre implícitamente) con vectores (funcionales lineales) en el espacio dual de Minkowski. Los que tienen índices superiores son vectores contravariantes . De la misma manera, la inversa del mapa de espacios tangentes a cotangentes, dada explícitamente por la inversa de η en la representación matricial, se puede utilizar para definir la elevación de un índice . Los componentes de esta inversa se denotan por η μν . Sucede que η μν = η μν . Estos mapas entre un espacio vectorial y su dual se pueden denotar η ♭ (eta-bemol) y η ♯ (eta-sostenido) mediante la analogía musical. [20]
Los vectores contravariantes y covariantes son objetos geométricamente muy diferentes. Los primeros pueden y deben considerarse como flechas. Una función lineal se puede caracterizar por dos objetos: su núcleo , que es un hiperplano que pasa por el origen, y su norma. Por lo tanto, geométricamente, los vectores covariantes deben verse como un conjunto de hiperplanos, con un espaciado que depende de la norma (mayor = menor espaciado), y uno de ellos (el núcleo) pasa por el origen. El término matemático para un vector covariante es 1-covector o 1-forma (aunque este último suele reservarse para campos de covectores ).
Una analogía de la mecánica cuántica explorada en la literatura es la de una onda de Broglie (escalada por un factor de la constante reducida de Planck) asociada con un cuatro-vector de momento para ilustrar cómo se podría imaginar una versión covariante de un vector contravariante. El producto interno de dos vectores contravariantes también podría considerarse como la acción de la versión covariante de uno de ellos sobre la versión contravariante del otro. El producto interior es entonces cuántas veces la flecha atraviesa los planos. [18] La referencia matemática, Lee (2003), ofrece la misma visión geométrica de estos objetos (pero no menciona ninguna perforación).
El tensor de campo electromagnético es una forma diferencial de 2 , cuya descripción geométrica también se puede encontrar en MTW.
Por supuesto, se pueden ignorar por completo los puntos de vista geométricos (como es el estilo, por ejemplo, en Weinberg (2002) y Landau & Lifshitz 2002) y proceder algebraicamente de una manera puramente formal. La robustez comprobada en el tiempo del formalismo en sí, a veces denominada gimnasia de índices , garantiza que mover vectores y cambiar de vectores contravariantes a covariantes y viceversa (así como tensores de orden superior) sea matemáticamente sólido. Las expresiones incorrectas tienden a revelarse rápidamente.
Dada una forma bilineal , la versión reducida de un vector puede considerarse como la evaluación parcial de , es decir, hay un mapa de evaluación parcial asociado.
El vector bajado es entonces el mapa dual . Tenga en cuenta que no importa qué argumento se evalúe parcialmente debido a la simetría de .
La no degeneración es entonces equivalente a la inyectividad del mapa de evaluación parcial o, de manera equivalente, la no degeneración indica que el núcleo del mapa es trivial. En dimensión finita, como es el caso aquí, y observando que la dimensión de un espacio de dimensión finita es igual a la dimensión del dual, esto es suficiente para concluir que el mapa de evaluación parcial es un isomorfismo lineal de a . Esto luego permite la definición del mapa de evaluación parcial inversa, que permite definir la métrica inversa donde los dos usos diferentes de pueden diferenciarse mediante el argumento sobre el que se evalúa cada uno. Esto luego puede usarse para subir los índices. Si se utiliza una base de coordenadas, la métrica η −1 es de hecho la matriz inversa a η .
El presente propósito es mostrar semi rigurosamente cómo se puede aplicar formalmente la métrica de Minkowski a dos vectores y obtener un número real, es decir, mostrar el papel de los diferenciales y cómo desaparecen en un cálculo. El escenario es el de la teoría múltiple suave y se introducen conceptos como campos convectores y derivadas exteriores.
Aparece una versión completa de la métrica de Minkowski en coordenadas como campo tensorial en el espacio-tiempo
Explicación: Los diferenciales de coordenadas son campos de 1 formato. Se definen como la derivada exterior de las funciones de coordenadas x μ . Estas cantidades evaluadas en un punto p proporcionan una base para el espacio cotangente en p . El producto tensorial (denotado por el símbolo ⊗ ) produce un campo tensorial de tipo (0, 2) , es decir, el tipo que espera dos vectores contravariantes como argumentos. En el lado derecho se ha tomado el producto simétrico (indicado por el símbolo ⊙ o por yuxtaposición). La igualdad se cumple ya que, por definición, la métrica de Minkowski es simétrica. [21] La notación del extremo derecho también se utiliza a veces para el elemento de línea relacionado, pero diferente . No es un tensor. Para más detalles sobre las diferencias y similitudes, véase Misner, Thorne y Wheeler (1973, recuadro 3.2 y sección 13.2).
Los vectores tangentes , en este formalismo, están dados en términos de una base de operadores diferenciales de primer orden, donde p es un evento. Este operador aplicado a una función f da la derivada direccional de f en p en la dirección de aumentar x μ con x ν , ν ≠ μ fijo. Proporcionan una base para el espacio tangente en p .
La derivada exterior df de una función f es un campo covector , es decir , una asignación de un vector cotangente a cada punto p , por definición tal que para cada campo vectorial X. Un campo vectorial es una asignación de un vector tangente a cada punto p . En coordenadas X se puede expandir en cada punto p en la base dada por ∂/∂ x ν | pag . Aplicando esto con f = x μ , la función de coordenadas en sí, y X = ∂/∂ x ν , llamado campo vectorial de coordenadas , se obtiene
Dado que esta relación se cumple en cada punto p , el dx μ | p proporciona una base para el espacio cotangente en cada p y las bases dx μ | p y ∂/∂ x ν | p son duales entre sí, en cada p . Además, se tienen formas uno generales en un espacio tangente α , β y vectores tangentes generales a , b . (Esto puede tomarse como una definición, pero también puede demostrarse en un contexto más general).
Por lo tanto, cuando el tensor métrico recibe dos campos vectoriales a , b , ambos expandidos en términos de los campos vectoriales de coordenadas base, el resultado es donde a μ , b ν son las funciones componentes de los campos vectoriales. La ecuación anterior se cumple en cada punto p , y la relación también puede interpretarse como la métrica de Minkowski en p aplicada a dos vectores tangentes en p .
Como se mencionó, en un espacio vectorial, como en el modelado del espacio-tiempo de la relatividad especial, los vectores tangentes se pueden identificar canónicamente con vectores en el espacio mismo, y viceversa. Esto significa que los espacios tangentes en cada punto se identifican canónicamente entre sí y con el propio espacio vectorial. Esto explica cómo el lado derecho de la ecuación anterior se puede emplear directamente, sin tener en cuenta el punto del espacio-tiempo en el que se va a evaluar la métrica y de dónde (de qué espacio tangente) provienen los vectores.
Esta situación cambia en la relatividad general . Allí se tiene donde ahora η → g ( p ) , es decir, g sigue siendo un tensor métrico pero ahora depende del espacio-tiempo y es una solución de las ecuaciones de campo de Einstein . Además, a , b deben ser vectores tangentes en el punto p del espacio-tiempo y ya no pueden moverse libremente.
Sea x , y ∈ M. Aquí,
Supongamos que x ∈ M es temporal. Entonces el hiperplano simultáneo para x es { y : η ( x , y ) = 0} . Dado que este hiperplano varía a medida que varía x , existe una relatividad de simultaneidad en el espacio de Minkowski.
Una variedad de Lorentz es una generalización del espacio de Minkowski de dos maneras. El número total de dimensiones del espacio-tiempo no está restringido a 4 ( 2 o más) y una variedad de Lorentz no necesita ser plana, es decir, permite la curvatura.
El espacio de Minkowski complejizado se define como M c = M ⊕ iM . [22] Su parte real es el espacio de Minkowski de cuatro vectores , como los cuatro velocidades y los cuatro momentos , que son independientes de la elección de la orientación del espacio. La parte imaginaria, por otro lado, puede constar de cuatro pseudovectores, como la velocidad angular y el momento magnético , que cambian de dirección con un cambio de orientación. Se introduce un pseudoescalar i , que también cambia de signo con un cambio de orientación. Por tanto, los elementos de M c son independientes de la elección de la orientación.
La estructura tipo producto interno en M c se define como u ⋅ v = η ( u , v ) para cualquier u , v ∈ M c . Un espín puro relativista de un electrón o cualquier partícula de medio espín se describe mediante ρ ∈ M c como ρ = u + is , donde u es la velocidad de cuatro de la partícula, que satisface u 2 = 1 y s es el vector de espín 4D, [23] que también es el pseudovector de Pauli-Lubanski que satisface s 2 = −1 y u ⋅ s = 0 .
El espacio de Minkowski se refiere a una formulación matemática en cuatro dimensiones. Sin embargo, las matemáticas pueden ampliarse o simplificarse fácilmente para crear un espacio de Minkowski generalizado análogo en cualquier número de dimensiones. Si n ≥ 2 , el espacio de Minkowski n -dimensional es un espacio vectorial de dimensión real n en el que hay una métrica de firma de Minkowski constante ( n − 1, 1) o (1, n − 1) . Estas generalizaciones se utilizan en teorías donde se supone que el espacio-tiempo tiene más o menos de 4 dimensiones. La teoría de cuerdas y la teoría M son dos ejemplos donde n > 4 . En la teoría de cuerdas aparecen teorías de campos conformes con dimensiones espacio-temporales 1 + 1 .
El espacio de Sitter se puede formular como una subvariedad del espacio de Minkowski generalizado, al igual que los espacios modelo de geometría hiperbólica (ver más abajo).
Como espaciotiempo plano , los tres componentes espaciales del espaciotiempo de Minkowski siempre obedecen al teorema de Pitágoras . El espacio de Minkowski es una base adecuada para la relatividad especial, una buena descripción de sistemas físicos en distancias finitas en sistemas sin gravitación significativa . Sin embargo, para tener en cuenta la gravedad, los físicos utilizan la teoría de la relatividad general , que se formula en las matemáticas de una geometría no euclidiana . Cuando esta geometría se utiliza como modelo del espacio físico se le conoce como espacio curvo .
Incluso en el espacio curvo, el espacio de Minkowski sigue siendo una buena descripción en una región infinitesimal que rodea cualquier punto (salvo singularidades gravitacionales). [nb 6] De manera más abstracta, se puede decir que en presencia de gravedad el espacio-tiempo se describe mediante una variedad curva de 4 dimensiones para la cual el espacio tangente a cualquier punto es un espacio de Minkowski de 4 dimensiones. Por tanto, la estructura del espacio de Minkowski sigue siendo esencial en la descripción de la relatividad general.
El significado del término geometría para el espacio de Minkowski depende en gran medida del contexto. El espacio de Minkowski no está dotado de geometría euclidiana, ni tampoco de ninguna de las geometrías riemannianas generalizadas con curvatura intrínseca, las expuestas por los espacios modelo en geometría hiperbólica (curvatura negativa) y la geometría modelada por la esfera (curvatura positiva). La razón es la indefinición de la métrica de Minkowski. El espacio de Minkowski no es, en particular, un espacio métrico ni una variedad de Riemann con una métrica de Riemann. Sin embargo, el espacio de Minkowski contiene subvariedades dotadas de una métrica de Riemann que produce una geometría hiperbólica.
Los espacios modelo de geometría hiperbólica de baja dimensión, digamos 2 o 3 , no pueden incrustarse isométricamente en el espacio euclidiano con una dimensión más, es decir, ℝ 3 o ℝ 4 respectivamente, con la métrica euclidiana g , lo que no permite una fácil visualización. [nb 7] [24] En comparación, los espacios modelo con curvatura positiva son simplemente esferas en el espacio euclidiano de una dimensión superior. [25] Los espacios hiperbólicos pueden incrustarse isométricamente en espacios de una dimensión más cuando el espacio de incrustación está dotado de la métrica de Minkowski η .
Definir H1( n )
R⊂ M n +1 es la hoja superior ( ct > 0 ) del hiperboloide
en el espacio generalizado de Minkowski M n +1 de dimensión espaciotemporal n + 1 . Ésta es una de las superficies de transitividad del grupo de Lorentz generalizado. La métrica inducida en esta subvariedad,
el retroceso de la métrica de Minkowski η bajo inclusión, es una métrica de Riemann . Con esta métrica H1( n )
Res una variedad de Riemann . Es uno de los espacios modelo de la geometría riemanniana, el modelo hiperboloide del espacio hiperbólico . Es un espacio de curvatura negativa constante −1/ R 2 . [26] El 1 en el índice superior se refiere a una enumeración de los diferentes espacios modelo de geometría hiperbólica, y la n a su dimensión. A 2(2) corresponde al modelo de disco de Poincaré , mientras que 3( n ) corresponde al modelo de medio espacio de Poincaré de dimensión n .
En la definición anterior ι : H1( n )
R→ M n +1 es el mapa de inclusión y la estrella en superíndice denota el retroceso . El presente propósito es describir esta y operaciones similares como preparación para la demostración real de que H1( n )
Ren realidad es un espacio hiperbólico.
Para visualizar la métrica, es necesario recuperarla mediante una parametrización adecuada . Una parametrización de una subvariedad S de M es una aplicación U ⊂ R m → M cuyo rango es un subconjunto abierto de S . Si S tiene la misma dimensión que M , una parametrización es justo la inversa de un mapa de coordenadas φ : M → U ⊂ R m . La parametrización a utilizar es la inversa de la proyección estereográfica hiperbólica . Esto se ilustra en la figura de la derecha para n = 2 . Es instructivo compararlo con la proyección estereográfica de esferas.
Proyección estereográfica σ : Hnorte
r→ R n y su inversa σ −1 : R n → Hnorte
restán dados por
donde, por simplicidad, τ ≡ ct . Las ( τ , x ) son coordenadas en M n +1 y las u son coordenadas en R n .
dejar y dejar
Si entonces es geométricamente claro que el vector intersecta al hiperplano una vez en el punto denotado
uno tiene o
Mediante la construcción de proyección estereográfica se tiene
Esto conduce al sistema de ecuaciones.
El primero de ellos se resuelve para λ y se obtiene para proyección estereográfica
A continuación se debe calcular la inversa σ −1 ( u ) = ( τ , x ) . Utilice las mismas consideraciones que antes, pero ahora con uno se obtiene pero ahora con λ dependiendo de u . La condición para que P se encuentre en el hiperboloide es o conduce a
Con este λ se obtiene
Uno tiene y el mapa.
La métrica retirada se puede obtener mediante métodos sencillos de cálculo;
Se calcula de acuerdo con las reglas estándar para calcular diferenciales (aunque en realidad se están calculando las derivadas exteriores rigurosamente definidas) y se sustituyen los resultados en el lado derecho. Esto produce
Esta última ecuación muestra que la métrica de la pelota es idéntica a la métrica de Riemann h2( n )
Ren el modelo de bola de Poincaré , otro modelo estándar de geometría hiperbólica.
Medios relacionados con los diagramas de Minkowski en Wikimedia Commons