En física , el espacio de Minkowski (o espacio-tiempo de Minkowski ) ( / m ɪ ŋ ˈ k ɔː f s k i , - ˈ k ɒ f -/ [1] ) es la principal descripción matemática del espacio-tiempo en ausencia de gravitación . Combina las variedades inerciales del espacio y del tiempo en un modelo de cuatro dimensiones .
El modelo ayuda a mostrar cómo un intervalo de espacio-tiempo entre dos eventos cualesquiera es independiente del marco de referencia inercial en el que se registran. El matemático Hermann Minkowski lo desarrolló a partir del trabajo de Hendrik Lorentz , Henri Poincaré y otros, y dijo que "se desarrolló sobre bases físicas experimentales".
El espacio de Minkowski está estrechamente asociado con las teorías de la relatividad especial y la relatividad general de Einstein y es la estructura matemática más común mediante la cual se formaliza la relatividad especial. Si bien los componentes individuales en el espacio y el tiempo euclidianos pueden diferir debido a la contracción de la longitud y la dilatación del tiempo , en el espacio-tiempo de Minkowski, todos los marcos de referencia estarán de acuerdo en el intervalo total en el espacio-tiempo entre eventos. [nb 1] El espacio de Minkowski difiere del espacio euclidiano de cuatro dimensiones en la medida en que trata el tiempo de manera diferente a las tres dimensiones espaciales.
En el espacio euclidiano tridimensional , el grupo de isometría (mapas que conservan la distancia euclidiana regular ) es el grupo euclidiano . Se genera mediante rotaciones , reflexiones y traslaciones . Cuando se añade el tiempo como cuarta dimensión, se suman las transformaciones posteriores de las traslaciones en el tiempo y los impulsos de Lorentz , y el grupo de todas estas transformaciones se denomina grupo de Poincaré . El modelo de Minkowski sigue la relatividad especial, donde el movimiento causa dilatación del tiempo cambiando la escala aplicada al marco en movimiento y desplaza la fase de la luz.
El espacio-tiempo está equipado con una forma bilineal no degenerada indefinida , llamada métrica de Minkowski , [2] la norma de Minkowski al cuadrado o producto interno de Minkowski dependiendo del contexto. [nb 2] El producto interno de Minkowski se define de modo que produzca el intervalo de espacio-tiempo entre dos eventos cuando se da su vector de diferencia de coordenadas como argumento. [3] Equipado con este producto interno, el modelo matemático del espacio-tiempo se llama espacio de Minkowski. El grupo de transformaciones para el espacio de Minkowski que preserva el intervalo de espacio-tiempo (a diferencia de la distancia euclidiana espacial) es el grupo de Poincaré (a diferencia del grupo galileano ).
En su segundo artículo sobre la relatividad de 1905, Henri Poincaré demostró [4] cómo, al tomar el tiempo como una cuarta coordenada imaginaria del espacio-tiempo ict , donde c es la velocidad de la luz e i es la unidad imaginaria , las transformaciones de Lorentz se pueden visualizar como rotaciones ordinarias de la esfera euclidiana de cuatro dimensiones. El espacio-tiempo de cuatro dimensiones se puede visualizar como un espacio de cuatro dimensiones, donde cada punto representa un evento en el espacio-tiempo. Las transformaciones de Lorentz se pueden considerar entonces como rotaciones en este espacio de cuatro dimensiones, donde el eje de rotación corresponde a la dirección del movimiento relativo entre los dos observadores y el ángulo de rotación está relacionado con su velocidad relativa.
Para entender este concepto, se deben considerar las coordenadas de un evento en el espacio-tiempo representadas como un cuatrivector ( t , x , y , z ) . Una transformación de Lorentz se representa mediante una matriz que actúa sobre el cuatrivector, modificando sus componentes. Esta matriz puede considerarse como una matriz de rotación en un espacio de cuatro dimensiones, que hace rotar el cuatrivector alrededor de un eje particular.
Las rotaciones en planos abarcados por dos vectores unitarios espaciales aparecen en el espacio de coordenadas así como en el espacio-tiempo físico como rotaciones euclidianas y se interpretan en el sentido ordinario. La "rotación" en un plano abarcado por un vector unitario espacial y un vector unitario temporal, aunque formalmente sigue siendo una rotación en el espacio de coordenadas, es un aumento de Lorentz en el espacio-tiempo físico con coordenadas inerciales reales . La analogía con las rotaciones euclidianas es solo parcial, ya que el radio de la esfera es en realidad imaginario, lo que convierte las rotaciones en rotaciones en el espacio hiperbólico (véase rotación hiperbólica ).
Esta idea, que Poincaré mencionó brevemente, fue elaborada por Minkowski en un artículo en alemán publicado en 1908 llamado "Las ecuaciones fundamentales para los procesos electromagnéticos en cuerpos en movimiento". [5] Reformuló las ecuaciones de Maxwell como un conjunto simétrico de ecuaciones en las cuatro variables ( x , y , z , ict ) combinadas con variables vectoriales redefinidas para las cantidades electromagnéticas, y pudo demostrar de manera directa y muy simple su invariancia bajo la transformación de Lorentz. También hizo otras contribuciones importantes y utilizó la notación matricial por primera vez en este contexto. A partir de su reformulación, concluyó que el tiempo y el espacio deberían tratarse por igual, y así surgió su concepto de eventos que tienen lugar en un continuo espacio-temporal unificado de cuatro dimensiones .
En un desarrollo posterior en su conferencia de 1908 "Espacio y tiempo", [6] Minkowski dio una formulación alternativa de esta idea que utilizaba una coordenada de tiempo real en lugar de una imaginaria, representando las cuatro variables ( x , y , z , t ) del espacio y el tiempo en forma de coordenadas en un espacio vectorial real de cuatro dimensiones . Los puntos en este espacio corresponden a eventos en el espacio-tiempo. En este espacio, hay un cono de luz definido asociado con cada punto, y los eventos que no están en el cono de luz se clasifican por su relación con el ápice como espaciales o temporales . Es principalmente esta visión del espacio-tiempo la que está vigente hoy en día, aunque la visión más antigua que involucra el tiempo imaginario también ha influido en la relatividad especial.
En la traducción al inglés del artículo de Minkowski, la métrica de Minkowski, tal como se define a continuación, se denomina elemento de línea . El producto interno de Minkowski que aparece a continuación no se nombra cuando se hace referencia a la ortogonalidad (a la que él llama normalidad ) de ciertos vectores, y la norma de Minkowski al cuadrado se denomina (de manera un tanto críptica, tal vez esto dependa de una traducción) "suma".
La herramienta principal de Minkowski es el diagrama de Minkowski , y lo utiliza para definir conceptos y demostrar propiedades de las transformaciones de Lorentz (por ejemplo, tiempo propio y contracción de longitud ) y para proporcionar una interpretación geométrica a la generalización de la mecánica newtoniana a la mecánica relativista . Para estos temas especiales, consulte los artículos de referencia, ya que la presentación a continuación se limitará principalmente a la estructura matemática (métrica de Minkowski y de ella magnitudes derivadas y el grupo de Poincaré como grupo de simetría del espacio-tiempo) que se desprende de la invariancia del intervalo del espacio-tiempo en la variedad del espacio-tiempo como consecuencia de los postulados de la relatividad especial, no a la aplicación o derivación específica de la invariancia del intervalo del espacio-tiempo. Esta estructura proporciona el contexto de fondo de todas las teorías relativistas actuales, salvo la relatividad general para la que el espacio-tiempo plano de Minkowski todavía proporciona un trampolín ya que el espacio-tiempo curvo es localmente lorentziano.
Minkowski, consciente de la reformulación fundamental de la teoría que había hecho, dijo:
Las concepciones del espacio y del tiempo que deseo exponerles han surgido del terreno de la física experimental, y en eso reside su fuerza. Son radicales. De ahora en adelante, el espacio por sí mismo y el tiempo por sí mismo están condenados a desvanecerse en meras sombras, y sólo una especie de unión de los dos preservará una realidad independiente.
— Hermann Minkowski, 1908, 1909 [6]
Aunque Minkowski dio un paso importante para la física, Albert Einstein vio su limitación:
En una época en la que Minkowski daba la interpretación geométrica de la relatividad especial extendiendo el espacio tridimensional euclidiano a un espacio cuatridimensional cuasi euclidiano que incluía el tiempo, Einstein ya era consciente de que esto no era válido, porque excluía el fenómeno de la gravitación . Aún estaba lejos del estudio de las coordenadas curvilíneas y de la geometría riemanniana , y del pesado aparato matemático que ello implicaba. [7]
Para mayor información histórica véanse las referencias Galison (1979), Corry (1997) y Walter (1999).
Donde v es la velocidad, x , y y z son coordenadas cartesianas en el espacio tridimensional, c es la constante que representa el límite de velocidad universal y t es el tiempo, el vector tetradimensional v = ( ct , x , y , z ) = ( ct , r ) se clasifica según el signo de c 2 t 2 − r 2 . Un vector es temporal si c 2 t 2 > r 2 , espacial si c 2 t 2 < r 2 y nulo o luminoso si c 2 t 2 = r 2 . Esto se puede expresar en términos del signo de η ( v , v ) , también llamado producto escalar, que depende de la firma. La clasificación de cualquier vector será la misma en todos los marcos de referencia que estén relacionados por una transformación de Lorentz (pero no por una transformación de Poincaré general porque entonces el origen podría desplazarse) debido a la invariancia del intervalo espacio-temporal bajo la transformación de Lorentz.
El conjunto de todos los vectores nulos en un evento [nb 3] del espacio de Minkowski constituye el cono de luz de ese evento. Dado un vector temporal v , existe una línea de universo de velocidad constante asociada a él, representada por una línea recta en un diagrama de Minkowski.
Una vez que se elige una dirección del tiempo, los vectores temporales y nulos [nb 4] se pueden descomponer en varias clases. Para los vectores temporales, se tiene
Los vectores nulos se dividen en tres clases:
Junto con los vectores espaciales, hay 6 clases en total.
Una base ortonormal para el espacio de Minkowski consta necesariamente de un vector unitario temporal y tres espaciales. Si se desea trabajar con bases no ortonormales, es posible tener otras combinaciones de vectores. Por ejemplo, se puede construir fácilmente una base (no ortonormal) que consista enteramente en vectores nulos, llamada base nula .
Los campos vectoriales se denominan temporales, espaciales o nulos si los vectores asociados son temporales, espaciales o nulos en cada punto donde se define el campo.
Los vectores temporales tienen especial importancia en la teoría de la relatividad, ya que corresponden a eventos que son accesibles al observador en (0, 0, 0, 0) con una velocidad menor que la de la luz. Los vectores temporales que tienen una dirección similar son de mayor interés , es decir, todos están en el cono hacia adelante o en el cono hacia atrás. Dichos vectores tienen varias propiedades que no comparten los vectores espaciales. Estas surgen porque tanto el cono hacia adelante como el cono hacia atrás son convexos, mientras que la región espacial no lo es.
El producto escalar de dos vectores temporales u 1 = ( t 1 , x 1 , y 1 , z 1 ) y u 2 = ( t 2 , x 2 , y 2 , z 2 ) es
Positividad del producto escalar : Una propiedad importante es que el producto escalar de dos vectores temporales con direcciones similares siempre es positivo. Esto se puede ver en la desigualdad de Cauchy-Schwarz invertida que aparece a continuación. De ello se deduce que si el producto escalar de dos vectores es cero, entonces al menos uno de ellos debe ser espacial. El producto escalar de dos vectores espaciales puede ser positivo o negativo, como se puede ver al considerar el producto de dos vectores espaciales que tienen componentes espaciales ortogonales y tiempos de signos diferentes o iguales.
Utilizando la propiedad de positividad de los vectores temporales, es fácil verificar que una suma lineal con coeficientes positivos de vectores temporales con dirección similar también es temporal con dirección similar (la suma permanece dentro del cono de luz debido a la convexidad).
La norma de un vector temporal u = ( ct , x , y , z ) se define como
La desigualdad de Cauchy invertida es otra consecuencia de la convexidad de cada cono de luz. [8] Para dos vectores temporales distintos y de dirección similar u 1 y u 2 esta desigualdad es o algebraicamente,
De esto se desprende la propiedad positiva del producto escalar.
Para dos vectores temporales con direcciones similares u y w , la desigualdad es [9] donde la igualdad se cumple cuando los vectores son linealmente dependientes .
La prueba utiliza la definición algebraica con la desigualdad de Cauchy invertida: [10]
El resultado ahora se obtiene tomando la raíz cuadrada en ambos lados.
A continuación se supone que el espacio-tiempo está dotado de un sistema de coordenadas correspondiente a un marco inercial . Esto proporciona un origen , que es necesario para que el espacio-tiempo se modele como un espacio vectorial. Esta adición no es necesaria, y tratamientos más complejos análogos a un espacio afín pueden eliminar la estructura adicional. Sin embargo, esta no es la convención introductoria y no se trata aquí.
Para una visión general, el espacio de Minkowski es un espacio vectorial real de 4 dimensiones equipado con una forma bilineal simétrica no degenerada en el espacio tangente en cada punto del espacio-tiempo, aquí simplemente llamado producto interno de Minkowski , con firma métrica ( + − − −) o (− + + +) . El espacio tangente en cada evento es un espacio vectorial de la misma dimensión que el espacio-tiempo, 4 .
En la práctica, no es necesario preocuparse por los espacios tangentes. La estructura del espacio vectorial del espacio de Minkowski permite la identificación canónica de vectores en espacios tangentes en puntos (eventos) con vectores (puntos, eventos) en el propio espacio de Minkowski. Véase, por ejemplo, Lee (2003, Proposición 3.8.) o Lee (2012, Proposición 3.13.). Estas identificaciones se realizan de manera rutinaria en matemáticas. Se pueden expresar formalmente en coordenadas cartesianas como [11] con vectores base en los espacios tangentes definidos por
Aquí, p y q son dos eventos cualesquiera, y la segunda identificación del vector base se denomina transporte paralelo . La primera identificación es la identificación canónica de vectores en el espacio tangente en cualquier punto con vectores en el espacio mismo. La aparición de vectores base en espacios tangentes como operadores diferenciales de primer orden se debe a esta identificación. Está motivada por la observación de que un vector tangente geométrico se puede asociar de manera uno a uno con un operador de derivada direccional en el conjunto de funciones suaves. Esto se promueve a una definición de vectores tangentes en variedades que no necesariamente están incrustados en R n . Esta definición de vectores tangentes no es la única posible, ya que también se pueden usar n -tuplas ordinarias.
Un vector tangente en un punto p puede definirse, aquí especializado en coordenadas cartesianas en sistemas de Lorentz, como 4 × 1 vectores columna v asociados a cada sistema de Lorentz relacionado por la transformación de Lorentz Λ de modo que el vector v en un sistema relacionado con algún sistema por Λ se transforma de acuerdo con v → Λ v . Esta es la misma forma en que se transforman las coordenadas x μ . Explícitamente,
Esta definición es equivalente a la definición dada anteriormente bajo un isomorfismo canónico.
Para algunos propósitos, es deseable identificar vectores tangentes en un punto p con vectores de desplazamiento en p , lo cual, por supuesto, es admisible mediante esencialmente la misma identificación canónica. [12] Las identificaciones de vectores a las que se hizo referencia anteriormente en el contexto matemático se pueden encontrar correspondientemente en un contexto más físico y explícitamente geométrico en Misner, Thorne y Wheeler (1973). Ofrecen varios grados de sofisticación (y rigor) según qué parte del material se elija leer.
La firma métrica se refiere a qué signo produce el producto interno de Minkowski cuando se dan vectores de base espacial ( similar al espacio , para ser más específicos, definidos más adelante) y temporal ( similar al tiempo ) como argumentos. El análisis adicional sobre esta elección teóricamente intrascendente pero prácticamente necesaria para fines de consistencia interna y conveniencia se pospone al cuadro oculto a continuación. Véase también la página que trata la convención de signos en Relatividad.
En general, pero con varias excepciones, los matemáticos y relativistas generales prefieren que los vectores espaciales produzcan un signo positivo, (− + + +) , mientras que los físicos de partículas tienden a preferir que los vectores temporales produzcan un signo positivo, (+ − − −) . Los autores que cubren varias áreas de la física, por ejemplo, Steven Weinberg y Landau y Lifshitz ( (− + + +) y (+ − − −) respectivamente) se apegan a una opción independientemente del tema. Los argumentos para la primera convención incluyen la "continuidad" del caso euclidiano correspondiente al límite no relativista c → ∞ . Los argumentos para la segunda incluyen que los signos menos, de otra manera omnipresentes en la física de partículas, desaparecen. Sin embargo, otros autores, especialmente de textos introductorios, por ejemplo Kleppner y Kolenkow (1978), no eligen una firma en absoluto, sino que optan por coordinar el espacio-tiempo de modo que la coordenada temporal (¡pero no el tiempo mismo!) sea imaginaria. Esto elimina la necesidad de la introducción explícita de un tensor métrico (que puede parecer una carga extra en un curso introductorio), y uno no necesita preocuparse por vectores covariantes y vectores contravariantes (o índices de elevación y disminución) que se describirán a continuación. El producto interno se ve afectado en cambio por una extensión directa del producto escalar en R 3 a R 3 × C . Esto funciona en el espacio-tiempo plano de la relatividad especial, pero no en el espacio-tiempo curvo de la relatividad general, véase Misner, Thorne y Wheeler (1973, Cuadro 2.1, Adiós a ict ) (quienes, por cierto, utilizan (− + + +) ). MTW también sostiene que oculta la verdadera naturaleza indefinida de la métrica y la verdadera naturaleza de los impulsos de Lorentz, que no son rotaciones. También complica innecesariamente el uso de herramientas de geometría diferencial que de otro modo estarían inmediatamente disponibles y serían útiles para la descripción y el cálculo geométricos, incluso en el espacio-tiempo plano de la relatividad especial, por ejemplo, del campo electromagnético.
Matemáticamente asociado con la forma bilineal hay un tensor de tipo (0,2) en cada punto del espacio-tiempo, llamado métrica de Minkowski . [nb 5] La métrica de Minkowski, la forma bilineal y el producto interno de Minkowski son todos el mismo objeto; es una función bilineal que acepta dos vectores (contravariantes) y devuelve un número real. En coordenadas, esta es la matriz 4×4 que representa la forma bilineal.
A modo de comparación, en la relatividad general , una variedad lorentziana L está igualmente equipada con un tensor métrico g , que es una forma bilineal simétrica no degenerada en el espacio tangente T p L en cada punto p de L. En coordenadas, puede representarse mediante una matriz de 4×4 dependiendo de la posición en el espacio-tiempo . El espacio de Minkowski es, por tanto, un caso especial comparativamente simple de una variedad lorentziana . Su tensor métrico está en coordenadas con la misma matriz simétrica en cada punto de M , y sus argumentos pueden, como se ha indicado anteriormente, tomarse como vectores en el propio espacio-tiempo.
Introduciendo más terminología (pero no más estructura), el espacio de Minkowski es entonces un espacio pseudo-euclidiano con dimensión total n = 4 y signatura (1, 3) o (3, 1) . Los elementos del espacio de Minkowski se denominan eventos . El espacio de Minkowski a menudo se denota R 1,3 o R 3,1 para enfatizar la signatura elegida, o simplemente M . Es un ejemplo de una variedad pseudo-riemanniana .
Entonces, matemáticamente, la métrica es una forma bilineal en un espacio vectorial real abstracto de cuatro dimensiones V , es decir, donde η tiene signatura (+, -, -, -) , y signatura es una propiedad invariante en coordenadas de η . El espacio de aplicaciones bilineales forma un espacio vectorial que se puede identificar con , y η se puede ver de manera equivalente como un elemento de este espacio. Al hacer una elección de base ortonormal , se puede identificar con el espacio . La notación pretende enfatizar el hecho de que M y no son solo espacios vectoriales sino que tienen una estructura agregada. .
Un ejemplo interesante de coordenadas no inerciales para (parte del) espacio-tiempo de Minkowski son las coordenadas de Born . Otro conjunto útil de coordenadas son las coordenadas del cono de luz .
El producto interno de Minkowski no es un producto interno , ya que no es definido positivo , es decir, la forma cuadrática η ( v , v ) no necesita ser positiva para v distinto de cero . La condición definida positiva ha sido reemplazada por la condición más débil de no degeneración. Se dice que la forma bilineal es indefinida . La métrica de Minkowski η es el tensor métrico del espacio de Minkowski. Es una métrica pseudoeuclidiana o, más generalmente, una métrica pseudoriemanniana constante en coordenadas cartesianas. Como tal, es una forma bilineal simétrica no degenerada, un tensor de tipo (0, 2) . Acepta dos argumentos u p , v p , vectores en T p M , p ∈ M , el espacio tangente en p en M . Debido a la identificación canónica mencionada anteriormente de T p M con M mismo, acepta argumentos u , v con u y v en M .
Como convención de notación, los vectores v en M , llamados 4-vectores , se denotan en cursiva y no, como es común en el contexto euclidiano, con v en negrita . Esto último generalmente se reserva para la parte de 3 vectores (que se presentará a continuación) de un 4 -vector.
La definición [13] produce una estructura similar a un producto interno en M , anteriormente y también de ahora en adelante, llamada producto interno de Minkowski , similar al producto interno euclidiano , pero describe una geometría diferente. También se llama producto escalar relativista . Si los dos argumentos son los mismos, la cantidad resultante se llamará norma de Minkowski al cuadrado . El producto interno de Minkowski satisface las siguientes propiedades.
Las dos primeras condiciones implican bilinealidad. La diferencia definitoria entre un pseudoproducto interno y un producto interno propiamente dicho es que no se requiere que el primero sea definido positivo, es decir, se permite que η ( u , u ) < 0 .
La característica más importante del producto interno y la norma al cuadrado es que son cantidades que no se ven afectadas por las transformaciones de Lorentz . De hecho, puede tomarse como la propiedad definitoria de una transformación de Lorentz en el sentido de que preserva el producto interno (es decir, el valor de la forma bilineal correspondiente en dos vectores). Este enfoque se adopta de manera más general para todos los grupos clásicos definibles de esta manera en el grupo clásico . Allí, la matriz Φ es idéntica en el caso O(3, 1) (el grupo de Lorentz) a la matriz η que se mostrará a continuación.
Se dice que dos vectores v y w son ortogonales si η ( v , w ) = 0 . Para una interpretación geométrica de la ortogonalidad en el caso especial, cuando η ( v , v ) ≤ 0 y η ( w , w ) ≥ 0 (o viceversa), véase ortogonalidad hiperbólica .
Un vector e se denomina vector unitario si η ( e , e ) = ±1 . Una base para M que consiste en vectores unitarios mutuamente ortogonales se denomina base ortonormal . [14]
Para un sistema inercial dado , una base ortonormal en el espacio, combinada con el vector unitario de tiempo, forma una base ortonormal en el espacio de Minkowski. El número de vectores unitarios positivos y negativos en cualquier base de este tipo es un par fijo de números igual a la signatura de la forma bilineal asociada con el producto interno. Esta es la ley de inercia de Sylvester .
Más terminología (pero no más estructura): La métrica de Minkowski es una métrica pseudo-riemanniana , más específicamente, una métrica lorentziana , incluso más específicamente, la métrica de Lorentz, reservada para el espacio-tiempo plano de 4 dimensiones con la ambigüedad restante siendo solo la convención de la firma.
Del segundo postulado de la relatividad especial , junto con la homogeneidad del espacio-tiempo y la isotropía del espacio, se deduce que el intervalo de espacio-tiempo entre dos eventos arbitrarios llamados 1 y 2 es: [15] Esta cantidad no se nombra de manera consistente en la literatura. El intervalo a veces se denomina raíz cuadrada del intervalo tal como se define aquí. [16] [17]
La invariancia del intervalo bajo transformaciones de coordenadas entre sistemas inerciales se deriva de la invariancia de siempre que las transformaciones sean lineales. Esta forma cuadrática se puede utilizar para definir una forma bilineal a través de la identidad de polarización . Esta forma bilineal a su vez se puede escribir como donde [ η ] es una matriz asociada con η . Si bien puede resultar confuso, es una práctica común denotar [ η ] solo con η . La matriz se lee a partir de la forma bilineal explícita como y la forma bilineal con la que comenzó esta sección asumiendo su existencia, ahora se identifica.
Para mayor claridad y una presentación más breve, se adopta a continuación la signatura (− + + +) . Esta elección (o la otra opción posible) no tiene implicaciones físicas (conocidas). El grupo de simetría que preserva la forma bilineal con una opción de signatura es isomorfo (según la función que se da aquí ) con el grupo de simetría que preserva la otra opción de signatura. Esto significa que ambas opciones están de acuerdo con los dos postulados de la relatividad. Cambiar entre las dos convenciones es sencillo. Si se ha utilizado el tensor métrico η en una derivación, retroceda al punto más antiguo en el que se utilizó, sustituya η por − η y vuelva a avanzar hasta la fórmula deseada con la signatura métrica deseada.
Una base estándar u ortonormal para el espacio de Minkowski es un conjunto de cuatro vectores mutuamente ortogonales { e 0 , e 1 , e 2 , e 3 } tales que y para los cuales cuando
Estas condiciones se pueden escribir de forma compacta en la forma
En relación con una base estándar, los componentes de un vector v se escriben ( v 0 , v 1 , v 2 , v 3 ) donde se utiliza la notación de Einstein para escribir v = v μ e μ . El componente v 0 se denomina componente temporal de v mientras que los otros tres componentes se denominan componentes espaciales . Los componentes espaciales de un 4 -vector v pueden identificarse con un 3 -vector v = ( v 1 , v 2 , v 3 ) .
En términos de componentes, el producto interno de Minkowski entre dos vectores v y w está dado por
y
Aquí se utilizó la reducción de un índice con la métrica.
Hay muchas opciones posibles de base estándar que obedecen la condición Cualesquiera dos de estas bases están relacionadas en algún sentido por una transformación de Lorentz, ya sea por una matriz de cambio de base , una matriz real de 4 × 4 que satisface o Λ , una función lineal en el espacio vectorial abstracto que satisface, para cualquier par de vectores u , v ,
Entonces, si existen dos bases diferentes, { e 0 , e 1 , e 2 , e 3 } y { e ′ 0 , e ′ 1 , e ′ 2 , e ′ 3 } , se pueden representar como o . Si bien puede ser tentador pensar en y Λ como la misma cosa, matemáticamente, son elementos de espacios diferentes y actúan sobre el espacio de bases estándar desde lados diferentes.
Técnicamente, una forma bilineal no degenerada proporciona una función entre un espacio vectorial y su dual; en este contexto, la función está entre los espacios tangentes de M y los espacios cotangentes de M . En un punto en M , los espacios tangente y cotangente son espacios vectoriales duales (por lo que la dimensión del espacio cotangente en un evento también es 4 ). Así como un producto interno auténtico en un espacio vectorial con un argumento fijo, por el teorema de representación de Riesz , puede expresarse como la acción de un funcional lineal en el espacio vectorial, lo mismo se aplica al producto interno de Minkowski del espacio de Minkowski. [19]
Así, si v μ son los componentes de un vector en el espacio tangente, entonces η μν v μ = v ν son los componentes de un vector en el espacio cotangente (un funcional lineal). Debido a la identificación de vectores en espacios tangentes con vectores en M mismo, esto se ignora en la mayoría de los casos, y los vectores con índices más bajos se denominan vectores covariantes . En esta última interpretación, los vectores covariantes se identifican (casi siempre implícitamente) con vectores (funcionales lineales) en el dual del espacio de Minkowski. Los que tienen índices superiores son vectores contravariantes . De la misma manera, la inversa de la función de espacios tangentes a cotangentes, dada explícitamente por la inversa de η en la representación matricial, se puede utilizar para definir la elevación de un índice . Los componentes de esta inversa se denotan η μν . Sucede que η μν = η μν . Estos mapas entre un espacio vectorial y su dual pueden denotarse η ♭ (eta-bemol) y η ♯ (eta-sostenido) mediante la analogía musical. [20]
Los vectores contravariantes y covariantes son objetos geométricamente muy diferentes. Los primeros pueden y deben considerarse como flechas. Una función lineal puede caracterizarse por dos objetos: su núcleo , que es un hiperplano que pasa por el origen, y su norma. Geométricamente, por lo tanto, los vectores covariantes deben considerarse como un conjunto de hiperplanos, con un espaciado que depende de la norma (cuanto mayor sea el espaciado, menor será), y uno de ellos (el núcleo) pasa por el origen. El término matemático para un vector covariante es 1-covector o 1-forma (aunque este último suele reservarse para los campos de covectores ).
Una analogía de la mecánica cuántica explorada en la literatura es la de una onda de De Broglie (escalada por un factor de la constante reducida de Planck) asociada con un cuatrivector de momento para ilustrar cómo se podría imaginar una versión covariante de un vector contravariante. El producto interno de dos vectores contravariantes podría igualmente considerarse como la acción de la versión covariante de uno de ellos sobre la versión contravariante del otro. El producto interno es entonces cuántas veces la flecha perfora los planos. [18] La referencia matemática, Lee (2003), ofrece la misma visión geométrica de estos objetos (pero no menciona ninguna perforación).
El tensor de campo electromagnético es una forma diferencial 2 , cuya descripción geométrica también se puede encontrar en MTW.
Por supuesto, se pueden ignorar por completo las concepciones geométricas (como se hace, por ejemplo, en Weinberg (2002) y Landau & Lifshitz 2002) y proceder algebraicamente de una manera puramente formal. La robustez probada a lo largo del tiempo del formalismo en sí, a veces denominada gimnasia de índices , garantiza que mover vectores y cambiar de vectores contravariantes a covariantes y viceversa (así como tensores de orden superior) sea matemáticamente sólido. Las expresiones incorrectas tienden a revelarse rápidamente.
Dada una forma bilineal , la versión reducida de un vector puede considerarse como la evaluación parcial de , es decir, hay un mapa de evaluación parcial asociado
El vector reducido es entonces la función dual . Nótese que no importa qué argumento se evalúa parcialmente debido a la simetría de .
La no degeneración es entonces equivalente a la inyectividad del mapa de evaluación parcial, o equivalentemente la no degeneración indica que el núcleo del mapa es trivial. En dimensión finita, como es el caso aquí, y notando que la dimensión de un espacio de dimensión finita es igual a la dimensión del dual, esto es suficiente para concluir que el mapa de evaluación parcial es un isomorfismo lineal de a . Esto entonces permite la definición del mapa de evaluación parcial inverso, que permite definir la métrica inversa como donde los dos usos diferentes de pueden distinguirse por el argumento en el que se evalúa cada uno. Esto luego puede usarse para generar índices. Si se usa una base de coordenadas, la métrica η −1 es de hecho la matriz inversa a η .
El objetivo de este trabajo es mostrar de manera semi-rigurosa cómo se puede aplicar formalmente la métrica de Minkowski a dos vectores y obtener un número real, es decir, mostrar el papel de las diferenciales y cómo desaparecen en un cálculo. El contexto es el de la teoría de variedades suaves y se introducen conceptos como campos convectores y derivadas externas.
Una versión completa de la métrica de Minkowski en coordenadas como un campo tensorial en el espacio-tiempo tiene la apariencia
Explicación: Las diferenciales de coordenadas son campos de 1-forma. Se definen como la derivada exterior de las funciones de coordenadas x μ . Estas cantidades evaluadas en un punto p proporcionan una base para el espacio cotangente en p . El producto tensorial (denotado por el símbolo ⊗ ) produce un campo tensorial de tipo (0, 2) , es decir, el tipo que espera dos vectores contravariantes como argumentos. En el lado derecho, se ha tomado el producto simétrico (denotado por el símbolo ⊙ o por yuxtaposición). La igualdad se cumple ya que, por definición, la métrica de Minkowski es simétrica. [21] La notación en el extremo derecho también se utiliza a veces para el elemento de línea relacionado, pero diferente . No es un tensor. Para una elaboración sobre las diferencias y similitudes, véase Misner, Thorne y Wheeler (1973, Cuadro 3.2 y sección 13.2.)
Los vectores tangentes se dan, en este formalismo, en términos de una base de operadores diferenciales de primer orden, donde p es un evento. Este operador aplicado a una función f da la derivada direccional de f en p en la dirección de aumento de x μ con x ν , ν ≠ μ fijo. Proporcionan una base para el espacio tangente en p .
La derivada exterior df de una función f es un campo covectorial , es decir, una asignación de un vector cotangente a cada punto p , por definición tal que para cada campo vectorial X. Un campo vectorial es una asignación de un vector tangente a cada punto p . En coordenadas X se puede desarrollar en cada punto p en la base dada por ∂/∂ x ν | p . Aplicando esto con f = x μ , la función coordenada misma, y X = ∂/∂ x ν , llamado campo vectorial coordenado , se obtiene
Puesto que esta relación se cumple en cada punto p , los dx μ | p proporcionan una base para el espacio cotangente en cada p y las bases dx μ | p y ∂/∂ x ν | p son duales entre sí, en cada p . Además, se tienen para las uno-formas generales en un espacio tangente α , β y los vectores tangentes generales a , b . (Esto puede tomarse como una definición, pero también puede demostrarse en un contexto más general).
Así, cuando al tensor métrico se le aplican dos campos vectoriales a , b , ambos expandidos en términos de los campos vectoriales de coordenadas base, el resultado es donde a μ , b ν son las funciones componentes de los campos vectoriales. La ecuación anterior se cumple en cada punto p , y la relación también puede interpretarse como la métrica de Minkowski en p aplicada a dos vectores tangentes en p .
Como se mencionó, en un espacio vectorial, como el modelado del espacio-tiempo de la relatividad especial, los vectores tangentes pueden identificarse canónicamente con vectores en el espacio mismo, y viceversa. Esto significa que los espacios tangentes en cada punto se identifican canónicamente entre sí y con el espacio vectorial mismo. Esto explica cómo el lado derecho de la ecuación anterior puede emplearse directamente, sin tener en cuenta el punto del espacio-tiempo en el que se va a evaluar la métrica y de dónde (qué espacio tangente) provienen los vectores.
Esta situación cambia en la relatividad general . Se tiene entonces que ahora η → g ( p ) , es decir, g sigue siendo un tensor métrico pero ahora depende del espacio-tiempo y es una solución de las ecuaciones de campo de Einstein . Además, a , b deben ser vectores tangentes en el punto p del espacio-tiempo y ya no pueden moverse libremente.
Sea x , y ∈ M . Aquí,
Supongamos que x ∈ M es temporal. Entonces, el hiperplano simultáneo para x es { y : η ( x , y ) = 0} . Como este hiperplano varía a medida que varía x , existe una relatividad de la simultaneidad en el espacio de Minkowski.
Una variedad lorentziana es una generalización del espacio de Minkowski en dos sentidos. El número total de dimensiones del espacio-tiempo no está restringido a 4 ( 2 o más) y una variedad lorentziana no necesita ser plana, es decir, permite la curvatura.
El espacio de Minkowski complejizado se define como M c = M ⊕ iM . [22] Su parte real es el espacio de Minkowski de cuatro vectores , como el de cuatro velocidades y el de cuatro momentos , que son independientes de la elección de la orientación del espacio. La parte imaginaria, por otro lado, puede consistir en cuatro pseudovectores, como la velocidad angular y el momento magnético , que cambian su dirección con un cambio de orientación. Se introduce un pseudoescalar i , que también cambia de signo con un cambio de orientación. Por lo tanto, los elementos de M c son independientes de la elección de la orientación.
La estructura interna similar al producto en M c se define como u ⋅ v = η ( u , v ) para cualquier u , v ∈ M c . Un espín puro relativista de un electrón o cualquier partícula de medio espín se describe por ρ ∈ M c como ρ = u + is , donde u es la velocidad cuatridimensional de la partícula, que satisface u 2 = 1 y s es el vector de espín 4D, [23] que también es el pseudovector de Pauli–Lubanski que satisface s 2 = −1 y u ⋅ s = 0 .
El espacio de Minkowski se refiere a una formulación matemática en cuatro dimensiones. Sin embargo, las matemáticas se pueden extender o simplificar fácilmente para crear un espacio de Minkowski generalizado análogo en cualquier número de dimensiones. Si n ≥ 2 , el espacio de Minkowski n -dimensional es un espacio vectorial de dimensión real n en el que hay una métrica de Minkowski constante de signatura ( n − 1, 1) o (1, n − 1) . Estas generalizaciones se utilizan en teorías en las que se supone que el espacio-tiempo tiene más o menos de 4 dimensiones. La teoría de cuerdas y la teoría M son dos ejemplos en los que n > 4 . En la teoría de cuerdas, aparecen teorías de campos conformes con dimensiones de espacio-tiempo 1 + 1 .
El espacio de Sitter se puede formular como una subvariedad del espacio de Minkowski generalizado, al igual que los espacios modelo de la geometría hiperbólica (ver más abajo).
Como espacio-tiempo plano , los tres componentes espaciales del espacio-tiempo de Minkowski siempre obedecen al Teorema de Pitágoras . El espacio de Minkowski es una base adecuada para la relatividad especial, una buena descripción de los sistemas físicos en distancias finitas en sistemas sin gravitación significativa . Sin embargo, para tener en cuenta la gravedad, los físicos utilizan la teoría de la relatividad general , que se formula en las matemáticas de una geometría no euclidiana . Cuando esta geometría se utiliza como modelo del espacio físico, se conoce como espacio curvo .
Incluso en el espacio curvo, el espacio de Minkowski sigue siendo una buena descripción en una región infinitesimal que rodea cualquier punto (salvo las singularidades gravitacionales). [nb 6] De manera más abstracta, se puede decir que en presencia de gravedad el espacio-tiempo se describe mediante una variedad curva de 4 dimensiones para la cual el espacio tangente a cualquier punto es un espacio de Minkowski de 4 dimensiones. Por lo tanto, la estructura del espacio de Minkowski sigue siendo esencial en la descripción de la relatividad general.
El significado del término geometría para el espacio de Minkowski depende en gran medida del contexto. El espacio de Minkowski no está dotado de geometría euclidiana, ni de ninguna de las geometrías riemannianas generalizadas con curvatura intrínseca, las expuestas por los espacios modelo en geometría hiperbólica (curvatura negativa) y la geometría modelada por la esfera (curvatura positiva). La razón es la indefinición de la métrica de Minkowski. El espacio de Minkowski, en particular, no es un espacio métrico ni una variedad riemanniana con una métrica riemanniana. Sin embargo, el espacio de Minkowski contiene subvariedades dotadas de una métrica riemanniana que produce geometría hiperbólica.
Los espacios modelo de geometría hiperbólica de baja dimensión, digamos 2 o 3, no se pueden incrustar isométricamente en el espacio euclidiano con una dimensión más, es decir o respectivamente, con la métrica euclidiana , lo que impide una fácil visualización. [nb 7] [24] En comparación, los espacios modelo con curvatura positiva son solo esferas en el espacio euclidiano de una dimensión superior. [25] Los espacios hiperbólicos se pueden incrustar isométricamente en espacios de una dimensión más cuando el espacio de incrustación está dotado de la métrica de Minkowski .
Definir como la hoja superior ( ) del hiperboloide en el espacio generalizado de Minkowski de dimensión espaciotemporal Esta es una de las superficies de transitividad del grupo generalizado de Lorentz. La métrica inducida en esta subvariedad, el pullback de la métrica de Minkowski bajo inclusión, es una métrica de Riemann . Con esta métrica es una variedad de Riemann . Es uno de los espacios modelo de la geometría de Riemann, el modelo hiperboloide del espacio hiperbólico . Es un espacio de curvatura negativa constante . [26] El 1 en el índice superior se refiere a una enumeración de los diferentes espacios modelo de la geometría hiperbólica, y la n a su dimensión. A corresponde al modelo de disco de Poincaré , mientras que corresponde al modelo de semiespacio de Poincaré de dimensión
En la definición anterior se encuentra el mapa de inclusión y la estrella en superíndice denota el retroceso . El presente propósito es describir esta y otras operaciones similares como preparación para la demostración real de que en realidad es un espacio hiperbólico.
Para exhibir la métrica, es necesario retirarla mediante una parametrización adecuada . Una parametrización de una subvariedad S de una variedad M es una función U ⊂ R m → M cuyo rango es un subconjunto abierto de S. Si S tiene la misma dimensión que M , una parametrización es simplemente la inversa de una función de coordenadas φ : M → U ⊂ R m . La parametrización que se utilizará es la inversa de la proyección estereográfica hiperbólica . Esto se ilustra en la figura de la derecha para n = 2. Es instructivo compararla con la proyección estereográfica para esferas.
Proyección estereográfica σ : Hen R
→ R n y su inversa σ −1 : R n → Hen R
se dan por
donde, para simplificar, τ ≡ ct . Las ( τ , x ) son coordenadas en M n +1 y las u son coordenadas en R n .
Dejar y dejar
Si entonces es geométricamente claro que el vector interseca al hiperplano una vez en el punto denotado
Uno tiene o
Por construcción de proyección estereográfica se tiene
Esto nos lleva al sistema de ecuaciones
El primero de estos se resuelve para λ y se obtiene para la proyección estereográfica
A continuación, se debe calcular la inversa σ −1 ( u ) = ( τ , x ) . Use las mismas consideraciones que antes, pero ahora con uno se obtiene pero ahora con λ dependiendo de u . La condición para que P se encuentre en el hiperboloide es o que conduce a
Con este λ , se obtiene
Uno tiene y el mapa
La métrica retirada se puede obtener mediante métodos sencillos de cálculo;
Se calcula de acuerdo con las reglas estándar para calcular diferenciales (aunque en realidad se calculan las derivadas externas rigurosamente definidas) y se sustituyen los resultados en el lado derecho. Esto da
Esta última ecuación muestra que la métrica de la pelota es idéntica a la métrica riemanniana h2( n )
Ren el modelo de bola de Poincaré , otro modelo estándar de geometría hiperbólica.
Medios relacionados con los diagramas de Minkowski en Wikimedia Commons