Espacio-tiempo

En física , el espacio-tiempo , también llamado continuo espacio-tiempo , es un modelo matemático que fusiona las tres dimensiones del espacio y la única dimensión del tiempo en un único continuo de cuatro dimensiones . Los diagramas de espacio-tiempo son útiles para visualizar y comprender los efectos relativistas , como la forma en que los diferentes observadores perciben dónde y cuándo ocurren los eventos.

Hasta principios del siglo XX, se suponía que la geometría tridimensional del universo (su descripción en términos de ubicaciones, formas, distancias y direcciones) era distinta del tiempo (la medición de cuándo ocurren los eventos dentro del universo). Sin embargo, el espacio y el tiempo adquirieron nuevos significados con la transformación de Lorentz y la teoría especial de la relatividad .

En 1908, Hermann Minkowski presentó una interpretación geométrica de la relatividad especial que fusionaba el tiempo y las tres dimensiones espaciales del espacio en un único continuo de cuatro dimensiones, conocido hoy como espacio de Minkowski . Esta interpretación resultó vital para la teoría general de la relatividad , según la cual el espacio-tiempo está curvado por la masa y la energía .

Fundamentos

Definiciones

La mecánica clásica no relativista considera el tiempo como una cantidad universal de medida que es uniforme en todo su alcance, está separada del espacio y es aceptada por todos los observadores. La mecánica clásica supone que el tiempo tiene una velocidad de paso constante, independiente del estado de movimiento del observador o de cualquier elemento externo. ^[1] Supone que el espacio es euclidiano : supone que el espacio sigue la geometría del sentido común. ^[2]

En el contexto de la relatividad especial , el tiempo no puede separarse de las tres dimensiones del espacio, porque la velocidad observada a la que pasa el tiempo para un objeto depende de la velocidad del objeto en relación con el observador. ^[3]^{: 214–217} La relatividad general proporciona una explicación de cómo los campos gravitacionales pueden ralentizar el paso del tiempo de un objeto visto por un observador fuera del campo.

En el espacio ordinario, una posición se especifica mediante tres números, conocidos como dimensiones . En el sistema de coordenadas cartesianas , a menudo se denominan x , y y z . Un punto en el espacio-tiempo se denomina evento y requiere que se especifiquen cuatro números: la ubicación tridimensional en el espacio, más la posición en el tiempo (Fig. 1). Un evento se representa mediante un conjunto de coordenadas x , y , z y t . ^[4] El espacio-tiempo es, por tanto, cuatridimensional .

A diferencia de las analogías utilizadas en los escritos populares para explicar eventos, como los petardos o las chispas, los eventos matemáticos tienen duración cero y representan un único punto en el espacio-tiempo. ^[5] Aunque es posible estar en movimiento en relación con el estallido de un petardo o una chispa, no es posible que un observador esté en movimiento en relación con un evento.

La trayectoria de una partícula a través del espacio-tiempo puede considerarse una secuencia de eventos. La serie de eventos puede vincularse entre sí para formar una curva que representa el progreso de la partícula a través del espacio-tiempo. Esa trayectoria se denomina línea del universo de la partícula . ^[6]^{: 105}

Matemáticamente, el espacio-tiempo es una variedad , es decir, parece localmente "plana" cerca de cada punto de la misma manera que, a escalas suficientemente pequeñas, la superficie de un globo parece ser plana. ^[7] Un factor de escala (convencionalmente llamado velocidad de la luz ) relaciona las distancias medidas en el espacio con las distancias medidas en el tiempo. La magnitud de este factor de escala (casi 300.000 kilómetros o 190.000 millas en el espacio son equivalentes a un segundo en el tiempo), junto con el hecho de que el espacio-tiempo es una variedad, implica que a velocidades ordinarias, no relativistas y a distancias ordinarias, a escala humana, hay poco que los humanos puedan observar que sea notablemente diferente de lo que podrían observar si el mundo fuera euclidiano. Fue recién con el advenimiento de mediciones científicas sensibles a mediados del siglo XIX, como el experimento de Fizeau y el experimento de Michelson-Morley , que comenzaron a notarse discrepancias desconcertantes entre las observaciones y las predicciones basadas en el supuesto implícito del espacio euclidiano. ^[8] $c$

En la relatividad especial, un observador se refiere, en la mayoría de los casos, a un marco de referencia desde el cual se mide un conjunto de objetos o eventos. Este uso difiere significativamente del significado común del término en inglés. Los marcos de referencia son construcciones inherentemente no locales y, según este uso del término, no tiene sentido hablar de un observador como si tuviera una ubicación. ^[9]

En la figura 1-1, imaginemos que el marco en cuestión está equipado con una densa red de relojes, sincronizados dentro de este marco de referencia, que se extiende indefinidamente a lo largo de las tres dimensiones del espacio. Cualquier ubicación específica dentro de la red no es importante. La red de relojes se utiliza para determinar el tiempo y la posición de los eventos que tienen lugar dentro de todo el marco. El término observador se refiere a todo el conjunto de relojes asociados con un marco de referencia inercial. ^[9]^{: 17–22}

En este caso idealizado, cada punto del espacio tiene un reloj asociado y, por lo tanto, los relojes registran cada evento instantáneamente, sin demora temporal entre un evento y su registro. Un observador real verá una demora entre la emisión de una señal y su detección debido a la velocidad de la luz. Para sincronizar los relojes, en la reducción de datos posterior a un experimento, se corregirá la hora en la que se recibe una señal para reflejar su hora real si hubiera sido registrada por una red idealizada de relojes. ^[9]^{: 17–22}

En muchos libros sobre relatividad especial, especialmente en los más antiguos, la palabra "observador" se utiliza en el sentido más corriente de la palabra. El contexto suele dejar claro qué significado se ha adoptado.

Los físicos distinguen entre lo que se mide u observa , una vez descontados los retrasos en la propagación de la señal, y lo que se ve visualmente sin dichas correcciones. No entender la diferencia entre lo que se mide y lo que se ve es la fuente de mucha confusión entre los estudiantes de relatividad. ^[10]

Historia

A mediados del siglo XIX, varios experimentos, como la observación de la mancha de Arago y las mediciones diferenciales de la velocidad de la luz en el aire frente a la del agua, se consideraron que habían demostrado la naturaleza ondulatoria de la luz en oposición a una teoría corpuscular . ^[11] Entonces se asumió que la propagación de ondas requería la existencia de un medio ondulatorio ; en el caso de las ondas de luz, se consideró que este era un hipotético éter luminífero . ^{[nota 1]} Los diversos intentos de establecer las propiedades de este medio hipotético arrojaron resultados contradictorios. Por ejemplo, el experimento de Fizeau de 1851, realizado por el físico francés Hippolyte Fizeau , demostró que la velocidad de la luz en el agua en movimiento era menor que la suma de la velocidad de la luz en el aire más la velocidad del agua en una cantidad dependiente del índice de refracción del agua. ^[12]

Entre otras cuestiones, la dependencia del arrastre parcial del éter implicado por este experimento en el índice de refracción (que depende de la longitud de onda) llevó a la desagradable conclusión de que el éter fluye simultáneamente a diferentes velocidades para diferentes colores de luz. ^[13] El experimento de Michelson-Morley de 1887 (Fig. 1-2) no mostró ninguna influencia diferencial de los movimientos de la Tierra a través del éter hipotético en la velocidad de la luz, y la explicación más probable, el arrastre completo del éter, estaba en conflicto con la observación de la aberración estelar . ^[8]

George Francis FitzGerald en 1889, ^[14] y Hendrik Lorentz en 1892 propusieron de forma independiente que los cuerpos materiales que viajaban a través del éter fijo se veían afectados físicamente por su paso, contrayéndose en la dirección del movimiento en una cantidad que era exactamente la necesaria para explicar los resultados negativos del experimento de Michelson-Morley. No se producen cambios de longitud en direcciones transversales a la dirección del movimiento.

En 1904, Lorentz había ampliado su teoría de tal manera que había llegado a ecuaciones formalmente idénticas a las que Einstein derivaría más tarde, es decir, la transformación de Lorentz . ^[15] Como teoría de la dinámica (el estudio de las fuerzas y los pares y su efecto sobre el movimiento), su teoría suponía deformaciones físicas reales de los componentes físicos de la materia. ^[16]^{: 163–174} Las ecuaciones de Lorentz predijeron una cantidad que llamó tiempo local , con la que podía explicar la aberración de la luz , el experimento de Fizeau y otros fenómenos.

Figura 1-3.

Henri Poincaré fue el primero en combinar el espacio y el tiempo en el espacio-tiempo. ^[17]^[18]^{: 73–80, 93–95} Argumentó en 1898 que la simultaneidad de dos eventos es una cuestión de convención. ^[19]^{[nota 2]} En 1900, reconoció que el "tiempo local" de Lorentz es en realidad lo que indican los relojes en movimiento aplicando una definición explícitamente operacional de sincronización de relojes asumiendo una velocidad de la luz constante. ^{[nota 3]} En 1900 y 1904, sugirió la indetectabilidad inherente del éter enfatizando la validez de lo que llamó el principio de relatividad . En 1905/1906 ^[20] perfeccionó matemáticamente la teoría de los electrones de Lorentz para ponerla de acuerdo con el postulado de la relatividad.

Mientras discutía varias hipótesis sobre la gravitación invariante de Lorentz, introdujo el concepto innovador de un espacio-tiempo de cuatro dimensiones al definir varios vectores de cuatro dimensiones , a saber, cuatro posiciones , cuatro velocidades y cuatro fuerzas . ^[21]^[22] Sin embargo, no persiguió el formalismo de cuatro dimensiones en artículos posteriores, afirmando que esta línea de investigación parecía "implicar un gran dolor para un beneficio limitado", concluyendo finalmente "que el lenguaje tridimensional parece el más adecuado para la descripción de nuestro mundo". ^[22] Incluso en 1909, Poincaré continuó describiendo la interpretación dinámica de la transformada de Lorentz. ^[16]^{: 163–174}

En 1905, Albert Einstein analizó la relatividad especial en términos de cinemática (el estudio de los cuerpos en movimiento sin referencia a fuerzas) en lugar de dinámica. Sus resultados eran matemáticamente equivalentes a los de Lorentz y Poincaré. Los obtuvo al reconocer que toda la teoría puede construirse sobre dos postulados: el principio de relatividad y el principio de la constancia de la velocidad de la luz. Su trabajo estaba lleno de vívidas imágenes que involucraban el intercambio de señales de luz entre relojes en movimiento, mediciones cuidadosas de las longitudes de varillas en movimiento y otros ejemplos similares. ^[23]^{[nota 4]}

En 1905, Einstein superó los intentos previos de una relación electromagnética masa -energía al introducir la equivalencia general de masa y energía , que fue fundamental para su posterior formulación del principio de equivalencia en 1907, que declara la equivalencia de la masa inercial y gravitacional. Al utilizar la equivalencia masa-energía, Einstein demostró que la masa gravitacional de un cuerpo es proporcional a su contenido de energía, lo que fue uno de los primeros resultados en el desarrollo de la relatividad general . Si bien parecería que al principio no pensó geométricamente sobre el espacio-tiempo, ^[3]^{: 219} en el desarrollo posterior de la relatividad general, Einstein incorporó plenamente el formalismo del espacio-tiempo.

Cuando Einstein publicó en 1905, otro de sus competidores, su antiguo profesor de matemáticas Hermann Minkowski , también había llegado a la mayoría de los elementos básicos de la relatividad especial. Max Born relató una reunión que había concertado con Minkowski, con la intención de ser su alumno/colaborador: ^[25]

Fui a Colonia, conocí a Minkowski y escuché su célebre conferencia «Espacio y tiempo», pronunciada el 2 de septiembre de 1908. [...] Más tarde me dijo que le causó un gran impacto cuando Einstein publicó su artículo en el que se afirmaba la equivalencia de los diferentes tiempos locales de los observadores que se movían unos con respecto a otros; pues había llegado a las mismas conclusiones de forma independiente, pero no las publicó porque deseaba primero elaborar la estructura matemática en todo su esplendor. Nunca reivindicó la prioridad y siempre concedió a Einstein su parte plena en el gran descubrimiento.

Minkowski se había interesado por el estado de la electrodinámica después de los experimentos disruptivos de Michelson al menos desde el verano de 1905, cuando Minkowski y David Hilbert dirigieron un seminario avanzado al que asistieron físicos notables de la época para estudiar los artículos de Lorentz, Poincaré y otros. Minkowski vio el trabajo de Einstein como una extensión del de Lorentz, y fue influenciado más directamente por Poincaré. ^[26]

El 5 de noviembre de 1907 (poco más de un año antes de su muerte), Minkowski presentó su interpretación geométrica del espacio-tiempo en una conferencia ante la Sociedad Matemática de Göttingen con el título El principio de relatividad ( Das Relativitätsprinzip ). ^{[nota 5]} El 21 de septiembre de 1908, Minkowski presentó su charla Espacio y tiempo ( Raum und Zeit ), ^[27] ante la Sociedad Alemana de Científicos y Médicos. Las palabras iniciales de Espacio y tiempo incluyen la declaración de Minkowski de que "de ahora en adelante, el espacio para sí mismo y el tiempo para sí mismo se reducirán completamente a una mera sombra, y solo algún tipo de unión de los dos preservará la independencia". Espacio y tiempo incluyó la primera presentación pública de diagramas de espacio-tiempo (Fig. 1-4), e incluyó una notable demostración de que el concepto de intervalo invariante (discutido más adelante), junto con la observación empírica de que la velocidad de la luz es finita, permite la derivación de la totalidad de la relatividad especial. ^{[nota 6]}

El concepto de espacio-tiempo y el grupo de Lorentz están estrechamente relacionados con ciertos tipos de geometrías esféricas , hiperbólicas o conformes y sus grupos de transformación ya desarrollados en el siglo XIX, en los que se utilizan intervalos invariantes análogos al intervalo espacio-tiempo . ^{[nota 7]}

Einstein, por su parte, inicialmente desestimó la interpretación geométrica de Minkowski de la relatividad especial, considerándola überflüssige Gelehrsamkeit (erudición superflua). Sin embargo, para completar su búsqueda de la relatividad general que comenzó en 1907, la interpretación geométrica de la relatividad resultó vital. En 1916, Einstein reconoció plenamente su deuda con Minkowski, cuya interpretación facilitó enormemente la transición a la relatividad general. ^[16]^{: 151–152} Dado que existen otros tipos de espacio-tiempo, como el espacio-tiempo curvo de la relatividad general, el espacio-tiempo de la relatividad especial se conoce hoy como espacio-tiempo de Minkowski.

El espacio-tiempo en la relatividad especial

Intervalo espacio-temporal

En tres dimensiones, la distancia entre dos puntos se puede definir utilizando el teorema de Pitágoras : $\Delta {d}$

(\Delta {d})^{2}=(\Delta {x})^{2}+(\Delta {y})^{2}+(\Delta {z})^{2}

Aunque dos observadores pueden medir la posición x , y y z de los dos puntos utilizando diferentes sistemas de coordenadas, la distancia entre los puntos será la misma para ambos, suponiendo que estén midiendo utilizando las mismas unidades. La distancia es "invariante".

Sin embargo, en la relatividad especial, la distancia entre dos puntos ya no es la misma si la miden dos observadores diferentes, cuando uno de ellos se mueve, debido a la contracción de Lorentz . La situación es aún más complicada si los dos puntos están separados tanto en el tiempo como en el espacio. Por ejemplo, si un observador ve que dos eventos ocurren en el mismo lugar, pero en diferentes momentos, una persona que se mueve con respecto al primer observador verá que los dos eventos ocurren en lugares diferentes, porque el punto de vista en movimiento se ve a sí mismo como estacionario, y la posición del evento como alejándose o acercándose. Por lo tanto, se debe utilizar una medida diferente para medir la "distancia" efectiva entre dos eventos. ^[31]^{: 48–50, 100–102}

En el espacio-tiempo de cuatro dimensiones, el análogo de la distancia es el intervalo. Aunque el tiempo entra como una cuarta dimensión, se trata de manera diferente a las dimensiones espaciales. Por lo tanto, el espacio de Minkowski difiere en aspectos importantes del espacio euclidiano de cuatro dimensiones . La razón fundamental para fusionar el espacio y el tiempo en el espacio-tiempo es que el espacio y el tiempo no son invariantes por separado, lo que quiere decir que, en las condiciones adecuadas, diferentes observadores no estarán de acuerdo sobre la duración del tiempo entre dos eventos (debido a la dilatación del tiempo ) o la distancia entre los dos eventos (debido a la contracción de la longitud ). La relatividad especial proporciona un nuevo invariante, llamado intervalo espacio-temporal , que combina distancias en el espacio y en el tiempo. Todos los observadores que midan el tiempo y la distancia entre dos eventos cualesquiera terminarán calculando el mismo intervalo espacio-temporal. Supongamos que un observador mide dos eventos separados en el tiempo por y una distancia espacial . Entonces, el intervalo espacio-temporal al cuadrado entre los dos eventos que están separados por una distancia en el espacio y por en la coordenada es: ^[32] $\Delta t$ $\Delta x.$ $(\Delta {s})^{2}$ $\Delta {x}$ $\Delta {ct}=c\Delta t$ $ct$

(\Delta s)^{2}=(\Delta ct)^{2}-(\Delta x)^{2},

o para tres dimensiones espaciales,

(\Delta s)^{2}=(\Delta ct)^{2}-(\Delta x)^{2}-(\Delta y)^{2}-(\Delta z)^{2}.

La constante de la velocidad de la luz convierte las unidades de tiempo (como los segundos) en unidades de espacio (como los metros). El intervalo al cuadrado es una medida de separación entre los eventos A y B que están separados en el tiempo y además separados en el espacio, ya sea porque hay dos objetos separados que experimentan eventos o porque un solo objeto en el espacio se mueve inercialmente entre sus eventos. El intervalo de separación es la diferencia entre el cuadrado de la distancia espacial que separa el evento B del evento A y el cuadrado de la distancia espacial recorrida por una señal de luz en ese mismo intervalo de tiempo . Si la separación de eventos se debe a una señal de luz, entonces esta diferencia se desvanece y . $c,$ $t$ $\Delta s^{2}$ $\Delta t$ $\Delta s=0$

Cuando los eventos considerados son infinitesimalmente cercanos entre sí, entonces podemos escribir

ds^{2}=c^{2}dt^{2}-dx^{2}-dy^{2}-dz^{2}.

En un marco inercial diferente, digamos con coordenadas , el intervalo espacio-temporal se puede escribir en la misma forma que arriba. Debido a la constancia de la velocidad de la luz, los eventos de luz en todos los marcos inerciales pertenecen al intervalo cero, . Para cualquier otro evento infinitesimal donde , se puede probar que lo que a su vez al integrar conduce a . ^[33]^{: 2} La invariancia del intervalo espacio-temporal entre los mismos eventos para todos los marcos de referencia inerciales es uno de los resultados fundamentales de la teoría especial de la relatividad. $(t',x',y',z')$ $ds'$ $ds=ds'=0$ $ds\neq 0$ $ds^{2}=ds'^{2}$ $s=s'$

Aunque por brevedad, con frecuencia se ven expresiones de intervalo expresadas sin deltas, incluso en la mayor parte de la discusión siguiente, debe entenderse que, en general, significa , etc. Siempre nos preocupan las diferencias de los valores de coordenadas espaciales o temporales que pertenecen a dos eventos y, dado que no hay un origen preferido, los valores de coordenadas individuales no tienen un significado esencial. $x$ $\Delta {x}$

La ecuación anterior es similar al teorema de Pitágoras, excepto que hay un signo menos entre los términos y . El intervalo del espacio-tiempo es la cantidad, no en sí misma. La razón es que, a diferencia de las distancias en la geometría euclidiana, los intervalos en el espacio-tiempo de Minkowski pueden ser negativos. En lugar de tratar con raíces cuadradas de números negativos, los físicos suelen considerarlo como un símbolo distinto en sí mismo, en lugar del cuadrado de algo. ^[3]^{: 217} $(ct)^{2}$ $x^{2}$ $s^{2},$ $s$ $s^{2}$

Nota: Hay dos convenciones de signos en uso en la literatura sobre relatividad:

s^{2}=(ct)^{2}-x^{2}-y^{2}-z^{2}

s^{2}=-(ct)^{2}+x^{2}+y^{2}+z^{2}

Estas convenciones de signos están asociadas con las signaturas métricas (+−−−) y (−+++). Una variación menor es colocar la coordenada de tiempo al final en lugar de al principio. Ambas convenciones se utilizan ampliamente en el campo de estudio. ^[34]

En la siguiente discusión, utilizamos la primera convención.

En general, puede asumir cualquier valor de número real. Si es positivo, el intervalo de espacio-tiempo se denomina similar al tiempo . Dado que la distancia espacial recorrida por cualquier objeto masivo es siempre menor que la distancia recorrida por la luz durante el mismo intervalo de tiempo, los intervalos positivos son siempre similares al tiempo. Si es negativo, se dice que el intervalo de espacio-tiempo es similar al espacio . Los intervalos de espacio-tiempo son iguales a cero cuando En otras palabras, el intervalo de espacio-tiempo entre dos eventos en la línea del universo de algo que se mueve a la velocidad de la luz es cero. Tal intervalo se denomina similar a la luz o nulo . Un fotón que llega a nuestro ojo desde una estrella distante no habrá envejecido, a pesar de haber pasado (desde nuestra perspectiva) años en su paso. ^[31]^{: 48–50} $s^{2}$ $s^{2}$ $s^{2}$ $x=\pm ct.$

Un diagrama de espacio-tiempo se dibuja típicamente con un solo espacio y una sola coordenada de tiempo. La Fig. 2-1 presenta un diagrama de espacio-tiempo que ilustra las líneas del mundo (es decir, las trayectorias en el espacio-tiempo) de dos fotones, A y B, que se originan del mismo evento y van en direcciones opuestas. Además, C ilustra la línea del mundo de un objeto más lento que la velocidad de la luz. La coordenada de tiempo vertical está escalada de modo que tenga las mismas unidades (metros) que la coordenada espacial horizontal. Dado que los fotones viajan a la velocidad de la luz, sus líneas del mundo tienen una pendiente de ±1. ^[31]^{: 23–25} En otras palabras, cada metro que un fotón viaja hacia la izquierda o la derecha requiere aproximadamente 3,3 nanosegundos de tiempo. $c$

Marcos de referencia

Para comprender mejor cómo se comparan entre sí las coordenadas del espacio-tiempo medidas por observadores en diferentes marcos de referencia , es útil trabajar con una configuración simplificada con marcos en una configuración estándar. Con cuidado, esto permite simplificar las matemáticas sin perder generalidad en las conclusiones a las que se llega. En la figura 2-2, se muestran dos marcos de referencia galileanos (es decir, marcos convencionales de 3 espacios) en movimiento relativo. El marco S pertenece a un primer observador O, y el marco S′ (pronunciado "S prima") pertenece a un segundo observador O′.

Los ejes x , y , z del marco S están orientados paralelos a los respectivos ejes primos del marco S′.
El marco S′ se mueve en la dirección x del marco S con una velocidad constante v medida en el marco S.
Los orígenes de los marcos S y S′ son coincidentes cuando el tiempo t = 0 para el marco S y t ′ = 0 para el marco S′. ^[6]^{: 107}

La figura 2-3a vuelve a dibujar la figura 2-2 con una orientación diferente. La figura 2-3b ilustra un diagrama de espacio-tiempo relativista desde el punto de vista del observador O. Puesto que S y S′ están en configuración estándar, sus orígenes coinciden en los tiempos t = 0 en el sistema de referencia S y t ′ = 0 en el sistema de referencia S′. El eje ct ′ pasa por los eventos en el sistema de referencia S′ que tienen x ′ = 0. Pero los puntos con x ′ = 0 se mueven en la dirección x del sistema de referencia S con velocidad v , de modo que no coinciden con el eje ct en ningún tiempo distinto de cero. Por lo tanto, el eje ct ′ está inclinado con respecto al eje ct en un ángulo θ dado por ^[31]^{: 23–31}

\tan(\theta )=v/c.

El eje x ′ también está inclinado con respecto al eje x . Para determinar el ángulo de esta inclinación, recordamos que la pendiente de la línea del universo de un pulso de luz es siempre ±1. La figura 2-3c presenta un diagrama de espacio-tiempo desde el punto de vista del observador O′. El evento P representa la emisión de un pulso de luz en x ′ = 0, ct ′ = − a . El pulso se refleja desde un espejo situado a una distancia a de la fuente de luz (evento Q), y regresa a la fuente de luz en x ′ = 0, ct ′ = a (evento R).

Los mismos eventos P, Q, R se representan en la Fig. 2-3b en el marco del observador O. Las trayectorias de la luz tienen pendientes = 1 y −1, de modo que △PQR forma un triángulo rectángulo con PQ y QR ambos a 45 grados con respecto a los ejes x y ct . Como OP = OQ = OR, el ángulo entre x ′ y x también debe ser θ . ^[6]^{: 113–118}

Mientras que el marco en reposo tiene ejes de espacio y tiempo que se encuentran en ángulos rectos, el marco en movimiento está dibujado con ejes que se encuentran en un ángulo agudo. Los marcos son en realidad equivalentes. ^[31]^{: 23–31} La asimetría se debe a distorsiones inevitables en cómo las coordenadas del espacio-tiempo pueden mapearse en un plano cartesiano , y no debe considerarse más extraña que la manera en que, en una proyección Mercator de la Tierra, los tamaños relativos de las masas de tierra cerca de los polos (Groenlandia y la Antártida) son altamente exagerados en relación con las masas de tierra cerca del Ecuador.

Cono de luz

En la figura 2-4, el evento O está en el origen de un diagrama de espacio-tiempo, y las dos líneas diagonales representan todos los eventos que tienen un intervalo de espacio-tiempo cero con respecto al evento de origen. Estas dos líneas forman lo que se llama el cono de luz del evento O, ya que al agregar una segunda dimensión espacial (figura 2-5) se crea la apariencia de dos conos circulares rectos que se encuentran con sus vértices en O. Un cono se extiende hacia el futuro (t>0), el otro hacia el pasado (t<0).

Un cono de luz (doble) divide el espacio-tiempo en regiones separadas con respecto a su vértice. El interior del cono de luz futuro consta de todos los eventos que están separados del vértice por más tiempo (distancia temporal) del necesario para cruzar su distancia espacial a la velocidad de la luz; estos eventos comprenden el futuro temporal del evento O. Del mismo modo, el pasado temporal comprende los eventos interiores del cono de luz pasado. Por lo tanto, en intervalos temporales Δ ct es mayor que Δ x , lo que hace que los intervalos temporales sean positivos. ^[3]^{: 220}

La región exterior al cono de luz consiste en eventos que están separados del evento O por más espacio del que se puede cruzar a la velocidad de la luz en el tiempo dado . Estos eventos comprenden la llamada región espacial del evento O, denotada como "En otro lugar" en la Fig. 2-4. Se dice que los eventos en el propio cono de luz son similares a la luz (o separados nulamente ) de O. Debido a la invariancia del intervalo espacio-temporal, todos los observadores asignarán el mismo cono de luz a cualquier evento dado y, por lo tanto, estarán de acuerdo con esta división del espacio-tiempo. ^[3]^{: 220}

El cono de luz tiene un papel esencial dentro del concepto de causalidad . Es posible que una señal que no viaja más rápido que la velocidad de la luz viaje desde la posición y el tiempo de O a la posición y el tiempo de D (Fig. 2-4). Por lo tanto, es posible que el evento O tenga una influencia causal en el evento D. El cono de luz futuro contiene todos los eventos que podrían ser influenciados causalmente por O. Del mismo modo, es posible que una señal que no viaja más rápido que la velocidad de la luz viaje desde la posición y el tiempo de A, a la posición y el tiempo de O. El cono de luz pasado contiene todos los eventos que podrían tener una influencia causal en O. En contraste, suponiendo que las señales no pueden viajar más rápido que la velocidad de la luz, cualquier evento, como por ejemplo B o C, en la región espacial (Elsewhere), no puede afectar al evento O, ni puede ser afectado por el evento O que emplee dicha señalización. Bajo este supuesto, se excluye cualquier relación causal entre el evento O y cualquier evento en la región espacial de un cono de luz. ^[35]

Relatividad de la simultaneidad

Todos los observadores estarán de acuerdo en que, para cualquier evento dado, un evento dentro del cono de luz futuro del evento dado ocurre después del evento dado. De la misma manera, para cualquier evento dado, un evento dentro del cono de luz pasado del evento dado ocurre antes del evento dado. La relación antes-después observada para eventos separados en el tiempo permanece invariable sin importar cuál sea el marco de referencia del observador, es decir, sin importar cómo se esté moviendo el observador. La situación es bastante diferente para eventos separados en el espacio. La figura 2-4 se dibujó a partir del marco de referencia de un observador que se mueve en v = 0. A partir de este marco de referencia, se observa que el evento C ocurre después del evento O, y se observa que el evento B ocurre antes del evento O. ^[36]

Desde un marco de referencia diferente, el orden de estos eventos no relacionados causalmente puede invertirse. En particular, se observa que si dos eventos son simultáneos en un marco de referencia particular, están necesariamente separados por un intervalo espacial y, por lo tanto, están relacionados de manera no causal. La observación de que la simultaneidad no es absoluta, sino que depende del marco de referencia del observador, se denomina relatividad de la simultaneidad . ^[36]

La figura 2-6 ilustra el uso de diagramas de espacio-tiempo en el análisis de la relatividad de la simultaneidad. Los eventos en el espacio-tiempo son invariantes, pero los marcos de coordenadas se transforman como se discutió anteriormente para la figura 2-3. Los tres eventos (A, B, C) son simultáneos desde el marco de referencia de un observador que se mueve en v = 0. Desde el marco de referencia de un observador que se mueve en v = 0.3 c , los eventos parecen ocurrir en el orden C, B, A. Desde el marco de referencia de un observador que se mueve en v = −0.5 c , los eventos parecen ocurrir en el orden A, B, C . La línea blanca representa un plano de simultaneidad que se mueve desde el pasado del observador al futuro del observador, resaltando los eventos que residen en él. El área gris es el cono de luz del observador, que permanece invariante.

Un intervalo de espacio-tiempo similar al espacio da la misma distancia que un observador mediría si los eventos que se están midiendo fueran simultáneos para el observador. Un intervalo de espacio-tiempo similar al espacio proporciona, por lo tanto, una medida de la distancia propia , es decir, la distancia verdadera = Del mismo modo, un intervalo de espacio-tiempo similar al tiempo da la misma medida del tiempo que se presentaría por el tictac acumulativo de un reloj que se mueve a lo largo de una línea de universo dada. Un intervalo de espacio-tiempo similar al tiempo proporciona, por lo tanto, una medida del tiempo propio = ^[3]^{: 220–221} ${\sqrt {-s^{2}}}.$ ${\sqrt {s^{2}}}.$

Hipérbola invariante

En el espacio euclidiano (que tiene solo dimensiones espaciales), el conjunto de puntos equidistantes (usando la métrica euclidiana) de algún punto forman un círculo (en dos dimensiones) o una esfera (en tres dimensiones). En el espacio-tiempo de Minkowski (1+1)-dimensional (que tiene una dimensión temporal y una espacial), los puntos a un intervalo de espacio-tiempo constante alejados del origen (usando la métrica de Minkowski) forman curvas dadas por las dos ecuaciones

(ct)^{2}-x^{2}=\pm s^{2},

con alguna constante real positiva. Estas ecuaciones describen dos familias de hipérbolas en un diagrama de espacio-tiempo x – ct , que se denominan hipérbolas invariantes . $s^{2}$

En la figura 2-7a, cada hipérbola magenta conecta todos los eventos que tienen una separación espacial fija desde el origen, mientras que las hipérbolas verdes conectan eventos con una separación temporal igual.

Las hipérbolas magenta, que cruzan el eje x , son curvas temporales, es decir, representan trayectorias reales que pueden recorrer partículas (constantemente aceleradas) en el espacio-tiempo: Entre dos eventos cualesquiera en una hipérbola es posible una relación de causalidad, porque la inversa de la pendiente (que representa la velocidad necesaria) para todas las secantes es menor que . Por otro lado, las hipérbolas verdes, que cruzan el eje ct , son curvas espaciales porque todos los intervalos a lo largo de estas hipérbolas son intervalos espaciales: No es posible ninguna causalidad entre dos puntos cualesquiera en una de estas hipérbolas, porque todas las secantes representan velocidades mayores que . $c$ $c$

La figura 2-7b refleja la situación en el espacio-tiempo de Minkowski (1+2)-dimensional (una temporal y dos espaciales) con los hiperboloides correspondientes. Las hipérbolas invariantes desplazadas por intervalos espaciales desde el origen generan hiperboloides de una hoja, mientras que las hipérbolas invariantes desplazadas por intervalos temporales desde el origen generan hiperboloides de dos hojas.

El límite (1+2)-dimensional entre hiperboloides espaciales y temporales, establecido por los eventos que forman un intervalo de espacio-tiempo cero hasta el origen, se forma degenerando los hiperboloides hasta el cono de luz. En (1+1)-dimensionales las hipérbolas degeneran hasta las dos líneas grises de 45° representadas en la Fig. 2-7a.

Dilatación del tiempo y contracción de la longitud

La figura 2-8 ilustra la hipérbola invariante para todos los eventos a los que se puede llegar desde el origen en un tiempo propio de 5 metros (aproximadamente1,67 × 10 ⁻⁸ s ). Diferentes líneas del universo representan relojes que se mueven a diferentes velocidades. Un reloj que está estacionario con respecto al observador tiene una línea del universo que es vertical, y el tiempo transcurrido medido por el observador es el mismo que el tiempo propio. Para un reloj que se mueve a 0,3 c , el tiempo transcurrido medido por el observador es de 5,24 metros (1,75 × 10 ⁻⁸ s ), mientras que para un reloj que viaja a 0,7 c , el tiempo transcurrido medido por el observador es de 7,00 metros (2,34 × 10 ⁻⁸ s ). ^[3]^{: 220–221}

Esto ilustra el fenómeno conocido como dilatación del tiempo . Los relojes que viajan más rápido tardan más (en el marco del observador) en marcar la misma cantidad de tiempo propio, y viajan más lejos a lo largo del eje x dentro de ese tiempo propio de lo que lo hubieran hecho sin la dilatación del tiempo. ^[3]^{: 220–221} La medición de la dilatación del tiempo por dos observadores en diferentes marcos de referencia inerciales es mutua. Si el observador O mide los relojes del observador O′ como si fueran más lentos en su marco, el observador O′ a su vez medirá los relojes del observador O como si fueran más lentos.

La contracción de la longitud , al igual que la dilatación del tiempo, es una manifestación de la relatividad de la simultaneidad. La medición de la longitud requiere la medición del intervalo espacio-temporal entre dos eventos que son simultáneos en nuestro marco de referencia. Pero los eventos que son simultáneos en un marco de referencia, en general, no lo son en otros marcos de referencia.

La figura 2-9 ilustra los movimientos de una varilla de 1 m que se desplaza a 0,5 c a lo largo del eje x . Los bordes de la banda azul representan las líneas de universo de los dos puntos finales de la varilla. La hipérbola invariante ilustra eventos separados del origen por un intervalo espacial de 1 m. Los puntos finales O y B medidos cuando t ′ = 0 son eventos simultáneos en el marco S′. Pero para un observador en el marco S, los eventos O y B no son simultáneos. Para medir la longitud, el observador en el marco S mide los puntos finales de la varilla tal como se proyectan sobre el eje x a lo largo de sus líneas de universo. La proyección de la lámina de universo de la varilla sobre el eje x produce la longitud escorzada OC. ^[6]^{: 125}

(no ilustrado) Trazar una línea vertical a través de A de modo que intersecte el eje x ′ demuestra que, así como OB está acortado desde el punto de vista del observador O, OA también está acortado desde el punto de vista del observador O′. De la misma manera que cada observador mide los relojes del otro como si estuvieran atrasados, cada observador mide las reglas del otro como si estuvieran contraídas.

Con respecto a la contracción mutua de longitud, la figura 2-9 ilustra que los marcos primados y no primados se rotan mutuamente en un ángulo hiperbólico (análogo a los ángulos ordinarios en la geometría euclidiana). ^{[nota 8]} Debido a esta rotación, la proyección de una regla métrica primada sobre el eje x no primado se acorta, mientras que la proyección de una regla métrica no primada sobre el eje x′ primado también se acorta.

La dilatación mutua del tiempo y la paradoja de los gemelos

Dilatación mutua del tiempo

La dilatación mutua del tiempo y la contracción de la longitud tienden a parecer a los principiantes conceptos inherentemente contradictorios. Si un observador en el marco S mide un reloj, en reposo en el marco S', como si funcionara más lento que el suyo, mientras que S' se mueve a una velocidad v en S, entonces el principio de relatividad requiere que un observador en el marco S' mida de la misma manera un reloj en el marco S, que se mueve a una velocidad − v en S', como si funcionara más lento que el suyo. Cómo pueden funcionar dos relojes más lentos que el otro es una pregunta importante que "va al corazón de la comprensión de la relatividad especial". ^[3]^{: 198}

Esta aparente contradicción se debe a que no se han tenido en cuenta correctamente las diferentes configuraciones de las mediciones necesarias relacionadas. Estas configuraciones permiten una explicación coherente de la única contradicción aparente . No se trata del tictac abstracto de dos relojes idénticos, sino de cómo medir en un marco la distancia temporal de dos tictacs de un reloj en movimiento. Resulta que para observar mutuamente la duración entre tictacs de relojes, cada uno en movimiento en el marco respectivo, deben participar diferentes conjuntos de relojes. Para medir en el marco S la duración del tictac de un reloj en movimiento W′ (en reposo en S′), se utilizan dos relojes adicionales sincronizados W ₁ y W ₂ en reposo en dos puntos arbitrariamente fijos en S con la distancia espacial d .

Dos eventos pueden definirse por la condición "dos relojes están simultáneamente en un lugar", es decir, cuando W′ pasa cada uno por W ₁ y W ₂ . Para ambos eventos se registran las dos lecturas de los relojes colocados. La diferencia de las dos lecturas de W ₁ y W ₂ es la distancia temporal de los dos eventos en S, y su distancia espacial es d . La diferencia de las dos lecturas de W′ es la distancia temporal de los dos eventos en S′. En S′ estos eventos solo están separados en el tiempo, ocurren en el mismo lugar en S′. Debido a la invariancia del intervalo espacio-temporal abarcado por estos dos eventos, y la separación espacial d no nula en S, la distancia temporal en S′ debe ser menor que la de S: la distancia temporal menor entre los dos eventos, resultante de las lecturas del reloj en movimiento W′, pertenece al reloj de funcionamiento más lento W′.

Por el contrario, para juzgar en el marco S′ la distancia temporal de dos eventos en un reloj en movimiento W (en reposo en S), se necesitan dos relojes en reposo en S′.

En esta comparación, el reloj W se mueve con una velocidad de − v . Al registrar nuevamente las cuatro lecturas de los eventos, definidos por "dos relojes simultáneamente en un lugar", se obtienen las distancias temporales análogas de los dos eventos, ahora separados temporal y espacialmente en S′, y solo separados temporalmente pero ubicados en el mismo lugar en S. Para mantener invariable el intervalo espacio-temporal, la distancia temporal en S debe ser menor que en S′, debido a la separación espacial de los eventos en S′: ahora se observa que el reloj W corre más lento.

Los registros necesarios para los dos juicios, con "un reloj en movimiento" y "dos relojes en reposo" en S o S′ respectivamente, implican dos conjuntos diferentes, cada uno con tres relojes. Dado que hay diferentes conjuntos de relojes involucrados en las mediciones, no hay una necesidad inherente de que las mediciones sean recíprocamente "consistentes" de modo que, si un observador mide el reloj en movimiento como lento, el otro observador mide el reloj del primero como rápido. ^[3]^{: 198–199}

Figura 2-10. Dilatación temporal mutua

La figura 2-10 ilustra la discusión previa de la dilatación mutua del tiempo con diagramas de Minkowski. La imagen superior refleja las mediciones como se ven desde el marco S "en reposo" con ejes rectangulares sin primar, y el marco S′ "moviéndose con v > 0", coordinado por ejes oblicuos con primar, inclinados hacia la derecha; la imagen inferior muestra el marco S′ "en reposo" con coordenadas rectangulares con primar, y el marco S "moviéndose con − v < 0", con ejes oblicuos sin primar, inclinados hacia la izquierda.

Cada línea trazada paralela a un eje espacial ( x , x ′ ) representa una línea de simultaneidad. Todos los eventos en dicha línea tienen el mismo valor temporal ( ct , ct ′ ). Del mismo modo, cada línea trazada paralela a un eje temporal ( ct , ct′ ) representa una línea de valores de coordenadas espaciales iguales ( x , x ′ ).

En ambas imágenes se puede designar el origen O (= O ′ ) como el evento, donde el respectivo "reloj en movimiento" se coloca junto con el "primer reloj en reposo" en ambas comparaciones. Obviamente, para este evento las lecturas en ambos relojes en ambas comparaciones son cero. Como consecuencia, las líneas de mundo de los relojes en movimiento son el eje ct ′ inclinado hacia la derecha (imágenes superiores, reloj W′) y los ejes ct inclinados hacia la izquierda (imágenes inferiores, reloj W). Las líneas de mundo de W ₁ y W′ ₁ son los ejes de tiempo verticales correspondientes ( ct en las imágenes superiores y ct ′ en las imágenes inferiores).

En la imagen superior, el lugar para W ₂ se toma como A _x > 0 y, por lo tanto, la línea de mundo (no se muestra en las imágenes) de este reloj intersecta la línea de mundo del reloj en movimiento (el eje ct ′) en el evento etiquetado A , donde "dos relojes están simultáneamente en un lugar". En la imagen inferior, el lugar para W′ ₂ se toma como C _{x ′} < 0 y, por lo tanto, en esta medición, el reloj en movimiento W pasa por W′ ₂ en el evento C .

En la imagen superior, la coordenada ct A _t del evento A (la lectura de W ₂ ) está etiquetada como B , dando así el tiempo transcurrido entre los dos eventos, medidos con W ₁ y W ₂ , como OB . Para una comparación, la longitud del intervalo de tiempo OA , medido con W′, debe transformarse a la escala del eje ct . Esto se hace mediante la hipérbola invariante (ver también la Fig. 2-8) a través de A , conectando todos los eventos con el mismo intervalo de espacio-tiempo desde el origen como A . Esto produce el evento C en el eje ct y, obviamente: OC < OB , el reloj "en movimiento" W′ corre más lento.

Para mostrar la dilatación mutua del tiempo inmediatamente en la imagen superior, el evento D puede construirse como el evento en x ′ = 0 (la ubicación del reloj W′ en S′), que es simultáneo a C ( OC tiene el mismo intervalo de espacio-tiempo que OA ) en S′. Esto muestra que el intervalo de tiempo OD es más largo que OA , lo que demuestra que el reloj "en movimiento" corre más lento. ^[6]^{: 124}

En la imagen inferior, el sistema S se mueve con velocidad − v en el sistema S′ en reposo. La línea de mundo del reloj W es el eje ct (inclinado hacia la izquierda), la línea de mundo de W′ ₁ es el eje vertical ct ′ y la línea de mundo de W′ ₂ es la vertical que pasa por el evento C , con la coordenada ct ′ D. La hipérbola invariante que pasa por el evento C escala el intervalo de tiempo OC a OA , que es más corto que OD ; además, B se construye (similar a D en las imágenes superiores) como simultáneo a A en S, en x = 0. El resultado OB > OC corresponde nuevamente al anterior.

La palabra "medida" es importante. En física clásica, un observador no puede afectar a un objeto observado, pero el estado de movimiento del objeto puede afectar las observaciones que el observador hace del objeto.

Paradoja de los gemelos

Muchas introducciones a la relatividad especial ilustran las diferencias entre la relatividad galileana y la relatividad especial planteando una serie de "paradojas". Estas paradojas son, de hecho, problemas mal planteados, resultado de nuestra falta de familiaridad con velocidades comparables a la velocidad de la luz. La solución es resolver muchos problemas de la relatividad especial y familiarizarse con sus llamadas predicciones contraintuitivas. El enfoque geométrico para estudiar el espacio-tiempo se considera uno de los mejores métodos para desarrollar una intuición moderna. ^[37]

La paradoja de los gemelos es un experimento mental que involucra a gemelos idénticos, uno de los cuales hace un viaje al espacio en un cohete de alta velocidad, regresa a casa y descubre que el gemelo que permaneció en la Tierra ha envejecido más. Este resultado parece desconcertante porque cada gemelo observa al otro gemelo moverse, y por lo tanto, a primera vista, parecería que cada uno debería encontrar que el otro ha envejecido menos. La paradoja de los gemelos elude la justificación de la dilatación mutua del tiempo presentada anteriormente al evitar el requisito de un tercer reloj. ^[3]^{: 207} Sin embargo, la paradoja de los gemelos no es una verdadera paradoja porque se entiende fácilmente dentro del contexto de la relatividad especial.

La impresión de que existe una paradoja surge de una mala interpretación de lo que afirma la relatividad especial. La relatividad especial no declara que todos los marcos de referencia sean equivalentes, sino sólo los marcos inerciales. El marco de la gemela viajera no es inercial durante los períodos en que está acelerando. Además, la diferencia entre las gemelas es detectable observacionalmente: la gemela viajera necesita encender sus cohetes para poder regresar a casa, mientras que la gemela que se queda en casa no. ^[38]^{[nota 9]}

Estas distinciones deberían dar como resultado una diferencia en las edades de los gemelos. El diagrama de espacio-tiempo de la figura 2-11 presenta el caso simple de un gemelo que sale en línea recta a lo largo del eje x y regresa inmediatamente. Desde el punto de vista del gemelo que se queda en casa, no hay nada desconcertante en la paradoja de los gemelos en absoluto. El tiempo propio medido a lo largo de la línea del mundo del gemelo viajero de O a C, más el tiempo propio medido de C a B, es menor que el tiempo propio del gemelo que se queda en casa medido de O a A a B. Las trayectorias más complejas requieren integrar el tiempo propio entre los respectivos eventos a lo largo de la curva (es decir, la integral de trayectoria ) para calcular la cantidad total de tiempo propio experimentado por el gemelo viajero. ^[38]

Surgen complicaciones si se analiza la paradoja de los gemelos desde el punto de vista del gemelo viajero.

De ahora en adelante se utilizará la nomenclatura de Weiss, que designa al gemelo que se queda en casa como Terence y a la gemela que viaja como Stella. ^[38]

Stella no está en un marco inercial. Dado este hecho, a veces se afirma incorrectamente que la resolución completa de la paradoja de los gemelos requiere la relatividad general: ^[38]

Un análisis SR puro sería el siguiente: Analizado en el marco de reposo de Stella, ella está inmóvil durante todo el viaje. Cuando dispara sus cohetes para el cambio de dirección, experimenta una pseudofuerza que se asemeja a una fuerza gravitacional. ^[38] Las figuras 2-6 y 2-11 ilustran el concepto de líneas (planos) de simultaneidad: las líneas paralelas al eje x del observador (plano xy ) representan conjuntos de eventos que son simultáneos en el marco del observador. En la figura 2-11, las líneas azules conectan eventos en la línea del mundo de Terence que, desde el punto de vista de Stella , son simultáneos con eventos en su línea del mundo. (Terence, a su vez, observaría un conjunto de líneas horizontales de simultaneidad). A lo largo de los tramos de ida y vuelta del viaje de Stella, ella mide los relojes de Terence como si fueran más lentos que el suyo. Pero durante el giro (es decir, entre las líneas azules en negrita de la figura), se produce un cambio en el ángulo de sus líneas de simultaneidad, que corresponde a un rápido salto de los acontecimientos en la línea del mundo de Terence que Stella considera simultáneos con el suyo. Por lo tanto, al final de su viaje, Stella descubre que Terence ha envejecido más que ella. ^[38]

Aunque no se requiere la relatividad general para analizar la paradoja de los gemelos, la aplicación del principio de equivalencia de la relatividad general sí proporciona una visión adicional del tema. Stella no está estacionaria en un marco inercial. Analizada en el marco de reposo de Stella, está inmóvil durante todo el viaje. Cuando se desplaza por inercia, su marco de reposo es inercial, y el reloj de Terence parecerá ir más lento. Pero cuando dispara sus cohetes para dar la vuelta, su marco de reposo es un marco acelerado y experimenta una fuerza que la empuja como si estuviera en un campo gravitatorio. Terence parecerá estar muy arriba en ese campo y, debido a la dilatación del tiempo gravitacional , su reloj parecerá ir más rápido, tanto que el resultado neto será que Terence ha envejecido más que Stella cuando vuelvan a estar juntos. ^[38] Los argumentos teóricos que predicen la dilatación del tiempo gravitacional no son exclusivos de la relatividad general. Cualquier teoría de la gravedad predecirá la dilatación del tiempo gravitacional si respeta el principio de equivalencia, incluida la teoría de Newton. ^[3]^{: 16}

Gravitación

Esta sección introductoria se ha centrado en el espacio-tiempo de la relatividad especial, ya que es el más fácil de describir. El espacio-tiempo de Minkowski es plano, no tiene en cuenta la gravedad, es uniforme en todas sus partes y no sirve más que como un fondo estático para los eventos que tienen lugar en él. La presencia de la gravedad complica enormemente la descripción del espacio-tiempo. En la relatividad general, el espacio-tiempo ya no es un fondo estático, sino que interactúa activamente con los sistemas físicos que contiene. El espacio-tiempo se curva en presencia de materia, puede propagar ondas, doblar la luz y exhibe una serie de otros fenómenos. ^[3]^{: 221} Algunos de estos fenómenos se describen en las secciones posteriores de este artículo.

Matemáticas básicas del espacio-tiempo

Transformaciones galileanas

Un objetivo básico es poder comparar las mediciones realizadas por observadores en movimiento relativo. Si hay un observador O en el sistema S que ha medido las coordenadas de tiempo y espacio de un evento, asignando a este evento tres coordenadas cartesianas y el tiempo medido en su red de relojes sincronizados ( x , y , z , t ) (ver Fig. 1-1). Un segundo observador O′ en un sistema diferente S′ mide el mismo evento en su sistema de coordenadas y su red de relojes sincronizados ( x ′ , y ′ , z ′ , t ′ ) . Con sistemas inerciales, ninguno de los observadores está bajo aceleración, y un conjunto simple de ecuaciones nos permite relacionar las coordenadas ( x , y , z , t ) con ( x ′ , y ′ , z ′ , t ′ ) . Dado que los dos sistemas de coordenadas están en configuración estándar, es decir, están alineados con coordenadas paralelas ( x , y , z ) y que t = 0 cuando t ′ = 0 , la transformación de coordenadas es la siguiente: ^[39]^[40]

x'=x-vt

y'=y

z'=z

t'=t.

La figura 3-1 ilustra que en la teoría de Newton, el tiempo es universal, no la velocidad de la luz. ^[41]^{: 36–37} Considere el siguiente experimento mental: La flecha roja ilustra un tren que se mueve a 0,4 c con respecto a la plataforma. Dentro del tren, un pasajero dispara una bala con una velocidad de 0,4 c en el marco del tren. La flecha azul ilustra que una persona parada en las vías del tren mide la bala como viajando a 0,8 c. Esto está de acuerdo con nuestras expectativas ingenuas.

En términos más generales, suponiendo que el marco S′ se mueve a una velocidad v con respecto al marco S, entonces, dentro del marco S′, el observador O′ mide un objeto que se mueve con velocidad u ′ . La velocidad u con respecto al marco S, dado que x = ut , x ′ = x − vt y t = t ′ , se puede escribir como x ′ = ut − vt = ( u − v ) t = ( u − v ) t ′ . Esto conduce a u ′ = x ′ / t ′ y, en última instancia,

u'=u-v

u=u'+v,

que es la ley galileana de sentido común para la suma de velocidades .

Composición relativista de velocidades

La composición de las velocidades es bastante diferente en el espacio-tiempo relativista. Para reducir ligeramente la complejidad de las ecuaciones, introducimos una abreviatura común para la relación entre la velocidad de un objeto y la de la luz,

\beta =v/c

La figura 3-2a ilustra un tren rojo que avanza a una velocidad dada por v / c = β = s / a . Desde el marco preparado del tren, un pasajero dispara una bala con una velocidad dada por u ′ / c = β ′ = n / m , donde la distancia se mide a lo largo de una línea paralela al eje x ′ rojo en lugar de paralela al eje x negro . ¿Cuál es la velocidad compuesta u de la bala con respecto a la plataforma, como se representa mediante la flecha azul? Con referencia a la figura 3-2b:

Desde la plataforma, la velocidad compuesta de la bala viene dada por u = c ( s + r )/( a + b ) .
Los dos triángulos amarillos son semejantes porque son triángulos rectángulos que comparten un ángulo común α . En el triángulo amarillo grande, la razón s / a = v / c = β .
Las razones de los lados correspondientes de los dos triángulos amarillos son constantes, de modo que r / a = b / s = n / m = β ′ . Por lo tanto, b = u ′ s / c y r = u ′ a / c .
Sustituya las expresiones para b y r en la expresión para u en el paso 1 para obtener la fórmula de Einstein para la suma de velocidades: ^[41]^{: 42–48}
$u={v+u' \over 1+(vu'/c^{2})}.$

La fórmula relativista para la suma de velocidades presentada anteriormente presenta varias características importantes:

Si u ′ y v son muy pequeñas comparadas con la velocidad de la luz, entonces el producto vu ′ / c ² se vuelve extremadamente pequeño y el resultado general se vuelve indistinguible de la fórmula galileana (fórmula de Newton) para la adición de velocidades: u = u ′ + v . La fórmula galileana es un caso especial de la fórmula relativista aplicable a bajas velocidades.
Si u ′ se establece igual a c , entonces la fórmula arroja u = c independientemente del valor inicial de v . La velocidad de la luz es la misma para todos los observadores independientemente de sus movimientos relativos a la fuente emisora. ^[41]^{: 49}

La dilatación del tiempo y la contracción de la longitud revisitadas

Es fácil obtener expresiones cuantitativas para la dilatación del tiempo y la contracción de la longitud. La figura 3-3 es una imagen compuesta que contiene fotogramas individuales tomados de dos animaciones anteriores, simplificadas y reetiquetadas para los fines de esta sección.

Para reducir ligeramente la complejidad de las ecuaciones, existen distintas notaciones abreviadas para ct :

\mathrm {T} =ct

y son comunes.

w=ct

También se ve muy frecuentemente el uso de la convención

c=1.

En la figura 3-3a, los segmentos OA y OK representan intervalos de espacio-tiempo iguales. La dilatación del tiempo está representada por la relación OB / OK . La hipérbola invariante tiene la ecuación $w = \sqrt x 2 + k 2$ donde k = OK , y la línea roja que representa la línea del universo de una partícula en movimiento tiene la ecuación w = x / β = xc / v . Un poco de manipulación algebraica da como resultado ${\textstyle OB=OK/{\sqrt {1-v^{2}/c^{2}}}.}$

La expresión que implica el símbolo de la raíz cuadrada aparece muy frecuentemente en relatividad, y una expresión adicional se llama factor de Lorentz, denotado por la letra griega gamma : ^[42] $\gamma$

\gamma ={\frac {1}{\sqrt {1-v^{2}/c^{2}}}}={\frac {1}{\sqrt {1-\beta ^{2}}}}

Si v es mayor o igual que c , la expresión para pierde todo significado físico, lo que implica que c es la velocidad máxima posible en la naturaleza. Para cualquier v mayor que cero, el factor de Lorentz será mayor que uno, aunque la forma de la curva es tal que para velocidades bajas, el factor de Lorentz es extremadamente cercano a uno. $\gamma$

En la Fig. 3-3b, los segmentos OA y OK representan intervalos de espacio-tiempo iguales. La contracción de longitud está representada por la razón OB / OK . La hipérbola invariante tiene la ecuación $x = \sqrt w 2 + k 2$ , donde k = OK , y los bordes de la banda azul que representan las líneas del universo de los puntos finales de una varilla en movimiento tienen pendiente 1/ β = c / v . El evento A tiene coordenadas ( x , w ) = ( γk , γβk ). Dado que la línea tangente a través de A y B tiene la ecuación w = ( x − OB )/ β , tenemos γβk = ( γk − OB )/ β y

OB/OK=\gamma (1-\beta ^{2})={\frac {1}{\gamma }}

Transformaciones de Lorentz

Las transformaciones de Galileo y la consiguiente ley de sentido común de la suma de velocidades funcionan bien en nuestro mundo ordinario de baja velocidad de aviones, automóviles y pelotas. Sin embargo, a partir de mediados del siglo XIX, la instrumentación científica sensible comenzó a detectar anomalías que no encajaban bien con la suma ordinaria de velocidades.

Las transformaciones de Lorentz se utilizan para transformar las coordenadas de un evento de un marco a otro en relatividad especial.

El factor de Lorentz aparece en las transformaciones de Lorentz:

{\begin{aligned}t'&=\gamma \left(t-{\frac {vx}{c^{2}}}\right)\\x'&=\gamma \left(x-vt\right)\\y'&=y\\z'&=z\end{aligned}}

Las transformaciones inversas de Lorentz son:

{\begin{aligned}t&=\gamma \left(t'+{\frac {vx'}{c^{2}}}\right)\\x&=\gamma \left(x'+vt'\right)\\y&=y'\\z&=z'\end{aligned}}

Cuando v ≪ c y x es suficientemente pequeño, los términos v ² / c ² y vx / c ² se acercan a cero, y las transformaciones de Lorentz se aproximan a las transformaciones galileanas.

$t'=\gamma (t-vx/c^{2}),$ $x'=\gamma (x-vt)$ etc., la mayoría de las veces realmente significan etc. Aunque para abreviar las ecuaciones de transformación de Lorentz se escriben sin deltas, x significa Δ x , etc. En general, siempre nos preocupan las diferencias de espacio y tiempo entre eventos. $\Delta t'=\gamma (\Delta t-v\Delta x/c^{2}),$ $\Delta x'=\gamma (\Delta x-v\Delta t)$

Llamar a un conjunto de transformaciones transformaciones normales de Lorentz y al otro transformaciones inversas es engañoso, ya que no hay diferencia intrínseca entre los sistemas de referencia. Diferentes autores llaman a uno u otro conjunto de transformaciones el conjunto "inverso". Las transformaciones hacia delante y hacia atrás están trivialmente relacionadas entre sí, ya que el sistema de referencia S solo puede moverse hacia delante o hacia atrás con respecto a S ′ . Por lo tanto, invertir las ecuaciones simplemente implica intercambiar las variables primadas y no primadas y reemplazar v por − v . ^[43]^{: 71–79}

Ejemplo: Terence y Stella participan en una carrera espacial de la Tierra a Marte. Terence es un oficial en la línea de partida, mientras que Stella es una participante. En el momento $t = t' = 0$ , la nave espacial de Stella acelera instantáneamente a una velocidad de 0,5 c . La distancia de la Tierra a Marte es de 300 segundos luz (aproximadamente90,0 × 10 ⁶ km ). Terence observa a Stella cruzando el reloj de la línea de meta en $t = 600,00 s$ . Pero Stella observa que el tiempo en el cronómetro de su barco es ⁠ ⁠ $t^{\prime }=\gamma \left(t-vx/c^{2}\right)=519.62\ {\text{s}}$ cuando pasa la línea de meta, y calcula que la distancia entre las líneas de salida y llegada, medida en su marco, es de 259,81 segundos luz (aproximadamente77,9 × 10 ⁶ kilómetros ). 1).

Derivación de las transformaciones de Lorentz

Ha habido muchas docenas de derivaciones de las transformaciones de Lorentz desde el trabajo original de Einstein en 1905, cada una con su enfoque particular. Aunque la derivación de Einstein se basó en la invariancia de la velocidad de la luz, hay otros principios físicos que pueden servir como puntos de partida. En última instancia, estos puntos de partida alternativos pueden considerarse diferentes expresiones del principio subyacente de localidad , que establece que la influencia que una partícula ejerce sobre otra no puede transmitirse instantáneamente. ^[44]

La derivación dada aquí e ilustrada en la Fig. 3-5 se basa en una presentada por Bais ^[41]^{: 64–66} y hace uso de resultados previos de las secciones Composición relativista de velocidades, Dilatación del tiempo y Contracción de longitud. El evento P tiene coordenadas ( w , x ) en el "sistema de reposo" negro y coordenadas $(w', x')$ en el marco rojo que se mueve con el parámetro de velocidad $β = v / c$ . Para determinar w ′ y x ′ en términos de w y x (o al revés) es más fácil al principio derivar la transformación inversa de Lorentz.

No puede haber expansión/contracción de longitud en las direcciones transversales. y ' debe ser igual a y y z ′ debe ser igual a z , de lo contrario, si una pelota de 1 m que se mueve rápidamente podría pasar por un agujero circular de 1 m dependería del observador. El primer postulado de la relatividad establece que todos los marcos inerciales son equivalentes, y la expansión/contracción transversal violaría esta ley. ^[43]^{: 27–28}
Del dibujo, w = a + b y $x = r + s$
De resultados anteriores usando triángulos similares, sabemos que $s / a = b / r = v / c = β$ .
Debido a la dilatación del tiempo, $a = γw'$
Sustituyendo la ecuación (4) en $s / a = β$ se obtiene $s = γw' β$ .
La contracción de longitud y los triángulos similares nos dan $r = γx'$ y $b = βr = βγx'$
Sustituyendo las expresiones para s , a , r y b en las ecuaciones del Paso 2 obtenemos inmediatamente
$w=\gamma w'+\beta \gamma x'$
$x=\gamma x'+\beta \gamma w'$

Las ecuaciones anteriores son expresiones alternativas para las ecuaciones t y x de la transformación inversa de Lorentz, como se puede ver al sustituir ct por w , ct ′ por w ′ y v / c por β . A partir de la transformación inversa, las ecuaciones de la transformación hacia adelante se pueden derivar al resolver para t ′ y x ′ .

Linealidad de las transformaciones de Lorentz

Las transformaciones de Lorentz tienen una propiedad matemática llamada linealidad, ya que x ′ y t ′ se obtienen como combinaciones lineales de x y t , sin potencias superiores involucradas. La linealidad de la transformación refleja una propiedad fundamental del espacio-tiempo que se asumió tácitamente en la derivación, a saber, que las propiedades de los marcos de referencia inerciales son independientes de la ubicación y el tiempo. En ausencia de gravedad, el espacio-tiempo parece el mismo en todas partes. ^[41]^{: 67} Todos los observadores inerciales estarán de acuerdo en lo que constituye movimiento acelerado y no acelerado. ^[43]^{: 72–73} Cualquier observador puede usar sus propias mediciones de espacio y tiempo, pero no hay nada absoluto en ellas. Las convenciones de otro observador funcionarán igual de bien. ^[3]^{: 190}

Un resultado de la linealidad es que si se aplican secuencialmente dos transformaciones de Lorentz, el resultado también es una transformación de Lorentz.

Ejemplo: Terence observa a Stella alejándose de él a una velocidad de 0,500 c y puede usar las transformaciones de Lorentz con $β = 0,500$ para relacionar las mediciones de Stella con las suyas. Stella, en su marco, observa a Ursula alejándose de él a una velocidad de 0,250 c y puede usar las transformaciones de Lorentz con $β = 0,250$ para relacionar las mediciones de Ursula con las suyas. Debido a la linealidad de las transformaciones y a la composición relativista de las velocidades, Terence puede usar las transformaciones de Lorentz con $β = 0,666$ para relacionar las mediciones de Ursula con las suyas.

Efecto Doppler

El efecto Doppler es el cambio de frecuencia o longitud de onda de una onda para un receptor y una fuente en movimiento relativo. Para simplificar, consideramos aquí dos escenarios básicos: (1) Los movimientos de la fuente y/o el receptor se producen exactamente a lo largo de la línea que los une (efecto Doppler longitudinal), y (2) los movimientos forman ángulos rectos con respecto a dicha línea ( efecto Doppler transversal ). Ignoramos los escenarios en los que se mueven a lo largo de ángulos intermedios.

Efecto Doppler longitudinal

El análisis Doppler clásico se ocupa de las ondas que se propagan en un medio, como las ondas sonoras o las ondulaciones del agua, y que se transmiten entre fuentes y receptores que se mueven acercándose o alejándose uno del otro. El análisis de dichas ondas depende de si la fuente, el receptor o ambos se mueven en relación con el medio. Dado el escenario en el que el receptor está estacionario con respecto al medio y la fuente se aleja directamente del receptor a una velocidad de v _s para un parámetro de velocidad de β _s , la longitud de onda aumenta y la frecuencia observada f viene dada por

f={\frac {1}{1+\beta _{s}}}f_{0}

Por otra parte, dado el escenario donde la fuente es estacionaria y el receptor se está alejando directamente de la fuente a una velocidad de v _r para un parámetro de velocidad de β _r , la longitud de onda no cambia, pero la velocidad de transmisión de las ondas en relación con el receptor disminuye, y la frecuencia observada f está dada por

f=(1-\beta _{r})f_{0}

La luz, a diferencia del sonido o las ondas del agua, no se propaga a través de un medio y no hay distinción entre una fuente que se aleja del receptor o un receptor que se aleja de la fuente. La figura 3-6 ilustra un diagrama de espacio-tiempo relativista que muestra una fuente que se separa del receptor con un parámetro de velocidad de modo que la separación entre la fuente y el receptor en el tiempo es . Debido a la dilatación del tiempo, Puesto que la pendiente del rayo de luz verde es −1, Por lo tanto, el efecto Doppler relativista está dado por ^[41]^{: 58–59} $\beta ,$ $w$ $\beta w$ $w=\gamma w'.$ $T=w+\beta w=\gamma w'(1+\beta ).$

f={\sqrt {\frac {1-\beta }{1+\beta }}}\,f_{0}.

Efecto Doppler transversal

Supongamos que una fuente y un receptor, que se aproximan entre sí en un movimiento inercial uniforme a lo largo de líneas que no se intersecan, están en su punto más cercano de aproximación entre sí. Parecería que el análisis clásico predice que el receptor no detecta ningún desplazamiento Doppler. Debido a sutilezas en el análisis, esa expectativa no es necesariamente cierta. Sin embargo, cuando se define adecuadamente, el desplazamiento Doppler transversal es un efecto relativista que no tiene análogo clásico. Las sutilezas son las siguientes: ^[45]^{: 541–543}

Fig. 3-7a. ¿Cuál es la medición de frecuencia cuando el receptor se encuentra geométricamente en su punto más cercano a la fuente? Este escenario se analiza más fácilmente desde el marco S′ de la fuente. ^{[nota 10]}
Fig. 3-7b. ¿Cuál es la medición de frecuencia cuando el receptor ve la fuente como la más cercana a él? Este escenario se analiza más fácilmente desde el marco S del receptor.

En los debates sobre el desplazamiento Doppler transversal se examinan habitualmente otros dos escenarios:

Fig. 3-7c. If the receiver is moving in a circle around the source, what frequency does the receiver measure?
Fig. 3-7d. If the source is moving in a circle around the receiver, what frequency does the receiver measure?

<!—end plainlist—>

In scenario (a), the point of closest approach is frame-independent and represents the moment where there is no change in distance versus time (i.e. dr/dt = 0 where r is the distance between receiver and source) and hence no longitudinal Doppler shift. The source observes the receiver as being illuminated by light of frequency f′, but also observes the receiver as having a time-dilated clock. In frame S, the receiver is therefore illuminated by blueshifted light of frequency

f=f'\gamma =f'/{\sqrt {1-\beta ^{2}}}

In scenario (b) the illustration shows the receiver being illuminated by light from when the source was closest to the receiver, even though the source has moved on. Because the source's clocks are time dilated as measured in frame S, and since dr/dt was equal to zero at this point, the light from the source, emitted from this closest point, is redshifted with frequency

f=f'/\gamma =f'{\sqrt {1-\beta ^{2}}}

Scenarios (c) and (d) can be analyzed by simple time dilation arguments. In (c), the receiver observes light from the source as being blueshifted by a factor of $\gamma$ , and in (d), the light is redshifted. The only seeming complication is that the orbiting objects are in accelerated motion. However, if an inertial observer looks at an accelerating clock, only the clock's instantaneous speed is important when computing time dilation. (The converse, however, is not true.)^[45]^{: 541–543} Most reports of transverse Doppler shift refer to the effect as a redshift and analyze the effect in terms of scenarios (b) or (d).^{[note 11]}

Energy and momentum

Extending momentum to four dimensions

In classical mechanics, the state of motion of a particle is characterized by its mass and its velocity. Linear momentum, the product of a particle's mass and velocity, is a vector quantity, possessing the same direction as the velocity: $p = m v$ . It is a conserved quantity, meaning that if a closed system is not affected by external forces, its total linear momentum cannot change.

In relativistic mechanics, the momentum vector is extended to four dimensions. Added to the momentum vector is a time component that allows the spacetime momentum vector to transform like the spacetime position vector ⁠ $(x,t)$ ⁠. In exploring the properties of the spacetime momentum, we start, in Fig. 3-8a, by examining what a particle looks like at rest. In the rest frame, the spatial component of the momentum is zero, i.e. $p = 0$ , but the time component equals mc.

We can obtain the transformed components of this vector in the moving frame by using the Lorentz transformations, or we can read it directly from the figure because we know that ⁠ $(mc)^{\prime }=\gamma mc$ ⁠ and ⁠ $p^{\prime }=-\beta \gamma mc$ ⁠, since the red axes are rescaled by gamma. Fig. 3-8b illustrates the situation as it appears in the moving frame. It is apparent that the space and time components of the four-momentum go to infinity as the velocity of the moving frame approaches c.^[41]^: 84–87

We will use this information shortly to obtain an expression for the four-momentum.

Momentum of light

Light particles, or photons, travel at the speed of c, the constant that is conventionally known as the speed of light. This statement is not a tautology, since many modern formulations of relativity do not start with constant speed of light as a postulate. Photons therefore propagate along a lightlike world line and, in appropriate units, have equal space and time components for every observer.

A consequence of Maxwell's theory of electromagnetism is that light carries energy and momentum, and that their ratio is a constant: ⁠ $E/p=c$ ⁠. Rearranging, ⁠ $E/c=p$ ⁠, and since for photons, the space and time components are equal, E/c must therefore be equated with the time component of the spacetime momentum vector.

Photons travel at the speed of light, yet have finite momentum and energy. For this to be so, the mass term in γmc must be zero, meaning that photons are massless particles. Infinity times zero is an ill-defined quantity, but E/c is well-defined.

By this analysis, if the energy of a photon equals E in the rest frame, it equals ⁠ $E^{\prime }=(1-\beta )\gamma E$ ⁠ in a moving frame. This result can be derived by inspection of Fig. 3-9 or by application of the Lorentz transformations, and is consistent with the analysis of Doppler effect given previously.^[41]^: 88

Mass–energy relationship

Consideration of the interrelationships between the various components of the relativistic momentum vector led Einstein to several important conclusions.

In the low speed limit as $β = v / c$ approaches zero, $γ$ approaches 1, so the spatial component of the relativistic momentum ⁠ $\beta \gamma mc=\gamma mv$ ⁠ approaches mv, the classical term for momentum. Following this perspective, γm can be interpreted as a relativistic generalization of m. Einstein proposed that the relativistic mass of an object increases with velocity according to the formula ⁠ $m_{\text{rel}}=\gamma m$ ⁠.
Likewise, comparing the time component of the relativistic momentum with that of the photon, ⁠ $\gamma mc=m_{\text{rel}}c=E/c$ ⁠, so that Einstein arrived at the relationship ⁠ $E=m_{\text{rel}}c^{2}$ ⁠. Simplified to the case of zero velocity, this is Einstein's equation relating energy and mass.

Another way of looking at the relationship between mass and energy is to consider a series expansion of $γmc 2$ at low velocity:

E=\gamma mc^{2}={\frac {mc^{2}}{\sqrt {1-\beta ^{2}}}}

\approx mc^{2}+{\frac {1}{2}}mv^{2}...

The second term is just an expression for the kinetic energy of the particle. Mass indeed appears to be another form of energy.^[41]^: 90–92^[43]^{: 129–130, 180}

The concept of relativistic mass that Einstein introduced in 1905, m_rel, although amply validated every day in particle accelerators around the globe (or indeed in any instrumentation whose use depends on high velocity particles, such as electron microscopes,^[46] old-fashioned color television sets, etc.), has nevertheless not proven to be a fruitful concept in physics in the sense that it is not a concept that has served as a basis for other theoretical development. Relativistic mass, for instance, plays no role in general relativity.

For this reason, as well as for pedagogical concerns, most physicists currently prefer a different terminology when referring to the relationship between mass and energy.^[47] "Relativistic mass" is a deprecated term. The term "mass" by itself refers to the rest mass or invariant mass, and is equal to the invariant length of the relativistic momentum vector. Expressed as a formula,

E^{2}-p^{2}c^{2}=m_{\text{rest}}^{2}c^{4}

This formula applies to all particles, massless as well as massive. For photons where m_rest equals zero, it yields, ⁠ $E=\pm pc$ ⁠.^[41]^: 90–92

Four-momentum

Because of the close relationship between mass and energy, the four-momentum (also called 4-momentum) is also called the energy–momentum 4-vector. Using an uppercase P to represent the four-momentum and a lowercase p to denote the spatial momentum, the four-momentum may be written as

P\equiv (E/c,{\vec {p}})=(E/c,p_{x},p_{y},p_{z})

or alternatively,

P\equiv (E,{\vec {p}})=(E,p_{x},p_{y},p_{z})

using the convention that

c=1.

^[43]^{: 129–130, 180}

Conservation laws

In physics, conservation laws state that certain particular measurable properties of an isolated physical system do not change as the system evolves over time. In 1915, Emmy Noether discovered that underlying each conservation law is a fundamental symmetry of nature.^[48] The fact that physical processes do not care where in space they take place (space translation symmetry) yields conservation of momentum, the fact that such processes do not care when they take place (time translation symmetry) yields conservation of energy, and so on. In this section, we examine the Newtonian views of conservation of mass, momentum and energy from a relativistic perspective.

Total momentum

To understand how the Newtonian view of conservation of momentum needs to be modified in a relativistic context, we examine the problem of two colliding bodies limited to a single dimension.

In Newtonian mechanics, two extreme cases of this problem may be distinguished yielding mathematics of minimum complexity:

(1) The two bodies rebound from each other in a completely elastic collision.

(2) The two bodies stick together and continue moving as a single particle. This second case is the case of completely inelastic collision.

For both cases (1) and (2), momentum, mass, and total energy are conserved. However, kinetic energy is not conserved in cases of inelastic collision. A certain fraction of the initial kinetic energy is converted to heat.

In case (2), two masses with momentums ⁠ ${\boldsymbol {p}}_{\boldsymbol {1}}=m_{1}{\boldsymbol {v}}_{\boldsymbol {1}}$ ⁠and ⁠ ${\boldsymbol {p}}_{\boldsymbol {2}}=m_{2}{\boldsymbol {v}}_{\boldsymbol {2}}$ ⁠ collide to produce a single particle of conserved mass ⁠ $m=m_{1}+m_{2}$ ⁠ traveling at the center of mass velocity of the original system, ${\boldsymbol {v_{cm}}}=\left(m_{1}{\boldsymbol {v_{1}}}+m_{2}{\boldsymbol {v_{2}}}\right)/\left(m_{1}+m_{2}\right)$ . The total momentum ⁠ ${\boldsymbol {p=p_{1}+p_{2}}}$ ⁠ is conserved.

Fig. 3-10 illustrates the inelastic collision of two particles from a relativistic perspective. The time components ⁠ $E_{1}/c$ ⁠ and ⁠ $E_{2}/c$ ⁠ add up to total E/c of the resultant vector, meaning that energy is conserved. Likewise, the space components ⁠ ${\boldsymbol {p_{1}}}$ ⁠ and ⁠ ${\boldsymbol {p_{2}}}$ ⁠ add up to form p of the resultant vector. The four-momentum is, as expected, a conserved quantity. However, the invariant mass of the fused particle, given by the point where the invariant hyperbola of the total momentum intersects the energy axis, is not equal to the sum of the invariant masses of the individual particles that collided. Indeed, it is larger than the sum of the individual masses: ⁠ $m>m_{1}+m_{2}$ ⁠.^[41]^: 94–97

Looking at the events of this scenario in reverse sequence, we see that non-conservation of mass is a common occurrence: when an unstable elementary particle spontaneously decays into two lighter particles, total energy is conserved, but the mass is not. Part of the mass is converted into kinetic energy.^[43]^{: 134–138}

Choice of reference frames

The freedom to choose any frame in which to perform an analysis allows us to pick one which may be particularly convenient. For analysis of momentum and energy problems, the most convenient frame is usually the "center-of-momentum frame" (also called the zero-momentum frame, or COM frame). This is the frame in which the space component of the system's total momentum is zero. Fig. 3-11 illustrates the breakup of a high speed particle into two daughter particles. In the lab frame, the daughter particles are preferentially emitted in a direction oriented along the original particle's trajectory. In the COM frame, however, the two daughter particles are emitted in opposite directions, although their masses and the magnitude of their velocities are generally not the same.^[49]

Energy and momentum conservation

In a Newtonian analysis of interacting particles, transformation between frames is simple because all that is necessary is to apply the Galilean transformation to all velocities. Since ⁠ $v'=v-u$ ⁠, the momentum ⁠ $p'=p-mu$ ⁠. If the total momentum of an interacting system of particles is observed to be conserved in one frame, it will likewise be observed to be conserved in any other frame.^[43]^{: 241–245}

Conservation of momentum in the COM frame amounts to the requirement that $p = 0$ both before and after collision. In the Newtonian analysis, conservation of mass dictates that ⁠ $m=m_{1}+m_{2}$ ⁠. In the simplified, one-dimensional scenarios that we have been considering, only one additional constraint is necessary before the outgoing momenta of the particles can be determined—an energy condition. In the one-dimensional case of a completely elastic collision with no loss of kinetic energy, the outgoing velocities of the rebounding particles in the COM frame will be precisely equal and opposite to their incoming velocities. In the case of a completely inelastic collision with total loss of kinetic energy, the outgoing velocities of the rebounding particles will be zero.^[43]^{: 241–245}

Newtonian momenta, calculated as ⁠ $p=mv$ ⁠, fail to behave properly under Lorentzian transformation. The linear transformation of velocities ⁠ $v'=v-u$ ⁠ is replaced by the highly nonlinear⁠ $v^{\prime }=(v-u)/(1-{vu}/{c^{2}})$ ⁠ so that a calculation demonstrating conservation of momentum in one frame will be invalid in other frames. Einstein was faced with either having to give up conservation of momentum, or to change the definition of momentum. This second option was what he chose.^[41]^: 104

The relativistic conservation law for energy and momentum replaces the three classical conservation laws for energy, momentum and mass. Mass is no longer conserved independently, because it has been subsumed into the total relativistic energy. This makes the relativistic conservation of energy a simpler concept than in nonrelativistic mechanics, because the total energy is conserved without any qualifications. Kinetic energy converted into heat or internal potential energy shows up as an increase in mass.^[43]^: 127

Example: Because of the equivalence of mass and energy, elementary particle masses are customarily stated in energy units, where 1 MeV = 10⁶ electron volts. A charged pion is a particle of mass 139.57 MeV (approx. 273 times the electron mass). It is unstable, and decays into a muon of mass 105.66 MeV (approx. 207 times the electron mass) and an antineutrino, which has an almost negligible mass. The difference between the pion mass and the muon mass is 33.91 MeV.

π⁻
→ μ− + νμ

Fig. 3-12a illustrates the energy–momentum diagram for this decay reaction in the rest frame of the pion. Because of its negligible mass, a neutrino travels at very nearly the speed of light. The relativistic expression for its energy, like that of the photon, is ⁠ $E_{v}=pc,$ ⁠ which is also the value of the space component of its momentum. To conserve momentum, the muon has the same value of the space component of the neutrino's momentum, but in the opposite direction.

Algebraic analyses of the energetics of this decay reaction are available online,^[50] so Fig. 3-12b presents instead a graphing calculator solution. The energy of the neutrino is 29.79 MeV, and the energy of the muon is 33.91 MeV − 29.79 MeV = 4.12 MeV. Most of the energy is carried off by the near-zero-mass neutrino.

Introduction to curved spacetime

Newton's theories assumed that motion takes place against the backdrop of a rigid Euclidean reference frame that extends throughout all space and all time. Gravity is mediated by a mysterious force, acting instantaneously across a distance, whose actions are independent of the intervening space.^{[note 12]} In contrast, Einstein denied that there is any background Euclidean reference frame that extends throughout space. Nor is there any such thing as a force of gravitation, only the structure of spacetime itself.^[51]^{: 175–190}

In spacetime terms, the path of a satellite orbiting the Earth is not dictated by the distant influences of the Earth, Moon and Sun. Instead, the satellite moves through space only in response to local conditions. Since spacetime is everywhere locally flat when considered on a sufficiently small scale, the satellite is always following a straight line in its local inertial frame. We say that the satellite always follows along the path of a geodesic. No evidence of gravitation can be discovered following alongside the motions of a single particle.^[51]^{: 175–190}

In any analysis of spacetime, evidence of gravitation requires that one observe the relative accelerations of two bodies or two separated particles. In Fig. 5-1, two separated particles, free-falling in the gravitational field of the Earth, exhibit tidal accelerations due to local inhomogeneities in the gravitational field such that each particle follows a different path through spacetime. The tidal accelerations that these particles exhibit with respect to each other do not require forces for their explanation. Rather, Einstein described them in terms of the geometry of spacetime, i.e. the curvature of spacetime. These tidal accelerations are strictly local. It is the cumulative total effect of many local manifestations of curvature that result in the appearance of a gravitational force acting at a long range from Earth.^[51]^{: 175–190}

Two central propositions underlie general relativity.

The first crucial concept is coordinate independence: The laws of physics cannot depend on what coordinate system one uses. This is a major extension of the principle of relativity from the version used in special relativity, which states that the laws of physics must be the same for every observer moving in non-accelerated (inertial) reference frames. In general relativity, to use Einstein's own (translated) words, "the laws of physics must be of such a nature that they apply to systems of reference in any kind of motion."^[53]^: 113 This leads to an immediate issue: In accelerated frames, one feels forces that seemingly would enable one to assess one's state of acceleration in an absolute sense. Einstein resolved this problem through the principle of equivalence.^[54]^{: 137–149}

The equivalence principle states that in any sufficiently small region of space, the effects of gravitation are the same as those from acceleration.
In Fig. 5-2, person A is in a spaceship, far from any massive objects, that undergoes a uniform acceleration of g. Person B is in a box resting on Earth. Provided that the spaceship is sufficiently small so that tidal effects are non-measurable (given the sensitivity of current gravity measurement instrumentation, A and B presumably should be Lilliputians), there are no experiments that A and B can perform which will enable them to tell which setting they are in.^[54]^{: 141–149}
An alternative expression of the equivalence principle is to note that in Newton's universal law of gravitation, F = GMm_g/r² = m_gg and in Newton's second law, F = m_ia, there is no a priori reason why the gravitational mass m_g should be equal to the inertial mass m_i. The equivalence principle states that these two masses are identical.^[54]^{: 141–149}

To go from the elementary description above of curved spacetime to a complete description of gravitation requires tensor calculus and differential geometry, topics both requiring considerable study. Without these mathematical tools, it is possible to write about general relativity, but it is not possible to demonstrate any non-trivial derivations.

Technical topics

Is spacetime really curved?

In Poincaré's conventionalist views, the essential criteria according to which one should select a Euclidean versus non-Euclidean geometry would be economy and simplicity. A realist would say that Einstein discovered spacetime to be non-Euclidean. A conventionalist would say that Einstein merely found it more convenient to use non-Euclidean geometry. The conventionalist would maintain that Einstein's analysis said nothing about what the geometry of spacetime really is.^[55]

Such being said,

Is it possible to represent general relativity in terms of flat spacetime?
Are there any situations where a flat spacetime interpretation of general relativity may be more convenient than the usual curved spacetime interpretation?

In response to the first question, a number of authors including Deser, Grishchuk, Rosen, Weinberg, etc. have provided various formulations of gravitation as a field in a flat manifold. Those theories are variously called "bimetric gravity", the "field-theoretical approach to general relativity", and so forth.^[56]^[57]^[58]^[59] Kip Thorne has provided a popular review of these theories.^[60]^{: 397–403}

The flat spacetime paradigm posits that matter creates a gravitational field that causes rulers to shrink when they are turned from circumferential orientation to radial, and that causes the ticking rates of clocks to dilate. The flat spacetime paradigm is fully equivalent to the curved spacetime paradigm in that they both represent the same physical phenomena. However, their mathematical formulations are entirely different. Working physicists routinely switch between using curved and flat spacetime techniques depending on the requirements of the problem. The flat spacetime paradigm is convenient when performing approximate calculations in weak fields. Hence, flat spacetime techniques tend be used when solving gravitational wave problems, while curved spacetime techniques tend be used in the analysis of black holes.^[60]^{: 397–403}

Asymptotic symmetries

The spacetime symmetry group for Special Relativity is the Poincaré group, which is a ten-dimensional group of three Lorentz boosts, three rotations, and four spacetime translations. It is logical to ask what symmetries if any might apply in General Relativity. A tractable case might be to consider the symmetries of spacetime as seen by observers located far away from all sources of the gravitational field. The naive expectation for asymptotically flat spacetime symmetries might be simply to extend and reproduce the symmetries of flat spacetime of special relativity, viz., the Poincaré group.

In 1962 Hermann Bondi, M. G. van der Burg, A. W. Metzner^[61] and Rainer K. Sachs^[62] addressed this asymptotic symmetry problem in order to investigate the flow of energy at infinity due to propagating gravitational waves. Their first step was to decide on some physically sensible boundary conditions to place on the gravitational field at lightlike infinity to characterize what it means to say a metric is asymptotically flat, making no a priori assumptions about the nature of the asymptotic symmetry group—not even the assumption that such a group exists. Then after designing what they considered to be the most sensible boundary conditions, they investigated the nature of the resulting asymptotic symmetry transformations that leave invariant the form of the boundary conditions appropriate for asymptotically flat gravitational fields.^[63]^: 35

What they found was that the asymptotic symmetry transformations actually do form a group and the structure of this group does not depend on the particular gravitational field that happens to be present. This means that, as expected, one can separate the kinematics of spacetime from the dynamics of the gravitational field at least at spatial infinity. The puzzling surprise in 1962 was their discovery of a rich infinite-dimensional group (the so-called BMS group) as the asymptotic symmetry group, instead of the finite-dimensional Poincaré group, which is a subgroup of the BMS group. Not only are the Lorentz transformations asymptotic symmetry transformations, there are also additional transformations that are not Lorentz transformations but are asymptotic symmetry transformations. In fact, they found an additional infinity of transformation generators known as supertranslations. This implies the conclusion that General Relativity (GR) does not reduce to special relativity in the case of weak fields at long distances.^[63]^: 35

Riemannian geometry

Riemannian geometry is the branch of differential geometry that studies Riemannian manifolds, defined as smooth manifolds with a Riemannian metric (an inner product on the tangent space at each point that varies smoothly from point to point). This gives, in particular, local notions of angle, length of curves, surface area and volume. From those, some other global quantities can be derived by integrating local contributions.

Riemannian geometry originated with the vision of Bernhard Riemann expressed in his inaugural lecture "Ueber die Hypothesen, welche der Geometrie zu Grunde liegen" ("On the Hypotheses on which Geometry is Based").^[64] It is a very broad and abstract generalization of the differential geometry of surfaces in R3. Development of Riemannian geometry resulted in synthesis of diverse results concerning the geometry of surfaces and the behavior of geodesics on them, with techniques that can be applied to the study of differentiable manifolds of higher dimensions. It enabled the formulation of Einstein's general theory of relativity, made profound impact on group theory and representation theory, as well as analysis, and spurred the development of algebraic and differential topology.

Curved manifolds

For physical reasons, a spacetime continuum is mathematically defined as a four-dimensional, smooth, connected Lorentzian manifold $(M,g)$ . This means the smooth Lorentz metric $g$ has signature $(3,1)$ . The metric determines the geometry of spacetime, as well as determining the geodesics of particles and light beams. About each point (event) on this manifold, coordinate charts are used to represent observers in reference frames. Usually, Cartesian coordinates $(x,y,z,t)$ are used. Moreover, for simplicity's sake, units of measurement are usually chosen such that the speed of light $c$ is equal to 1.^[65]

A reference frame (observer) can be identified with one of these coordinate charts; any such observer can describe any event $p$ . Another reference frame may be identified by a second coordinate chart about $p$ . Two observers (one in each reference frame) may describe the same event $p$ but obtain different descriptions.^[65]

Usually, many overlapping coordinate charts are needed to cover a manifold. Given two coordinate charts, one containing $p$ (representing an observer) and another containing $q$ (representing another observer), the intersection of the charts represents the region of spacetime in which both observers can measure physical quantities and hence compare results. The relation between the two sets of measurements is given by a non-singular coordinate transformation on this intersection. The idea of coordinate charts as local observers who can perform measurements in their vicinity also makes good physical sense, as this is how one actually collects physical data—locally.^[65]

For example, two observers, one of whom is on Earth, but the other one who is on a fast rocket to Jupiter, may observe a comet crashing into Jupiter (this is the event $p$ ). In general, they will disagree about the exact location and timing of this impact, i.e., they will have different 4-tuples $(x,y,z,t)$ (as they are using different coordinate systems). Although their kinematic descriptions will differ, dynamical (physical) laws, such as momentum conservation and the first law of thermodynamics, will still hold. In fact, relativity theory requires more than this in the sense that it stipulates these (and all other physical) laws must take the same form in all coordinate systems. This introduces tensors into relativity, by which all physical quantities are represented.

Geodesics are said to be timelike, null, or spacelike if the tangent vector to one point of the geodesic is of this nature. Paths of particles and light beams in spacetime are represented by timelike and null (lightlike) geodesics, respectively.^[65]

Privileged character of 3+1 spacetime

There are two kinds of dimensions: spatial (bidirectional) and temporal (unidirectional).^[67] Let the number of spatial dimensions be N and the number of temporal dimensions be T. That N = 3 and T = 1, setting aside the compactified dimensions invoked by string theory and undetectable to date, can be explained by appealing to the physical consequences of letting N differ from 3 and T differ from 1. The argument is often of an anthropic character and possibly the first of its kind, albeit before the complete concept came into vogue.

The implicit notion that the dimensionality of the universe is special is first attributed to Gottfried Wilhelm Leibniz, who in the Discourse on Metaphysics suggested that the world is "the one which is at the same time the simplest in hypothesis and the richest in phenomena".^[68] Immanuel Kant argued that 3-dimensional space was a consequence of the inverse square law of universal gravitation. While Kant's argument is historically important, John D. Barrow said that it "gets the punch-line back to front: it is the three-dimensionality of space that explains why we see inverse-square force laws in Nature, not vice-versa" (Barrow 2002:204).^{[note 13]}

In 1920, Paul Ehrenfest showed that if there is only a single time dimension and more than three spatial dimensions, the orbit of a planet about its Sun cannot remain stable. The same is true of a star's orbit around the center of its galaxy.^[69] Ehrenfest also showed that if there are an even number of spatial dimensions, then the different parts of a wave impulse will travel at different speeds. If there are $5+2k$ spatial dimensions, where k is a positive whole number, then wave impulses become distorted. In 1922, Hermann Weyl claimed that Maxwell's theory of electromagnetism can be expressed in terms of an action only for a four-dimensional manifold.^[70] Finally, Tangherlini showed in 1963 that when there are more than three spatial dimensions, electron orbitals around nuclei cannot be stable; electrons would either fall into the nucleus or disperse.^[71]

Max Tegmark expands on the preceding argument in the following anthropic manner.^[72] If T differs from 1, the behavior of physical systems could not be predicted reliably from knowledge of the relevant partial differential equations. In such a universe, intelligent life capable of manipulating technology could not emerge. Moreover, if T > 1, Tegmark maintains that protons and electrons would be unstable and could decay into particles having greater mass than themselves. (This is not a problem if the particles have a sufficiently low temperature.)^[72] Lastly, if N < 3, gravitation of any kind becomes problematic, and the universe would probably be too simple to contain observers. For example, when N < 3, nerves cannot cross without intersecting.^[72] Hence anthropic and other arguments rule out all cases except N = 3 and T = 1, which describes the world around us.

On the other hand, in view of creating black holes from an ideal monatomic gas under its self-gravity, Wei-Xiang Feng showed that (3 + 1)-dimensional spacetime is the marginal dimensionality. Moreover, it is the unique dimensionality that can afford a "stable" gas sphere with a "positive" cosmological constant. However, a self-gravitating gas cannot be stably bound if the mass sphere is larger than ~10²¹ solar masses, due to the small positivity of the cosmological constant observed.^[73]

In 2019, James Scargill argued that complex life may be possible with two spatial dimensions. According to Scargill, a purely scalar theory of gravity may enable a local gravitational force, and 2D networks may be sufficient for complex neural networks.^[74]^[75]

Notes

^ luminiferous from the Latin lumen, light, + ferens, carrying; aether from the Greek αἰθήρ (aithēr), pure air, clear sky
^ By stating that simultaneity is a matter of convention, Poincaré meant that to talk about time at all, one must have synchronized clocks, and the synchronization of clocks must be established by a specified, operational procedure (convention). This stance represented a fundamental philosophical break from Newton, who conceived of an absolute, true time that was independent of the workings of the inaccurate clocks of his day. This stance also represented a direct attack against the influential philosopher Henri Bergson, who argued that time, simultaneity, and duration were matters of intuitive understanding.^[19]
^ The operational procedure adopted by Poincaré was essentially identical to what is known as Einstein synchronization, even though a variant of it was already a widely used procedure by telegraphers in the middle 19th century. Basically, to synchronize two clocks, one flashes a light signal from one to the other, and adjusts for the time that the flash takes to arrive.^[19]
^ A hallmark of Einstein's career, in fact, was his use of visualized thought experiments (Gedanken–Experimente) as a fundamental tool for understanding physical issues. For special relativity, he employed moving trains and flashes of lightning for his most penetrating insights. For curved spacetime, he considered a painter falling off a roof, accelerating elevators, blind beetles crawling on curved surfaces and the like. In his great Solvay Debates with Bohr on the nature of reality (1927 and 1930), he devised multiple imaginary contraptions intended to show, at least in concept, means whereby the Heisenberg uncertainty principle might be evaded. Finally, in a profound contribution to the literature on quantum mechanics, Einstein considered two particles briefly interacting and then flying apart so that their states are correlated, anticipating the phenomenon known as quantum entanglement.^[24]
^ In the original version of this lecture, Minkowski continued to use such obsolescent terms as the ether, but the posthumous publication in 1915 of this lecture in the Annals of Physics (Annalen der Physik) was edited by Sommerfeld to remove this term. Sommerfeld also edited the published form of this lecture to revise Minkowski's judgement of Einstein from being a mere clarifier of the principle of relativity, to being its chief expositor.^[25]
^ (In the following, the group G_∞ is the Galilean group and the group G_c the Lorentz group.) "With respect to this it is clear that the group G_c in the limit for c = ∞, i.e. as group G_∞, exactly becomes the full group belonging to Newtonian Mechanics. In this state of affairs, and since G_c is mathematically more intelligible than G_∞, a mathematician may, by a free play of imagination, hit upon the thought that natural phenomena actually possess an invariance, not for the group G_∞, but rather for a group G_c, where c is definitely finite, and only exceedingly large using the ordinary measuring units."^[27]
^ For instance, the Lorentz group is a subgroup of the conformal group in four dimensions.^[28]^: 41–42The Lorentz group is isomorphic to the Laguerre group transforming planes into planes,^[28]^: 39–42it is isomorphic to the Möbius group of the plane,^[29]^: 22and is isomorphic to the group of isometries in hyperbolic space which is often expressed in terms of the hyperboloid model.^[30]^: 3.2.3
^ In a Cartesian plane, ordinary rotation leaves a circle unchanged. In spacetime, hyperbolic rotation preserves the hyperbolic metric.
^ Even with no (de)acceleration i.e. using one inertial frame O for constant, high-velocity outward journey and another inertial frame I for constant, high-velocity inward journey – the sum of the elapsed time in those frames (O and I) is shorter than the elapsed time in the stationary inertial frame S. Thus acceleration and deceleration is not the cause of shorter elapsed time during the outward and inward journey. Instead the use of two different constant, high-velocity inertial frames for outward and inward journey is really the cause of shorter elapsed time total. Granted, if the same twin has to travel outward and inward leg of the journey and safely switch from outward to inward leg of the journey, the acceleration and deceleration is required. If the travelling twin could ride the high-velocity outward inertial frame and instantaneously switch to high-velocity inward inertial frame the example would still work. The point is that real reason should be stated clearly. The asymmetry is because of the comparison of sum of elapsed times in two different inertial frames (O and I) to the elapsed time in a single inertial frame S.
^ The ease of analyzing a relativistic scenario often depends on the frame in which one chooses to perform the analysis. In this linked image, we present alternative views of the transverse Doppler shift scenario where source and receiver are at their closest approach to each other. (a) If we analyze the scenario in the frame of the receiver, we find that the analysis is more complicated than it should be. The apparent position of a celestial object is displaced from its true position (or geometric position) because of the object's motion during the time it takes its light to reach an observer. The source would be time-dilated relative to the receiver, but the redshift implied by this time dilation would be offset by a blueshift due to the longitudinal component of the relative motion between the receiver and the apparent position of the source. (b) It is much easier if, instead, we analyze the scenario from the frame of the source. An observer situated at the source knows, from the problem statement, that the receiver is at its closest point to him. That means that the receiver has no longitudinal component of motion to complicate the analysis. Since the receiver's clocks are time-dilated relative to the source, the light that the receiver receives is therefore blue-shifted by a factor of gamma.
^ Not all experiments characterize the effect in terms of a redshift. For example, the Kündig experiment measures transverse blueshift using a Mössbauer source setup at the center of a centrifuge rotor and an absorber at the rim.
^ Newton himself was acutely aware of the inherent difficulties with these assumptions, but as a practical matter, making these assumptions was the only way that he could make progress. In 1692, he wrote to his friend Richard Bentley: "That Gravity should be innate, inherent and essential to Matter, so that one body may act upon another at a distance thro' a Vacuum, without the Mediation of any thing else, by and through which their Action and Force may be conveyed from one to another, is to me so great an Absurdity that I believe no Man who has in philosophical Matters a competent Faculty of thinking can ever fall into it."
^ This is because the law of gravitation (or any other inverse-square law) follows from the concept of flux and the proportional relationship of flux density and field strength. If N = 3, then 3-dimensional solid objects have surface areas proportional to the square of their size in any selected spatial dimension. In particular, a sphere of radius r has a surface area of 4πr². More generally, in a space of N dimensions, the strength of the gravitational attraction between two bodies separated by a distance of r would be inversely proportional to r^N−1.

Additional details

References

^ Rynasiewicz, Robert (12 August 2004). "Newton's Views on Space, Time, and Motion". Stanford Encyclopedia of Philosophy. Metaphysics Research Lab, Stanford University. Archived from the original on 16 July 2012. Retrieved 24 March 2017.
^ Davis, Philip J. (2006). Mathematics & Common Sense: A Case of Creative Tension. Wellesley, Massachusetts: A.K. Peters. p. 86. ISBN 978-1-4398-6432-6.
^ a b c d e f g h i j k l m n Schutz, Bernard (2004). Gravity from the Ground Up: An Introductory Guide to Gravity and General Relativity (Reprint ed.). Cambridge: Cambridge University Press. ISBN 0-521-45506-5. Archived from the original on 17 January 2023. Retrieved 24 May 2017.
^ Fock, V. (1966). The Theory of Space, Time and Gravitation (2nd ed.). New York: Pergamon Press Ltd. p. 33. ISBN 0-08-010061-9. Retrieved 14 October 2023.
^ Lawden, D. F. (1982). Introduction to Tensor Calculus, Relativity and Cosmology (3rd ed.). Mineola, New York: Dover Publications. p. 7. ISBN 978-0-486-42540-5.
^ a b c d e Collier, Peter (2017). A Most Incomprehensible Thing: Notes Towards a Very Gentle Introduction to the Mathematics of Relativity (3rd ed.). Incomprehensible Books. ISBN 978-0-9573894-6-5.
^ Rowland, Todd. "Manifold". Wolfram Mathworld. Wolfram Research. Archived from the original on 13 March 2017. Retrieved 24 March 2017.
^ a b French, A. P. (1968). Special Relativity. Boca Raton, Florida: CRC Press. pp. 35–60. ISBN 0-7487-6422-4.
^ a b c Taylor, Edwin F.; Wheeler, John Archibald (1992). Spacetime Physics: Introduction to Special Relativity (2nd ed.). San Francisco, California: Freeman. ISBN 0-7167-0336-X. Retrieved 14 April 2017.
^ Scherr, Rachel E.; Shaffer, Peter S.; Vokos, Stamatis (July 2001). "Student understanding of time in special relativity: Simultaneity and reference frames" (PDF). American Journal of Physics. 69 (S1). College Park, Maryland: American Association of Physics Teachers: S24–S35. arXiv:physics/0207109. Bibcode:2001AmJPh..69S..24S. doi:10.1119/1.1371254. S2CID 8146369. Archived (PDF) from the original on 28 September 2018. Retrieved 11 April 2017.
^ Hughes, Stefan (2013). Catchers of the Light: Catching Space: Origins, Lunar, Solar, Solar System and Deep Space. Paphos, Cyprus: ArtDeCiel Publishing. pp. 202–233. ISBN 978-1-4675-7992-6. Archived from the original on 17 January 2023. Retrieved 7 April 2017.
^ Williams, Matt (28 January 2022). "What is Einstein's Theory of Relativity?". Universe Today. Archived from the original on 3 August 2022. Retrieved 13 August 2022.
^ Stachel, John (2005). "Fresnel's (Dragging) Coefficient as a Challenge to 19th Century Optics of Moving Bodies." (PDF). In Kox, A. J.; Eisenstaedt, Jean (eds.). The Universe of General Relativity. Boston, Massachusetts: Birkhäuser. pp. 1–13. ISBN 0-8176-4380-X. Archived from the original (PDF) on 15 April 2017.
^ "George Francis FitzGerald". The Linda Hall Library. Archived from the original on 17 January 2023. Retrieved 13 August 2022.
^ "The Nobel Prize in Physics 1902". NobelPrize.org. Archived from the original on 23 June 2017. Retrieved 13 August 2022.
^ a b c Pais, Abraham (1982). 'Subtle is the Lord–': The Science and the Life of Albert Einstein (11th ed.). Oxford: Oxford University Press. ISBN 0-19-853907-X.
^ Darrigol, O. (2005), "The Genesis of the theory of relativity" (PDF), Séminaire Poincaré, 1: 1–22, Bibcode:2006eins.book....1D, doi:10.1007/3-7643-7436-5_1, ISBN 978-3-7643-7435-8, archived (PDF) from the original on 28 February 2008, retrieved 17 July 2017
^ Miller, Arthur I. (1998). Albert Einstein's Special Theory of Relativity. New York: Springer-Verlag. ISBN 0-387-94870-8.
^ a b c Galison, Peter (2003). Einstein's Clocks, Poincaré's Maps: Empires of Time. New York: W. W. Norton & Company, Inc. pp. 13–47. ISBN 0-393-02001-0.
^ Poincare, Henri (1906). "On the Dynamics of the Electron (Sur la dynamique de l'électron)". Rendiconti del Circolo Matematico di Palermo. 21: 129–176. Bibcode:1906RCMP...21..129P. doi:10.1007/bf03013466. hdl:2027/uiug.30112063899089. S2CID 120211823. Archived from the original on 11 July 2017. Retrieved 15 July 2017.
^ Zahar, Elie (1989) [1983], "Poincaré's Independent Discovery of the relativity principle", Einstein's Revolution: A Study in Heuristic, Chicago, Illinois: Open Court Publishing Company, ISBN 0-8126-9067-2
^ a b Walter, Scott A. (2007). "Breaking in the 4-vectors: the four-dimensional movement in gravitation, 1905–1910". In Renn, Jürgen; Schemmel, Matthias (eds.). The Genesis of General Relativity, Volume 3. Berlin, Germany: Springer. pp. 193–252. Archived from the original on 28 May 2024. Retrieved 15 July 2017.
^ Einstein, Albert (1905). "On the Electrodynamics of Moving Bodies ( Zur Elektrodynamik bewegter Körper)". Annalen der Physik. 322 (10): 891–921. Bibcode:1905AnP...322..891E. doi:10.1002/andp.19053221004. Archived from the original on 6 November 2018. Retrieved 7 April 2018.
^ Isaacson, Walter (2007). Einstein: His Life and Universe. Simon & Schuster. pp. 26–27, 122–127, 145–146, 345–349, 448–460. ISBN 978-0-7432-6473-0.
^ a b Weinstein, Galina (2012). "Max Born, Albert Einstein and Hermann Minkowski's Space–Time Formalism of Special Relativity". arXiv:1210.6929 [physics.hist-ph].
^ Galison, Peter Louis (1979). "Minkowski's space–time: From visual thinking to the absolute world". Historical Studies in the Physical Sciences. 10: 85–121. doi:10.2307/27757388. JSTOR 27757388.
^ a b Minkowski, Hermann (1909). "Raum und Zeit" [Space and Time]. Jahresbericht der Deutschen Mathematiker-Vereinigung. B. G. Teubner: 1–14. Archived from the original on 28 July 2017. Retrieved 17 July 2017.
^ a b Cartan, É.; Fano, G. (1955) [1915]. "La théorie des groupes continus et la géométrie". Encyclopédie des Sciences Mathématiques Pures et Appliquées. 3 (1): 39–43. Archived from the original on 23 March 2018. Retrieved 6 April 2018. (Only pages 1–21 were published in 1915, the entire article including pp. 39–43 concerning the groups of Laguerre and Lorentz was posthumously published in 1955 in Cartan's collected papers, and was reprinted in the Encyclopédie in 1991.)
^ Kastrup, H. A. (2008). "On the advancements of conformal transformations and their associated symmetries in geometry and theoretical physics". Annalen der Physik. 520 (9–10): 631–690. arXiv:0808.2730. Bibcode:2008AnP...520..631K. doi:10.1002/andp.200810324. S2CID 12020510.
^ Ratcliffe, J. G. (1994). "Hyperbolic geometry". Foundations of Hyperbolic Manifolds. New York. pp. 56–104. ISBN 0-387-94348-X.{{cite book}}: CS1 maint: location missing publisher (link)
^ a b c d e Kogut, John B. (2001). Introduction to Relativity. Massachusetts: Harcourt/Academic Press. ISBN 0-12-417561-9.
^ Ray d'Inverno; James Vickers (2022). Introducing Einstein's Relativity: A Deeper Understanding (illustrated ed.). Oxford University Press. pp. 26–28. ISBN 978-0-19-886202-4. Extract of page 27
^ Landau, L. D., and Lifshitz, E. M. (2013). The classical theory of fields (Vol. 2).
^ Carroll, Sean (2022). The Biggest Ideas in the Universe. New York: Penguin Random House LLC. pp. 155–156. ISBN 9780593186589.
^ Curiel, Erik; Bokulich, Peter. "Lightcones and Causal Structure". Stanford Encyclopedia of Philosophy. Metaphysics Research Lab, Stanford University. Archived from the original on 17 May 2019. Retrieved 26 March 2017.
^ a b Savitt, Steven. "Being and Becoming in Modern Physics. 3. The Special Theory of Relativity". The Stanford Encyclopedia of Philosophy. Metaphysics Research Lab, Stanford University. Archived from the original on 11 March 2017. Retrieved 26 March 2017.
^ Schutz, Bernard F. (1985). A first course in general relativity. Cambridge, UK: Cambridge University Press. p. 26. ISBN 0-521-27703-5.
^ a b c d e f g Weiss, Michael. "The Twin Paradox". The Physics and Relativity FAQ. Archived from the original on 27 April 2017. Retrieved 10 April 2017.
^ Mould, Richard A. (1994). Basic Relativity (1st ed.). Springer. p. 42. ISBN 978-0-387-95210-9. Retrieved 22 April 2017.
^ Lerner, Lawrence S. (1997). Physics for Scientists and Engineers, Volume 2 (1st ed.). Jones & Bartlett Pub. p. 1047. ISBN 978-0-7637-0460-5. Retrieved 22 April 2017.
^ a b c d e f g h i j k l Bais, Sander (2007). Very Special Relativity: An Illustrated Guide. Cambridge, Massachusetts: Harvard University Press. ISBN 978-0-674-02611-7.
^ Forshaw, Jeffrey; Smith, Gavin (2014). Dynamics and Relativity. John Wiley & Sons. p. 118. ISBN 978-1-118-93329-9. Retrieved 24 April 2017.
^ a b c d e f g h i Morin, David (2017). Special Relativity for the Enthusiastic Beginner. CreateSpace Independent Publishing Platform. ISBN 978-1-5423-2351-2.
^ Landau, L. D.; Lifshitz, E. M. (2006). The Classical Theory of Fields, Course of Theoretical Physics, Volume 2 (4th ed.). Amsterdam: Elsevier. pp. 1–24. ISBN 978-0-7506-2768-9.
^ a b Morin, David (2008). Introduction to Classical Mechanics: With Problems and Solutions. Cambridge University Press. ISBN 978-0-521-87622-3.
^ Rose, H. H. (21 April 2008). "Optics of high-performance electron microscopes". Science and Technology of Advanced Materials. 9 (1): 014107. Bibcode:2008STAdM...9a4107R. doi:10.1088/0031-8949/9/1/014107. PMC 5099802. PMID 27877933.
^ Griffiths, David J. (2013). Revolutions in Twentieth-Century Physics. Cambridge: Cambridge University Press. p. 60. ISBN 978-1-107-60217-5. Retrieved 24 May 2017.
^ Byers, Nina (1998). "E. Noether's Discovery of the Deep Connection Between Symmetries and Conservation Laws". arXiv:physics/9807044.
^ Idema, Timon (17 April 2019). "Mechanics and Relativity. Chapter 4.3: Reference Frames". LibreTexts Physics. California State University Affordable Learning Solutions Program. Retrieved 6 July 2024.
^ Nave, R. "Energetics of Charged Pion Decay". Hyperphysics. Department of Physics and Astronomy, Georgia State University. Archived from the original on 21 May 2017. Retrieved 27 May 2017.
^ a b c Taylor, Edwin F.; Wheeler, John Archibald (1992). Spacetime Physics: Introduction to Special Relativity (2nd ed.). San Francisco, California: Freeman. ISBN 0-7167-0336-X. Retrieved 14 April 2017.
^ Different reporters viewing the scenarios presented in this figure interpret the scenarios differently depending on their knowledge of the situation. (i) A first reporter, at the center of mass of particles 2 and 3 but unaware of the large mass 1, concludes that a force of repulsion exists between the particles in scenario A while a force of attraction exists between the particles in scenario B. (ii) A second reporter, aware of the large mass 1, smiles at the first reporter's naiveté. This second reporter knows that in reality, the apparent forces between particles 2 and 3 really represent tidal effects resulting from their differential attraction by mass 1. (iii) A third reporter, trained in general relativity, knows that there are, in fact, no forces at all acting between the three objects. Rather, all three objects move along geodesics in spacetime.
^ Lorentz, H. A.; Einstein, A.; Minkowski, H.; Weyl, H. (1952). The Principle of Relativity: A Collection of Original Memoirs on the Special and General Theory of Relativity. Dover Publications. ISBN 0-486-60081-5.
^ a b c Mook, Delo E.; Vargish, Thoma s (1987). Inside Relativity. Princeton, New Jersey: Princeton University Press. ISBN 0-691-08472-6.
^ Murzi, Mauro. "Jules Henri Poincaré (1854–1912)". Internet Encyclopedia of Philosophy (ISSN 2161-0002). Archived from the original on 23 December 2020. Retrieved 9 April 2018.
^ Deser, S. (1970). "Self-Interaction and Gauge Invariance". General Relativity and Gravitation. 1 (18): 9–8. arXiv:gr-qc/0411023. Bibcode:1970GReGr...1....9D. doi:10.1007/BF00759198. S2CID 14295121.
^ Grishchuk, L. P.; Petrov, A. N.; Popova, A. D. (1984). "Exact Theory of the (Einstein) Gravitational Field in an Arbitrary Background Space–Time". Communications in Mathematical Physics. 94 (3): 379–396. Bibcode:1984CMaPh..94..379G. doi:10.1007/BF01224832. S2CID 120021772. Archived from the original on 25 February 2021. Retrieved 9 April 2018.
^ Rosen, N. (1940). "General Relativity and Flat Space I". Physical Review. 57 (2): 147–150. Bibcode:1940PhRv...57..147R. doi:10.1103/PhysRev.57.147.
^ Weinberg, S. (1964). "Derivation of Gauge Invariance and the Equivalence Principle from Lorentz Invariance of the S-Matrix". Physics Letters. 9 (4): 357–359. Bibcode:1964PhL.....9..357W. doi:10.1016/0031-9163(64)90396-8.
^ a b Thorne, Kip (1995). Black Holes & Time Warps: Einstein's Outrageous Legacy. W. W. Norton & Company. ISBN 978-0-393-31276-8.
^ Bondi, H.; Van der Burg, M. G. J.; Metzner, A. (1962). "Gravitational waves in general relativity: VII. Waves from axisymmetric isolated systems". Proceedings of the Royal Society of London A. A269 (1336): 21–52. Bibcode:1962RSPSA.269...21B. doi:10.1098/rspa.1962.0161. S2CID 120125096.
^ Sachs, Rainer K. (1962). "Asymptotic symmetries in gravitational theory". Physical Review. 128 (6): 2851–2864. Bibcode:1962PhRv..128.2851S. doi:10.1103/PhysRev.128.2851.
^ a b Strominger, Andrew (2017). "Lectures on the Infrared Structure of Gravity and Gauge Theory". arXiv:1703.05448 [hep-th]. ...redacted transcript of a course given by the author at Harvard in spring semester 2016. It contains a pedagogical overview of recent developments connecting the subjects of soft theorems, the memory effect and asymptotic symmetries in four-dimensional QED, nonabelian gauge theory and gravity with applications to black holes. To be published Princeton University Press, 158 pages.
^ maths.tcd.ie
^ a b c d Bär, Christian; Fredenhagen, Klaus (2009). "Lorentzian Manifolds" (PDF). Quantum Field Theory on Curved Spacetimes: Concepts and Mathematical Foundations. Dordrecht: Springer. pp. 39–58. ISBN 978-3-642-02779-6. Archived from the original (PDF) on 15 April 2017. Retrieved 14 April 2017.
^ Tegmark, Max (1 April 1997). "On the dimensionality of spacetime". Classical and Quantum Gravity. 14 (4): L69–L75. arXiv:gr-qc/9702052. Bibcode:1997CQGra..14L..69T. doi:10.1088/0264-9381/14/4/002. ISSN 0264-9381. S2CID 250904081.
^ Skow, Bradford (2007). "What makes time different from space?" (PDF). Noûs. 41 (2): 227–252. CiteSeerX 10.1.1.404.7853. doi:10.1111/j.1468-0068.2007.00645.x. Archived from the original (PDF) on 24 August 2016. Retrieved 13 April 2018.
^ Leibniz, Gottfried (1880). "Discourse on metaphysics". Die philosophischen schriften von Gottfried Wilhelm Leibniz. Vol. 4. Weidmann. pp. 427–463. Retrieved 13 April 2018.
^ Ehrenfest, Paul (1920). "Welche Rolle spielt die Dreidimensionalität des Raumes in den Grundgesetzen der Physik?" [How do the fundamental laws of physics make manifest that space has 3 dimensions?]. Annalen der Physik. 61 (5): 440–446. Bibcode:1920AnP...366..440E. doi:10.1002/andp.19203660503.. Also see Ehrenfest, P. (1917) "In what way does it become manifest in the fundamental laws of physics that space has three dimensions?" Proceedings of the Amsterdam academy 20:200.
^ Weyl, H. (1922). Space, time, and matter. Dover reprint: 284.
^ Tangherlini, F. R. (1963). "Schwarzschild field in n dimensions and the dimensionality of space problem". Nuovo Cimento. 27 (3): 636–651. Bibcode:1963NCim...27..636T. doi:10.1007/BF02784569. S2CID 119683293.
^ a b c Tegmark, Max (April 1997). "On the dimensionality of spacetime" (PDF). Classical and Quantum Gravity. 14 (4): L69–L75. arXiv:gr-qc/9702052. Bibcode:1997CQGra..14L..69T. doi:10.1088/0264-9381/14/4/002. S2CID 15694111. Retrieved 16 December 2006.
^ Feng, W.X. (3 August 2022). "Gravothermal phase transition, black holes and space dimensionality". Physical Review D. 106 (4): L041501. arXiv:2207.14317. Bibcode:2022PhRvD.106d1501F. doi:10.1103/PhysRevD.106.L041501. S2CID 251196731.
^ Scargill, J. H. C. (26 February 2020). "Existence of life in 2 + 1 dimensions". Physical Review Research. 2 (1): 013217. arXiv:1906.05336. Bibcode:2020PhRvR...2a3217S. doi:10.1103/PhysRevResearch.2.013217. S2CID 211734117.
^ "Life could exist in a 2D universe (according to physics, anyway)". technologyreview.com. Retrieved 16 June 2021.

External links

Wikiquote has quotations related to Spacetime.

Wikibooks has a book on the topic of: Special Relativity

Media related to Spacetime at Wikimedia Commons
Albert Einstein on space–time 13th edition Encyclopædia Britannica Historical: Albert Einstein's 1926 article
Encyclopedia of Space–time and gravitation Scholarpedia Expert articles
Stanford Encyclopedia of Philosophy: "Space and Time: Inertial Frames" by Robert DiSalle.