En física , la teoría especial de la relatividad , o relatividad especial para abreviar, es una teoría científica de la relación entre el espacio y el tiempo . En el tratamiento de Albert Einstein de 1905, la teoría se presenta basada en sólo dos postulados : [p 1] [1] [2]
El primer postulado fue formulado por primera vez por Galileo Galilei (ver Invariancia galileana ).
La relatividad especial fue descrita por Albert Einstein en un artículo publicado el 26 de septiembre de 1905 titulado " Sobre la electrodinámica de los cuerpos en movimiento ". [p 1] Las ecuaciones de electromagnetismo de Maxwell parecían ser incompatibles con la mecánica newtoniana , y el experimento de Michelson-Morley no logró detectar el movimiento de la Tierra contra el supuesto éter luminífero . Estos llevaron al desarrollo de las transformaciones de Lorentz , que ajustan distancias y tiempos para objetos en movimiento. La relatividad especial corrige las leyes hasta ahora de la mecánica para manejar situaciones que involucran todos los movimientos y especialmente aquellos a una velocidad cercana a la de la luz (conocida comovelocidades relativistas ). Hoy en día, se ha demostrado que la relatividad especial es el modelo más preciso de movimiento a cualquier velocidad cuando los efectos gravitacionales y cuánticos son insignificantes.[3][4]Aun así, el modelo newtoniano sigue siendo válido como una aproximación simple y precisa a velocidades bajas (en relación con la velocidad de la luz), por ejemplo, los movimientos cotidianos en la Tierra.
La relatividad especial tiene una amplia gama de consecuencias que han sido verificadas experimentalmente. [5] Incluyen la relatividad de la simultaneidad , la contracción de la longitud , la dilatación del tiempo , la fórmula relativista de la suma de la velocidad, el efecto Doppler relativista , la masa relativista , un límite de velocidad universal , la equivalencia masa-energía , la velocidad de la causalidad y la precesión de Thomas . [1] [2] Por ejemplo, ha reemplazado la noción convencional de un tiempo universal absoluto por la noción de un tiempo que depende del marco de referencia y la posición espacial . En lugar de un intervalo de tiempo invariante entre dos eventos, existe un intervalo de espacio-tiempo invariante . Combinados con otras leyes de la física, los dos postulados de la relatividad especial predicen la equivalencia de masa y energía , como se expresa en la fórmula de equivalencia masa-energía , donde es la velocidad de la luz en el vacío. [6] [7] También explica cómo se relacionan los fenómenos de la electricidad y el magnetismo. [1] [2]
Una característica definitoria de la relatividad especial es la sustitución de las transformaciones galileanas de la mecánica newtoniana por las transformaciones de Lorentz . El tiempo y el espacio no pueden definirse por separado (como se pensaba anteriormente). Más bien, el espacio y el tiempo están entrelazados en un único continuo conocido como "espaciotiempo" . Los acontecimientos que ocurren al mismo tiempo para un observador pueden ocurrir en momentos diferentes para otro.
Hasta varios años más tarde, cuando Einstein desarrolló la relatividad general , que introdujo un espacio-tiempo curvo para incorporar la gravedad, no se utilizó la frase "relatividad especial". Una traducción que a veces se utiliza es "relatividad restringida"; "especial" realmente significa "caso especial". [p 2] [p 3] [p 4] [nota 1] Parte del trabajo de Albert Einstein en relatividad especial se basa en el trabajo anterior de Hendrik Lorentz y Henri Poincaré . La teoría quedó esencialmente completa en 1907, con los artículos de Hermann Minkowski sobre el espacio-tiempo. [4]
La teoría es "especial" porque sólo se aplica en el caso especial donde el espacio-tiempo es "plano", es decir, donde la curvatura del espacio-tiempo (una consecuencia del tensor de energía-momento y que representa la gravedad ) es insignificante. [8] [nota 2] Para acomodar correctamente la gravedad, Einstein formuló la relatividad general en 1915. La relatividad especial, contrariamente a algunas descripciones históricas, se adapta tanto a las aceleraciones como a los marcos de referencia acelerados . [9] [10]
Así como ahora se acepta que la relatividad galileana es una aproximación de la relatividad especial válida para velocidades bajas, la relatividad especial se considera una aproximación de la relatividad general válida para campos gravitacionales débiles , es decir, a una escala suficientemente pequeña (por ejemplo, cuando las fuerzas de marea son insignificantes) y en condiciones de caída libre . Pero la relatividad general incorpora geometría no euclidiana para representar los efectos gravitacionales como la curvatura geométrica del espacio-tiempo. La relatividad especial está restringida al espaciotiempo plano conocido como espacio de Minkowski . Siempre que el universo pueda modelarse como una variedad pseudo-riemanniana , se puede definir un marco invariante de Lorentz que respete la relatividad especial para una vecindad suficientemente pequeña de cada punto en este espacio-tiempo curvo .
Galileo Galilei ya había postulado que no existe un estado de reposo absoluto y bien definido (ni marcos de referencia privilegiados ), principio que ahora se denomina principio de relatividad de Galileo . Einstein amplió este principio para que explicara la velocidad constante de la luz, [11] un fenómeno que se había observado en el experimento de Michelson-Morley. También postuló que es válido para todas las leyes de la física , incluidas tanto las leyes de la mecánica como las de la electrodinámica . [12]
"Reflexiones de este tipo me dejaron claro ya poco después de 1900, es decir, poco después del trabajo pionero de Planck, que ni la mecánica ni la electrodinámica podían (excepto en casos límite) pretender una validez exacta. Poco a poco, perdí la esperanza de descubrir las verdaderas leyes mediante esfuerzos constructivos basados en hechos conocidos. Cuanto más y más desesperadamente lo intentaba, más llegaba a la convicción de que sólo el descubrimiento de un principio formal universal podría llevarnos a resultados seguros... ¿Cómo, entonces? , ¿podría encontrarse tal principio universal?"
Albert Einstein: Notas autobiográficas [p 5]
Einstein distinguió dos proposiciones fundamentales que parecían ser las más seguras, independientemente de la validez exacta de las leyes (entonces) conocidas de la mecánica o la electrodinámica. Estas proposiciones eran la constancia de la velocidad de la luz en el vacío y la independencia de las leyes físicas (especialmente la constancia de la velocidad de la luz) de la elección del sistema inercial. En su presentación inicial de la relatividad especial en 1905 expresó estos postulados como: [p 1]
La constancia de la velocidad de la luz fue motivada por la teoría del electromagnetismo de Maxwell [13] y la falta de evidencia a favor del éter luminífero . [14] Existe evidencia contradictoria sobre hasta qué punto Einstein fue influenciado por el resultado nulo del experimento de Michelson-Morley. [15] [16] En cualquier caso, el resultado nulo del experimento de Michelson-Morley ayudó a que la noción de la constancia de la velocidad de la luz ganara una aceptación rápida y generalizada.
La derivación de la relatividad especial depende no sólo de estos dos postulados explícitos, sino también de varios supuestos tácitos ( hechos en casi todas las teorías de la física ), incluida la isotropía y homogeneidad del espacio y la independencia de las barras de medir y los relojes de su historia pasada. [página 6]
Tras la presentación original de Einstein de la relatividad especial en 1905, se han propuesto muchos conjuntos diferentes de postulados en diversas derivaciones alternativas. [17] Pero el conjunto de postulados más común sigue siendo el empleado por Einstein en su artículo original. Una declaración más matemática del principio de relatividad hecha más tarde por Einstein, que introduce el concepto de simplicidad no mencionado anteriormente es:
Principio especial de relatividad : si se elige un sistema de coordenadas K de modo que, en relación con él, las leyes físicas se cumplan en su forma más simple, las mismas leyes se aplicarán en relación con cualquier otro sistema de coordenadas K ′ que se mueva en traslación uniforme relativamente. a K. [18]
Henri Poincaré proporcionó el marco matemático para la teoría de la relatividad al demostrar que las transformaciones de Lorentz son un subconjunto de su grupo de transformaciones de simetría de Poincaré. Posteriormente, Einstein derivó estas transformaciones de sus axiomas.
Muchos de los artículos de Einstein presentan derivaciones de la transformación de Lorentz basadas en estos dos principios. [pág. 7]
Los marcos de referencia juegan un papel crucial en la teoría de la relatividad. El término marco de referencia, tal como se utiliza aquí, es una perspectiva de observación en el espacio que no sufre ningún cambio en el movimiento (aceleración), desde la cual se puede medir una posición a lo largo de 3 ejes espaciales (es decir, en reposo o a velocidad constante). Además, un sistema de referencia tiene la capacidad de determinar mediciones del tiempo de eventos utilizando un "reloj" (cualquier dispositivo de referencia con periodicidad uniforme).
Un evento es un suceso al que se le puede asignar un único momento y ubicación en el espacio con respecto a un marco de referencia: es un "punto" en el espacio-tiempo . Dado que la velocidad de la luz es constante en relatividad independientemente del marco de referencia, se pueden usar pulsos de luz para medir distancias sin ambigüedades y hacer referencia a las horas en que ocurrieron los eventos en el reloj, aunque la luz tarda en llegar al reloj después del evento. ha ocurrido.
Por ejemplo, la explosión de un petardo puede considerarse un "evento". Podemos especificar completamente un evento por sus cuatro coordenadas espacio-temporales: el momento en que ocurre y su ubicación espacial tridimensional definen un punto de referencia. Llamemos a este marco de referencia S.
En la teoría de la relatividad, a menudo queremos calcular las coordenadas de un evento a partir de diferentes marcos de referencia. Las ecuaciones que relacionan mediciones realizadas en diferentes marcos se denominan ecuaciones de transformación .
Para obtener una idea de cómo se comparan entre sí las coordenadas espacio-temporales medidas por los observadores en diferentes marcos de referencia , es útil trabajar con una configuración simplificada con marcos en una configuración estándar . [19] : 107 Con cuidado, esto permite la simplificación de las matemáticas sin pérdida de generalidad en las conclusiones a las que se llega. En la figura 2-1 se muestran dos sistemas de referencia galileanos (es decir, sistemas convencionales de tres espacios) en movimiento relativo. El cuadro S pertenece a un primer observador O , y el cuadro S ′ (pronunciado "S primo" o "S guión") pertenece a un segundo observador O ′ .
Dado que no existe un marco de referencia absoluto en la teoría de la relatividad, no existe estrictamente el concepto de "movimiento", ya que todo puede estar en movimiento con respecto a algún otro marco de referencia. En cambio, se dice que dos cuadros cualesquiera que se mueven a la misma velocidad en la misma dirección se mueven comodamente . Por lo tanto, S y S ′ no son comoving .
El principio de relatividad , que establece que las leyes físicas tienen la misma forma en cada sistema de referencia inercial , se remonta a Galileo y fue incorporado a la física newtoniana. Pero a finales del siglo XIX la existencia de ondas electromagnéticas llevó a algunos físicos a sugerir que el universo estaba lleno de una sustancia a la que llamaron " éter ", que, postularon, actuaría como medio a través del cual se propagarían estas ondas, o vibraciones ( en muchos aspectos similar a la forma en que el sonido se propaga a través del aire). Se pensaba que el éter era un marco de referencia absoluto contra el cual se podían medir todas las velocidades, y podía considerarse fijo e inmóvil en relación con la Tierra o algún otro punto de referencia fijo. Se suponía que el éter era lo suficientemente elástico para soportar ondas electromagnéticas, mientras que esas ondas podían interactuar con la materia, pero no ofrecían resistencia a los cuerpos que lo atravesaban (su única propiedad era que permitía que las ondas electromagnéticas se propagaran). Los resultados de varios experimentos, incluido el experimento de Michelson-Morley en 1887 (posteriormente verificado con experimentos más precisos e innovadores), llevaron a la teoría de la relatividad especial, al demostrar que el éter no existía. [20] La solución de Einstein fue descartar la noción de éter y el estado absoluto de reposo. En relatividad, cualquier sistema de referencia que se mueva con movimiento uniforme observará las mismas leyes de la física. En particular, la velocidad de la luz en el vacío siempre se mide como c , incluso cuando se mide mediante múltiples sistemas que se mueven a velocidades diferentes (pero constantes).
Partiendo únicamente del principio de la relatividad, sin asumir la constancia de la velocidad de la luz (es decir, utilizando la isotropía del espacio y la simetría implícitas en el principio de la relatividad especial), se puede demostrar que las transformaciones espacio-temporales entre marcos inerciales son euclidianas o galileanas. , o lorentziano. En el caso de Lorentz, se puede entonces obtener una conservación del intervalo relativista y una cierta velocidad límite finita. Los experimentos sugieren que esta velocidad es la velocidad de la luz en el vacío. [pág. 8] [21]
Einstein basó sistemáticamente la derivación de la invariancia de Lorentz (el núcleo esencial de la relatividad especial) sólo en los dos principios básicos de la relatividad y la invariancia de la velocidad de la luz. El escribio:
La idea fundamental para la teoría especial de la relatividad es la siguiente: los supuestos de la relatividad y la invariancia de la velocidad de la luz son compatibles si se postulan relaciones de un nuevo tipo ("transformación de Lorentz") para la conversión de coordenadas y tiempos de eventos... El principio universal de la teoría especial de la relatividad está contenida en el postulado: Las leyes de la física son invariantes con respecto a las transformaciones de Lorentz (para la transición de un sistema inercial a cualquier otro sistema inercial elegido arbitrariamente). Este es un principio restrictivo para las leyes naturales... [p 5]
Así, muchos tratamientos modernos de la relatividad especial la basan en el postulado único de la covarianza universal de Lorentz o, de manera equivalente, en el postulado único del espaciotiempo de Minkowski . [pág. 9] [pág. 10]
En lugar de considerar la covarianza de Lorentz universal como un principio derivado, este artículo la considera el postulado fundamental de la relatividad especial. El enfoque tradicional de los dos postulados de la relatividad especial se presenta en innumerables libros de texto universitarios y presentaciones populares. [22] Los libros de texto que comienzan con el postulado único del espacio-tiempo de Minkowski incluyen los de Taylor y Wheeler [23] y Callahan. [24] Este es también el enfoque seguido por los artículos de Wikipedia Espacio-tiempo y Diagrama de Minkowski .
Defina un evento para que tenga coordenadas espacio-temporales ( t , x , y , z ) en el sistema S y ( t ′ , x ′ , y ′ , z ′ ) en un sistema de referencia que se mueve a una velocidad v en el eje x con respecto a ese marco, S ′ . Entonces la transformación de Lorentz especifica que estas coordenadas están relacionadas de la siguiente manera: donde es el factor de Lorentz y c es la velocidad de la luz en el vacío, y la velocidad v de S ′ , relativa a S , es paralela al eje x . Por simplicidad, las coordenadas y y z no se ven afectadas; sólo se transforman las coordenadas x y t . Estas transformaciones de Lorentz forman un grupo de asignaciones lineales de un parámetro , llamado ese parámetro rapidez .
Resolver las cuatro ecuaciones de transformación anteriores para las coordenadas no preparadas produce la transformación inversa de Lorentz:
Esto muestra que el marco no preparado se mueve con la velocidad − v , medida en el marco preparado. [25]
No hay nada especial en el eje x . La transformación puede aplicarse al eje y o z , o incluso en cualquier dirección paralela al movimiento (que están deformadas por el factor γ ) y perpendicular; consulte el artículo Transformación de Lorentz para obtener más detalles.
Una cantidad invariante bajo transformaciones de Lorentz se conoce como escalar de Lorentz .
Escribiendo la transformación de Lorentz y su inversa en términos de diferencias de coordenadas, donde un evento tiene coordenadas ( x 1 , t 1 ) y ( x ′ 1 , t ′ 1 ) , otro evento tiene coordenadas ( x 2 , t 2 ) y ( x ′ 2 , t ′ 2 ) , y las diferencias se definen como
obtenemos
Si tomamos diferenciales en lugar de diferencias, obtenemos
Los diagramas de espacio-tiempo ( diagramas de Minkowski ) son una ayuda extremadamente útil para visualizar cómo se transforman las coordenadas entre diferentes sistemas de referencia. Aunque no es tan fácil realizar cálculos exactos usándolas como invocando directamente las transformaciones de Lorentz, su principal poder es su capacidad para proporcionar una comprensión intuitiva de los resultados de un escenario relativista. [21]
Para dibujar un diagrama espacio-temporal, comience considerando dos sistemas de referencia galileanos, S y S', en configuración estándar, como se muestra en la figura 2-1. [21] [26] : 155-199
Figura 3-1a . Dibuja los ejes y del cuadro S. El eje es horizontal y el eje (en realidad ) es vertical, lo cual es lo opuesto a la convención habitual en cinemática. El eje se escala mediante un factor de de modo que ambos ejes tengan unidades de longitud comunes. En el diagrama que se muestra, las líneas de la cuadrícula están espaciadas una unidad de distancia. Las líneas diagonales de 45° representan las líneas de mundo de dos fotones que pasan por el origen en el tiempo. La pendiente de estas líneas de mundo es 1 porque los fotones avanzan una unidad en el espacio por unidad de tiempo. Dos eventos, y se han trazado en este gráfico para que sus coordenadas puedan compararse en los marcos S y S'.
Figura 3-1b . Dibuje los ejes y del marco S'. El eje representa la línea mundial del origen del sistema de coordenadas S' medido en el cuadro S. En esta figura, tanto los ejes como están inclinados desde los ejes no preparados en un ángulo en el que los ejes preparados y no preparados comparten un origen común porque los cuadros S y S' se habían configurado en configuración estándar, de modo que cuando
Figura 3-1c . Las unidades en los ejes preparados tienen una escala diferente a la de las unidades en los ejes no preparados. A partir de las transformaciones de Lorentz, observamos que las coordenadas de en el sistema de coordenadas preparado se transforman en el sistema de coordenadas no preparado. Del mismo modo, las coordenadas del sistema de coordenadas preparado se transforman en el sistema no preparado. Dibuje líneas de cuadrícula paralelas al eje que pasa por los puntos medidos en el marco no preparado, donde es un número entero. Del mismo modo, dibuje líneas de cuadrícula paralelas al eje medido en el marco sin imprimación. Utilizando el teorema de Pitágoras, observamos que el espacio entre unidades es igual a multiplicado por el espacio entre unidades, medido en el cuadro S. Esta relación es siempre mayor que 1 y, en última instancia, se acerca al infinito como
Figura 3-1d . Dado que la velocidad de la luz es invariante, las líneas de mundo de dos fotones que pasan por el origen en el tiempo todavía se trazan como líneas diagonales de 45°. Las coordenadas preparadas de y están relacionadas con las coordenadas no preparadas a través de las transformaciones de Lorentz y podrían medirse aproximadamente a partir del gráfico (suponiendo que se haya trazado con suficiente precisión), pero el verdadero mérito de un diagrama de Minkowski es que nos otorga una vista geométrica de el escenario. Por ejemplo, en esta figura, observamos que los dos eventos separados en el tiempo que tenían diferentes coordenadas x en el marco no preparado ahora están en la misma posición en el espacio.
Mientras que el marco no preparado se dibuja con ejes de espacio y tiempo que se encuentran en ángulos rectos, el marco preparado se dibuja con ejes que se encuentran en ángulos agudos u obtusos. Esta asimetría se debe a distorsiones inevitables en cómo las coordenadas del espacio-tiempo se asignan a un plano cartesiano , pero los marcos son en realidad equivalentes.
Las consecuencias de la relatividad especial pueden derivarse de las ecuaciones de transformación de Lorentz . [27] Estas transformaciones, y por tanto la relatividad especial, conducen a predicciones físicas diferentes a las de la mecánica newtoniana en todas las velocidades relativas, y más pronunciadas cuando las velocidades relativas se vuelven comparables a la velocidad de la luz. La velocidad de la luz es mucho mayor que cualquier cosa que la mayoría de los humanos encuentren, por lo que algunos de los efectos predichos por la relatividad son inicialmente contrarios a la intuición .
En la relatividad galileana, la longitud de un objeto ( ) [nota 3] y la separación temporal entre dos eventos ( ) son invariantes independientes, cuyos valores no cambian cuando se observan desde diferentes marcos de referencia. [nota 4] [nota 5]
En la relatividad especial, sin embargo, el entrelazamiento de coordenadas espaciales y temporales genera el concepto de intervalo invariante , denotado como : [nota 6]
El entrelazamiento del espacio y el tiempo revoca los conceptos implícitamente asumidos de simultaneidad absoluta y sincronización a través de marcos no móviles.
La forma de ser la diferencia del lapso de tiempo al cuadrado y la distancia espacial al cuadrado demuestra una discrepancia fundamental entre las distancias euclidianas y el espacio-temporal. [nota 7] La invariancia de este intervalo es una propiedad de la transformada general de Lorentz (también llamada transformación de Poincaré ), convirtiéndola en una isometría del espacio-tiempo. La transformada de Lorentz general extiende la transformada de Lorentz estándar (que se ocupa de traslaciones sin rotación, es decir, impulsos de Lorentz , en la dirección x) con todas las demás traslaciones , reflexiones y rotaciones entre cualquier marco inercial cartesiano. [31] : 33–34
En el análisis de escenarios simplificados, como los diagramas espacio-temporales, a menudo se emplea una forma de dimensionalidad reducida del intervalo invariante:
Demostrar que el intervalo es invariante es sencillo para el caso de dimensionalidad reducida y con marcos en configuración estándar: [21]
Por tanto, el valor de es independiente del marco en el que se mide.
Al considerar el significado físico de , hay tres casos a tener en cuenta: [21] [32] : 25–39
Considere dos eventos que suceden en dos lugares diferentes y que ocurren simultáneamente en el sistema de referencia de un observador inercial. Pueden ocurrir de manera no simultánea en el marco de referencia de otro observador inercial (falta de simultaneidad absoluta ).
De la Ecuación 3 (la transformación directa de Lorentz en términos de diferencias de coordenadas)
Está claro que los dos eventos que son simultáneos en el marco S (que satisface Δ t = 0 ), no son necesariamente simultáneos en otro marco inercial S ′ (que satisface Δ t ′ = 0 ). Sólo si estos eventos son además co-locales en el marco S (que satisfacen Δ x = 0 ), serán simultáneos en otro marco S ′ .
El efecto Sagnac puede considerarse una manifestación de la relatividad de la simultaneidad. [33] Dado que la relatividad de la simultaneidad es un efecto de primer orden en , [21] los instrumentos basados en el efecto Sagnac para su funcionamiento, como los giroscopios láser de anillo y los giroscopios de fibra óptica , son capaces de alcanzar niveles extremos de sensibilidad. [pág. 14]
El lapso de tiempo entre dos eventos no es invariable de un observador a otro, sino que depende de las velocidades relativas de los marcos de referencia de los observadores.
Supongamos que un reloj está en reposo en el sistema no preparado S. La ubicación del reloj en dos tics diferentes se caracteriza entonces por Δ x = 0 . Para encontrar la relación entre los tiempos entre estos ticks medidos en ambos sistemas, se puede usar la Ecuación 3 para encontrar:
Esto muestra que el tiempo (Δ t ′ ) entre los dos tics como se ve en el cuadro en el que se mueve el reloj ( S ′ ), es más largo que el tiempo (Δ t ) entre estos tics medido en el cuadro de reposo del reloj ( S ). La dilatación del tiempo explica una serie de fenómenos físicos; por ejemplo, la vida útil de los muones de alta velocidad creados por la colisión de rayos cósmicos con partículas en la atmósfera exterior de la Tierra y que se mueven hacia la superficie es mayor que la vida útil de los muones que se mueven lentamente, creados y en descomposición en un laboratorio. [34]
Cada vez que uno escucha una afirmación en el sentido de que "los relojes en movimiento funcionan lento", uno debería imaginar un sistema de referencia inercial densamente poblado con relojes idénticos y sincronizados. A medida que un reloj en movimiento viaja a través de este conjunto, su lectura en cualquier punto particular se compara con la de un reloj estacionario en el mismo punto. [35] : 149-152
Las medidas que obtendríamos si mirásemos un reloj en movimiento, en general, no serían las mismas, porque el tiempo que veríamos se retrasaría por la velocidad finita de la luz, es decir, los tiempos que veríamos serían ser distorsionado por el efecto Doppler . Siempre debe entenderse que las mediciones de los efectos relativistas se han realizado después de haber excluido los efectos finitos de la velocidad de la luz. [35] : 149-152
Paul Langevin , uno de los primeros defensores de la teoría de la relatividad, hizo mucho para popularizar la teoría frente a la resistencia de muchos físicos a los conceptos revolucionarios de Einstein. Entre sus numerosas contribuciones a los fundamentos de la relatividad especial se encuentran trabajos independientes sobre la relación masa-energía, un examen exhaustivo de la paradoja de los gemelos e investigaciones sobre sistemas de coordenadas giratorias. Su nombre se asocia con frecuencia a una construcción hipotética llamada "reloj de luz" (desarrollada originalmente por Lewis y Tolman en 1909 [36] ) que utilizó para realizar una novedosa derivación de la transformación de Lorentz. [37]
Se imagina un reloj de luz como una caja de paredes perfectamente reflectantes en las que una señal luminosa se refleja hacia adelante y hacia atrás desde caras opuestas. El concepto de dilatación del tiempo se enseña frecuentemente utilizando un reloj de luz que viaja en un movimiento inercial uniforme perpendicular a una línea que conecta los dos espejos. [38] [39] [40] [41] (El propio Langevin hizo uso de un reloj de luz orientado paralelo a su línea de movimiento. [37] )
Considere el escenario ilustrado en la figura 4-3A. El observador A sostiene un reloj de luz de longitud así como un cronómetro electrónico con el que mide cuánto tiempo le toma a un pulso hacer un viaje de ida y vuelta hacia arriba y hacia abajo a lo largo del reloj de luz. Aunque el observador A viaja rápidamente a lo largo de un tren, desde su punto de vista la emisión y recepción del pulso ocurren en el mismo lugar, y mide el intervalo utilizando un único reloj ubicado en la posición precisa de estos dos eventos. Para el intervalo entre estos dos eventos, el observador A encuentra. Un intervalo de tiempo medido usando un solo reloj que está inmóvil en un marco de referencia particular se llama intervalo de tiempo propio . [42]
La figura 4-3B ilustra estos mismos dos eventos desde el punto de vista del observador B, quien está estacionado junto a las vías mientras el tren pasa a una velocidad de En lugar de hacer movimientos rectos hacia arriba y hacia abajo, el observador B ve los pulsos moviéndose a lo largo. una línea en zigzag. Sin embargo, debido al postulado de la constancia de la velocidad de la luz, la velocidad de los pulsos a lo largo de estas líneas diagonales es la misma que vio el observador A para sus pulsos hacia arriba y hacia abajo. B mide la velocidad del componente vertical de estos pulsos de modo que el tiempo total de ida y vuelta de los pulsos sea. Tenga en cuenta que para el observador B, la emisión y recepción del pulso de luz ocurrió en diferentes lugares, y midió el intervalo usando dos relojes estacionarios y sincronizados ubicados en dos posiciones diferentes en su sistema de referencia. Por lo tanto, el intervalo que B midió no era un intervalo de tiempo adecuado porque no lo midió con un solo reloj en reposo. [42]
En la descripción anterior del reloj de luz de Langevin, etiquetar a un observador como estacionario y al otro como en movimiento era completamente arbitrario. También se podría tener al observador B llevando el reloj de luz y moviéndose a una velocidad de hacia la izquierda, en cuyo caso el observador A percibiría que el reloj de B funciona más lento que su reloj local.
No hay aquí ninguna paradoja, porque no hay ningún observador independiente C que esté de acuerdo tanto con A como con B. El observador C necesariamente realiza sus mediciones desde su propio sistema de referencia. Si ese sistema de referencia coincide con el sistema de referencia de A, entonces C estará de acuerdo con la medida del tiempo de A. Si el sistema de referencia de C coincide con el sistema de referencia de B, entonces C coincidirá con la medición del tiempo de B. Si el marco de referencia de C no coincide ni con el marco de A ni con el marco de B, entonces la medición del tiempo de C no estará de acuerdo con la medición del tiempo de A y B. [43]
La reciprocidad de la dilatación del tiempo entre dos observadores en marcos inerciales separados conduce a la llamada paradoja de los gemelos , articulada en su forma actual por Langevin en 1911. [44] Langevin imaginó a un aventurero que deseaba explorar el futuro de la Tierra. Este viajero sube a bordo de un proyectil capaz de viajar al 99,995% de la velocidad de la luz. Después de realizar un viaje de ida y vuelta hacia y desde una estrella cercana que duró sólo dos años de su propia vida, regresa a una Tierra que es doscientos años mayor.
Este resultado parece desconcertante porque tanto el viajero como un observador terrestre verían al otro en movimiento y, por lo tanto, debido a la reciprocidad de la dilatación del tiempo, inicialmente se podría esperar que cada uno hubiera descubierto que el otro había envejecido menos. En realidad, no hay ninguna paradoja, porque para que los dos observadores comparen sus tiempos correctos, la simetría de la situación debe romperse: al menos uno de los dos observadores debe cambiar su estado de movimiento para igualarlo al del otro. [45]
Sin embargo, conocer la resolución general de la paradoja no permite calcular inmediatamente resultados cuantitativos correctos. En la literatura se han proporcionado muchas soluciones a este enigma y se han revisado en el artículo sobre la paradoja de los gemelos . A continuación examinaremos una de esas soluciones a la paradoja.
Nuestro objetivo básico será demostrar que, tras el viaje, ambos gemelos están perfectamente de acuerdo sobre quién envejece y cuánto, independientemente de sus diferentes experiencias. La figura 4-4 ilustra un escenario en el que el gemelo viajero vuela a 0,6 c hacia y desde una estrella a 3 ly de distancia. Durante el viaje, cada gemelo envía señales horarias anuales (medidas en sus propios tiempos) al otro. Después del viaje, se comparan los recuentos acumulados. En la fase de ida del viaje, cada gemelo recibe las señales del otro a la velocidad reducida de Inicialmente, la situación es perfectamente simétrica: obsérvese que cada gemelo recibe la señal anual del otro a los dos años medidos en su propio reloj. La simetría se rompe cuando la gemela viajera da la vuelta en la marca de los cuatro años medida por su reloj. Durante los cuatro años restantes de su viaje, recibe señales a una frecuencia aumentada. La situación es bastante diferente con el gemelo estacionario. Debido al retraso en la velocidad de la luz, no ve a su hermana darse la vuelta hasta que han pasado ocho años en su propio reloj. Por lo tanto, recibe señales de frecuencia mejorada de su hermana sólo durante un período relativamente breve. Aunque los gemelos no están de acuerdo en sus respectivas medidas de tiempo total, vemos en la siguiente tabla, así como por simple observación del diagrama de Minkowski, que cada gemelo está totalmente de acuerdo con el otro en cuanto al número total de señales enviadas desde uno. al otro. Por tanto, no hay ninguna paradoja. [35] : 152-159
Las dimensiones (p. ej., longitud) de un objeto medidas por un observador pueden ser menores que los resultados de las mediciones del mismo objeto realizadas por otro observador (p. ej., la paradoja de la escalera implica una escalera larga que viaja cerca de la velocidad de la luz y está contenida dentro de un garaje más pequeño).
De manera similar, supongamos que una varilla de medición está en reposo y alineada a lo largo del eje x en el sistema no cebado S. En este sistema, la longitud de esta varilla se escribe como Δ x . Para medir la longitud de esta varilla en el sistema S ′ , en el que la varilla se mueve, se deben medir simultáneamente las distancias x ′ a los puntos extremos de la varilla en ese sistema S ′ . En otras palabras, la medición se caracteriza por Δ t ′ = 0 , que se puede combinar con la Ecuación 4 para encontrar la relación entre las longitudes Δ x y Δ x ′ :
Esto muestra que la longitud (Δ x ′ ) de la varilla medida en el marco en el que se mueve ( S ′ ) es más corta que su longitud (Δ x ) en su propio marco de reposo ( S ).
La dilatación del tiempo y la contracción de la longitud no son meras apariencias. La dilatación del tiempo está explícitamente relacionada con nuestra forma de medir intervalos de tiempo entre eventos que ocurren en el mismo lugar en un sistema de coordenadas determinado (llamados eventos "co-locales"). Estos intervalos de tiempo (que pueden ser, y en realidad son, medidos experimentalmente por observadores relevantes) son diferentes en otro sistema de coordenadas que se mueve con respecto al primero, a menos que los eventos, además de ser co-locales, también sean simultáneos. De manera similar, la contracción de longitud se relaciona con nuestras distancias medidas entre eventos separados pero simultáneos en un sistema de coordenadas dado de elección. Si estos eventos no son co-locales, sino que están separados por una distancia (espacio), no ocurrirán a la misma distancia espacial entre sí cuando se los vea desde otro sistema de coordenadas en movimiento.
Considere dos marcos S y S ′ en configuración estándar. Una partícula en S se mueve en la dirección x con un vector velocidad ¿Cuál es su velocidad en el marco S ′ ?
Podemos escribir
Sustituyendo expresiones de y de la Ecuación 5 en la Ecuación 8 , seguidas de manipulaciones matemáticas sencillas y sustitución inversa de la Ecuación 7, se obtiene la transformación de Lorentz de la velocidad a :
La relación inversa se obtiene intercambiando los símbolos primos y no primos y reemplazándolos con
Para no alineado a lo largo del eje x, escribimos: [12] : 47–49
Las transformaciones directa e inversa para este caso son:
Se puede interpretar que las ecuaciones 10 y 14 dan la resultante de las dos velocidades y reemplazan la fórmula que es válida en la relatividad galileana. Interpretadas de esta manera, se las conoce comúnmente como fórmulas relativistas de adición (o composición) de velocidades , válidas para que los tres ejes de S y S ′ estén alineados entre sí (aunque no necesariamente en la configuración estándar). [12] : 47–49
Tomamos nota de los siguientes puntos:
No hay nada especial en la dirección x en la configuración estándar. El formalismo anterior se aplica a cualquier dirección; y tres direcciones ortogonales permiten tratar todas las direcciones en el espacio descomponiendo los vectores de velocidad en sus componentes en estas direcciones. Consulte Fórmula de suma de velocidades para obtener más detalles.
La composición de dos impulsos de Lorentz no colineales (es decir, dos transformaciones de Lorentz no colineales, ninguna de las cuales implica rotación) da como resultado una transformación de Lorentz que no es un impulso puro sino la composición de un impulso y una rotación.
La rotación de Thomas resulta de la relatividad de la simultaneidad. En la figura 4-5a, una varilla de longitud en su marco de reposo (es decir, que tiene una longitud adecuada de ) se eleva verticalmente a lo largo del eje y en el marco del suelo.
En la figura 4-5b, se observa la misma varilla desde la estructura de un cohete que se mueve con velocidad hacia la derecha. Si imaginamos dos relojes situados en los extremos izquierdo y derecho de la varilla que están sincronizados en el marco de la varilla , la relatividad de la simultaneidad hace que el observador en el marco del cohete observe (no vea) el reloj en el extremo derecho de la varilla. avanza en el tiempo y se observa correspondientemente que la varilla está inclinada. [32] : 98–99
A diferencia de los efectos relativistas de segundo orden, como la contracción de la longitud o la dilatación del tiempo, este efecto se vuelve bastante significativo incluso a velocidades bastante bajas. Por ejemplo, esto se puede ver en el giro de partículas en movimiento , donde la precesión de Thomas es una corrección relativista que se aplica al giro de una partícula elemental o a la rotación de un giroscopio macroscópico , relacionando la velocidad angular del giro de una partícula siguiendo una órbita curvilínea a la velocidad angular del movimiento orbital. [32] : 169-174
La rotación de Thomas proporciona la resolución a la conocida "paradoja del metro y el agujero". [pág. 15] [32] : 98–99
En la figura 4-6, el intervalo de tiempo entre los eventos A (la "causa") y B (el "efecto") es "temporal"; es decir, existe un marco de referencia en el que los eventos A y B ocurren en el mismo lugar en el espacio , separados sólo por ocurrir en momentos diferentes. Si A precede a B en ese cuadro, entonces A precede a B en todos los cuadros accesibles mediante una transformación de Lorentz. Es posible que la materia (o información) viaje (por debajo de la velocidad de la luz) desde la ubicación de A, comenzando en el momento de A, hasta la ubicación de B, llegando en el momento de B, por lo que puede haber una relación causal ( siendo A la causa y B el efecto).
El intervalo AC en el diagrama es "parecido a un espacio"; es decir, existe un marco de referencia en el que los eventos A y C ocurren simultáneamente, separados sólo en el espacio. También hay cuadros en los que A precede a C (como se muestra) y cuadros en los que C precede a A. Pero no se puede acceder a ningún cuadro mediante una transformación de Lorentz, en la que los eventos A y C ocurren en el mismo lugar. Si fuera posible que existiera una relación de causa y efecto entre los eventos A y C, se producirían paradojas de causalidad.
Por ejemplo, si las señales pudieran enviarse más rápido que la luz, entonces las señales podrían enviarse al pasado del emisor (observador B en los diagramas). [46] [p 16] Entonces se podrían construir una variedad de paradojas causales.
Considere los diagramas espacio-temporales de la figura 4-7. A y B se encuentran junto a una vía de ferrocarril, cuando pasa un tren de alta velocidad, con C viajando en el último vagón del tren y D viajando en el vagón principal. Las líneas mundiales de A y B son verticales ( ct ), lo que distingue la posición estacionaria de estos observadores en el suelo, mientras que las líneas mundiales de C y D están inclinadas hacia adelante ( ct ′ ), reflejando el rápido movimiento de los observadores C y D. parados en su tren, observados desde el suelo.
No es necesario que las señales sean instantáneas para violar la causalidad. Incluso si la señal de D a C fuera ligeramente más superficial que el eje (y la señal de A a B ligeramente más pronunciada que el eje), aún sería posible que B recibiera su mensaje antes de enviarlo. Al aumentar la velocidad del tren a velocidades cercanas a la de la luz, los ejes y se pueden acercar mucho a la línea discontinua que representa la velocidad de la luz. Con esta configuración modificada, se puede demostrar que incluso señales sólo un poco más rápidas que la velocidad de la luz darán lugar a una violación de la causalidad. [48]
Por lo tanto, si se quiere preservar la causalidad , una de las consecuencias de la relatividad especial es que ninguna señal de información u objeto material puede viajar más rápido que la luz en el vacío.
Esto no quiere decir que todo sea más rápido que la velocidad de la luz sea imposible. Se pueden describir varias situaciones triviales en las que algunas "cosas" (no materia o energía reales) se mueven más rápido que la luz. [49] Por ejemplo, el lugar donde el haz de una luz de búsqueda incide en la parte inferior de una nube puede moverse más rápido que la luz cuando la luz de búsqueda se gira rápidamente (aunque esto no viola la causalidad ni ningún otro fenómeno relativista). [50] [51]
En 1850, Hippolyte Fizeau y Léon Foucault establecieron de forma independiente que la luz viaja más lentamente en el agua que en el aire, validando así una predicción de la teoría ondulatoria de la luz de Fresnel e invalidando la predicción correspondiente de la teoría corpuscular de Newton . [52] La velocidad de la luz se midió en aguas tranquilas. ¿Cuál sería la velocidad de la luz en el agua que fluye?
En 1851, Fizeau llevó a cabo un experimento para responder a esta pregunta, cuya representación simplificada se ilustra en la figura 5-1. Un haz de luz se divide mediante un divisor de haz, y los haces divididos pasan en direcciones opuestas a través de un tubo de agua que fluye. Se recombinan para formar franjas de interferencia, lo que indica una diferencia en la longitud del camino óptico, que un observador puede ver. El experimento demostró que el arrastre de la luz por el agua que fluía provocaba un desplazamiento de las franjas, lo que demuestra que el movimiento del agua había afectado la velocidad de la luz.
Según las teorías predominantes en la época, la luz que viaja a través de un medio en movimiento sería una simple suma de su velocidad a través del medio más la velocidad del medio. Contrariamente a lo esperado, Fizeau descubrió que aunque la luz parecía ser arrastrada por el agua, la magnitud del arrastre era mucho menor de lo esperado. Si es la velocidad de la luz en aguas tranquilas, y es la velocidad del agua, y es la velocidad de la luz transmitida por el agua en el marco del laboratorio con el flujo de agua sumando o restando a la velocidad de la luz, entonces
Los resultados de Fizeau, aunque consistentes con la hipótesis anterior de Fresnel sobre el arrastre parcial del éter , fueron extremadamente desconcertantes para los físicos de la época. Entre otras cosas, la presencia de un índice de refracción significaba que, dado que depende de la longitud de onda, el éter debe ser capaz de sostener diferentes movimientos al mismo tiempo . [nota 8] Se propusieron una variedad de explicaciones teóricas para explicar el coeficiente de arrastre de Fresnel , que estaban completamente en desacuerdo entre sí. Incluso antes del experimento de Michelson-Morley, los resultados experimentales de Fizeau se encontraban entre una serie de observaciones que crearon una situación crítica para explicar la óptica de los cuerpos en movimiento. [53]
Desde el punto de vista de la relatividad especial, el resultado de Fizeau no es más que una aproximación a la Ecuación 10 , la fórmula relativista para la composición de velocidades. [31]
Debido a la velocidad finita de la luz, si los movimientos relativos de una fuente y un receptor incluyen una componente transversal, entonces la dirección desde la cual llega la luz al receptor se desplazará de la posición geométrica en el espacio de la fuente con respecto al receptor. El cálculo clásico del desplazamiento adopta dos formas y realiza predicciones diferentes dependiendo de si el receptor, la fuente o ambos están en movimiento con respecto al medio. (1) Si el receptor está en movimiento, el desplazamiento sería consecuencia de la aberración de la luz . El ángulo de incidencia del haz con respecto al receptor se podría calcular a partir de la suma vectorial de los movimientos del receptor y la velocidad de la luz incidente. [54] (2) Si la fuente está en movimiento, el desplazamiento sería consecuencia de la corrección del tiempo de luz . El desplazamiento de la posición aparente de la fuente respecto de su posición geométrica sería el resultado del movimiento de la fuente durante el tiempo que tarda su luz en llegar al receptor. [55]
La explicación clásica no pasó la prueba experimental. Dado que el ángulo de aberración depende de la relación entre la velocidad del receptor y la velocidad de la luz incidente, el paso de la luz incidente a través de un medio refractivo debería cambiar el ángulo de aberración. En 1810, Arago utilizó este fenómeno esperado en un intento fallido de medir la velocidad de la luz, [56] y en 1870, George Airy probó la hipótesis usando un telescopio lleno de agua y descubrió que, contra lo esperado, la aberración medida era idéntica a la aberración medida con un telescopio lleno de aire. [57] Un intento "engorroso" de explicar estos resultados utilizó la hipótesis de arrastre de éter parcial, [58] pero fue incompatible con los resultados del experimento de Michelson-Morley, que aparentemente exigía un arrastre de éter completo . [59]
Suponiendo marcos inerciales, la expresión relativista para la aberración de la luz es aplicable tanto al caso del receptor en movimiento como al de la fuente en movimiento. Se han publicado una variedad de fórmulas trigonométricamente equivalentes. Expresadas en términos de las variables de la figura 5-2, estas incluyen [31] : 57-60
El efecto Doppler clásico depende de si la fuente, el receptor o ambos están en movimiento con respecto al medio. El efecto Doppler relativista es independiente de cualquier medio. Sin embargo, el desplazamiento Doppler relativista para el caso longitudinal, con la fuente y el receptor acercándose o alejándose directamente uno del otro, puede derivarse como si fuera el fenómeno clásico, pero modificado añadiendo un término de dilatación del tiempo , y ese es el tratamiento. descrito aquí. [60] [61]
Suponga que el receptor y la fuente se están alejando uno del otro con una velocidad relativa medida por un observador en el receptor o la fuente (la convención de signos adoptada aquí es negativa si el receptor y la fuente se están moviendo uno hacia el otro). Suponga que la fuente está estacionaria en el medio. Entonces ¿dónde está la velocidad del sonido?
Para la luz, y con el receptor moviéndose a velocidades relativistas, los relojes del receptor están dilatados en relación con los relojes de la fuente. El receptor medirá la frecuencia recibida para estar donde
Se obtiene una expresión idéntica para el desplazamiento Doppler relativista cuando se realiza el análisis en el sistema de referencia del receptor con una fuente en movimiento. [62] [21]
El efecto Doppler transversal es una de las principales predicciones novedosas de la teoría especial de la relatividad.
Clásicamente, uno podría esperar que si la fuente y el receptor se mueven transversalmente uno con respecto al otro sin ningún componente longitudinal en sus movimientos relativos, no debería haber ningún desplazamiento Doppler en la luz que llega al receptor.
La relatividad especial predice lo contrario. La figura 5-3 ilustra dos variantes comunes de este escenario. Ambas variantes pueden analizarse utilizando argumentos simples de dilatación del tiempo. [21] En la figura 5-3a, el receptor observa que la luz de la fuente está desplazada hacia el azul en un factor de . En la figura 5-3b, la luz se desplaza al rojo en el mismo factor.
La dilatación del tiempo y la contracción de la longitud no son ilusiones ópticas, sino efectos genuinos. Las mediciones de estos efectos no son un artefacto del desplazamiento Doppler , ni son el resultado de no tener en cuenta el tiempo que tarda la luz en viajar desde un evento hasta un observador.
Los científicos hacen una distinción fundamental entre medición u observación , por un lado, y apariencia visual , o lo que uno ve . La forma medida de un objeto es una instantánea hipotética de todos los puntos del objeto tal como existen en un único momento en el tiempo. Pero la apariencia visual de un objeto se ve afectada por los diferentes tiempos que tarda la luz en viajar desde diferentes puntos del objeto hasta el ojo.
Durante muchos años, la distinción entre los dos no había sido apreciada en general, y generalmente se pensaba que un objeto de longitud contraída que pasara por un observador en realidad sería visto como de longitud contraída. En 1959, James Terrell y Roger Penrose señalaron de forma independiente que los efectos diferenciales de retardo de tiempo en las señales que llegan al observador desde las diferentes partes de un objeto en movimiento dan como resultado que la apariencia visual de un objeto en movimiento rápido sea bastante diferente de su forma medida. Por ejemplo, un objeto que se aleja parecería contraído, un objeto que se acerca parecería alargado y un objeto que pasa tendría una apariencia oblicua que se ha comparado con una rotación. [p 19] [p 20] [63] [64] Una esfera en movimiento conserva el contorno circular para todas las velocidades, para cualquier distancia y para todos los ángulos de visión, aunque la superficie de la esfera y las imágenes en ella aparecerán distorsionadas. . [65] [66]
Tanto la Fig. 5-4 como la Fig. 5-5 ilustran objetos que se mueven transversalmente a la línea de visión. En la figura 5-4, se ve un cubo desde una distancia de cuatro veces la longitud de sus lados. A altas velocidades, los lados del cubo que son perpendiculares a la dirección del movimiento tienen forma hiperbólica. En realidad, el cubo no gira. Más bien, la luz de la parte trasera del cubo tarda más en llegar a los ojos en comparación con la luz del frente, tiempo durante el cual el cubo se ha movido hacia la derecha. A altas velocidades, la esfera de la figura 5-5 adquiere la apariencia de un disco aplanado inclinado hasta 45° desde la línea de visión. Si los movimientos de los objetos no son estrictamente transversales sino que incluyen un componente longitudinal, se pueden observar distorsiones exageradas en la perspectiva. [67] Esta ilusión se conoce como rotación de Terrell o efecto Terrell-Penrose . [nota 9]
Otro ejemplo en el que la apariencia visual está reñida con la medición proviene de la observación del movimiento superluminal aparente en varias radiogalaxias , objetos BL Lac , cuásares y otros objetos astronómicos que expulsan chorros de materia de velocidad relativista en ángulos estrechos con respecto al espectador. Se produce una aparente ilusión óptica que da la apariencia de un viaje más rápido que la luz. [68] [69] [70] En la Fig. 5-6, la galaxia M87 lanza un chorro de partículas subatómicas a alta velocidad casi directamente hacia nosotros, pero la rotación de Penrose-Terrell hace que el chorro parezca moverse lateralmente en la misma dirección. manera que la apariencia del cubo en la figura 5-4 se ha alargado. [71]
La sección Consecuencias derivadas de la transformación de Lorentz trataba estrictamente de cinemática , el estudio del movimiento de puntos, cuerpos y sistemas de cuerpos sin considerar las fuerzas que provocaban el movimiento. Esta sección analiza masas, fuerzas, energía, etc., y como tal requiere la consideración de efectos físicos más allá de los abarcados por la propia transformación de Lorentz.
A medida que la velocidad de un objeto se acerca a la velocidad de la luz desde el punto de vista de un observador, su masa relativista aumenta, lo que hace cada vez más difícil acelerarlo desde dentro del marco de referencia del observador.
El contenido de energía de un objeto en reposo con masa m es igual a mc 2 . La conservación de energía implica que, en cualquier reacción, una disminución de la suma de las masas de las partículas debe ir acompañada de un aumento de las energías cinéticas de las partículas después de la reacción. De manera similar, la masa de un objeto se puede aumentar absorbiendo energías cinéticas.
Además de los artículos mencionados anteriormente, que dan derivaciones de la transformación de Lorentz y describen los fundamentos de la relatividad especial, Einstein también escribió al menos cuatro artículos dando argumentos heurísticos para la equivalencia (y transmutabilidad) de masa y energía, para E = mc 2 .
La equivalencia masa-energía es una consecuencia de la relatividad especial. La energía y el momento, que en la mecánica newtoniana están separados, forman un vector de cuatro en la relatividad, y esto relaciona la componente temporal (la energía) con la componente espacial (el momento) de una manera no trivial. Para un objeto en reposo, el cuatro vector energía-momento es ( E / c , 0, 0, 0) : tiene una componente de tiempo que es la energía y tres componentes espaciales que son cero. Al cambiar de marco con una transformación de Lorentz en la dirección x con un valor pequeño de la velocidad v, el cuatro-vector del momento de energía se convierte en ( E / c , Ev / c 2 , 0, 0) . El impulso es igual a la energía multiplicada por la velocidad dividida por c 2 . Como tal, la masa newtoniana de un objeto, que es la relación entre el impulso y la velocidad para velocidades lentas, es igual a E / c 2 .
La energía y el momento son propiedades de la materia y la radiación, y es imposible deducir que formen un cuádruple vector sólo a partir de los dos postulados básicos de la relatividad especial por sí solos, porque estos no hablan de materia ni de radiación, solo hablan de espacio y tiempo. Por lo tanto, la derivación requiere algún razonamiento físico adicional. En su artículo de 1905, Einstein utilizó los principios adicionales que la mecánica newtoniana debería mantener para velocidades lentas, de modo que haya un escalar de energía y un momento de tres vectores a velocidades lentas, y que la ley de conservación de la energía y el momento es exactamente cierta en la relatividad. . Además, supuso que la energía de la luz se transforma mediante el mismo factor de desplazamiento Doppler que su frecuencia, algo que ya había demostrado anteriormente basándose en las ecuaciones de Maxwell. [p 1] El primero de los artículos de Einstein sobre este tema fue "¿Depende la inercia de un cuerpo de su contenido energético?" en 1905. [p 21] Aunque el argumento de Einstein en este artículo es aceptado casi universalmente por los físicos como correcto, incluso evidente, muchos autores a lo largo de los años han sugerido que está equivocado. [72] Otros autores sugieren que el argumento simplemente no fue concluyente porque se basó en algunos supuestos implícitos. [73]
Einstein reconoció la controversia sobre su derivación en su artículo de 1907 sobre la relatividad especial. Allí señala que es problemático confiar en las ecuaciones de Maxwell para el argumento heurístico masa-energía. El argumento de su artículo de 1905 puede llevarse a cabo con la emisión de cualquier partícula sin masa, pero las ecuaciones de Maxwell se utilizan implícitamente para hacer obvio que la emisión de luz en particular sólo puede lograrse realizando trabajo. Para emitir ondas electromagnéticas lo único que hay que hacer es agitar una partícula cargada, y esta claramente está haciendo trabajo, por lo que la emisión es de energía. [pág. 22] [nota 10]
En el cuarto de sus artículos Annus mirabilis de 1905 , [p 21] Einstein presentó un argumento heurístico para la equivalencia de masa y energía. Aunque, como se discutió anteriormente, estudios posteriores han establecido que sus argumentos no alcanzaron una prueba ampliamente definitiva, las conclusiones a las que llegó en este artículo han resistido la prueba del tiempo.
Einstein tomó como supuestos iniciales su fórmula recientemente descubierta para el desplazamiento Doppler relativista , las leyes de conservación de la energía y la conservación del momento , y la relación entre la frecuencia de la luz y su energía, como lo implican las ecuaciones de Maxwell .
Figura 6-1 (arriba). Considere un sistema de ondas planas de luz que tienen una frecuencia que viaja en dirección relativa al eje x del sistema de referencia S. La frecuencia (y por lo tanto la energía) de las ondas medidas en el cuadro S ′ que se mueve a lo largo del eje x a velocidad viene dada por la fórmula relativista de desplazamiento Doppler que Einstein había desarrollado en su artículo de 1905 sobre la relatividad especial: [p 1]
Figura 6-1 (abajo). Considere un cuerpo arbitrario que está estacionario en el sistema de referencia S. Supongamos que este cuerpo emita un par de pulsos de luz de igual energía en direcciones opuestas formando un ángulo con respecto al eje x. Cada pulso tiene energía . Debido a la conservación del impulso, el cuerpo permanece estacionario en S después de la emisión de los dos pulsos. Sea la energía del cuerpo antes de la emisión de los dos pulsos y después de su emisión.
A continuación, considere el mismo sistema observado desde el cuadro S ′ que se mueve a lo largo del eje x a una velocidad relativa al cuadro S. En este cuadro, la luz de los pulsos directos e inversos tendrá un desplazamiento Doppler relativista. Sea la energía del cuerpo medida en el sistema de referencia S ′ antes de la emisión de los dos pulsos y después de su emisión. Obtenemos las siguientes relaciones: [p 21]
De las ecuaciones anteriores obtenemos lo siguiente:
Las dos diferencias de forma que se ven en la ecuación anterior tienen una interpretación física sencilla. Dado que y son las energías de un cuerpo arbitrario en los marcos móvil y estacionario, y representa las energías cinéticas de los cuerpos antes y después de la emisión de luz (excepto por una constante aditiva que fija el punto cero de la energía y que convencionalmente se establece en cero ). Por eso,
Tomando una expansión en serie de Taylor y despreciando términos de orden superior, obtuvo
Comparando la expresión anterior con la expresión clásica de energía cinética, KE = 1/2 mv 2 , Einstein observó entonces: "Si un cuerpo emite la energía L en forma de radiación, su masa disminuye en L / c 2 ".
Rindler ha observado que el argumento heurístico de Einstein sugería simplemente que la energía contribuye a la masa. En 1905, la cautelosa expresión de Einstein de la relación masa-energía permitió la posibilidad de que pudiera existir masa "dormida" que permaneciera detrás después de que se eliminara toda la energía de un cuerpo. Sin embargo, en 1907, Einstein estaba dispuesto a afirmar que toda masa inercial representaba una reserva de energía. "Para equiparar toda masa con energía se requería un acto de fe estética, muy característico de Einstein". [12] : 81–84 La audaz hipótesis de Einstein ha sido ampliamente confirmada en los años posteriores a su propuesta original.
Por diversas razones, la derivación original de Einstein rara vez se enseña en la actualidad. Además del vigoroso debate que continúa hasta el día de hoy sobre la corrección formal de su derivación original, el reconocimiento de la relatividad especial como lo que Einstein llamó una "teoría de principios" ha llevado a un alejamiento de la dependencia de los fenómenos electromagnéticos hacia métodos puramente dinámicos de prueba. [74]
Dado que nada puede viajar más rápido que la luz, se podría concluir que un ser humano nunca puede viajar más lejos de la Tierra que ~100 años luz. Se podría pensar fácilmente que un viajero nunca podría llegar a más que los pocos sistemas solares que existen dentro del límite de 100 años luz de la Tierra. Sin embargo, debido a la dilatación del tiempo, una hipotética nave espacial puede viajar miles de años luz durante la vida de un pasajero. Si se pudiera construir una nave espacial que acelerara a una velocidad constante de 1 g , después de un año viajaría casi a la velocidad de la luz vista desde la Tierra. Esto se describe mediante: donde v ( t ) es la velocidad en un tiempo t , a es la aceleración de la nave espacial y t es el tiempo coordinado medido por la gente en la Tierra. [p 23] Por lo tanto, después de un año de acelerar a 9,81 m/s 2 , la nave espacial viajará a v = 0,712 c y 0,946 c después de tres años, en relación con la Tierra. Después de tres años de esta aceleración, con la nave espacial alcanzando una velocidad del 94,6% de la velocidad de la luz en relación con la Tierra, la dilatación del tiempo dará como resultado que cada segundo experimentado en la nave espacial corresponda a 3,1 segundos de regreso a la Tierra. Durante su viaje, los habitantes de la Tierra experimentarán más tiempo que ellos, ya que sus relojes (todos fenómenos físicos) funcionarían realmente 3,1 veces más rápido que los de la nave espacial. Un viaje de ida y vuelta de cinco años le llevará 6,5 años terrestres y cubrirá una distancia de más de 6 años luz. Un viaje de ida y vuelta de 20 años para ellos (5 años acelerando, 5 desacelerando, dos veces cada uno) los llevará de regreso a la Tierra después de haber viajado durante 335 años terrestres y una distancia de 331 años luz. [75] Un viaje completo de 40 años a 1 g parecerá que en la Tierra durará 58.000 años y cubrirá una distancia de 55.000 años luz. Un viaje de 40 años a 1,1 g tardará 148.000 años terrestres y cubrirá unos 140.000 años luz. Un viaje de ida de 28 años (14 años acelerando, 14 desacelerando según lo medido con el reloj del astronauta) con una aceleración de 1 g podría alcanzar 2.000.000 de años luz hasta la galaxia de Andrómeda. [75] Esta misma dilatación del tiempo es la razón por la que se observa que un muón que viaja cerca de c viaja mucho más lejos que c veces su vida media (cuando está en reposo). [76]
El examen de los productos de colisión generados por los aceleradores de partículas en todo el mundo proporciona a los científicos pruebas de la estructura del mundo subatómico y las leyes naturales que lo gobiernan. El análisis de los productos de colisión, cuya suma de masas puede exceder ampliamente las masas de las partículas incidentes, requiere una relatividad especial. [77]
En la mecánica newtoniana, el análisis de colisiones implica el uso de las leyes de conservación de la masa , el momento y la energía . En la mecánica relativista, la masa no se conserva independientemente porque ha sido subsumida en la energía relativista total. Ilustramos las diferencias que surgen entre los tratamientos newtoniano y relativista de las colisiones de partículas examinando el caso simple de dos partículas perfectamente elásticas de igual masa en colisión. ( Las colisiones inelásticas se analizan en Leyes de conservación del espacio-tiempo . La desintegración radiactiva puede considerarse una especie de colisión inelástica invertida en el tiempo. [77] )
La dispersión elástica de partículas elementales cargadas se desvía de la idealidad debido a la producción de radiación Bremsstrahlung . [78] [79]
La figura 6-2 proporciona una demostración del resultado, familiar para los jugadores de billar, de que si una bola estacionaria es golpeada elásticamente por otra de la misma masa (suponiendo que no haya efecto lateral o "inglés"), luego de la colisión, las trayectorias divergentes de las dos bolas subtenderá un ángulo recto. (a) En el sistema estacionario, una esfera incidente que viaja a 2 v choca contra una esfera estacionaria. (b) En el centro del marco de momento, las dos esferas se acercan simétricamente en ± v . Después de la colisión elástica, las dos esferas rebotan entre sí con velocidades iguales y opuestas ± u . La conservación de energía requiere que | tu | = | v |. (c) Volviendo al marco estacionario, las velocidades de rebote son v ± u . El producto escalar ( v + u ) ⋅ ( v − u ) = v 2 − u 2 = 0 , indica que los vectores son ortogonales. [12] : 26-27
Considere el escenario de colisión elástica de la figura 6-3 entre una partícula en movimiento que choca con una partícula estacionaria de igual masa. A diferencia del caso newtoniano, el ángulo entre las dos partículas después de la colisión es inferior a 90°, depende del ángulo de dispersión y se vuelve cada vez más pequeño a medida que la velocidad de la partícula incidente se acerca a la velocidad de la luz:
El momento relativista y la energía relativista total de una partícula están dados por
La conservación del momento dicta que la suma de los momentos de la partícula entrante y la partícula estacionaria (que inicialmente tiene momento = 0) es igual a la suma de los momentos de las partículas emergentes:
Asimismo, la suma de las energías relativistas totales de la partícula entrante y la partícula estacionaria (que inicialmente tiene energía total mc 2 ) es igual a la suma de las energías totales de las partículas emergentes:
Descomponer ( 6-5 ) en sus componentes, reemplazarlos con los adimensionales y factorizar los términos comunes de ( 6-5 ) y ( 6-6 ) produce lo siguiente: [p 24]
De estos obtenemos las siguientes relaciones: [p 24]
Para el caso simétrico en el que y ( 6-12 ) adopta la forma más simple: [p 24]
Las transformaciones de Lorentz relacionan coordenadas de eventos en un sistema de referencia con las de otro sistema. La composición relativista de velocidades se utiliza para sumar dos velocidades. Las fórmulas para realizar estos últimos cálculos no son lineales, lo que las hace más complejas que las correspondientes fórmulas galileanas.
Esta no linealidad es un artefacto de nuestra elección de parámetros. [80] : 47–59 Anteriormente hemos observado que en un diagrama de espacio-tiempo x-ct , los puntos en algún intervalo de espacio-tiempo constante desde el origen forman una hipérbola invariante. También hemos observado que los sistemas de coordenadas de dos sistemas de referencia espacio-temporales en configuración estándar están rotados hiperbólicamente entre sí.
Las funciones naturales para expresar estas relaciones son las análogas hiperbólicas de las funciones trigonométricas . La figura 7-1a muestra un círculo unitario con sen( a ) y cos( a ), la única diferencia entre este diagrama y el familiar círculo unitario de la trigonometría elemental es que a se interpreta, no como el ángulo entre el rayo y x. -eje , pero como el doble del área del sector barrido por el rayo del eje x . Numéricamente, las medidas del ángulo y 2 × área del círculo unitario son idénticas. La figura 7-1b muestra una hipérbola unitaria con sinh( a ) y cosh( a ), donde a también se interpreta como el doble del área teñida. [81] La figura 7-2 presenta gráficos de las funciones sinh, cosh y tanh.
Para el círculo unitario, la pendiente del rayo está dada por
En el plano cartesiano, la rotación del punto ( x , y ) hacia el punto ( x ' , y ' ) mediante el ángulo θ viene dada por
En un diagrama de espacio-tiempo, el parámetro de velocidad es análogo a la pendiente. La rapidez , φ , está definida por [21] : 96–99
dónde
La rapidez definida anteriormente es muy útil en la relatividad especial porque muchas expresiones adoptan una forma considerablemente más simple cuando se expresan en términos de ella. Por ejemplo, la rapidez es simplemente aditiva en la fórmula colineal de suma de velocidades; [80] : 47–59
o en otras palabras,
Las transformaciones de Lorentz toman una forma simple cuando se expresan en términos de rapidez. El factor γ se puede escribir como
Las transformaciones que describen un movimiento relativo con velocidad uniforme y sin rotación de los ejes de coordenadas espaciales se denominan impulsos .
Sustituyendo γ y γβ en las transformaciones presentadas anteriormente y reescribiendo en forma matricial, el impulso de Lorentz en la dirección x puede escribirse como
y el impulso de Lorentz inverso en la dirección x puede escribirse como
En otras palabras, los impulsos de Lorentz representan rotaciones hiperbólicas en el espacio-tiempo de Minkowski. [21] : 96–99
Las ventajas del uso de funciones hiperbólicas son tales que algunos libros de texto como los clásicos de Taylor y Wheeler introducen su uso desde una etapa muy temprana. [80] [82] [nota 11]
Los cuatro vectores se han mencionado anteriormente en el contexto del 4 vectores de energía-momento , pero sin mucho énfasis. De hecho, ninguna de las derivaciones elementales de la relatividad especial los requiere. Pero una vez entendidos, los 4 vectores , y más generalmente los tensores , simplifican enormemente la comprensión matemática y conceptual de la relatividad especial. Trabajar exclusivamente con tales objetos conduce a fórmulas que son manifiestamente relativistas invariantes, lo cual es una ventaja considerable en contextos no triviales. Por ejemplo, demostrar la invariancia relativista de las ecuaciones de Maxwell en su forma habitual no es trivial, mientras que es simplemente un cálculo de rutina, en realidad no más que una observación, utilizando la formulación del tensor de intensidad de campo . [83]
Por otro lado, la relatividad general, desde el principio, se basa en gran medida en 4 vectores y, más generalmente, en tensores, que representan entidades físicamente relevantes. Relacionarlos mediante ecuaciones que no dependen de coordenadas específicas requiere tensores, capaces de conectar dichos 4 vectores incluso dentro de un espacio-tiempo curvo , y no solo dentro de uno plano como en la relatividad especial. El estudio de los tensores está fuera del alcance de este artículo, que proporciona sólo una discusión básica del espacio-tiempo.
Una tupla de 4, es un "vector de 4" si su componente Ai se transforma entre cuadros de acuerdo con la transformación de Lorentz.
Si usa coordenadas , A es un vector de 4 si se transforma (en la dirección x ) de acuerdo con
que surge simplemente reemplazando ct con A 0 y x con A 1 en la presentación anterior de la transformación de Lorentz.
Como es habitual, cuando escribimos x , t , etc. generalmente nos referimos a Δx , Δt , etc.
Los últimos tres componentes de un vector de 4 deben ser un vector estándar en un espacio tridimensional. Por lo tanto, un vector de 4 debe transformarse como bajo las transformaciones de Lorentz y las rotaciones. [84] : 36–59
Como se esperaba, los componentes finales de los 4 vectores anteriores son todos 3 vectores estándar correspondientes al 3-momento espacial , 3-fuerza , etc. [21] : 178–181 [84] : 36–59
El primer postulado de la relatividad especial declara la equivalencia de todos los sistemas inerciales. Una ley física que se cumple en un marco debe aplicarse en todos los marcos, ya que de lo contrario sería posible diferenciar entre marcos. Los momentos newtonianos no se comportan adecuadamente bajo la transformación de Lorentz, y Einstein prefirió cambiar la definición de momento a una que involucrara 4 vectores en lugar de renunciar a la conservación del momento.
Las leyes físicas deben basarse en construcciones que sean independientes del marco. Esto significa que las leyes físicas pueden tomar la forma de ecuaciones que conectan escalares, que siempre son independientes del marco. Sin embargo, las ecuaciones que involucran 4 vectores requieren el uso de tensores con rango apropiado, que a su vez pueden considerarse construidos a partir de 4 vectores . [21] : 186
Es un error común pensar que la relatividad especial es aplicable sólo a sistemas inerciales y que es incapaz de manejar objetos en aceleración o sistemas de referencia en aceleración. En realidad, los objetos en aceleración generalmente se pueden analizar sin necesidad de tratar en absoluto con fotogramas en aceleración. Sólo cuando la gravitación es significativa se requiere la relatividad general. [85]
Sin embargo, el manejo adecuado de cuadros en aceleración requiere cierto cuidado. La diferencia entre la relatividad especial y la general es que (1) En la relatividad especial, todas las velocidades son relativas, pero la aceleración es absoluta. (2) En la relatividad general, todo movimiento es relativo, ya sea inercial, acelerado o giratorio. Para dar cabida a esta diferencia, la relatividad general utiliza el espacio-tiempo curvo. [85]
En esta sección, analizamos varios escenarios que involucran sistemas de referencia acelerados.
La paradoja de la nave espacial Dewan-Beran-Bell ( paradoja de la nave espacial de Bell ) es un buen ejemplo de un problema en el que el razonamiento intuitivo sin la ayuda de la visión geométrica del enfoque del espacio-tiempo puede generar problemas.
En la figura 7-4, dos naves espaciales idénticas flotan en el espacio y están en reposo una respecto de la otra. Están conectados por una cuerda que sólo es capaz de estirarse un poco antes de romperse. En un instante dado en nuestro marco, el marco del observador, ambas naves espaciales aceleran en la misma dirección a lo largo de la línea entre ellas con la misma aceleración propia constante. [nota 12] ¿Se romperá la cuerda?
Cuando la paradoja era nueva y relativamente desconocida, incluso los físicos profesionales tuvieron dificultades para encontrar la solución. Dos líneas de razonamiento conducen a conclusiones opuestas. Ambos argumentos, que se presentan a continuación, son erróneos aunque uno de ellos dé la respuesta correcta. [21] : 106, 120-122
El problema con el primer argumento es que no existe una "estructura de las naves espaciales". No puede haberlo, porque las dos naves espaciales miden una distancia cada vez mayor entre ambas. Como no existe una estructura común para las naves espaciales, la longitud de la cuerda no está bien definida. Sin embargo, la conclusión es correcta y el argumento es en gran medida correcto. El segundo argumento, sin embargo, ignora por completo la relatividad de la simultaneidad. [21] : 106, 120-122
Un diagrama espacio-temporal (figura 7-5) hace evidente casi de inmediato la solución correcta a esta paradoja. Dos observadores en el espacio-tiempo de Minkowski aceleran con una aceleración de magnitud constante durante el tiempo adecuado (aceleración y tiempo transcurrido medidos por los propios observadores, no por algún observador inercial). Son comomovientes e inerciales antes y después de esta fase. En geometría de Minkowski, la longitud a lo largo de la línea de simultaneidad resulta ser mayor que la longitud a lo largo de la línea de simultaneidad .
El aumento de longitud se puede calcular con la ayuda de la transformación de Lorentz. Si, como se ilustra en la Fig. 7-5, la aceleración finaliza, los barcos permanecerán en un desplazamiento constante en algún cuadro. Si y son las posiciones de los barcos en las posiciones del cuadro son: [86]
La "paradoja", por así decirlo, proviene de la forma en que Bell construyó su ejemplo. En la discusión habitual sobre la contracción de Lorentz, la longitud en reposo es fija y la longitud en movimiento se acorta según se mide en el marco . Como se muestra en la figura 7-5, el ejemplo de Bell afirma que las longitudes en movimiento y medidas en el marco deben ser fijas, forzando así a que aumente la longitud del marco en reposo en el marco .
Ciertas configuraciones de problemas de relatividad especial pueden conducir a una comprensión de los fenómenos normalmente asociados con la relatividad general, como los horizontes de sucesos . En el texto que acompaña a la sección "Hipérbola invariante" del artículo Espacio-tiempo , las hipérbolas magenta representaban caminos reales que sigue un viajero en constante aceleración en el espacio-tiempo. Durante los períodos de aceleración positiva, la velocidad del viajero se acerca a la velocidad de la luz, mientras que, medida en nuestro marco, la aceleración del viajero disminuye constantemente.
La figura 7-6 detalla varias características de los movimientos del viajero con más especificidad. En cualquier momento dado, su eje espacial está formado por una línea que pasa por el origen y su posición actual en la hipérbola, mientras que su eje temporal es la tangente a la hipérbola en su posición. El parámetro de velocidad se acerca a un límite de uno a medida que aumenta. Asimismo, se acerca al infinito.
La forma de la hipérbola invariante corresponde a una trayectoria de aceleración propia constante. Esto se puede demostrar de la siguiente manera:
La figura 7-6 ilustra un escenario calculado específico. Terence (A) y Stella (B) inicialmente se encuentran juntos a 100 horas luz del origen. Stella despega en el tiempo 0 y su nave espacial acelera a 0,01 c por hora. Cada veinte horas, Terence envía por radio actualizaciones a Stella sobre la situación en casa (líneas verdes continuas). Stella recibe estas transmisiones regulares, pero la distancia cada vez mayor (compensada en parte por la dilatación del tiempo) hace que reciba las comunicaciones de Terence cada vez más tarde según lo medido en su reloj, y nunca recibe ninguna comunicación de Terence después de 100 horas en su reloj (línea verde discontinua). líneas). [87] : 110-113
Después de 100 horas según el reloj de Terence, Stella entra en una región oscura. Ha viajado fuera del futuro temporal de Terence. Por otro lado, Terence puede seguir recibiendo los mensajes de Stella indefinidamente. Sólo tiene que esperar lo suficiente. El espacio-tiempo se ha dividido en distintas regiones separadas por un aparente horizonte de sucesos. Mientras Stella siga acelerando, nunca podrá saber qué sucede detrás de este horizonte. [87] : 110-113
La investigación teórica del electromagnetismo clásico condujo al descubrimiento de la propagación de ondas. Las ecuaciones que generalizan los efectos electromagnéticos encontraron que la velocidad de propagación finita de los campos E y B requería ciertos comportamientos en las partículas cargadas. El estudio general de las cargas en movimiento forma el potencial de Liénard-Wiechert , que es un paso hacia la relatividad especial.
La transformación de Lorentz del campo eléctrico de una carga en movimiento en el marco de referencia de un observador inmóvil da como resultado la aparición de un término matemático comúnmente llamado campo magnético . Por el contrario, el campo magnético generado por una carga en movimiento desaparece y se convierte en un campo puramente electrostático en un marco de referencia en movimiento. Por tanto , las ecuaciones de Maxwell son simplemente un ajuste empírico a los efectos relativistas especiales en un modelo clásico del Universo. Como los campos eléctricos y magnéticos dependen del marco de referencia y, por lo tanto, están entrelazados, se habla de campos electromagnéticos . La relatividad especial proporciona las reglas de transformación de cómo un campo electromagnético en un sistema inercial aparece en otro sistema inercial.
Las ecuaciones de Maxwell en forma tridimensional ya son consistentes con el contenido físico de la relatividad especial, aunque son más fáciles de manipular en una forma manifiestamente covariante , es decir, en el lenguaje del cálculo tensorial . [83]
La relatividad especial se puede combinar con la mecánica cuántica para formar la mecánica cuántica relativista y la electrodinámica cuántica . Cómo unificar la relatividad general y la mecánica cuántica es uno de los problemas no resueltos de la física ; La gravedad cuántica y una " teoría del todo ", que requieren una unificación que incluya también la relatividad general, son áreas activas y en curso en la investigación teórica.
El primer modelo atómico de Bohr-Sommerfeld explicaba la estructura fina de los átomos de metales alcalinos utilizando tanto la relatividad especial como los conocimientos preliminares sobre la mecánica cuántica de la época. [88]
En 1928, Paul Dirac construyó una influyente ecuación de onda relativista , ahora conocida como ecuación de Dirac en su honor, [p. 25] que es totalmente compatible tanto con la relatividad especial como con la versión final de la teoría cuántica existente después de 1926. Esta ecuación no sólo describió el momento angular intrínseco de los electrones llamado espín , también condujo a la predicción de la antipartícula del electrón (el positrón ), [p 25] [p 26] y la estructura fina sólo pudo explicarse completamente con la relatividad especial. Fue el primer fundamento de la mecánica cuántica relativista .
Por otro lado, la existencia de antipartículas lleva a la conclusión de que la mecánica cuántica relativista no es suficiente para una teoría más precisa y completa de las interacciones entre partículas. En cambio, se hace necesaria una teoría de partículas interpretadas como campos cuantificados, llamada teoría cuántica de campos ; en el que se pueden crear y destruir partículas a lo largo del espacio y el tiempo.
La relatividad especial en su espacio-tiempo de Minkowski es exacta sólo cuando el valor absoluto del potencial gravitacional es mucho menor que c 2 en la región de interés. [89] En un campo gravitacional fuerte, se debe utilizar la relatividad general . La relatividad general se convierte en relatividad especial en el límite de un campo débil. En escalas muy pequeñas, como la longitud de Planck e inferiores, se deben tener en cuenta los efectos cuánticos que dan como resultado la gravedad cuántica . Pero a escalas macroscópicas y en ausencia de campos gravitacionales fuertes, la relatividad especial se prueba experimentalmente con un grado de precisión extremadamente alto (10 −20 ) [90] y, por lo tanto, es aceptada por la comunidad física. Los resultados experimentales que parecen contradecirlo no son reproducibles y, por lo tanto, se cree ampliamente que se deben a errores experimentales. [91]
La relatividad especial es matemáticamente autoconsistente y es una parte orgánica de todas las teorías físicas modernas, más notablemente la teoría cuántica de campos , la teoría de cuerdas y la relatividad general (en el caso límite de campos gravitacionales insignificantes).
La mecánica newtoniana se deriva matemáticamente de la relatividad especial a velocidades pequeñas (en comparación con la velocidad de la luz); por lo tanto, la mecánica newtoniana puede considerarse como una relatividad especial de cuerpos que se mueven lentamente. Consulte la mecánica clásica para una discusión más detallada.
Varios experimentos anteriores al artículo de Einstein de 1905 se interpretan ahora como evidencia de la relatividad. De estos, se sabe que Einstein estaba al tanto del experimento de Fizeau antes de 1905, [92] y los historiadores han concluido que Einstein al menos estaba al tanto del experimento de Michelson-Morley ya en 1899, a pesar de las afirmaciones que hizo en sus últimos años de que no desempeñaba ningún papel. papel en el desarrollo de la teoría. [dieciséis]
Los aceleradores de partículas aceleran y miden las propiedades de las partículas que se mueven casi a la velocidad de la luz, donde su comportamiento es consistente con la teoría de la relatividad e inconsistente con la mecánica newtoniana anterior . Estas máquinas simplemente no funcionarían si no estuvieran diseñadas según principios relativistas. Además, se han realizado un número considerable de experimentos modernos para comprobar la relatividad especial. Algunos ejemplos:
La relatividad especial utiliza un espacio de Minkowski "plano" de 4 dimensiones, un ejemplo de espacio-tiempo . El espacio-tiempo de Minkowski parece ser muy similar al espacio euclidiano tridimensional estándar , pero existe una diferencia crucial con respecto al tiempo.
En el espacio 3D, el diferencial de distancia (elemento de línea) ds se define por donde d x = ( dx 1 , dx 2 , dx 3 ) son los diferenciales de las tres dimensiones espaciales. En la geometría de Minkowski, hay una dimensión extra con la coordenada X 0 derivada del tiempo, de modo que se cumple el diferencial de distancia donde d X = ( dX 0 , dX 1 , dX 2 , dX 3 ) son los diferenciales de las cuatro dimensiones del espacio-tiempo. Esto sugiere una profunda idea teórica: la relatividad especial es simplemente una simetría rotacional de nuestro espacio-tiempo, análoga a la simetría rotacional del espacio euclidiano (ver figura 10-1). [94] Así como el espacio euclidiano utiliza una métrica euclidiana , el espacio-tiempo utiliza una métrica de Minkowski .Básicamente, la relatividad especial se puede expresar como la invariancia de cualquier intervalo de espacio-tiempo (es decir, la distancia 4D entre dos eventos cualesquiera) cuando se ve desde cualquier sistema de referencia inercial . Todas las ecuaciones y efectos de la relatividad especial pueden derivarse de esta simetría rotacional (el grupo de Poincaré ) del espaciotiempo de Minkowski.
La forma real de ds anterior depende de la métrica y de las elecciones para la coordenada X 0 . Para que la coordenada de tiempo se parezca a las coordenadas del espacio, se puede tratar como imaginaria : X 0 = ict (esto se llama rotación de Wick ). Según Misner, Thorne y Wheeler (1971, §2.3), en última instancia, la comprensión más profunda de la relatividad especial y general vendrá del estudio de la métrica de Minkowski (descrita a continuación) y de tomar X 0 = ct , en lugar de una "disfrazada". "Métrica euclidiana utilizando las tic como coordenada temporal.
Algunos autores utilizan X 0 = t , con factores de c en otros lugares para compensar; por ejemplo, las coordenadas espaciales se dividen por c o se incluyen factores de c ±2 en el tensor métrico. [95] Estas numerosas convenciones pueden ser reemplazadas mediante el uso de unidades naturales donde c = 1 . Entonces el espacio y el tiempo tienen unidades equivalentes y no aparecen factores de c en ninguna parte.
Si reducimos las dimensiones espaciales a 2, para que podamos representar la física en un espacio 3D, veremos que las geodésicas nulas se encuentran a lo largo de un cono dual (ver Fig. 10-2) definido por la ecuación; o simplemente cuál es la ecuación de una circunferencia de radio c dt .
Si extendemos esto a tres dimensiones espaciales, las geodésicas nulas son el cono de 4 dimensiones: entonces
Como se ilustra en la figura 10-3, las geodésicas nulas se pueden visualizar como un conjunto de esferas concéntricas continuas con radios = c dt .
Este cono dual nulo representa la "línea de visión" de un punto en el espacio. Es decir, cuando miramos las estrellas y decimos "La luz de esa estrella que estoy recibiendo tiene X años", estamos mirando hacia abajo en esta línea de visión: una geodésica nula. Estamos ante un evento lejano y en un tiempo d/c en el pasado. Por este motivo, el cono dual nulo también se conoce como "cono de luz". (El punto en la parte inferior izquierda de la Fig. 10-2 representa la estrella, el origen representa al observador y la línea representa la "línea de visión" geodésica nula).
El cono en la región − t es la información que el punto está "recibiendo", mientras que el cono en la sección + t es la información que el punto está "enviando".
La geometría del espacio de Minkowski se puede representar utilizando diagramas de Minkowski , que también son útiles para comprender muchos de los experimentos mentales de la relatividad especial.
Arriba, la transformación de Lorentz para la coordenada temporal y tres coordenadas espaciales ilustra que están entrelazadas. Esto es cierto en términos más generales: ciertos pares de cantidades "temporales" y "espaciales" se combinan naturalmente en pie de igualdad bajo la misma transformación de Lorentz.
La transformación de Lorentz en la configuración estándar anterior, es decir, para un impulso en la dirección x , se puede reformular en forma matricial de la siguiente manera:
En la mecánica newtoniana, las cantidades que tienen magnitud y dirección se describen matemáticamente como vectores tridimensionales en el espacio euclidiano y, en general, están parametrizadas por el tiempo. En la relatividad especial, esta noción se amplía sumando la cantidad temporal apropiada a una cantidad vectorial espacial, y tenemos vectores 4d, o " cuatro vectores ", en el espacio-tiempo de Minkowski. Las componentes de los vectores se escriben utilizando notación de índice tensorial , ya que esto tiene numerosas ventajas. La notación deja claro que las ecuaciones son manifiestamente covariantes bajo el grupo de Poincaré , evitando así los tediosos cálculos para comprobar este hecho. Al construir tales ecuaciones, a menudo encontramos que ecuaciones que antes se pensaba que no estaban relacionadas, en realidad están estrechamente relacionadas y forman parte de la misma ecuación tensorial. Reconocer otras cantidades físicas como tensores simplifica sus leyes de transformación. En todo momento, los índices superiores (superíndices) son índices contravariantes en lugar de exponentes, excepto cuando indican un cuadrado (esto debe quedar claro por el contexto), y los índices inferiores (subíndices) son índices covariantes. Por simplicidad y coherencia con las ecuaciones anteriores, se utilizarán coordenadas cartesianas.
El ejemplo más simple de un cuatro vectores es la posición de un evento en el espacio-tiempo, que constituye una componente temporal ct y una componente espacial x = ( x , y , z ) , en una posición contravariante de cuatro vectores con componentes: donde definimos X 0 = ct para que la coordenada temporal tenga la misma dimensión de distancia que las otras dimensiones espaciales; para que el espacio y el tiempo sean tratados por igual. [96] [97] [98] Ahora la transformación de los componentes contravariantes del 4-vector de posición se puede escribir de forma compacta como: donde hay una suma implícita de 0 a 3, y es una matriz .
De manera más general, todos los componentes contravariantes de una transformación de cuatro vectores de un cuadro a otro mediante una transformación de Lorentz :
Ejemplos de otros 4 vectores incluyen las cuatro velocidades definidas como la derivada del 4 vectores de posición con respecto al tiempo propio : donde el factor de Lorentz es:
La energía relativista y el impulso relativista de un objeto son respectivamente los componentes temporales y espaciales de un vector contravariante de cuatro momentos : donde m es la masa invariante .
La cuarta aceleración es la derivada temporal propia de la cuarta velocidad:
Las reglas de transformación para velocidades y aceleraciones tridimensionales son muy complicadas ; Incluso arriba, en la configuración estándar, las ecuaciones de velocidad son bastante complicadas debido a su no linealidad. Por otro lado, la transformación de cuatro velocidades y cuatro aceleraciones es más sencilla mediante la matriz de transformación de Lorentz.
El cuatro gradiente de un campo escalar φ se transforma de forma covariante en lugar de contravariante: que es la transposición de: solo en coordenadas cartesianas. Es la derivada covariante la que se transforma en covarianza manifiesta, en coordenadas cartesianas esto pasa a reducirse a las derivadas parciales, pero no en otras coordenadas.
De manera más general, los componentes covariantes de una transformada de 4 vectores según la transformación inversa de Lorentz: donde está la matriz recíproca de .
Los postulados de la relatividad especial limitan la forma exacta que toman las matrices de transformación de Lorentz.
De manera más general, la mayoría de las cantidades físicas se describen mejor como (componentes de) tensores . Entonces, para transformar de un marco a otro, usamos la conocida ley de transformación tensorial [99] donde es la matriz recíproca de . Todos los tensores se transforman según esta regla.
Un ejemplo de tensor antisimétrico de segundo orden de cuatro dimensiones es el momento angular relativista , que tiene seis componentes: tres son el momento angular clásico , y los otros tres están relacionados con el impulso del centro de masa del sistema. La derivada del momento angular relativista con respecto al tiempo propio es el par relativista, también tensor antisimétrico de segundo orden .
El tensor de campo electromagnético es otro tensor de campo antisimétrico de segundo orden , con seis componentes: tres para el campo eléctrico y otros tres para el campo magnético . También existe el tensor de tensión-energía para el campo electromagnético, es decir, el tensor de tensión-energía electromagnética .
El tensor métrico permite definir el producto interno de dos vectores, lo que a su vez permite asignar una magnitud al vector. Dada la naturaleza cuatridimensional del espacio-tiempo, la métrica de Minkowski η tiene componentes (válidas con coordenadas elegidas adecuadamente) que pueden organizarse en una matriz de 4 × 4 : que es igual a su recíproco, , en esos marcos. En todo momento usamos los signos como se indicó anteriormente, diferentes autores usan diferentes convenciones; consulte los signos alternativos métricos de Minkowski .
El grupo de Poincaré es el grupo más general de transformaciones que preserva la métrica de Minkowski: y ésta es la simetría física que subyace a la relatividad especial.
La métrica se puede utilizar para subir y bajar índices en vectores y tensores. Las invariantes se pueden construir usando la métrica, el producto interno de un T de 4 vectores con otro S de 4 vectores es:
Invariante significa que toma el mismo valor en todos los marcos inerciales, porque es un escalar (tensor de rango 0), por lo que no aparece Λ en su transformación trivial. La magnitud del 4-vector T es la raíz cuadrada positiva del producto interno consigo mismo:
Se puede extender esta idea a tensores de orden superior; para un tensor de segundo orden podemos formar las invariantes: de manera similar para tensores de orden superior. Las expresiones invariantes, particularmente los productos internos de 4 vectores consigo mismos, proporcionan ecuaciones que son útiles para los cálculos, porque no es necesario realizar transformaciones de Lorentz para determinar las invariantes.
Los diferenciales de coordenadas se transforman también de forma contravariante: por lo tanto, la longitud al cuadrado del diferencial del cuatro vector de posición dX μ construido usando es un invariante. Observe que cuando el elemento lineal d X 2 es negativo, √ − d X 2 es el diferencial del tiempo adecuado , mientras que cuando d X 2 es positivo, √ d X 2 es el diferencial de la distancia adecuada .
La U μ de 4 velocidades tiene una forma invariante: lo que significa que todos los cuatro vectores de velocidad tienen una magnitud de c . Esta es una expresión del hecho de que no existe el reposo coordinado en la relatividad: al menos, siempre estás avanzando en el tiempo. Diferenciar la ecuación anterior por τ produce: Entonces, en la relatividad especial, los cuatro vectores de aceleración y los cuatro vectores de velocidad son ortogonales.
La magnitud invariante del 4-vector de impulso genera la relación energía-momento :
Podemos determinar cuál es este invariante argumentando primero que, dado que es un escalar, no importa en qué marco de referencia lo calculemos, y luego transformándolo a un marco donde el impulso total sea cero.
Vemos que la energía en reposo es un invariante independiente. Se puede calcular una energía en reposo incluso para partículas y sistemas en movimiento, traduciéndola a un marco en el que el impulso es cero.
La energía en reposo está relacionada con la masa según la célebre ecuación comentada anteriormente:
La masa de los sistemas medida en su marco de impulso (donde el impulso total es cero) viene dada por la energía total del sistema en este marco. Puede que no sea igual a la suma de las masas individuales del sistema medidas en otros marcos.
Para utilizar la tercera ley del movimiento de Newton , ambas fuerzas deben definirse como la tasa de cambio del impulso con respecto a la misma coordenada de tiempo. Es decir, requiere la fuerza 3D definida anteriormente. Desafortunadamente, no existe ningún tensor en 4D que contenga entre sus componentes las componentes del vector de fuerza 3D.
Si una partícula no viaja en c , se puede transformar la fuerza 3D del sistema de referencia en movimiento conjunto de la partícula al sistema de referencia del observador. Esto produce un vector de 4 llamado cuatro fuerzas . Es la tasa de cambio del cuatro vector de impulso de energía anterior con respecto al tiempo adecuado. La versión covariante de las cuatro fuerzas es:
En el marco de reposo del objeto, el componente de tiempo de las cuatro fuerzas es cero a menos que la " masa invariante " del objeto esté cambiando (esto requiere un sistema no cerrado en el que la energía/masa se agrega o elimina directamente del objeto). objeto) en cuyo caso es el negativo de esa tasa de cambio de masa, multiplicado por c . Sin embargo, en general, las componentes de las cuatro fuerzas no son iguales a las componentes de las tres fuerzas, porque las tres fuerzas se definen por la tasa de cambio del impulso con respecto al tiempo coordinado, es decir, dp / dt mientras las cuatro fuerzas se definen por la tasa de cambio del impulso con respecto al tiempo adecuado, es decir, dp / dτ .
En un medio continuo, la densidad de fuerza 3D se combina con la densidad de potencia para formar un 4-vector covariante. La parte espacial es el resultado de dividir la fuerza sobre una celda pequeña (en 3 espacios) por el volumen de esa celda. El componente de tiempo es −1/ c veces la potencia transferida a esa celda dividida por el volumen de la celda. Esto se utilizará más adelante en la sección sobre electromagnetismo.
{{cite book}}
: CS1 maint: multiple names: authors list (link)Taylor
was invoked but never defined (see the help page).Bais
was invoked but never defined (see the help page).