En física , las transformaciones de Lorentz son una familia de seis parámetros de transformaciones lineales desde un sistema de coordenadas en el espacio-tiempo a otro sistema que se mueve a una velocidad constante con respecto al primero. La transformación inversa respectiva se parametriza entonces por el negativo de esta velocidad. Las transformaciones reciben su nombre del físico holandés Hendrik Lorentz .
La forma más común de la transformación, parametrizada por la constante real que representa una velocidad confinada a la dirección x , se expresa como [1] [2] donde ( t , x , y , z ) y ( t ′, x ′, y ′, z ′) son las coordenadas de un evento en dos marcos con los orígenes espaciales coincidiendo en t = t ′ = 0, donde el marco primado se ve desde el marco no primado como moviéndose con velocidad v a lo largo del eje x , donde c es la velocidad de la luz , y es el factor de Lorentz . Cuando la velocidad v es mucho menor que c , el factor de Lorentz es despreciablemente diferente de 1, pero a medida que v se acerca a c , crece sin límite. El valor de v debe ser menor que c para que la transformación tenga sentido.
Expresar la velocidad como una forma equivalente de la transformación es [3]
Los sistemas de referencia se pueden dividir en dos grupos: inerciales (movimiento relativo con velocidad constante) y no inerciales (aceleración, movimiento en trayectorias curvas, movimiento rotacional con velocidad angular constante , etc.). El término "transformaciones de Lorentz" se refiere únicamente a las transformaciones entre sistemas inerciales , generalmente en el contexto de la relatividad especial.
En cada marco de referencia , un observador puede utilizar un sistema de coordenadas local (normalmente coordenadas cartesianas en este contexto) para medir longitudes, y un reloj para medir intervalos de tiempo. Un acontecimiento es algo que sucede en un punto del espacio en un instante de tiempo, o más formalmente un punto del espacio-tiempo . Las transformaciones conectan las coordenadas espaciales y temporales de un acontecimiento medido por un observador en cada marco. [nb 1]
Reemplazan la transformación galileana de la física newtoniana , que supone un espacio y un tiempo absolutos (véase la relatividad galileana ). La transformación galileana es una buena aproximación solo a velocidades relativas mucho menores que la velocidad de la luz. Las transformaciones de Lorentz tienen una serie de características poco intuitivas que no aparecen en las transformaciones galileanas. Por ejemplo, reflejan el hecho de que los observadores que se mueven a diferentes velocidades pueden medir diferentes distancias , tiempos transcurridos e incluso diferentes ordenaciones de eventos , pero siempre de manera que la velocidad de la luz sea la misma en todos los marcos de referencia inerciales. La invariancia de la velocidad de la luz es uno de los postulados de la relatividad especial .
Históricamente, las transformaciones fueron el resultado de los intentos de Lorentz y otros de explicar cómo se observaba que la velocidad de la luz era independiente del marco de referencia y de comprender las simetrías de las leyes del electromagnetismo . Las transformaciones se convirtieron más tarde en una piedra angular de la relatividad especial .
La transformación de Lorentz es una transformación lineal . Puede incluir una rotación del espacio; una transformación de Lorentz sin rotación se denomina impulso de Lorentz . En el espacio de Minkowski (el modelo matemático del espacio-tiempo en la relatividad especial), las transformaciones de Lorentz preservan el intervalo de espacio-tiempo entre dos eventos cualesquiera. Esta propiedad es la propiedad definitoria de una transformación de Lorentz. Describen solo las transformaciones en las que el evento del espacio-tiempo en el origen se deja fijo. Pueden considerarse como una rotación hiperbólica del espacio de Minkowski. El conjunto más general de transformaciones que también incluye traslaciones se conoce como el grupo de Poincaré .
Muchos físicos, incluidos Woldemar Voigt , George FitzGerald , Joseph Larmor y el propio Hendrik Lorentz [4] , habían estado discutiendo la física implícita en estas ecuaciones desde 1887. [5] A principios de 1889, Oliver Heaviside había demostrado a partir de las ecuaciones de Maxwell que el campo eléctrico que rodea una distribución esférica de carga debería dejar de tener simetría esférica una vez que la carga está en movimiento en relación con el éter luminífero . FitzGerald luego conjeturó que el resultado de distorsión de Heaviside podría aplicarse a una teoría de fuerzas intermoleculares. Algunos meses después, FitzGerald publicó la conjetura de que los cuerpos en movimiento se contraen, para explicar el desconcertante resultado del experimento de éter-viento de 1887 de Michelson y Morley . En 1892, Lorentz presentó de forma independiente la misma idea de una manera más detallada, que posteriormente se denominó hipótesis de contracción de FitzGerald-Lorentz . [6] Su explicación era ampliamente conocida antes de 1905. [7]
Lorentz (1892-1904) y Larmor (1897-1900), que creían en la hipótesis del éter luminífero, también buscaron la transformación bajo la cual las ecuaciones de Maxwell son invariantes cuando se transforman del éter a un marco móvil. Extendieron la hipótesis de contracción de FitzGerald-Lorentz y descubrieron que la coordenada temporal también debe modificarse (" tiempo local "). Henri Poincaré dio una interpretación física del tiempo local (de primer orden en v / c , la velocidad relativa de los dos marcos de referencia normalizada a la velocidad de la luz) como consecuencia de la sincronización del reloj, bajo el supuesto de que la velocidad de la luz es constante en marcos móviles. [8] Se atribuye a Larmor haber sido el primero en comprender la crucial propiedad de dilatación del tiempo inherente a sus ecuaciones. [9]
En 1905, Poincaré fue el primero en reconocer que la transformación tiene las propiedades de un grupo matemático , y la nombró en honor a Lorentz. [10] Más tarde, ese mismo año, Albert Einstein publicó lo que ahora se llama relatividad especial , al derivar la transformación de Lorentz bajo los supuestos del principio de relatividad y la constancia de la velocidad de la luz en cualquier marco de referencia inercial , y al abandonar el éter mecanicista por innecesario. [11]
Un evento es algo que sucede en un punto determinado del espacio-tiempo o, de manera más general, en el punto mismo del espacio-tiempo. En cualquier sistema inercial, un evento se especifica mediante una coordenada temporal ct y un conjunto de coordenadas cartesianas x , y , z para especificar la posición en el espacio en ese sistema. Los subíndices etiquetan eventos individuales.
Del segundo postulado de la relatividad de Einstein (invariancia de c ) se deduce que:
en todos los sistemas inerciales para eventos conectados por señales luminosas . La cantidad de la izquierda se llama intervalo espacio-temporal entre los eventos a 1 = ( t 1 , x 1 , y 1 , z 1 ) y a 2 = ( t 2 , x 2 , y 2 , z 2 ) . El intervalo entre dos eventos cualesquiera , no necesariamente separados por señales luminosas, es de hecho invariante, es decir, independiente del estado de movimiento relativo de los observadores en diferentes sistemas inerciales, como se muestra utilizando la homogeneidad y la isotropía del espacio . La transformación buscada debe poseer, por tanto, la propiedad de que:
donde ( t , x , y , z ) son las coordenadas espacio-temporales utilizadas para definir eventos en un marco, y ( t ′, x ′, y ′, z ′) son las coordenadas en otro marco. Primero se observa que ( D2 ) se satisface si se agrega una 4 -tupla arbitraria b de números a los eventos a 1 y a 2 . Tales transformaciones se denominan traslaciones espacio-temporales y no se tratan más aquí. Luego se observa que una solución lineal que preserva el origen del problema más simple resuelve también el problema general:
(una solución que satisface la primera fórmula satisface automáticamente también la segunda; ver identidad de polarización ). Encontrar la solución al problema más simple es solo cuestión de buscar en la teoría de grupos clásicos que preservan formas bilineales de varias firmas. [nb 2] La primera ecuación en ( D3 ) se puede escribir de manera más compacta como:
donde (·, ·) se refiere a la forma bilineal de la signatura (1, 3) en R 4 expuesta por la fórmula del lado derecho en ( D3 ). La notación alternativa definida a la derecha se conoce como el producto escalar relativista . El espacio-tiempo visto matemáticamente como R 4 dotado de esta forma bilineal se conoce como espacio de Minkowski M . La transformación de Lorentz es, por tanto, un elemento del grupo O(1, 3) , el grupo de Lorentz o, para aquellos que prefieren la otra signatura métrica , O(3, 1) (también llamado el grupo de Lorentz). [nb 3] Se tiene:
que es precisamente la conservación de la forma bilineal ( D3 ) lo que implica (por linealidad de Λ y bilinealidad de la forma) que ( D2 ) se satisface. Los elementos del grupo de Lorentz son rotaciones y empujes y mezclas de los mismos. Si se incluyen las traslaciones espaciotemporales, entonces se obtiene el grupo de Lorentz no homogéneo o el grupo de Poincaré .
Las relaciones entre las coordenadas espacio-temporales primitivas y no primitivas son las transformaciones de Lorentz ; cada coordenada en un sistema es una función lineal de todas las coordenadas en el otro sistema, y las funciones inversas son la transformación inversa. Dependiendo de cómo se mueven los sistemas entre sí y de cómo están orientados en el espacio entre sí, otros parámetros que describen la dirección, la velocidad y la orientación entran en las ecuaciones de transformación.
Las transformaciones que describen el movimiento relativo con velocidad constante (uniforme) y sin rotación de los ejes de coordenadas espaciales se denominan boosts de Lorentz o simplemente boosts , y la velocidad relativa entre los marcos es el parámetro de la transformación. El otro tipo básico de transformación de Lorentz es la rotación solo en las coordenadas espaciales, estas como boosts son transformaciones inerciales ya que no hay movimiento relativo, los marcos simplemente están inclinados (y no rotan continuamente), y en este caso las cantidades que definen la rotación son los parámetros de la transformación (por ejemplo, representación eje-ángulo , o ángulos de Euler , etc.). Una combinación de rotación e boost es una transformación homogénea , que transforma el origen de nuevo al origen.
El grupo de Lorentz completo O(3, 1) también contiene transformaciones especiales que no son ni rotaciones ni impulsos, sino más bien reflexiones en un plano que pasa por el origen. Se pueden distinguir dos de ellas: la inversión espacial , en la que se invierte el signo de las coordenadas espaciales de todos los eventos, y la inversión temporal, en la que se invierte el signo de la coordenada temporal de cada evento.
Los impulsos no deben confundirse con meros desplazamientos en el espacio-tiempo; en este caso, los sistemas de coordenadas simplemente se desplazan y no hay movimiento relativo. Sin embargo, también cuentan como simetrías forzadas por la relatividad especial, ya que dejan invariable el intervalo espacio-tiempo. Una combinación de una rotación con un impulso, seguida de un desplazamiento en el espacio-tiempo, es una transformación de Lorentz no homogénea , un elemento del grupo de Poincaré, que también se denomina grupo de Lorentz no homogéneo.
Un observador "estacionario" en el marco F define eventos con coordenadas t , x , y , z . Otro marco F ′ se mueve con velocidad v relativa a F , y un observador en este marco "móvil" F ′ define eventos utilizando las coordenadas t ′, x ′, y ′, z ′ .
Los ejes de coordenadas en cada marco son paralelos (los ejes x y x ′ son paralelos, los ejes y e y ′ son paralelos, y los ejes z y z ′ son paralelos ), permanecen mutuamente perpendiculares, y el movimiento relativo es a lo largo de los ejes xx′ coincidentes . En t = t ′ = 0 , los orígenes de ambos sistemas de coordenadas son los mismos, ( x, y, z ) = ( x ′, y ′, z ′) = (0, 0, 0) . En otras palabras, los tiempos y las posiciones son coincidentes en este evento. Si todo esto se cumple, entonces se dice que los sistemas de coordenadas están en configuración estándar o sincronizados .
Si un observador en F registra un evento t , x , y , z , entonces un observador en F ′ registra el mismo evento con coordenadas [13]
donde v es la velocidad relativa entre fotogramas en la dirección x , c es la velocidad de la luz y ( gamma minúscula ) es el factor de Lorentz .
Aquí, v es el parámetro de la transformación, para un impulso dado es un número constante, pero puede tomar un rango continuo de valores. En la configuración utilizada aquí, la velocidad relativa positiva v > 0 es movimiento a lo largo de las direcciones positivas de los ejes xx ′ , la velocidad relativa cero v = 0 es ningún movimiento relativo, mientras que la velocidad relativa negativa v < 0 es movimiento relativo a lo largo de las direcciones negativas de los ejes xx ′ . La magnitud de la velocidad relativa v no puede ser igual o mayor que c , por lo que solo se permiten velocidades subluminales − c < v < c . El rango correspondiente de γ es 1 ≤ γ < ∞ .
Las transformaciones no están definidas si v está fuera de estos límites. A la velocidad de la luz ( v = c ) γ es infinito, y más rápido que la luz ( v > c ) γ es un número complejo , cada uno de los cuales hace que las transformaciones no sean físicas. Las coordenadas de espacio y tiempo son cantidades mensurables y numéricamente deben ser números reales.
Como transformación activa , un observador en F′ nota que las coordenadas del evento se "impulsan" en las direcciones negativas de los ejes xx ′ , debido a la − v en las transformaciones. Esto tiene el efecto equivalente del sistema de coordenadas F′ impulsado en las direcciones positivas de los ejes xx ′ , mientras que el evento no cambia y simplemente se representa en otro sistema de coordenadas, una transformación pasiva .
Las relaciones inversas ( t , x , y , z en términos de t ′, x ′, y ′, z ′ ) se pueden encontrar resolviendo algebraicamente el conjunto original de ecuaciones. Una forma más eficiente es usar principios físicos. Aquí F ′ es el marco "estacionario" mientras que F es el marco "móvil". De acuerdo con el principio de relatividad, no hay un marco de referencia privilegiado, por lo que las transformaciones de F ′ a F deben tomar exactamente la misma forma que las transformaciones de F a F ′ . La única diferencia es que F se mueve con velocidad − v relativa a F ′ (es decir, la velocidad relativa tiene la misma magnitud pero está dirigida en sentido opuesto). Por lo tanto, si un observador en F ′ nota un evento t ′, x ′, y ′, z ′ , entonces un observador en F nota el mismo evento con coordenadas
y el valor de γ permanece invariable. Este "truco" de simplemente invertir la dirección de la velocidad relativa mientras se conserva su magnitud, e intercambiar las variables cebadas y no cebadas, siempre se aplica para encontrar la transformación inversa de cada impulso en cualquier dirección.
En ocasiones resulta más conveniente utilizar β = v / c ( beta minúscula ) en lugar de v , de forma que se muestre mucho más claramente la simetría en la transformación. De los rangos permitidos de v y de la definición de β se deduce que −1 < β < 1. El uso de β y γ es estándar en toda la literatura.
Cuando la velocidad de impulso está en una dirección vectorial arbitraria con el vector de impulso , entonces la transformación de un sistema de coordenadas de espacio-tiempo no primado a un sistema de coordenadas primado está dada por [14]
donde el factor de Lorentz es . El determinante de la matriz de transformación es +1 y su traza es . La inversa de la transformación se obtiene invirtiendo el signo de .
Las transformaciones de Lorentz también se pueden derivar de una manera que se parezca a las rotaciones circulares en el espacio 3D utilizando las funciones hiperbólicas . Para el impulso en la dirección x , los resultados son
donde ζ ( zeta minúscula ) es un parámetro llamado rapidez (se utilizan muchos otros símbolos, incluidos θ, ϕ, φ, η, ψ, ξ ). Dada la gran semejanza con las rotaciones de coordenadas espaciales en el espacio 3d en los planos cartesianos xy, yz y zx, un impulso de Lorentz puede considerarse como una rotación hiperbólica de las coordenadas del espacio-tiempo en los planos cartesianos-temporales xt, yt y zt del espacio de Minkowski 4d . El parámetro ζ es el ángulo hiperbólico de rotación, análogo al ángulo ordinario para rotaciones circulares. Esta transformación puede ilustrarse con un diagrama de Minkowski .
Las funciones hiperbólicas surgen de la diferencia entre los cuadrados de las coordenadas temporales y espaciales en el intervalo espacio-temporal, en lugar de una suma. La significación geométrica de las funciones hiperbólicas se puede visualizar tomando x = 0 o ct = 0 en las transformaciones. Elevando al cuadrado y restando los resultados, se pueden derivar curvas hiperbólicas de valores de coordenadas constantes pero con ζ variable , lo que parametriza las curvas según la identidad
Por el contrario, los ejes ct y x pueden construirse para coordenadas variables pero con ζ constante . La definición proporciona el vínculo entre un valor constante de rapidez y la pendiente del eje ct en el espacio-tiempo. Una consecuencia de estas dos fórmulas hiperbólicas es una identidad que coincide con el factor de Lorentz.
Comparando las transformaciones de Lorentz en términos de velocidad y rapidez relativas, o utilizando las fórmulas anteriores, las conexiones entre β , γ y ζ son
Tomando la tangente hiperbólica inversa se obtiene la rapidez
Como −1 < β < 1 , se sigue −∞ < ζ < ∞ . De la relación entre ζ y β , la rapidez positiva ζ > 0 es movimiento a lo largo de las direcciones positivas de los ejes xx ′ , la rapidez cero ζ = 0 es ningún movimiento relativo, mientras que la rapidez negativa ζ < 0 es movimiento relativo a lo largo de las direcciones negativas de los ejes xx ′ .
Las transformaciones inversas se obtienen intercambiando cantidades cebadas y no cebadas para cambiar los marcos de coordenadas y negando la rapidez ζ → − ζ ya que esto es equivalente a negar la velocidad relativa. Por lo tanto,
Las transformaciones inversas se pueden visualizar de manera similar considerando los casos en que x ′ = 0 y ct ′ = 0 .
Hasta ahora, las transformaciones de Lorentz se han aplicado a un evento . Si hay dos eventos, existe una separación espacial y un intervalo de tiempo entre ellos. De la linealidad de las transformaciones de Lorentz se deduce que se pueden elegir dos valores de coordenadas espaciales y temporales, se pueden aplicar las transformaciones de Lorentz a cada uno y luego restarlas para obtener las transformaciones de Lorentz de las diferencias;
con relaciones inversas
donde Δ ( delta mayúscula ) indica una diferencia de cantidades; por ejemplo, Δ x = x 2 − x 1 para dos valores de coordenadas x , y así sucesivamente.
Estas transformaciones en diferencias en lugar de puntos espaciales o instantes de tiempo son útiles por varias razones:
Un requisito crítico de las transformaciones de Lorentz es la invariancia de la velocidad de la luz, un hecho utilizado en su derivación y contenido en las propias transformaciones. Si en F la ecuación para un pulso de luz a lo largo de la dirección x es x = ct , entonces en F ′ las transformaciones de Lorentz dan x ′ = ct ′ , y viceversa, para cualquier − c < v < c .
Para velocidades relativas mucho menores que la velocidad de la luz, las transformaciones de Lorentz se reducen a la transformación de Galileo de acuerdo con el principio de correspondencia . A veces se dice que la física no relativista es una física de "acción instantánea a distancia". [15]
Tres predicciones contraintuitivas, pero correctas, de las transformaciones son:
El uso de vectores permite expresar posiciones y velocidades en direcciones arbitrarias de forma compacta. Un impulso único en cualquier dirección depende del vector de velocidad relativa completo v con una magnitud | v | = v que no puede ser igual o mayor que c , de modo que 0 ≤ v < c .
Solo cambian el tiempo y las coordenadas paralelas a la dirección del movimiento relativo, mientras que las coordenadas perpendiculares no. Con esto en mente, divida el vector de posición espacial r medido en F y r ′ medido en F′ , cada uno en componentes perpendiculares (⊥) y paralelas (‖) a v , entonces las transformaciones son donde · es el producto escalar . El factor de Lorentz γ conserva su definición para un impulso en cualquier dirección, ya que depende solo de la magnitud de la velocidad relativa. La definición β = v / c con magnitud 0 ≤ β < 1 también es utilizada por algunos autores.
Introduciendo un vector unitario n = v / v = β / β en la dirección del movimiento relativo, la velocidad relativa es v = v n con magnitud v y dirección n , y la proyección y el rechazo del vector dan respectivamente
La acumulación de resultados da las transformaciones completas,
La proyección y el rechazo también se aplican a r ′ . Para las transformaciones inversas, intercambie r y r ′ para cambiar las coordenadas observadas y niegue la velocidad relativa v → − v (o simplemente el vector unitario n → − n ya que la magnitud v siempre es positiva) para obtener
El vector unitario tiene la ventaja de simplificar las ecuaciones para un único impulso, permite restablecer v o β cuando sea conveniente y la parametrización de rapidez se obtiene inmediatamente reemplazando β y βγ . No es conveniente para múltiples impulsos.
La relación vectorial entre la velocidad relativa y la rapidez es [16] y el "vector de rapidez" se puede definir como cada uno de los cuales sirve como una abreviatura útil en algunos contextos. La magnitud de ζ es el valor absoluto del escalar de rapidez confinado a 0 ≤ ζ < ∞ , lo que coincide con el rango 0 ≤ β < 1 .
Definición de las velocidades de coordenadas y el factor de Lorentz mediante
Tomando las diferenciales en las coordenadas y el tiempo de las transformaciones vectoriales, luego dividiendo las ecuaciones, se llega a
Las velocidades u y u ′ son la velocidad de algún objeto masivo. También pueden ser para un tercer sistema inercial (digamos F ′′), en cuyo caso deben ser constantes . Denotemos cada entidad por X. Entonces X se mueve con velocidad u relativa a F, o equivalentemente con velocidad u ′ relativa a F′, a su vez F′ se mueve con velocidad v relativa a F. Las transformaciones inversas se pueden obtener de manera similar, o como con las coordenadas de posición intercambiar u y u ′ , y cambiar v a − v .
La transformación de la velocidad es útil en la aberración estelar , el experimento de Fizeau y el efecto Doppler relativista .
Las transformaciones de Lorentz de la aceleración se pueden obtener de manera similar tomando diferenciales en los vectores de velocidad y dividiéndolos por el diferencial de tiempo.
En general, dadas cuatro cantidades A y Z = ( Z x , Z y , Z z ) y sus contrapartes potenciadas por Lorentz A ′ y Z ′ = ( Z ′ x , Z ′ y , Z ′ z ) , una relación de la forma implica que las cantidades se transforman bajo transformaciones de Lorentz similares a la transformación de las coordenadas del espacio-tiempo;
La descomposición de Z (y Z ′ ) en componentes perpendiculares y paralelas a v es exactamente la misma que para el vector de posición, como lo es el proceso de obtener las transformaciones inversas (intercambiar ( A , Z ) y ( A ′, Z ′) para intercambiar las cantidades observadas e invertir la dirección del movimiento relativo mediante la sustitución n ↦ − n ).
Las cantidades ( A , Z ) forman colectivamente un cuatrivector , donde A es el "componente temporal" y Z el "componente espacial". Los ejemplos de A y Z son los siguientes:
Para un objeto dado (por ejemplo, partícula, fluido, campo, material), si A o Z corresponden a propiedades específicas del objeto como su densidad de carga , densidad de masa , espín , etc., sus propiedades pueden fijarse en el marco de referencia en reposo de ese objeto. Entonces las transformaciones de Lorentz dan las propiedades correspondientes en un marco de referencia que se mueve en relación con el objeto con velocidad constante. Esto rompe algunas nociones que se dan por sentadas en la física no relativista. Por ejemplo, la energía E de un objeto es un escalar en la mecánica no relativista, pero no en la mecánica relativista porque la energía cambia bajo las transformaciones de Lorentz; su valor es diferente para varios marcos inerciales. En el marco de referencia en reposo de un objeto, tiene una energía en reposo y un momento cero. En un marco potenciado su energía es diferente y parece tener un momento. De manera similar, en la mecánica cuántica no relativista el espín de una partícula es un vector constante, pero en la mecánica cuántica relativista el espín s depende del movimiento relativo. En el marco de reposo de la partícula, el pseudovector de espín se puede fijar para que sea su espín no relativista ordinario con una cantidad temporal cero s t , sin embargo, un observador mejorado percibirá un componente temporal distinto de cero y un espín alterado. [17]
No todas las cantidades son invariantes en la forma que se muestra arriba, por ejemplo el momento angular orbital L no tiene una cantidad temporal, y tampoco la tienen el campo eléctrico E ni el campo magnético B. La definición de momento angular es L = r × p , y en un marco potenciado el momento angular alterado es L ′ = r ′ × p ′ . La aplicación de esta definición usando las transformaciones de coordenadas y momento conduce a la transformación del momento angular. Resulta que L se transforma con otra cantidad vectorial N = ( E / c 2 ) r − t p relacionada con los refuerzos, vea el momento angular relativista para más detalles. Para el caso de los campos E y B , las transformaciones no se pueden obtener directamente usando álgebra vectorial. La fuerza de Lorentz es la definición de estos campos, y en F es F = q ( E + v × B ) mientras que en F ′ es F ′ = q ( E ′ + v ′ × B ′) . Un método para derivar las transformaciones del campo EM de una manera eficiente que también ilustra la unidad del campo electromagnético utiliza el álgebra tensorial, que se muestra a continuación.
En todo el texto, las letras mayúsculas en cursiva (no negrita) son matrices de 4×4, mientras que las letras en negrita (no cursiva) son matrices de 3×3.
Escribiendo las coordenadas en vectores de columna y la métrica de Minkowski η como una matriz cuadrada, el intervalo espacio-temporal toma la forma (el superíndice T denota transposición ) y es invariante bajo una transformación de Lorentz donde Λ es una matriz cuadrada que puede depender de parámetros.
El conjunto de todas las transformaciones de Lorentz en este artículo se denota como . Este conjunto junto con la multiplicación de matrices forma un grupo , en este contexto conocido como el grupo de Lorentz . Además, la expresión anterior X · X es una forma cuadrática de la signatura (3,1) en el espacio-tiempo, y el grupo de transformaciones que deja esta forma cuadrática invariante es el grupo ortogonal indefinido O(3,1), un grupo de Lie . En otras palabras, el grupo de Lorentz es O(3,1). Como se presenta en este artículo, todos los grupos de Lie mencionados son grupos de Lie de matrices . En este contexto, la operación de composición equivale a la multiplicación de matrices .
De la invariancia del intervalo espacio-temporal se sigue que esta ecuación matricial contiene las condiciones generales de la transformación de Lorentz para asegurar la invariancia del intervalo espacio-temporal. Tomando el determinante de la ecuación utilizando la regla del producto [nb 4] se obtiene inmediatamente
Al escribir la métrica de Minkowski como una matriz de bloques y la transformación de Lorentz en la forma más general, al realizar las multiplicaciones de matrices de bloques se obtienen condiciones generales sobre Γ, a , b , M para asegurar la invariancia relativista. No se puede extraer mucha información directamente de todas las condiciones, sin embargo, uno de los resultados es útil; b T b ≥ 0 siempre, por lo que se deduce que
La desigualdad negativa puede ser inesperada, porque Γ multiplica la coordenada temporal y esto tiene un efecto sobre la simetría temporal . Si se cumple la igualdad positiva, entonces Γ es el factor de Lorentz.
El determinante y la desigualdad proporcionan cuatro formas de clasificar las transformaciones de Loentz ( en adelante, LT , por brevedad ). Cualquier LT particular tiene solo un signo determinante y solo una desigualdad. Hay cuatro conjuntos que incluyen cada par posible dado por las intersecciones (símbolo en forma de "n" que significa "y") de estos conjuntos de clasificación.
donde "+" y "−" indican el signo determinante, mientras que "↑" para ≥ y "↓" para ≤ denotan las desigualdades.
El grupo de Lorentz completo se divide en la unión (símbolo en forma de "u" que significa "o") de cuatro conjuntos disjuntos
Un subgrupo de un grupo debe estar cerrado bajo la misma operación del grupo (aquí, multiplicación de matrices). En otras palabras, para dos transformaciones de Lorentz Λ y L de un subgrupo particular, las transformaciones de Lorentz compuestas Λ L y L Λ deben estar en el mismo subgrupo que Λ y L . Este no siempre es el caso: la composición de dos transformaciones de Lorentz antícronas es ortócrona, y la composición de dos transformaciones de Lorentz impropias es propia. En otras palabras, mientras que los conjuntos , , , y todos forman subgrupos, los conjuntos que contienen transformaciones impropias y/o antícronas sin suficientes transformaciones ortócronas propias (por ejemplo , , , ) no forman subgrupos.
Si se mide un 4-vector covariante de Lorentz en un marco inercial con resultado , y la misma medición realizada en otro marco inercial (con la misma orientación y origen) da como resultado , los dos resultados estarán relacionados por donde la matriz de impulso representa la transformación de Lorentz sin rotación entre los marcos no primados y primados y es la velocidad del marco primado vista desde el marco no primado. La matriz está dada por [18]
donde es la magnitud de la velocidad y es el factor de Lorentz. Esta fórmula representa una transformación pasiva, ya que describe cómo cambian las coordenadas de la cantidad medida del marco sin primar al marco con primar. La transformación activa está dada por .
Si un marco F ′ es impulsado con velocidad u relativa al marco F , y otro marco F ′′ es impulsado con velocidad v relativa a F ′ , los impulsos separados son y la composición de los dos impulsos conecta las coordenadas en F ′′ y F , Las transformaciones sucesivas actúan sobre la izquierda. Si u y v son colineales (paralelas o antiparalelas a lo largo de la misma línea de movimiento relativo), las matrices de impulso conmutan : B ( v ) B ( u ) = B ( u ) B ( v ) . Esta transformación compuesta resulta ser otro impulso, B ( w ) , donde w es colineal con u y v .
Si u y v no son colineales sino que están en direcciones diferentes, la situación es considerablemente más complicada. Los boosts de Lorentz a lo largo de direcciones diferentes no conmutan: B ( v ) B ( u ) y B ( u ) B ( v ) no son iguales. Aunque cada una de estas composiciones no es un boost único, cada composición sigue siendo una transformación de Lorentz ya que preserva el intervalo de espacio-tiempo. Resulta que la composición de dos boosts de Lorentz cualesquiera es equivalente a un boost seguido o precedido por una rotación en las coordenadas espaciales, en la forma de R ( ρ ) B ( w ) o B ( w ) R ( ρ ) . Los w y w son velocidades compuestas , mientras que ρ y ρ son parámetros de rotación (por ejemplo, variables de eje-ángulo , ángulos de Euler , etc.). La rotación en forma de matriz de bloques es simplemente donde R ( ρ ) es una matriz de rotación 3d , que rota cualquier vector 3d en un sentido (transformación activa), o equivalentemente el marco de coordenadas en el sentido opuesto (transformación pasiva). No es simple conectar w y ρ (o w y ρ ) a los parámetros de impulso originales u y v . En una composición de impulsos, la matriz R se denomina rotación de Wigner y da lugar a la precesión de Thomas . Estos artículos dan las fórmulas explícitas para las matrices de transformación compuestas, incluidas expresiones para w , ρ , w , ρ .
En este artículo se utiliza la representación eje-ángulo para ρ . La rotación se realiza alrededor de un eje en la dirección de un vector unitario e , a través del ángulo θ (positivo en sentido antihorario, negativo en sentido horario, según la regla de la mano derecha ). El "vector eje-ángulo" servirá como una abreviatura útil.
Las rotaciones espaciales por sí solas también son transformaciones de Lorentz, ya que dejan invariable el intervalo espacio-temporal. Al igual que los impulsos, las rotaciones sucesivas sobre ejes diferentes no se conmutan. A diferencia de los impulsos, la composición de dos rotaciones cualesquiera es equivalente a una sola rotación. Algunas otras similitudes y diferencias entre las matrices de impulso y rotación incluyen:
La transformación de Lorentz propia más general Λ( v , θ ) incluye un impulso y una rotación juntos, y es una matriz no simétrica. Como casos especiales, Λ( 0 , θ ) = R ( θ ) y Λ( v , 0 ) = B ( v ) . Una forma explícita de la transformación de Lorentz general es complicada de escribir y no se dará aquí. Sin embargo, se darán a continuación expresiones de forma cerrada para las matrices de transformación utilizando argumentos teóricos de grupo. Será más fácil utilizar la parametrización de rapidez para impulsos, en cuyo caso se escribe Λ( ζ , θ ) y B ( ζ ) .
El conjunto de transformaciones con multiplicación de matrices como operación de composición forma un grupo, llamado "grupo restringido de Lorentz", y es el grupo ortogonal indefinido especial SO + (3,1). (El signo más indica que conserva la orientación de la dimensión temporal).
Para simplificar, observe el impulso infinitesimal de Lorentz en la dirección x (examinar un impulso en cualquier otra dirección, o una rotación sobre cualquier eje, sigue un procedimiento idéntico). El impulso infinitesimal es un pequeño impulso que se aleja de la identidad, obtenido por la expansión de Taylor de la matriz de impulso hasta el primer orden alrededor de ζ = 0 , donde los términos de orden superior que no se muestran son despreciables porque ζ es pequeño y B x es simplemente la matriz de impulso en la dirección x . La derivada de la matriz es la matriz de derivadas (de las entradas, con respecto a la misma variable), y se entiende que las derivadas se encuentran primero y luego se evalúan en ζ = 0 .
Por ahora, K x se define por este resultado (su significado se explicará en breve). En el límite de un número infinito de pasos infinitamente pequeños, se obtiene la transformación finita de boost en forma de exponencial matricial donde se ha utilizado la definición límite de la exponencial (ver también caracterizaciones de la función exponencial ). De manera más general [nb 5]
El vector eje-ángulo θ y el vector de rapidez ζ son en total seis variables continuas que forman los parámetros del grupo (en esta representación particular), y los generadores del grupo son K = ( K x , K y , K z ) y J = ( J x , J y , J z ) , cada uno vectores de matrices con las formas explícitas [nb 6]
Todos ellos se definen de forma análoga a K x anterior, aunque los signos menos en los generadores de impulso son convencionales. Físicamente, los generadores del grupo de Lorentz corresponden a simetrías importantes en el espacio-tiempo: J son los generadores de rotación que corresponden al momento angular , y K son los generadores de impulso que corresponden al movimiento del sistema en el espacio-tiempo. La derivada de cualquier curva suave C ( t ) con C (0) = I en el grupo que depende de algún parámetro de grupo t con respecto a ese parámetro de grupo, evaluado en t = 0 , sirve como definición de un generador de grupo correspondiente G , y esto refleja una transformación infinitesimal que se aleja de la identidad. La curva suave siempre se puede tomar como exponencial, ya que la exponencial siempre mapeará G suavemente de nuevo en el grupo a través de t → exp( tG ) para todo t ; esta curva producirá G nuevamente cuando se diferencie en t = 0 .
Al expandir las exponenciales en sus series de Taylor se obtiene que reproduce de forma compacta las matrices de impulso y rotación dadas en la sección anterior.
Se ha afirmado que la transformación general propia de Lorentz es un producto de un impulso y una rotación. En el nivel infinitesimal, el producto es conmutativo porque solo se requieren términos lineales (productos como ( θ · J )( ζ · K ) y ( ζ · K )( θ · J ) cuentan como términos de orden superior y son despreciables). Tomando el límite como antes, se llega a la transformación finita en forma de exponencial.
El caso inverso también es cierto, pero la descomposición de una transformación general finita de Lorentz en dichos factores no es trivial. En particular, porque los generadores no conmutan. Para una descripción de cómo encontrar los factores de una transformación general de Lorentz en términos de un impulso y una rotación en principio (esto generalmente no produce una expresión inteligible en términos de generadores J y K ), consulte la rotación de Wigner . Si, por otro lado, la descomposición se da en términos de los generadores, y uno quiere encontrar el producto en términos de los generadores, entonces se aplica la fórmula de Baker–Campbell–Hausdorff .
Los generadores de Lorentz se pueden sumar o multiplicar por números reales para obtener más generadores de Lorentz. En otras palabras, el conjunto de todos los generadores de Lorentz junto con las operaciones de suma de matrices ordinarias y multiplicación de una matriz por un número , forma un espacio vectorial sobre los números reales. [nb 7] Los generadores J x , J y , J z , K x , K y , K z forman un conjunto base de V , y los componentes de los vectores de eje-ángulo y rapidez, θ x , θ y , θ z , ζ x , ζ y , ζ z , son las coordenadas de un generador de Lorentz con respecto a esta base. [nb 8]
Tres de las relaciones de conmutación de los generadores de Lorentz son donde el corchete [ A , B ] = AB − BA se conoce como el conmutador , y las otras relaciones se pueden encontrar tomando permutaciones cíclicas de los componentes x, y, z (es decir, cambiar x a y, y a z, y z a x, repetir).
Estas relaciones de conmutación, y el espacio vectorial de generadores, cumplen la definición del álgebra de Lie . En resumen, un álgebra de Lie se define como un espacio vectorial V sobre un cuerpo de números, y con una operación binaria [ , ] (llamada corchete de Lie en este contexto) sobre los elementos del espacio vectorial, que satisface los axiomas de bilinealidad , alternatización y la identidad de Jacobi . Aquí la operación [ , ] es el conmutador que satisface todos estos axiomas, el espacio vectorial es el conjunto de generadores de Lorentz V como se dio anteriormente, y el cuerpo es el conjunto de números reales.
Terminología de enlace utilizada en matemáticas y física: un generador de grupo es cualquier elemento del álgebra de Lie. Un parámetro de grupo es un componente de un vector de coordenadas que representa un elemento arbitrario del álgebra de Lie con respecto a alguna base. Una base, entonces, es un conjunto de generadores que son una base del álgebra de Lie en el sentido usual del espacio vectorial.
La función exponencial del álgebra de Lie al grupo de Lie proporciona una correspondencia biunívoca entre los vecindarios suficientemente pequeños del origen del álgebra de Lie y los vecindarios del elemento identidad del grupo de Lie. En el caso del grupo de Lorentz, la función exponencial es simplemente la matriz exponencial . Globalmente, la función exponencial no es biunívoca, pero en el caso del grupo de Lorentz, es sobreyectiva (sobreyectiva). Por lo tanto, cualquier elemento del grupo en el componente conexo de la identidad puede expresarse como una exponencial de un elemento del álgebra de Lie.
Las transformaciones de Lorentz también incluyen la inversión de paridad , que niega todas las coordenadas espaciales únicamente, y la inversión temporal , que niega únicamente la coordenada temporal, porque estas transformaciones dejan invariante el intervalo espacio-temporal. Aquí I es la matriz identidad 3d . Ambas son simétricas, son sus propias inversas (véase involución (matemáticas) ), y cada una tiene determinante −1. Esta última propiedad las convierte en transformaciones impropias.
Si Λ es una transformación de Lorentz ortócrona propia, entonces T Λ es anticrónica impropia, P Λ es ortócrona impropia y TP Λ = PT Λ es anticrónica propia.
No se han tenido en cuenta otras dos simetrías del espacio-tiempo. Para que el intervalo del espacio-tiempo sea invariante, se puede demostrar [19] que es necesario y suficiente que la transformación de coordenadas sea de la forma donde C es una columna constante que contiene traslaciones en el tiempo y el espacio. Si C ≠ 0, se trata de una transformación de Lorentz no homogénea o transformación de Poincaré . [20] [21] Si C = 0, se trata de una transformación de Lorentz homogénea . Las transformaciones de Poincaré no se tratan más en este artículo.
Escribir la transformación matricial general de coordenadas como ecuación matricial permite la transformación de otras cantidades físicas que no se pueden expresar como cuatrivectores; por ejemplo, tensores o espinores de cualquier orden en el espacio-tiempo 4d, que se definirán. En la notación de índice tensorial correspondiente , la expresión matricial anterior es
donde los índices inferior y superior etiquetan los componentes covariantes y contravariantes respectivamente, [22] y se aplica la convención de suma . Es una convención estándar utilizar índices griegos que toman el valor 0 para los componentes de tiempo y 1, 2, 3 para los componentes espaciales, mientras que los índices latinos simplemente toman los valores 1, 2, 3 para los componentes espaciales (lo opuesto para Landau y Lifshitz). Nótese que el primer índice (leyendo de izquierda a derecha) corresponde en la notación matricial a un índice de fila . El segundo índice corresponde al índice de columna.
La matriz de transformación es universal para todos los cuatro vectores , no solo para las coordenadas del espacio-tiempo de cuatro dimensiones. Si A es cualquier vector de cuatro dimensiones, entonces en la notación de índice tensorial
Alternativamente, se escribe en donde los índices primos denotan los índices de A en el marco primo. Para un objeto general de n componentes se puede escribir donde Π es la representación apropiada del grupo de Lorentz , una matriz n × n para cada Λ . En este caso, los índices no deben considerarse como índices de espacio-tiempo (a veces llamados índices de Lorentz), y van de 1 a n . Por ejemplo, si X es un bispinor , entonces los índices se llaman índices de Dirac .
También hay magnitudes vectoriales con índices covariantes. Generalmente se obtienen a partir de sus objetos correspondientes con índices contravariantes mediante la operación de bajar un índice ; p. ej., donde η es el tensor métrico . (El artículo vinculado también proporciona más información sobre lo que realmente es matemáticamente la operación de subir y bajar índices). La inversa de esta transformación está dada por donde, cuando se ven como matrices, η μν es la inversa de η μν . Como sucede, η μν = η μν . Esto se conoce como subir un índice . Para transformar un vector covariante A μ , primero se eleva su índice, luego se transforma de acuerdo con la misma regla que para los 4 -vectores contravariantes, luego finalmente se baja el índice;
Pero
Es decir, es el componente ( μ , ν ) de la transformación inversa de Lorentz. Se define (como una cuestión de notación), y puede escribirse en esta notación
Ahora, una sutileza. La suma implícita en el lado derecho de se ejecuta sobre un índice de fila de la matriz que representa Λ −1 . Por lo tanto, en términos de matrices, esta transformación debe considerarse como la transpuesta inversa de Λ que actúa sobre el vector columna A μ . Es decir, en notación matricial pura,
Esto significa exactamente que los vectores covariantes (considerados como matrices columna) se transforman de acuerdo con la representación dual de la representación estándar del grupo de Lorentz. Esta noción se generaliza a representaciones generales, simplemente reemplazando Λ por Π(Λ) .
Si A y B son operadores lineales en espacios vectoriales U y V , entonces se puede definir un operador lineal A ⊗ B en el producto tensorial de U y V , denotado U ⊗ V de acuerdo con [23]
(T1)
De esto se desprende inmediatamente que si u y v son cuatrivectores en V , entonces u ⊗ v ∈ T 2 V ≡ V ⊗ V se transforma como
(T2)
El segundo paso utiliza la bilinealidad del producto tensorial y el último paso define un tensor de 2 componentes, o mejor dicho, simplemente cambia el nombre del tensor a u ⊗ v .
Estas observaciones se generalizan de manera obvia a más factores, y utilizando el hecho de que un tensor general en un espacio vectorial V puede escribirse como una suma de un coeficiente (¡componente!) por productos tensoriales de vectores base y covectores base, se llega a la ley de transformación para cualquier cantidad tensorial T . Está dada por [24]
(T3)
donde Λ χ′ ψ se define anteriormente. Esta forma puede reducirse generalmente a la forma para objetos generales de n componentes dada anteriormente con una sola matriz ( Π(Λ) ) que opera sobre vectores columna. Esta última forma es a veces preferida; por ejemplo, para el tensor de campo electromagnético.
Las transformaciones de Lorentz también se pueden utilizar para ilustrar que el campo magnético B y el campo eléctrico E son simplemente aspectos diferentes de la misma fuerza: la fuerza electromagnética , como consecuencia del movimiento relativo entre cargas eléctricas y observadores. [25] El hecho de que el campo electromagnético muestra efectos relativistas se hace evidente al llevar a cabo un simple experimento mental. [26]
Los campos eléctricos y magnéticos se transforman de manera diferente desde el espacio y el tiempo, pero exactamente de la misma manera que el momento angular relativista y el vector de impulso.
El tensor de intensidad del campo electromagnético se da en unidades del SI . En relatividad, el sistema de unidades gaussiano se prefiere a menudo a las unidades del SI, incluso en textos cuya elección principal de unidades son las unidades del SI, porque en él el campo eléctrico E y la inducción magnética B tienen las mismas unidades, lo que hace que la apariencia del tensor del campo electromagnético sea más natural. [27] Considere un impulso de Lorentz en la dirección x . Se da por [28] donde el tensor de campo se muestra uno al lado del otro para la referencia más fácil posible en las manipulaciones a continuación.
La ley general de transformación (T3) se convierte en
Para el campo magnético se obtiene
Para los resultados del campo eléctrico
Aquí, se utiliza β = ( β , 0, 0) . Estos resultados se pueden resumir por y son independientes de la firma métrica. Para las unidades del SI, sustituya E → E ⁄ c . Misner, Thorne y Wheeler (1973) se refieren a esta última forma como la vista 3 + 1 en oposición a la vista geométrica representada por la expresión tensorial y destacan la facilidad con la que se pueden obtener y comprender resultados que son difíciles de lograr utilizando la vista 3 + 1. Solo los objetos que tienen propiedades de transformación de Lorentz bien definidas (de hecho, bajo cualquier transformación de coordenadas suave) son objetos geométricos. En la vista geométrica, el campo electromagnético es un objeto geométrico de seis dimensiones en el espacio-tiempo en oposición a dos campos de 3 vectores interdependientes, pero separados, en el espacio y el tiempo . Los campos E (solo) y B (solo) no tienen propiedades de transformación de Lorentz bien definidas. Los fundamentos matemáticos son las ecuaciones (T1) y (T2) que producen inmediatamente (T3) . Cabe señalar que los tensores con y sin prima se refieren al mismo evento en el espacio-tiempo . Por lo tanto, la ecuación completa con dependencia del espacio-tiempo es
La contracción de la longitud tiene un efecto sobre la densidad de carga ρ y la densidad de corriente J , y la dilatación del tiempo tiene un efecto sobre la tasa de flujo de carga (corriente), por lo que las distribuciones de carga y corriente deben transformarse de una manera relacionada bajo un impulso. Resulta que se transforman exactamente como los cuatro vectores de espacio-tiempo y energía-momento,
o, en la visión geométrica más simple,
La densidad de carga se transforma como el componente temporal de un cuatrivector. Es un escalar rotacional. La densidad de corriente es un 3-vector.
Las ecuaciones de Maxwell son invariantes bajo las transformaciones de Lorentz.
La ecuación (T1) se mantiene sin modificaciones para cualquier representación del grupo de Lorentz, incluida la representación bispinorial . En (T2) uno simplemente reemplaza todas las ocurrencias de Λ por la representación bispinorial Π(Λ) ,
(T4)
La ecuación anterior podría, por ejemplo, ser la transformación de un estado en el espacio de Fock que describe dos electrones libres.
Un estado multipartícula general no interactuante (estado de espacio de Fock) en la teoría cuántica de campos se transforma de acuerdo con la regla [29]
donde W (Λ, p ) es el pequeño grupo de Wigner [30] y D ( j ) es la representación (2 j + 1) -dimensional de SO(3) .