stringtranslate.com

Transformación de Lorentz

En física , las transformaciones de Lorentz son una familia de transformaciones lineales de seis parámetros desde un marco de coordenadas en el espacio-tiempo a otro marco que se mueve a una velocidad constante con respecto al primero. La respectiva transformación inversa se parametriza entonces por el negativo de esta velocidad. Las transformaciones llevan el nombre del físico holandés Hendrik Lorentz .

La forma más común de transformación, parametrizada por la constante real que representa una velocidad confinada a la dirección x , se expresa como [1] [2]

( t , x , y , z )( t ′, x ′, y ′, z ′)ttvxcvelocidad de la luzfactor de Lorentzvcvcvc

Expresar la velocidad como una forma equivalente de la transformación es [3]

Los marcos de referencia se pueden dividir en dos grupos: inerciales (movimiento relativo con velocidad constante) y no inerciales (acelerando, moviéndose en trayectorias curvas, movimiento de rotación con velocidad angular constante , etc.). El término "transformaciones de Lorentz" sólo se refiere a transformaciones entre sistemas inerciales , generalmente en el contexto de la relatividad especial.

En cada sistema de referencia , un observador puede utilizar un sistema de coordenadas local (normalmente coordenadas cartesianas en este contexto) para medir longitudes y un reloj para medir intervalos de tiempo. Un evento es algo que sucede en un punto del espacio en un instante de tiempo, o más formalmente en un punto del espacio-tiempo . Las transformaciones conectan las coordenadas espaciales y temporales de un evento medido por un observador en cada cuadro. [nota 1]

Reemplazan la transformación galileana de la física newtoniana , que supone un espacio y un tiempo absolutos (ver Relatividad galileana ). La transformación de Galileo es una buena aproximación sólo a velocidades relativas mucho menores que la velocidad de la luz. Las transformaciones de Lorentz tienen una serie de características poco intuitivas que no aparecen en las transformaciones galileanas. Por ejemplo, reflejan el hecho de que observadores que se mueven a diferentes velocidades pueden medir diferentes distancias , tiempos transcurridos e incluso diferentes ordenamientos de eventos , pero siempre de modo que la velocidad de la luz sea la misma en todos los sistemas de referencia inerciales. La invariancia de la velocidad de la luz es uno de los postulados de la relatividad especial .

Históricamente, las transformaciones fueron el resultado de los intentos de Lorentz y otros de explicar cómo se observaba que la velocidad de la luz era independiente del sistema de referencia y de comprender las simetrías de las leyes del electromagnetismo . Posteriormente, las transformaciones se convirtieron en la piedra angular de la relatividad especial .

La transformación de Lorentz es una transformación lineal . Puede incluir una rotación del espacio; una transformación de Lorentz sin rotación se llama impulso de Lorentz . En el espacio de Minkowski (el modelo matemático del espacio-tiempo en la relatividad especial), las transformaciones de Lorentz preservan el intervalo de espacio-tiempo entre dos eventos cualesquiera. Esta propiedad es la propiedad definitoria de una transformación de Lorentz. Describen sólo las transformaciones en las que el evento espacio-temporal en el origen queda fijo. Pueden considerarse como una rotación hiperbólica del espacio de Minkowski. El conjunto más general de transformaciones que también incluye traducciones se conoce como grupo de Poincaré .

Historia

Muchos físicos, incluidos Woldemar Voigt , George FitzGerald , Joseph Larmor y el propio Hendrik Lorentz [4] , habían estado discutiendo la física implícita en estas ecuaciones desde 1887. [5] A principios de 1889, Oliver Heaviside había demostrado a partir de las ecuaciones de Maxwell que la energía eléctrica El campo que rodea una distribución esférica de carga debería dejar de tener simetría esférica una vez que la carga esté en movimiento con respecto al éter luminífero . FitzGerald conjeturó entonces que el resultado de la distorsión de Heaviside podría aplicarse a una teoría de fuerzas intermoleculares. Algunos meses más tarde, FitzGerald publicó la conjetura de que los cuerpos en movimiento se están contrayendo, para explicar el desconcertante resultado del experimento éter-viento de 1887 de Michelson y Morley . En 1892, Lorentz presentó de forma independiente la misma idea de manera más detallada, que posteriormente se denominó hipótesis de contracción de FitzGerald-Lorentz . [6] Su explicación era ampliamente conocida antes de 1905. [7]

Lorentz (1892-1904) y Larmor (1897-1900), que creían en la hipótesis del éter luminífero, también buscaron la transformación bajo la cual las ecuaciones de Maxwell son invariantes cuando se transforman del éter a un sistema en movimiento. Ampliaron la hipótesis de la contracción de FitzGerald-Lorentz y descubrieron que la coordenada temporal también debe modificarse (" hora local "). Henri Poincaré dio una interpretación física a la hora local (de primer orden en v / c , la velocidad relativa de los dos sistemas de referencia normalizada a la velocidad de la luz) como consecuencia de la sincronización del reloj, bajo el supuesto de que la velocidad de la luz es constante. en marcos en movimiento. [8] A Larmor se le atribuye haber sido el primero en comprender la crucial propiedad de dilatación del tiempo inherente a sus ecuaciones. [9]

En 1905, Poincaré fue el primero en reconocer que la transformación tiene las propiedades de un grupo matemático , y le puso el nombre de Lorentz. [10] Más tarde, ese mismo año, Albert Einstein publicó lo que ahora se llama relatividad especial , al derivar la transformación de Lorentz bajo los supuestos del principio de relatividad y la constancia de la velocidad de la luz en cualquier sistema de referencia inercial , y al abandonar el método mecanicista. éter como innecesario. [11]

Derivación del grupo de transformaciones de Lorentz.

Un evento es algo que sucede en un determinado punto del espacio-tiempo o, más generalmente, en el propio punto del espacio-tiempo. En cualquier marco inercial, un evento se especifica mediante una coordenada de tiempo ct y un conjunto de coordenadas cartesianas x , y , z para especificar la posición en el espacio en ese marco. Los subíndices etiquetan eventos individuales.

Del segundo postulado de la relatividad de Einstein (invariancia de c ) se deduce que:

en todos los marcos inerciales para eventos conectados por señales luminosas . La cantidad de la izquierda se llama intervalo espacio-temporal entre eventos a 1 = ( t 1 , x 1 , y 1 , z 1 ) y a 2 = ( t 2 , x 2 , y 2 , z 2 ) . El intervalo entre dos eventos cualesquiera, no necesariamente separados por señales luminosas, es de hecho invariante, es decir, independiente del estado de movimiento relativo de los observadores en diferentes marcos inerciales, como se muestra utilizando la homogeneidad y la isotropía del espacio . La transformación que se busca así debe poseer la propiedad de que:

donde ( t , x , y , z ) son las coordenadas espacio-temporales utilizadas para definir eventos en un cuadro, y ( t ′, x ′, y ′, z ′) son las coordenadas en otro cuadro. Primero se observa que ( D2 ) se satisface si se suma una tupla arbitraria de 4 números a los eventos a 1 y a 2 . Estas transformaciones se denominan traslaciones espacio-temporales y no se tratan más aquí. Luego se observa que una solución lineal que preserva el origen del problema más simple resuelve también el problema general:

(Una solución que satisface la primera fórmula también satisface automáticamente la segunda; consulte identidad de polarización ). Encontrar la solución al problema más simple es sólo una cuestión de buscar en la teoría de grupos clásicos que conservan formas bilineales de diversa firma. [nb 2] La primera ecuación en ( D3 ) se puede escribir de manera más compacta como:

donde (·, ·) se refiere a la forma bilineal de la firma (1, 3) en R 4 expuesta por la fórmula del lado derecho en ( D3 ). La notación alternativa definida a la derecha se conoce como producto escalar relativista . El espaciotiempo visto matemáticamente como R 4 dotado de esta forma bilineal se conoce como espacio de Minkowski M. La transformación de Lorentz es, por tanto, un elemento del grupo O(1, 3) , el grupo de Lorentz o, para aquellos que prefieren la otra firma métrica , O(3, 1) (también llamado grupo de Lorentz). [nb 3] Uno tiene:

que es precisamente la preservación de la forma bilineal ( D3 ) que implica (por linealidad de Λ y bilinealidad de la forma) que ( D2 ) se cumple. Los elementos del grupo de Lorentz son rotaciones y potenciaciones y mezclas de los mismos. Si se incluyen las traducciones espacio-temporales, se obtiene el grupo no homogéneo de Lorentz o el grupo de Poincaré .

Generalidades

Las relaciones entre las coordenadas espacio-temporales preparadas y no preparadas son las transformaciones de Lorentz , cada coordenada en un cuadro es una función lineal de todas las coordenadas en el otro cuadro y las funciones inversas son la transformación inversa. Dependiendo de cómo se mueven los marcos entre sí y de cómo se orientan en el espacio entre sí, otros parámetros que describen la dirección, la velocidad y la orientación entran en las ecuaciones de transformación.

Las transformaciones que describen un movimiento relativo con velocidad constante (uniforme) y sin rotación de los ejes de coordenadas espaciales se denominan impulsos de Lorentz o simplemente impulsos , y la velocidad relativa entre los fotogramas es el parámetro de la transformación. El otro tipo básico de transformación de Lorentz es la rotación en las coordenadas espaciales únicamente, estos impulsos similares son transformaciones inerciales ya que no hay movimiento relativo, los marcos simplemente están inclinados (y no giran continuamente), y en este caso las cantidades que definen la rotación son las parámetros de la transformación (p. ej., representación eje-ángulo , o ángulos de Euler , etc.). Una combinación de rotación y impulso es una transformación homogénea , que transforma el origen nuevamente al origen.

El grupo completo de Lorentz O(3, 1) también contiene transformaciones especiales que no son rotaciones ni impulsos, sino reflexiones en un plano que pasa por el origen. Se pueden destacar dos de ellos; inversión espacial en la que las coordenadas espaciales de todos los eventos se invierten en signo e inversión temporal en la que las coordenadas temporales de cada evento se invierten en signo.

Los impulsos no deberían confundirse con meros desplazamientos en el espacio-tiempo; en este caso, los sistemas de coordenadas simplemente se desplazan y no hay movimiento relativo. Sin embargo, estas también cuentan como simetrías forzadas por la relatividad especial, ya que dejan invariante el intervalo espacio-temporal. Una combinación de una rotación con un impulso, seguido de un cambio en el espacio-tiempo, es una transformación de Lorentz no homogénea , un elemento del grupo de Poincaré, también llamado grupo de Lorentz no homogéneo.

La formulación física de Lorentz aumenta.

Transformación de coordenadas

Las coordenadas espacio-temporales de un evento, medidas por cada observador en su sistema de referencia inercial (en configuración estándar), se muestran en los bocadillos.
Arriba: el cuadro F se mueve a una velocidad v a lo largo del eje x del cuadro F.
Abajo: el cuadro F se mueve a velocidad − v a lo largo del eje x del cuadro F . [12]

Un observador "estacionario" en el cuadro F define eventos con coordenadas t , x , y , z . Otro marco F se mueve con velocidad v relativa a F , y un observador en este marco "en movimiento" F define eventos usando las coordenadas t ′, x ′, y ′, z .

Los ejes de coordenadas en cada cuadro son paralelos (los ejes x y x son paralelos, los ejes y e y son paralelos y los ejes z y z ′ son paralelos), permanecen mutuamente perpendiculares y el movimiento relativo es a lo largo del xx coincidente. ejes. En t = t ′ = 0 , los orígenes de ambos sistemas de coordenadas son los mismos, ( x, y, z ) = ( x ′, y ′, z ′) = (0, 0, 0) . En otras palabras, los tiempos y posiciones coinciden en este evento. Si todo esto se cumple, entonces se dice que los sistemas de coordenadas están en configuración estándar o sincronizados .

Si un observador en F registra un evento t , x , y , z , entonces un observador en F registra el mismo evento con coordenadas [13]

Impulso de Lorentz ( dirección x )

donde v es la velocidad relativa entre fotogramas en la dirección x , c es la velocidad de la luz y

( gammafactor de Lorentz

Aquí, v es el parámetro de la transformación, para un impulso dado es un número constante, pero puede tomar un rango continuo de valores. En la configuración utilizada aquí, la velocidad relativa positiva v > 0 es movimiento a lo largo de las direcciones positivas de los ejes xx , la velocidad relativa cero v = 0 no es movimiento relativo, mientras que la velocidad relativa negativa v < 0 es movimiento relativo a lo largo de las direcciones negativas de los ejes xx . La magnitud de la velocidad relativa v no puede igualar ni exceder c , por lo que solo se permiten velocidades subluminales c < v < c . El rango correspondiente de γ es 1 ≤ γ < ∞ .

Las transformaciones no están definidas si v está fuera de estos límites. A la velocidad de la luz ( v = c ) γ es infinita, y más rápido que la luz ( v > c ) γ es un número complejo , cada uno de los cuales hace que las transformaciones no sean físicas. Las coordenadas espaciales y temporales son cantidades mensurables y numéricamente deben ser números reales.

Como transformación activa , un observador en F′ nota que las coordenadas del evento serán "impulsadas" en las direcciones negativas de los ejes xx , debido a v en las transformaciones. Esto tiene el efecto equivalente del sistema de coordenadas F′ impulsado en las direcciones positivas de los ejes xx , mientras que el evento no cambia y simplemente se representa en otro sistema de coordenadas, una transformación pasiva .

Las relaciones inversas ( t , x , y , z en términos de t ′, x ′, y ′, z ) se pueden encontrar resolviendo algebraicamente el conjunto original de ecuaciones. Una forma más eficiente es utilizar principios físicos. Aquí F es el marco "estacionario" mientras que F es el marco "en movimiento". Según el principio de relatividad, no existe un marco de referencia privilegiado, por lo que las transformaciones de F a F deben tomar exactamente la misma forma que las transformaciones de F a F . La única diferencia es que F se mueve con velocidad v con respecto a F (es decir, la velocidad relativa tiene la misma magnitud pero tiene direcciones opuestas). Así, si un observador en F nota un evento t ′, x ′, y ′, z , entonces un observador en F nota el mismo evento con coordenadas

Impulso de Lorentz inverso ( dirección x )

y el valor de γ permanece sin cambios. Este "truco" de simplemente invertir la dirección de la velocidad relativa preservando al mismo tiempo su magnitud, e intercambiando variables preparadas y no preparadas, siempre se aplica para encontrar la transformación inversa de cada impulso en cualquier dirección.

A veces es más conveniente usar β = v / c ( beta minúscula ) en lugar de v , de modo que

vβ−1 < β < 1βγ

Las transformaciones de Lorentz también se pueden derivar de una manera que se asemeja a rotaciones circulares en el espacio 3D utilizando funciones hiperbólicas . Para el impulso en la dirección x , los resultados son

Impulso de Lorentz ( dirección x con rapidez ζ )

donde ζ ( zeta minúscula ) es un parámetro llamado rapidez (se utilizan muchos otros símbolos, incluidos θ, ϕ, φ, η, ψ, ξ ). Dada la gran semejanza con las rotaciones de coordenadas espaciales en el espacio 3D en los planos cartesianos xy, yz y zx, se puede considerar un impulso de Lorentz como una rotación hiperbólica de las coordenadas espacio-temporales en los planos cartesianos xt, yt y zt de Espacio de Minkowski 4d . El parámetro ζ es el ángulo de rotación hiperbólico , análogo al ángulo ordinario para rotaciones circulares. Esta transformación se puede ilustrar con un diagrama de Minkowski .

Las funciones hiperbólicas surgen de la diferencia entre los cuadrados del tiempo y las coordenadas espaciales en el intervalo espacio-temporal, más que de una suma. El significado geométrico de las funciones hiperbólicas se puede visualizar tomando x = 0 o ct = 0 en las transformaciones. Al elevar al cuadrado y restar los resultados, se pueden derivar curvas hiperbólicas de valores de coordenadas constantes pero variando ζ , lo que parametriza las curvas según la identidad

Por el contrario, los ejes ct y x se pueden construir para coordenadas variables pero ζ constante . La definición

pendientect

Comparando las transformaciones de Lorentz en términos de velocidad y rapidez relativas, o usando las fórmulas anteriores, las conexiones entre β , γ y ζ son

Tomando la tangente hiperbólica inversa se obtiene la rapidez

Como −1 < β < 1 , se sigue −∞ < ζ < ∞ . De la relación entre ζ y β , la rapidez positiva ζ > 0 es un movimiento a lo largo de las direcciones positivas de los ejes xx , la rapidez cero ζ = 0 no es un movimiento relativo, mientras que la rapidez negativa ζ < 0 es un movimiento relativo a lo largo de las direcciones negativas de los ejes xx ′. xx ejes.

Las transformaciones inversas se obtienen intercambiando cantidades preparadas y no preparadas para cambiar los marcos de coordenadas y negando la rapidez ζ → − ζ ya que esto equivale a negar la velocidad relativa. Por lo tanto,

Impulso de Lorentz inverso ( dirección x con rapidez ζ )

Las transformaciones inversas se pueden visualizar de manera similar considerando los casos en los que x ′ = 0 y ct ′ = 0 .

Hasta ahora las transformaciones de Lorentz se han aplicado a un evento . Si hay dos eventos, hay una separación espacial y un intervalo de tiempo entre ellos. De la linealidad de las transformaciones de Lorentz se deduce que se pueden elegir dos valores de coordenadas espaciales y temporales, las transformaciones de Lorentz se pueden aplicar a cada uno y luego restarlas para obtener las transformaciones de Lorentz de las diferencias;

donde Δ ( delta mayúscula ) indica una diferencia de cantidades; por ejemplo, Δ x = x 2x 1 para dos valores de las coordenadas x , y así sucesivamente.

Estas transformaciones sobre diferencias en lugar de puntos espaciales o instantes de tiempo son útiles por varias razones:

Implicaciones físicas

Un requisito crítico de las transformaciones de Lorentz es la invariancia de la velocidad de la luz, un hecho utilizado en su derivación y contenido en las transformaciones mismas. Si en F la ecuación para un pulso de luz a lo largo de la dirección x es x = ct , entonces en F las transformaciones de Lorentz dan x ′ = ct , y viceversa, para cualquier c < v < c .

Para velocidades relativas mucho menores que la velocidad de la luz, las transformaciones de Lorentz se reducen a la transformación de Galileo.

principio de correspondencia[14]

Tres predicciones contradictorias, pero correctas, de las transformaciones son:

Relatividad de la simultaneidad
Supongamos que dos eventos ocurren a lo largo del eje x simultáneamente ( Δ t = 0 ) en F , pero separados por un desplazamiento Δ x distinto de cero . Entonces en F encontramos que , por lo que los eventos ya no son simultáneos según un observador en movimiento.
Dilatación del tiempo
Supongamos que hay un reloj en reposo en F. Si se mide un intervalo de tiempo en el mismo punto de ese cuadro, de modo que Δ x = 0 , entonces las transformaciones dan este intervalo en F por Δ t ′ = γ Δ t . Por el contrario, supongamos que hay un reloj en reposo en F . Si se mide un intervalo en el mismo punto de ese marco, de modo que Δ x ′ = 0 , entonces las transformaciones dan este intervalo en F por Δ t = γ Δ t . De cualquier manera, cada observador mide que el intervalo de tiempo entre tictac de un reloj en movimiento es mayor en un factor γ que el intervalo de tiempo entre tictac de su propio reloj.
Contracción de longitud
Supongamos que hay una varilla en reposo en F alineada a lo largo del eje x, con longitud Δ x . En F , la varilla se mueve con velocidad - v , por lo que su longitud debe medirse tomando dos mediciones simultáneas ( Δ t ′ = 0 ) en extremos opuestos. En estas condiciones, la transformada inversa de Lorentz muestra que Δ x = γ Δ x . En F las dos mediciones ya no son simultáneas, pero esto no importa porque la varilla está en reposo en F. Entonces, cada observador mide la distancia entre los puntos finales de una varilla en movimiento para que sea más corta en un factor 1/ γ que los puntos finales de una varilla idéntica en reposo en su propio marco. La contracción de longitud afecta cualquier cantidad geométrica relacionada con longitudes, por lo que desde la perspectiva de un observador en movimiento, las áreas y los volúmenes también parecerán contraerse a lo largo de la dirección del movimiento.

Transformaciones vectoriales

Un observador en el cuadro F observa que F se mueve con velocidad v , mientras que F observa que F se mueve con velocidad v . Los ejes de coordenadas de cada cuadro siguen siendo paralelos [ ¿ según quién? ] y ortogonal. El vector de posición medido en cada cuadro se divide en componentes paralelos y perpendiculares al vector de velocidad relativa v .
Izquierda: configuración estándar. Derecha: configuración inversa.

El uso de vectores permite expresar posiciones y velocidades en direcciones arbitrarias de forma compacta. Un solo impulso en cualquier dirección depende del vector de velocidad relativa completo v con una magnitud | v | = v que no puede igualar ni exceder c , de modo que 0 ≤ v < c .

Sólo cambian el tiempo y las coordenadas paralelas a la dirección del movimiento relativo, mientras que las coordenadas perpendiculares no. Con esto en mente, divida el vector de posición espacial r medido en F y r medido en F′ , cada uno en componentes perpendiculares (⊥) y paralelos (‖) a v ,

·producto escalarγβ = v / c0 ≤ β < 1 .

Introduciendo un vector unitario n = v / v = β / β en la dirección del movimiento relativo, la velocidad relativa es v = v n con magnitud v y dirección n , y el vector de proyección y rechazo dan respectivamente

La acumulación de resultados da las transformaciones completas,

Impulso de Lorentz ( en dirección n con magnitud v )

La proyección y el rechazo también se aplican a r . Para las transformaciones inversas, intercambie r y r para cambiar las coordenadas observadas y niegue la velocidad relativa v → − v (o simplemente el vector unitario n → − n ya que la magnitud v siempre es positiva) para obtener

Impulso de Lorentz inverso ( en dirección n con magnitud v )

El vector unitario tiene la ventaja de simplificar las ecuaciones para un solo impulso, permite restablecer v o β cuando sea conveniente y la parametrización de la rapidez se obtiene inmediatamente reemplazando β y βγ . No es conveniente realizar múltiples impulsos.

La relación vectorial entre velocidad relativa y rapidez es [15]

ζ0 ≤ ζ < ∞0 ≤ β < 1

Transformación de velocidades

La transformación de velocidades proporciona la definición de suma relativista de velocidades , el orden de los vectores se elige para reflejar el orden de la suma de velocidades; primero v (la velocidad de F′ con respecto a F) luego u (la velocidad de X con respecto a F′) para obtener u = vu (la velocidad de X con respecto a F).

Definiendo las velocidades coordinadas y el factor de Lorentz por

tomar los diferenciales en las coordenadas y el tiempo de las transformaciones vectoriales, luego dividir las ecuaciones, conduce a

Las velocidades u y u son la velocidad de algún objeto masivo. También pueden ser para un tercer sistema inercial (digamos F "), en cuyo caso deben ser constantes . Denota cualquier entidad por X. Entonces X se mueve con velocidad u relativa a F, o de manera equivalente con velocidad u relativa a F′, a su vez F′ se mueve con velocidad v relativa a F. Las transformaciones inversas se pueden obtener de manera similar, o como con las coordenadas de posición, intercambie u y u , y cambie v a v .

La transformación de velocidad es útil en la aberración estelar , el experimento de Fizeau y el efecto Doppler relativista .

Las transformaciones de aceleración de Lorentz se pueden obtener de manera similar tomando diferenciales en los vectores de velocidad y dividiéndolos por el diferencial de tiempo.

Transformación de otras cantidades.

En general, dadas cuatro cantidades A y Z = ( Z x , Z y , Z z ) y sus contrapartes potenciadas por Lorentz A y Z ′ = ( Zx , Zy , Zz ) , una relación de forma

La descomposición de Z (y Z ) en componentes perpendiculares y paralelas a v es exactamente la misma que para el vector de posición, al igual que el proceso de obtención de las transformaciones inversas (intercambio ( A , Z ) y ( A ′, Z ′ ) para cambiar las cantidades observadas e invertir la dirección del movimiento relativo mediante la sustitución n ↦ − n ).

Las cantidades ( A , Z ) forman colectivamente un cuatro vectores , donde A es el "componente temporal" y Z el "componente espacial". Ejemplos de A y Z son los siguientes:

Para un objeto dado (por ejemplo, partícula, fluido, campo, material), si A o Z corresponden a propiedades específicas del objeto como su densidad de carga , densidad de masa , espín , etc., sus propiedades se pueden fijar en el marco de reposo de ese objeto. Luego, las transformaciones de Lorentz dan las propiedades correspondientes en un marco que se mueve con respecto al objeto con velocidad constante. Esto rompe algunas nociones que se dan por sentadas en la física no relativista. Por ejemplo, la energía E de un objeto es un escalar en la mecánica no relativista, pero no en la mecánica relativista porque la energía cambia bajo las transformaciones de Lorentz; su valor es diferente para varios sistemas inerciales. En el sistema de reposo de un objeto, tiene energía en reposo y impulso cero. En un marco potenciado su energía es diferente y parece tener impulso. De manera similar, en la mecánica cuántica no relativista el espín de una partícula es un vector constante, pero en la mecánica cuántica relativista el espín depende del movimiento relativo. En el sistema de reposo de la partícula, el pseudovector de espín se puede fijar para que sea su espín no relativista normal con un número temporal cero st ; sin embargo , un observador mejorado percibirá un componente temporal distinto de cero y un espín alterado. [dieciséis]

No todas las cantidades son invariantes en la forma que se muestra arriba, por ejemplo, el momento angular orbital L no tiene una cantidad temporal, y tampoco la tienen el campo eléctrico E ni el campo magnético B. La definición de momento angular es L = r × p , y en un marco potenciado el momento angular alterado es L ′ = r ′ × p . La aplicación de esta definición utilizando las transformaciones de coordenadas y momento conduce a la transformación del momento angular. Resulta que L se transforma con otra cantidad vectorial N = ( E / c 2 ) rt p relacionada con impulsos; consulte momento angular relativista para más detalles. Para el caso de los campos E y B , las transformaciones no se pueden obtener directamente usando álgebra vectorial. La fuerza de Lorentz es la definición de estos campos, y en F es F = q ( E + v × B ) mientras que en F es F ′ = q ( E ′ + v ′ × B ′) . Un método para derivar las transformaciones del campo EM de una manera eficiente que también ilustra la unidad del campo electromagnético utiliza el álgebra tensorial, que se detalla a continuación.

formulación matemática

En todo momento, las letras mayúsculas en cursiva y no en negrita son matrices de 4 × 4, mientras que las letras en negrita no en cursiva son matrices de 3 × 3.

Grupo de Lorentz homogéneo

Escribir las coordenadas en vectores columna y la métrica de Minkowski η como una matriz cuadrada

Ttransposición
invariante
Λ

Se denota el conjunto de todas las transformaciones de Lorentz en este artículo . Este conjunto junto con la multiplicación de matrices forma un grupo , en este contexto conocido como grupo de Lorentz . Además, la expresión anterior X · X es una forma cuadrática de la firma (3,1) en el espacio-tiempo, y el grupo de transformaciones que deja invariante esta forma cuadrática es el grupo ortogonal indefinido O(3,1), un grupo de Lie . En otras palabras, el grupo de Lorentz es O(3,1). Como se presenta en este artículo, todos los grupos de Lie mencionados son grupos de Lie matriciales . En este contexto, la operación de composición equivale a la multiplicación de matrices .

De la invariancia del intervalo espacio-temporal se deduce

determinante[nb 4]

Escribiendo la métrica de Minkowski como una matriz de bloques y la transformación de Lorentz en la forma más general,

Γ, a , b , M
b T b ≥ 0

La desigualdad negativa puede ser inesperada, porque Γ multiplica la coordenada temporal y esto tiene un efecto sobre la simetría temporal . Si se cumple la igualdad positiva, entonces Γ es el factor de Lorentz.

El determinante y la desigualdad proporcionan cuatro formas de clasificar las transformaciones de Lorentz ( en este caso LT para mayor brevedad ). Cualquier LT particular tiene sólo un signo determinante y sólo una desigualdad. Hay cuatro conjuntos que incluyen todos los pares posibles dados por las intersecciones (símbolo en forma de "n" que significa "y") de estos conjuntos de clasificación.

donde "+" y "-" indican el signo determinante, mientras que " ↑ " para ≥ y "↓" para ≤ denotan las desigualdades.

El grupo de Lorentz completo se divide en la unión (símbolo en forma de "u" que significa "o") de cuatro conjuntos disjuntos

Un subgrupo de un grupo debe cerrarse bajo la misma operación del grupo (aquí multiplicación de matrices). En otras palabras, para dos transformaciones de Lorentz Λ y L de un conjunto particular, las transformaciones de Lorentz compuestas Λ L y L Λ deben estar en el mismo conjunto que Λ y L. Este no es siempre el caso: la composición de dos transformaciones de Lorentz anticrónicas es ortocrónica y la composición de dos transformaciones de Lorentz impropias es adecuada. En otras palabras, mientras que los conjuntos , , y todos forman subgrupos, los conjuntos que contienen transformaciones impropias y/o anticrónicas sin suficientes transformaciones ortocrónicas adecuadas (p. ej ., , ) no forman subgrupos.

Transformaciones adecuadas

Si se mide un 4-vector covariante de Lorentz en un marco inercial con resultado , y la misma medición realizada en otro marco inercial (con la misma orientación y origen) da resultado , los dos resultados estarán relacionados por

[17]

donde es la magnitud de la velocidad y es el factor de Lorentz. Esta fórmula representa una transformación pasiva, ya que describe cómo cambian las coordenadas de la cantidad medida del marco no preparado al marco preparado. La transformación activa viene dada por .

Si un cuadro F se impulsa con una velocidad u relativa al cuadro F , y otro cuadro F " se impulsa con una velocidad v relativa a F , los aumentos separados son

F "F
uvcolinealesconmutanB ( v ) B ( u ) = B ( u ) B ( v )B ( w )wuv

Si u y v no son colineales sino que están en direcciones diferentes, la situación es considerablemente más complicada. Los impulsos de Lorentz en diferentes direcciones no conmutan: B ( v ) B ( u ) y B ( u ) B ( v ) no son iguales. Aunque cada una de estas composiciones no es un impulso único, cada composición sigue siendo una transformación de Lorentz, ya que preserva el intervalo espacio-temporal. Resulta que la composición de dos impulsos de Lorentz cualesquiera es equivalente a un impulso seguido o precedido por una rotación en las coordenadas espaciales, en la forma de R ( ρ ) B ( w ) o B ( w ) R ( ρ ) . W y w son velocidades compuestas , mientras que ρ y ρ son parámetros de rotación (por ejemplo, variables de eje-ángulo , ángulos de Euler , etc.). La rotación en forma de matriz de bloques es simplemente

R ( ρ ) es una matriz de rotaciónNowρwρuvRrotación de Wignerprecesión de Thomasw , ρ , w , ρ

En este artículo se utiliza la representación eje-ángulo para ρ . La rotación se produce alrededor de un eje en la dirección de un vector unitario e , que pasa por el ángulo θ (positivo en el sentido contrario a las agujas del reloj, negativo en el sentido de las agujas del reloj, según la regla de la mano derecha ). El "vector eje-ángulo"

Las rotaciones espaciales por sí solas también son transformaciones de Lorentz, ya que dejan invariante el intervalo espacio-temporal. Al igual que los impulsos, las rotaciones sucesivas sobre diferentes ejes no se conmutan. A diferencia de los impulsos, la composición de dos rotaciones cualesquiera equivale a una sola rotación. Algunas otras similitudes y diferencias entre las matrices de impulso y rotación incluyen:

La transformación de Lorentz adecuada más general Λ( v , θ ) incluye un impulso y una rotación juntos, y es una matriz no simétrica. Como casos especiales, Λ( 0 , θ ) = R ( θ ) y Λ( v , 0 ) = B ( v ) . Es complicado escribir una forma explícita de la transformación general de Lorentz y no la daremos aquí. Sin embargo, a continuación se darán expresiones en forma cerrada para las matrices de transformación utilizando argumentos teóricos de grupo. Será más fácil usar la parametrización de rapidez para aumentos, en cuyo caso se escribe Λ( ζ , θ ) y B ( ζ ) .

El grupo de mentira SO + (3,1)

El conjunto de transformaciones.

grupo ortogonal indefinido especial+

Para simplificar, observe el impulso de Lorentz infinitesimal en la dirección x (examinar un impulso en cualquier otra dirección, o la rotación alrededor de cualquier eje, sigue un procedimiento idéntico). El impulso infinitesimal está a un pequeño impulso de la identidad, obtenido mediante la expansión de Taylor de la matriz de impulso a primer orden aproximadamente ζ = 0 ,

ζB xxderivada de la matrizζ = 0

Por ahora, K x está definido por este resultado (su significado se explicará en breve). En el límite de un número infinito de pasos infinitamente pequeños, se obtiene la transformación de impulso finito en forma de matriz exponencial.

definición límite de la exponencial (ver también caracterizaciones de la función exponencial[nb 5]

El vector eje-ángulo θ y el vector de rapidez ζ son en total seis variables continuas que forman los parámetros del grupo (en esta representación particular), y los generadores del grupo son K = ( K x , K y , K z ) y J = ( J x , J y , J z ) , cada vector de matrices con las formas explícitas [nb 6]

Todos estos se definen de manera análoga a K x arriba, aunque los signos menos en los generadores elevadores son convencionales. Físicamente, los generadores del grupo de Lorentz corresponden a simetrías importantes en el espacio-tiempo: J son los generadores de rotación que corresponden al momento angular y K son los generadores de impulso que corresponden al movimiento del sistema en el espacio-tiempo. La derivada de cualquier curva suave C ( t ) con C (0) = I en el grupo dependiendo de algún parámetro de grupo t con respecto a ese parámetro de grupo, evaluado en t = 0 , sirve como definición de un generador de grupo correspondiente G , y esto refleja una transformación infinitesimal alejándose de la identidad. La curva suave siempre se puede tomar como exponencial, ya que la exponencial siempre asignará G suavemente al grupo a través de t → exp( tG ) para todo t ; esta curva producirá G nuevamente cuando se diferencia en t = 0 .

Desarrollando las exponenciales en su serie de Taylor se obtiene

Se ha dicho que la transformación general propia de Lorentz es producto de un impulso y una rotación. En el nivel infinitesimal el producto

( θ · J )( ζ · K )( ζ · K )( θ · J )

Lo contrario también es cierto, pero la descomposición de una transformación general finita de Lorentz en tales factores no es trivial. En particular,

en principioJKRotación de Wignerla descomposición se dafórmula de Baker-Campbell-Hausdorff

El álgebra de Lie entonces(3,1)

Los generadores de Lorentz se pueden sumar o multiplicar por números reales para obtener más generadores de Lorentz. En otras palabras, el conjunto de todos los generadores Lorentz.

suma de matricesmultiplicación de una matriz por un númeroespacio vectorial[nb 7]J x , J y , J z , K x , K y , K zbasesVθ x , θ y , θ z , ζ x , ζ y , ζ zcoordenadas[nota 8]

Tres de las relaciones de conmutación de los generadores de Lorentz son

[ A , B ] = ABBAconmutadorpermutaciones cíclicas

Estas relaciones de conmutación, y el espacio vectorial de generadores, cumplen la definición del álgebra de Lie . En resumen, un álgebra de Lie se define como un espacio vectorial V sobre un campo de números, y con una operación binaria [,] (llamada corchete de Lie en este contexto) sobre los elementos del espacio vectorial, satisfaciendo los axiomas de bilinealidad , alternancia y la identidad jacobi . Aquí la operación [,] es el conmutador que satisface todos estos axiomas, el espacio vectorial es el conjunto de generadores de Lorentz V como se indicó anteriormente, y el campo es el conjunto de números reales.

Vinculación de la terminología utilizada en matemáticas y física: un generador de grupos es cualquier elemento del álgebra de Lie. Un parámetro de grupo es un componente de un vector de coordenadas que representa un elemento arbitrario del álgebra de Lie con respecto a alguna base. Una base, entonces, es un conjunto de generadores que son una base del álgebra de Lie en el sentido habitual del espacio vectorial.

El mapa exponencial del álgebra de Lie al grupo de Lie,

matriz exponencialsobreyectivo

Transformaciones inadecuadas

Las transformaciones de Lorentz también incluyen la inversión de paridad.

la inversión del tiempo
estoy la matriz de identidadinvolución (matemáticas)

Si Λ es una transformación de Lorentz ortocrónica adecuada, entonces T Λ es anticrónica impropia, P Λ es ortocrónica impropia y TP Λ = PT Λ es anticrónica propia.

Grupo de Lorentz no homogéneo

No se han tenido en cuenta otras dos simetrías del espacio-tiempo. Para que el intervalo espacio-temporal sea invariante, se puede demostrar [18] que es necesario y suficiente que la transformación de coordenadas sea de la forma

CCtransformación de Lorentztransformación de Poincaré[19] [20]Ctransformación de Lorentz homogénea

Formulación tensorial

Vectores contravariantes

Escribir la transformación matricial general de coordenadas como ecuación matricial

tensoresespinoresnotación de índice tensorial

donde los índices inferior y superior etiquetan componentes covariantes y contravariantes respectivamente, [21] y se aplica la convención de suma . Es una convención estándar utilizar índices griegos que toman el valor 0 para los componentes temporales y 1, 2, 3 para los componentes espaciales, mientras que los índices latinos simplemente toman los valores 1, 2, 3 para los componentes espaciales (lo contrario para Landau y Lifshitz). Tenga en cuenta que el primer índice (leído de izquierda a derecha) corresponde en la notación matricial a un índice de fila . El segundo índice corresponde al índice de la columna.

La matriz de transformación es universal para todos los cuatro vectores , no solo para las coordenadas espacio-temporales de 4 dimensiones. Si A es cualquier cuatro vector, entonces en notación de índice tensorial

Alternativamente, se escribe

de n
Πdel grupo de Lorentzn × nΛno1nXbispinoríndices de Dirac

Vectores covariantes

También existen cantidades vectoriales con índices covariantes. Generalmente se obtienen a partir de sus correspondientes objetos con índices contravariantes mediante la operación de bajar un índice ; p.ej,

ηtensor métrico
η μνη μνη μν = η μνelevar un índiceA μ4

Pero

Es decir, es el componente ( μ , ν ) de la transformación inversa de Lorentz. Uno define (como una cuestión de notación),

Ahora una sutileza. La suma implícita en el lado derecho de

un índice de filaΛ −1transpuesta inversaΛA μ

Esto significa exactamente que los vectores covariantes (considerados como matrices de columnas) se transforman según la representación dual de la representación estándar del grupo de Lorentz. Esta noción se generaliza a representaciones generales, simplemente reemplace Λ con Π(Λ) .

Tensores

Si A y B son operadores lineales en espacios vectoriales U y V , entonces se puede definir un operador lineal AB en el producto tensorial de U y V , denotado UV según [22]

              (T1)

De esto queda inmediatamente claro que si u y v son cuatro vectores en V , entonces uvT 2 VVV se transforma como

              (T2)

El segundo paso usa la bilinealidad del producto tensorial y el último paso define un tensor de 2 en forma de componente, o más bien, simplemente cambia el nombre del tensor uv .

Estas observaciones se generalizan de manera obvia a más factores, y utilizando el hecho de que un tensor general en un espacio vectorial V puede escribirse como la suma de un coeficiente (¡componente!) multiplicado por los productos tensoriales de vectores base y covectores base, se llega a la ley de transformación para cualquier cantidad tensor T . Está dado por [23]

              (T3)

donde Λ χ′ ψ se define arriba. Esta forma generalmente se puede reducir a la forma para objetos generales de n componentes dada anteriormente con una única matriz ( Π(Λ) ) que opera en vectores de columna. A veces se prefiere esta última forma; por ejemplo, para el tensor de campo electromagnético.

Transformación del campo electromagnético.

Impulso de Lorentz de una carga eléctrica, la carga está en reposo en un cuadro o en el otro.

Las transformaciones de Lorentz también se pueden utilizar para ilustrar que el campo magnético B y el campo eléctrico E son simplemente aspectos diferentes de la misma fuerza: la fuerza electromagnética , como consecuencia del movimiento relativo entre cargas eléctricas y observadores. [24] El hecho de que el campo electromagnético muestra efectos relativistas queda claro al realizar un simple experimento mental. [25]

Los campos eléctrico y magnético se transforman de manera diferente que en el espacio y el tiempo, pero exactamente de la misma manera que el momento angular relativista y el vector impulso.

El tensor de intensidad del campo electromagnético está dado por

unidades del SIsistema de unidades gaussianoEBcampo electromagnético. tensor[26]x[27]

La ley general de transformación (T3) se convierte en

Para el campo magnético se obtiene

Para los resultados del campo eléctrico.

Aquí, se utiliza β = ( β , 0, 0) . Estos resultados se pueden resumir en

EEc3 + 1vista geométrica
3 + 1 . cualquierespacio-tiempoel espacioel tiempoEB(T1)(T2)(T3)mismo evento en el espacio-tiempo

La contracción de longitud tiene un efecto sobre la densidad de carga ρ y la densidad de corriente J , y la dilatación del tiempo tiene un efecto sobre la tasa de flujo de carga (corriente), por lo que las distribuciones de carga y corriente deben transformarse de manera relacionada bajo un impulso. Resulta que se transforman exactamente como los cuatro vectores espacio-tiempo y energía-momento,

o, en la visión geométrica más simple,

La densidad de carga se transforma como el componente de tiempo de un cuatro vectores. Es un escalar rotacional. La densidad de corriente es un vector de 3.

Las ecuaciones de Maxwell son invariantes bajo transformaciones de Lorentz.

Espinores

La ecuación (T1) se mantiene sin modificaciones para cualquier representación del grupo de Lorentz, incluida la representación bispinor . En (T2) simplemente se reemplazan todas las apariciones de Λ por la representación bispinor Π(Λ) ,

              (T4)

La ecuación anterior podría ser, por ejemplo, la transformación de un estado en el espacio de Fock que describe dos electrones libres.

Transformación de campos generales.

Un estado general de múltiples partículas que no interactúan (estado espacial de Fock) en la teoría cuántica de campos se transforma de acuerdo con la regla [28]

donde W (Λ, p ) es la rotación de Wigner y D ( j ) es la representación dimensional (2 j + 1) de SO(3) .

Ver también

Notas a pie de página

  1. ^ Se puede imaginar que en cada marco inercial hay observadores ubicados en todo el espacio, cada uno con un reloj sincronizado y en reposo en el marco inercial particular. Estos observadores luego se presentan en una oficina central, donde se recopilan todos los informes. Cuando se habla de un observador en particular , se hace referencia a alguien que tiene, al menos en principio, una copia de este informe. Véase, por ejemplo, Sard (1970).
  2. ^ Los requisitos separados de las tres ecuaciones conducen a tres grupos diferentes. La segunda ecuación se satisface para las traducciones del espacio-tiempo además de las transformaciones de Lorentz que conducen al grupo de Poincaré o al grupo de Lorentz no homogéneo . La primera ecuación (o la segunda restringida a una separación similar a la luz) conduce a un grupo aún mayor, el grupo conforme del espacio-tiempo.
  3. ^ Los grupos O(3, 1) y O(1, 3) son isomorfos. Se cree ampliamente que la elección entre las dos firmas métricas no tiene relevancia física, aunque algunos objetos relacionados con O(3, 1) y O(1, 3) respectivamente, por ejemplo, las álgebras de Clifford correspondientes a las diferentes firmas de la forma bilineal asociada a los dos grupos, no son isomorfas.
  4. ^ Para dos matrices cuadradas A y B , det( AB ) = det( A )det( B )
  5. ^ Explícitamente,
  6. ^ En mecánica cuántica , mecánica cuántica relativista y teoría cuántica de campos , se utiliza una convención diferente para estas matrices; todos los lados derechos se multiplican por un factor de la unidad imaginaria i = −1 .
  7. ^ Hasta ahora, el término "vector" se ha referido exclusivamente al " vector euclidiano ", ejemplos son la posición r , la velocidad v , etc. El término "vector" se aplica de manera mucho más amplia que los vectores euclidianos, los vectores de fila o columna, etc., ver lineal álgebra y espacio vectorial para más detalles. Los generadores de un grupo de Lie también forman un espacio vectorial sobre un campo de números (por ejemplo, números reales , números complejos ), ya que una combinación lineal de los generadores también es un generador. Simplemente viven en un espacio diferente al de los vectores de posición en el espacio 3D ordinario.
  8. ^ En el espacio de posición 3D ordinario , el vector de posición r = x e x + y e y + z e z se expresa como una combinación lineal de los vectores unitarios cartesianos e x , e y , e z que forman una base, y el vector cartesiano las coordenadas x, y, z son coordenadas con respecto a esta base.

Notas

  1. ^ Rao, KN Srinivasa (1988). Los grupos de rotación y Lorentz y sus representaciones para los físicos (edición ilustrada). John Wiley e hijos. pag. 213.ISBN _ 978-0-470-21044-4.Ecuación 6-3.24, página 210
  2. ^ Forshaw y Smith 2009
  3. ^ Cottingham y Greenwood 2007, pág. 21
  4. ^ Lorentz 1904
  5. ^ O'Connor y Robertson 1996
  6. ^ Marrón 2003
  7. ^ Rothman 2006, págs. 112 y siguientes.
  8. ^ Darrigol 2005, págs. 1-22
  9. ^ Macrossan 1986, págs. 232–34
  10. ^ La referencia se encuentra en el siguiente artículo: Poincaré 1905, págs. 1504-1508
  11. ^ Einstein 1905, págs. 891–921
  12. ^ Joven y liberto 2008
  13. ^ Forshaw y Smith 2009
  14. ^ Einstein 1916
  15. ^ Barut 1964, pag. 18-19
  16. ^ Chaichian y Hagedorn 1997, pág. 239
  17. ^ Peludo, WH (1 de noviembre de 1955). "Transformación de Lorentz y la precesión de Thomas". Revista Estadounidense de Física . 23 (8): 517–525. Código bibliográfico : 1955AmJPh..23..517F. doi :10.1119/1.1934085. ISSN  0002-9505.
  18. ^ Weinberg 1972
  19. ^ Weinberg 2005, págs. 55–58
  20. ^ Ohlsson 2011, pag. 3–9
  21. ^ Dennery y Krzywicki 2012, pág. 138
  22. ^ Salón 2003, Capítulo 4
  23. ^ Carroll 2004, pag. 22
  24. ^ Grant y Phillips 2008
  25. ^ Griffiths 2007
  26. ^ Jackson 1975, pag. [ página necesaria ]
  27. ^ Misner, Thorne y Wheeler 1973
  28. ^ Weinberg 2002, Capítulo 3

Referencias

Sitios web

Documentos

Libros

Otras lecturas

enlaces externos