En mecánica clásica , el vector Laplace-Runge-Lenz (LRL) es un vector utilizado principalmente para describir la forma y orientación de la órbita de un cuerpo astronómico alrededor de otro, como una estrella binaria o un planeta que gira alrededor de una estrella. Para dos cuerpos que interactúan por gravedad newtoniana , el vector LRL es una constante de movimiento , lo que significa que es el mismo sin importar dónde se calcule en la órbita; [1] [2] equivalentemente, se dice que el vector LRL se conserva . De manera más general, el vector LRL se conserva en todos los problemas en los que dos cuerpos interactúan por una fuerza central que varía como el cuadrado inverso de la distancia entre ellos; tales problemas se denominan problemas de Kepler . [3] [4] [5] [6]
El átomo de hidrógeno es un problema de Kepler, ya que comprende dos partículas cargadas que interactúan mediante la ley de electrostática de Coulomb , otra fuerza central de inverso del cuadrado. El vector LRL fue esencial en la primera derivación mecánica cuántica del espectro del átomo de hidrógeno, [7] [8] antes del desarrollo de la ecuación de Schrödinger . Sin embargo, este enfoque rara vez se utiliza en la actualidad.
En mecánica clásica y cuántica, las cantidades conservadas generalmente corresponden a una simetría del sistema. [9] La conservación del vector LRL corresponde a una simetría inusual; el problema de Kepler es matemáticamente equivalente a una partícula que se mueve libremente en la superficie de una (hiper)esfera de cuatro dimensiones , [10] de modo que todo el problema es simétrico bajo ciertas rotaciones del espacio de cuatro dimensiones. [11] Esta mayor simetría resulta de dos propiedades del problema de Kepler: el vector de velocidad siempre se mueve en un círculo perfecto y, para una energía total dada , todos esos círculos de velocidad se intersecan entre sí en los mismos dos puntos. [12]
El vector de Laplace-Runge-Lenz debe su nombre a Pierre-Simon de Laplace , Carl Runge y Wilhelm Lenz . También se lo conoce como vector de Laplace , [13] [14] vector de Runge-Lenz [15] y vector de Lenz . [8] Irónicamente, ninguno de esos científicos lo descubrió. [15] El vector LRL ha sido redescubierto y reformulado varias veces; [15] por ejemplo, es equivalente al vector de excentricidad adimensional de la mecánica celeste . [2] [14] [16] Se han definido varias generalizaciones del vector LRL, que incorporan los efectos de la relatividad especial , los campos electromagnéticos e incluso diferentes tipos de fuerzas centrales. [17] [18] [19]
Una sola partícula que se mueve bajo cualquier fuerza central conservativa tiene al menos cuatro constantes de movimiento: la energía total E y los tres componentes cartesianos del vector de momento angular L con respecto al centro de fuerza. [20] [21] La órbita de la partícula está confinada al plano definido por el momento inicial de la partícula p (o, equivalentemente, su velocidad v ) y el vector r entre la partícula y el centro de fuerza [20] [21] (véase la Figura 1). Este plano de movimiento es perpendicular al vector de momento angular constante L = r × p ; esto puede expresarse matemáticamente mediante la ecuación del producto escalar vectorial r ⋅ L = 0 . Dada su definición matemática a continuación, el vector de Laplace–Runge–Lenz (vector LRL) A siempre es perpendicular al vector de momento angular constante L para todas las fuerzas centrales ( A ⋅ L = 0 ). Por lo tanto, A siempre se encuentra en el plano de movimiento. Como se muestra a continuación, A apunta desde el centro de fuerza hasta el periapsis del movimiento, el punto de aproximación más cercano, y su longitud es proporcional a la excentricidad de la órbita. [1]
El vector LRL A es constante en longitud y dirección, pero solo para una fuerza central de ley inversa del cuadrado. [1] Para otras fuerzas centrales , el vector A no es constante, sino que cambia tanto en longitud como en dirección. Si la fuerza central es aproximadamente una ley inversa del cuadrado, el vector A es aproximadamente constante en longitud, pero gira lentamente su dirección. [14] Se puede definir un vector LRL conservado generalizado para todas las fuerzas centrales, pero este vector generalizado es una función complicada de la posición y, por lo general, no se puede expresar en forma cerrada . [18] [19]
El vector LRL se diferencia de otras magnitudes conservadas en la siguiente propiedad. Mientras que para las magnitudes conservadas típicas existe una coordenada cíclica correspondiente en el lagrangiano tridimensional del sistema, no existe tal coordenada para el vector LRL. Por lo tanto, la conservación del vector LRL debe deducirse directamente, por ejemplo, mediante el método de los corchetes de Poisson , como se describe a continuación. Las magnitudes conservadas de este tipo se denominan "dinámicas", en contraste con las leyes de conservación "geométricas" habituales, por ejemplo, la del momento angular.
El vector LRL A es una constante de movimiento del problema de Kepler y resulta útil para describir órbitas astronómicas, como el movimiento de planetas y estrellas binarias. Sin embargo, nunca ha sido muy conocido entre los físicos, posiblemente porque es menos intuitivo que el momento y el momento angular. En consecuencia, ha sido redescubierto de forma independiente varias veces a lo largo de los últimos tres siglos. [15]
Jakob Hermann fue el primero en demostrar que A se conserva para un caso especial de la fuerza central de la inversa del cuadrado, [22] y calculó su conexión con la excentricidad de la elipse orbital . El trabajo de Hermann fue generalizado a su forma moderna por Johann Bernoulli en 1710. [23] A finales de siglo, Pierre-Simon de Laplace redescubrió la conservación de A , derivándola analíticamente, en lugar de geométricamente. [24] A mediados del siglo XIX, William Rowan Hamilton derivó el vector de excentricidad equivalente definido a continuación, [16] usándolo para demostrar que el vector de momento p se mueve en un círculo para el movimiento bajo una fuerza central de la inversa del cuadrado (Figura 3). [12]
A principios del siglo XX, Josiah Willard Gibbs derivó el mismo vector mediante análisis vectorial . [25] La derivación de Gibbs fue utilizada como ejemplo por Carl Runge en un popular libro de texto alemán sobre vectores, [26] al que Wilhelm Lenz hizo referencia en su artículo sobre el (antiguo) tratamiento mecánico cuántico del átomo de hidrógeno. [27] En 1926, Wolfgang Pauli utilizó el vector LRL para derivar los niveles de energía del átomo de hidrógeno utilizando la formulación de mecánica matricial de la mecánica cuántica, [7] después de lo cual se conoció principalmente como el vector de Runge-Lenz . [15]
Una fuerza central de cuadrado inverso que actúa sobre una sola partícula se describe mediante la ecuación La energía potencial correspondiente está dada por . El parámetro constante k describe la intensidad de la fuerza central; es igual a G ⋅ M ⋅ m para fuerzas gravitacionales y − k e ⋅ Q ⋅ q para fuerzas electrostáticas. La fuerza es atractiva si k > 0 y repulsiva si k < 0 .
El vector LRL A se define matemáticamente mediante la fórmula [1]
dónde
Las unidades del SI del vector LRL son julio-kilogramo-metro (J⋅kg⋅m). Esto se debe a que las unidades de p y L son kg⋅m/s y J⋅s, respectivamente. Esto concuerda con las unidades de m (kg) y de k (N⋅m 2 ).
Esta definición del vector LRL A se refiere a una partícula puntual de masa m que se mueve bajo la acción de una fuerza fija. Sin embargo, la misma definición puede extenderse a problemas de dos cuerpos , como el problema de Kepler, tomando m como la masa reducida de los dos cuerpos y r como el vector entre los dos cuerpos.
Dado que la fuerza supuesta es conservativa, la energía total E es una constante de movimiento,
La fuerza supuesta también es una fuerza central. Por lo tanto, el vector de momento angular L también se conserva y define el plano en el que se desplaza la partícula. El vector LRL A es perpendicular al vector de momento angular L porque tanto p × L como r son perpendiculares a L . De ello se deduce que A se encuentra en el plano de movimiento.
Se pueden definir formulaciones alternativas para la misma constante de movimiento, típicamente escalando el vector con constantes, como la masa m , el parámetro de fuerza k o el momento angular L . [15] La variante más común es dividir A por mk , lo que produce el vector de excentricidad, [2] [16] un vector adimensional a lo largo del semieje mayor cuyo módulo es igual a la excentricidad de la cónica: Una formulación equivalente [14] multiplica este vector de excentricidad por el semieje mayor a , dando al vector resultante las unidades de longitud. Otra formulación [28] divide A por , produciendo una cantidad conservada equivalente con unidades de longitud inversa, una cantidad que aparece en la solución del problema de Kepler donde es el ángulo entre A y el vector de posición r . A continuación se dan formulaciones alternativas adicionales.
La forma y orientación de las órbitas se pueden determinar a partir del vector LRL de la siguiente manera. [1] Tomando el producto escalar de A con el vector de posición r se obtiene la ecuación donde θ es el ángulo entre r y A (Figura 2). Permutando el triple producto escalar se obtiene
Al reorganizar se obtiene la solución de la ecuación de Kepler.
Esto corresponde a la fórmula para una sección cónica de excentricidad e donde la excentricidad y C es una constante. [1]
Tomando el producto escalar de A consigo mismo se obtiene una ecuación que involucra la energía total E , [1] que puede reescribirse en términos de la excentricidad, [1]
Así, si la energía E es negativa (órbitas ligadas), la excentricidad es menor que uno y la órbita es una elipse. Por el contrario, si la energía es positiva (órbitas no ligadas, también llamadas "órbitas dispersas" [1] ), la excentricidad es mayor que uno y la órbita es una hipérbola . [1] Finalmente, si la energía es exactamente cero, la excentricidad es uno y la órbita es una parábola . [1] En todos los casos, la dirección de A se encuentra a lo largo del eje de simetría de la sección cónica y apunta desde el centro de fuerza hacia el periapsis, el punto de aproximación más cercano. [1]
La conservación del vector LRL A y del vector de momento angular L es útil para demostrar que el vector de momento p se mueve en un círculo bajo una fuerza central de inverso del cuadrado. [12] [15]
Tomando el producto escalar de consigo mismo se obtiene
Además, al elegir L a lo largo del eje z y el semieje mayor como el eje x , se obtiene la ecuación del lugar geométrico para p ,
En otras palabras, el vector de momento p está confinado a un círculo de radio mk / L = L / ℓ centrado en (0, A / L ) . [29] Para órbitas acotadas, la excentricidad e corresponde al coseno del ángulo η que se muestra en la Figura 3. Para órbitas no acotadas, tenemos y por lo tanto el círculo no interseca el eje .
En el límite degenerado de las órbitas circulares, y por tanto nula A , el círculo se centra en el origen (0,0) . Por brevedad, también es útil introducir la variable .
Esta hodógrafa circular es útil para ilustrar la simetría del problema de Kepler.
Las siete cantidades escalares E , A y L (al ser vectores, las dos últimas contribuyen con tres cantidades conservadas cada una) están relacionadas por dos ecuaciones, A ⋅ L = 0 y A 2 = m 2 k 2 + 2 mEL 2 , dando cinco constantes de movimiento independientes . (Dado que la magnitud de A , y por lo tanto la excentricidad e de la órbita, se puede determinar a partir del momento angular total L y la energía E , solo la dirección de A se conserva independientemente; además, dado que A debe ser perpendicular a L , contribuye solo con una cantidad conservada adicional).
Esto es coherente con las seis condiciones iniciales (los vectores de posición y velocidad iniciales de la partícula, cada uno con tres componentes) que especifican la órbita de la partícula, ya que el tiempo inicial no está determinado por una constante de movimiento. La órbita unidimensional resultante en un espacio de fases de seis dimensiones está, por tanto, completamente especificada.
Un sistema mecánico con d grados de libertad puede tener como máximo 2 d − 1 constantes de movimiento, ya que hay 2 d condiciones iniciales y el tiempo inicial no puede determinarse por una constante de movimiento. Un sistema con más de d constantes de movimiento se denomina superintegrable y un sistema con 2 d − 1 constantes se denomina máximamente superintegrable . [30] Dado que la solución de la ecuación de Hamilton-Jacobi en un sistema de coordenadas puede producir solo d constantes de movimiento, los sistemas superintegrables deben ser separables en más de un sistema de coordenadas. [31] El problema de Kepler es máximamente superintegrable, ya que tiene tres grados de libertad ( d = 3 ) y cinco constantes de movimiento independientes; su ecuación de Hamilton-Jacobi es separable tanto en coordenadas esféricas como en coordenadas parabólicas , [17] como se describe a continuación.
Los sistemas máximamente superintegrables siguen órbitas cerradas y unidimensionales en el espacio de fases , ya que la órbita es la intersección de las isosuperficies del espacio de fases de sus constantes de movimiento. En consecuencia, las órbitas son perpendiculares a todos los gradientes de todas estas isosuperficies independientes, cinco en este problema específico, y por lo tanto están determinadas por los productos cruzados generalizados de todos estos gradientes. Como resultado, todos los sistemas superintegrables son automáticamente descriptibles por la mecánica de Nambu , [32] alternativamente y de manera equivalente, por la mecánica hamiltoniana .
Los sistemas máximamente superintegrables se pueden cuantificar utilizando relaciones de conmutación , como se ilustra a continuación. [33] Sin embargo, de manera equivalente, también se cuantifican en el marco de Nambu, como este problema clásico de Kepler en el átomo de hidrógeno cuántico. [34]
El vector A de Laplace-Runge-Lenz se conserva solo para una fuerza central perfecta de inverso del cuadrado. Sin embargo, en la mayoría de los problemas prácticos, como el movimiento planetario, la energía potencial de interacción entre dos cuerpos no es exactamente una ley de inverso del cuadrado, sino que puede incluir una fuerza central adicional, una denominada perturbación descrita por una energía potencial h ( r ) . En tales casos, el vector LRL gira lentamente en el plano de la órbita, lo que corresponde a una precesión apsidal lenta de la órbita.
Por suposición, el potencial perturbador h ( r ) es una fuerza central conservativa, lo que implica que la energía total E y el vector de momento angular L se conservan. Por lo tanto, el movimiento todavía se encuentra en un plano perpendicular a L y la magnitud A se conserva, a partir de la ecuación A 2 = m 2 k 2 + 2 mEL 2 . El potencial perturbador h ( r ) puede ser cualquier tipo de función, pero debería ser significativamente más débil que la fuerza principal inversa del cuadrado entre los dos cuerpos.
La velocidad a la que gira el vector LRL proporciona información sobre el potencial perturbador h ( r ) . Utilizando la teoría de perturbación canónica y las coordenadas del ángulo de acción , es sencillo demostrar [1] que A gira a una velocidad de, donde T es el período orbital, y la identidad L dt = m r 2 dθ se utilizó para convertir la integral de tiempo en una integral angular (Figura 5). La expresión entre corchetes angulares, ⟨ h ( r )⟩ , representa el potencial perturbador, pero promediado sobre un período completo; es decir, promediado sobre un paso completo del cuerpo alrededor de su órbita. Matemáticamente, este promedio de tiempo corresponde a la siguiente cantidad entre llaves. Este promedio ayuda a suprimir las fluctuaciones en la velocidad de rotación.
Este enfoque se utilizó para ayudar a verificar la teoría de la relatividad general de Einstein , que agrega una pequeña perturbación cúbica inversa efectiva al potencial gravitacional normal de Newton, [35]
Insertando esta función en la integral y usando la ecuación para expresar r en términos de θ , se calcula que la tasa de precesión del periapsis causada por esta perturbación no newtoniana es [35] que coincide estrechamente con la precesión anómala observada de Mercurio [36] y los púlsares binarios . [37] Esta concordancia con el experimento es una evidencia sólida de la relatividad general. [38] [39]
La estructura algebraica del problema es, como se explica en secciones posteriores, SO(4)/ Z 2 ~ SO(3) × SO(3) . [11] Los tres componentes L i del vector de momento angular L tienen los corchetes de Poisson [1] donde i = 1, 2, 3 y ε ijs es el tensor completamente antisimétrico , es decir, el símbolo de Levi-Civita ; el índice de suma s se utiliza aquí para evitar confusiones con el parámetro de fuerza k definido anteriormente. Entonces, dado que el vector LRL A se transforma como un vector, tenemos las siguientes relaciones de corchetes de Poisson entre A y L : [40] Finalmente, las relaciones de corchetes de Poisson entre los diferentes componentes de A son las siguientes: [41] donde es el hamiltoniano. Nótese que el lapso de los componentes de A y los componentes de L no está cerrado bajo corchetes de Poisson, debido al factor de en el lado derecho de esta última relación.
Finalmente, dado que tanto L como A son constantes de movimiento, tenemos
Los corchetes de Poisson se extenderán a las relaciones de conmutación mecánica cuántica en la siguiente sección y a los corchetes de Lie en una sección posterior.
Como se indica a continuación, un vector de Laplace-Runge-Lenz escalado D puede definirse con las mismas unidades que el momento angular dividiendo A por . Dado que D todavía se transforma como un vector, los corchetes de Poisson de D con el vector de momento angular L pueden escribirse de forma similar [11] [8]
Los corchetes de Poisson de D consigo mismo dependen del signo de H , es decir, de si la energía es negativa (que produce órbitas elípticas cerradas bajo una fuerza central de cuadrado inverso) o positiva (que produce órbitas hiperbólicas abiertas bajo una fuerza central de cuadrado inverso). Para energías negativas (es decir, para sistemas ligados), los corchetes de Poisson son [42] Ahora podemos apreciar la motivación para la escala elegida de D : con esta escala, el hamiltoniano ya no aparece en el lado derecho de la relación precedente. Por lo tanto, el lapso de los tres componentes de L y los tres componentes de D forman un álgebra de Lie de seis dimensiones bajo el corchete de Poisson. Esta álgebra de Lie es isomorfa a so(4) , el álgebra de Lie del grupo de rotación de cuatro dimensiones SO(4) . [43]
Por el contrario, para la energía positiva , los corchetes de Poisson tienen el signo opuesto. En este caso, el álgebra de Lie es isomorfa a so(3,1) .
La distinción entre energías positivas y negativas surge porque el escalamiento deseado (el que elimina el hamiltoniano del lado derecho de las relaciones de corchete de Poisson entre los componentes del vector LRL escalado) involucra la raíz cuadrada del hamiltoniano. Para obtener funciones de valor real, debemos tomar el valor absoluto del hamiltoniano, que distingue entre valores positivos (donde ) y valores negativos (donde ).
El operador de Laplace-Runge-Lenz escalado en el espacio de momento se encontró en 2022. [44] [45] La fórmula para el operador es más simple que en el espacio de posición:
donde el "operador de grado"
multiplica un polinomio homogéneo por su grado.
Los invariantes de Casimir para energías negativas son
y tienen corchetes de Poisson que se desvanecen con todos los componentes de D y L , C 2 es trivialmente cero, ya que los dos vectores son siempre perpendiculares.
Sin embargo, el otro invariante, C 1 , no es trivial y depende solo de m , k y E . Tras la cuantificación canónica, este invariante permite derivar los niveles de energía de los átomos similares al hidrógeno utilizando únicamente relaciones de conmutación canónicas mecánicas cuánticas, en lugar de la solución convencional de la ecuación de Schrödinger. [8] [43] Esta derivación se analiza en detalle en la siguiente sección.
Los corchetes de Poisson proporcionan una guía simple para cuantificar la mayoría de los sistemas clásicos: la relación de conmutación de dos operadores mecánicos cuánticos se especifica mediante el corchete de Poisson de las variables clásicas correspondientes, multiplicado por iħ . [46]
Al llevar a cabo esta cuantificación y calcular los valores propios del operador de Casimir C 1 para el problema de Kepler, Wolfgang Pauli pudo derivar los niveles de energía de los átomos similares al hidrógeno (Figura 6) y, por lo tanto, su espectro de emisión atómica. [7] Esta elegante derivación de 1926 se obtuvo antes del desarrollo de la ecuación de Schrödinger . [47]
Una sutileza del operador mecánico cuántico para el vector LRL A es que los operadores de momento y momento angular no conmutan; por lo tanto, el producto vectorial del operador cuántico de p y L debe definirse cuidadosamente. [8] Normalmente, los operadores para los componentes cartesianos A s se definen utilizando un producto simetrizado (hermítico). Una vez hecho esto, se puede demostrar que los operadores LRL cuánticos satisfacen relaciones de conmutación exactamente análogas a las relaciones de corchete de Poisson en la sección anterior, simplemente reemplazando el corchete de Poisson por el conmutador. [48] [49]
A partir de estos operadores, se pueden definir operadores de escalera adicionales para L. Estos conectan además diferentes estados propios de L 2 , es decir, diferentes multipletes de espín, entre sí.
También se puede definir un primer operador invariante de Casimir normalizado, análogo cuántico del anterior, donde H −1 es el inverso del operador de energía hamiltoniano , e I es el operador identidad .
Aplicando estos operadores de escalera a los estados propios | ℓ mn〉 de los operadores de momento angular total, momento angular azimutal y energía, se ve que los valores propios del primer operador de Casimir, C 1 , están cuantizados, n 2 − 1 . Es importante destacar que, en virtud de la desaparición de C 2 , son independientes de los números cuánticos ℓ y m , lo que hace que los niveles de energía se degeneren . [8]
Por lo tanto, los niveles de energía se dan por lo que coincide con la fórmula de Rydberg para átomos similares al hidrógeno (Figura 6). Los operadores de simetría adicionales A han conectado los diferentes multipletes ℓ entre sí, para una energía dada (y C 1 ), dictando n 2 estados en cada nivel. En efecto, han ampliado el grupo de momento angular SO(3) a SO(4) / Z 2 ~ SO(3) × SO(3) . [50]
La conservación del vector LRL corresponde a una simetría sutil del sistema. En mecánica clásica , las simetrías son operaciones continuas que mapean una órbita sobre otra sin cambiar la energía del sistema; en mecánica cuántica, las simetrías son operaciones continuas que "mezclan" orbitales electrónicos de la misma energía, es decir, niveles de energía degenerados. Una cantidad conservada suele estar asociada con tales simetrías. [1] Por ejemplo, cada fuerza central es simétrica bajo el grupo de rotación SO(3) , lo que conduce a la conservación del momento angular L . Clásicamente, una rotación general del sistema no afecta la energía de una órbita; en mecánica cuántica, las rotaciones mezclan los armónicos esféricos del mismo número cuántico ℓ sin cambiar la energía.
La simetría de la fuerza central inversa del cuadrado es mayor y más sutil. La simetría peculiar del problema de Kepler da como resultado la conservación tanto del vector de momento angular L como del vector LRL A (tal como se definió anteriormente) y, desde el punto de vista de la mecánica cuántica, garantiza que los niveles de energía del hidrógeno no dependan de los números cuánticos de momento angular ℓ y m . Sin embargo, la simetría es más sutil porque la operación de simetría debe tener lugar en un espacio de dimensiones superiores ; a estas simetrías a menudo se las llama "simetrías ocultas". [51]
Clásicamente, la mayor simetría del problema de Kepler permite alteraciones continuas de las órbitas que preservan la energía pero no el momento angular; expresado de otra manera, las órbitas de la misma energía pero diferente momento angular (excentricidad) pueden transformarse continuamente unas en otras. En mecánica cuántica, esto corresponde a la mezcla de orbitales que difieren en los números cuánticos ℓ y m , como los orbitales atómicos s ( ℓ = 0 ) y p ( ℓ = 1 ). Tal mezcla no se puede hacer con traslaciones o rotaciones tridimensionales ordinarias, sino que es equivalente a una rotación en una dimensión superior.
Para energías negativas , es decir, para sistemas ligados, el grupo de simetría superior es SO(4) , que preserva la longitud de los vectores de cuatro dimensiones.
En 1935, Vladimir Fock demostró que el problema de Kepler limitado en mecánica cuántica es equivalente al problema de una partícula libre confinada en una esfera unitaria tridimensional en un espacio de cuatro dimensiones. [10] Específicamente, Fock demostró que la función de onda de Schrödinger en el espacio de momento para el problema de Kepler era la proyección estereográfica de los armónicos esféricos en la esfera. La rotación de la esfera y la reproyección dan como resultado un mapeo continuo de las órbitas elípticas sin cambiar la energía, una simetría SO(4) a veces conocida como simetría de Fock ; [52] mecánica cuántica, esto corresponde a una mezcla de todos los orbitales del mismo número cuántico de energía n . Valentine Bargmann señaló posteriormente que los corchetes de Poisson para el vector de momento angular L y el vector LRL escalado A formaban el álgebra de Lie para SO(4) . [11] [42] En términos simples, las seis cantidades A y L corresponden a los seis momentos angulares conservados en cuatro dimensiones, asociados con las seis posibles rotaciones simples en ese espacio (hay seis maneras de elegir dos ejes de entre cuatro). Esta conclusión no implica que nuestro universo sea una esfera tridimensional; simplemente significa que este problema de física particular (el problema de los dos cuerpos para las fuerzas centrales de la inversa del cuadrado) es matemáticamente equivalente a una partícula libre en una esfera tridimensional.
Para energías positivas , es decir, para sistemas no ligados, "dispersos", el grupo de simetría superior es SO(3,1) , que preserva la longitud de Minkowski de los 4 vectores.
Fock [10] y Bargmann [11] consideraron los casos de energía negativa y positiva y Bander e Itzykson los revisaron enciclopédicamente. [53] [54]
Las órbitas de los sistemas de fuerza central –y las del problema de Kepler en particular– también son simétricas bajo reflexión . Por lo tanto, los grupos SO(3) , SO(4) y SO(3,1) citados anteriormente no son los grupos de simetría completa de sus órbitas; los grupos completos son O(3) , O(4) y O(3,1) , respectivamente. Sin embargo, solo los subgrupos conexos , SO(3) , SO(4) y SO + (3,1) , son necesarios para demostrar la conservación del momento angular y los vectores LRL; la simetría de reflexión es irrelevante para la conservación, que puede derivarse del álgebra de Lie del grupo.
La conexión entre el problema de Kepler y la simetría rotacional de cuatro dimensiones SO(4) se puede visualizar fácilmente. [53] [55] [56] Sean las coordenadas cartesianas de cuatro dimensiones ( w , x , y , z ) donde ( x , y , z ) representan las coordenadas cartesianas del vector de posición normal r . El vector de momento tridimensional p está asociado con un vector de cuatro dimensiones en una esfera unitaria tridimensional
donde es el vector unitario a lo largo del nuevo eje w . La transformación que mapea p a η se puede invertir de manera única; por ejemplo, el componente x del momento es igual a y de manera similar para p y y p z . En otras palabras, el vector tridimensional p es una proyección estereográfica del vector tetradimensional , escalado por p 0 (Figura 8).
Sin pérdida de generalidad, podemos eliminar la simetría rotacional normal eligiendo las coordenadas cartesianas de modo que el eje z esté alineado con el vector de momento angular L y las hodógrafas de momento estén alineadas como en la Figura 7, con los centros de los círculos en el eje y . Puesto que el movimiento es plano, y p y L son perpendiculares, p z = η z = 0 y la atención puede restringirse al vector tridimensional . La familia de círculos apolíneos de hodógrafas de momento (Figura 7) corresponde a una familia de círculos máximos en la esfera tridimensional , todos los cuales intersecan el eje η x en los dos focos η x = ±1 , correspondientes a los focos de la hodógrafa de momento en p x = ± p 0 . Estos círculos máximos están relacionados por una rotación simple sobre el eje η x (Figura 8). Esta simetría rotacional transforma todas las órbitas de la misma energía entre sí; Sin embargo, dicha rotación es ortogonal a las rotaciones tridimensionales habituales, ya que transforma la cuarta dimensión η w . Esta mayor simetría es característica del problema de Kepler y corresponde a la conservación del vector LRL.
Se puede obtener una solución elegante de variables de ángulo de acción para el problema de Kepler eliminando las coordenadas tetradimensionales redundantes en favor de coordenadas cilíndricas elípticas ( χ , ψ , φ ) [57]
donde sn , cn y dn son las funciones elípticas de Jacobi .
El vector de Laplace-Runge-Lenz también se puede generalizar para identificar cantidades conservadas que se aplican a otras situaciones.
En presencia de un campo eléctrico uniforme E , el vector Laplace-Runge-Lenz generalizado es [17] [58]
donde q es la carga de la partícula en órbita. Aunque no se conserva, da lugar a una cantidad conservada, a saber .
Generalizando aún más el vector de Laplace-Runge-Lenz a otros potenciales y a la relatividad especial , la forma más general se puede escribir como [18]
donde u = 1/ r y ξ = cos θ , con el ángulo θ definido por
y γ es el factor de Lorentz . Como antes, podemos obtener un vector binormal conservado B tomando el producto vectorial con el vector de momento angular conservado
Estos dos vectores también pueden combinarse en un tensor diádico conservado W ,
En la ilustración, se puede calcular el vector LRL para un oscilador armónico isótropo no relativista. [18] Dado que la fuerza es central, el vector del momento angular se conserva y el movimiento se encuentra en un plano.
El tensor diádico conservado se puede escribir en una forma simple aunque p y r no sean necesariamente perpendiculares.
El vector Runge-Lenz correspondiente es más complicado, donde es la frecuencia de oscilación natural y
Los siguientes son argumentos que muestran que el vector LRL se conserva bajo fuerzas centrales que obedecen una ley del cuadrado inverso.
Una fuerza central que actúa sobre la partícula es
para alguna función del radio . Dado que el momento angular se conserva bajo fuerzas centrales, y
donde el momento y el producto triple cruz se han simplificado utilizando la fórmula de Lagrange
La identidad
produce la ecuación
Para el caso especial de una fuerza central inversamente cuadrada , esto es igual a
Por lo tanto, A se conserva para fuerzas centrales de cuadrado inverso [59]
Una prueba más breve se obtiene utilizando la relación entre el momento angular y la velocidad angular, , que se cumple para una partícula que se desplaza en un plano perpendicular a . Especificando las fuerzas centrales de inverso cuadrado, la derivada temporal de es donde se cumple la última igualdad porque un vector unitario solo puede cambiar por rotación, y es la velocidad orbital del vector giratorio. Por lo tanto, se ve que A es una diferencia de dos vectores con derivadas temporales iguales.
Como se describe en otra parte de este artículo, este vector LRL A es un caso especial de un vector conservado general que se puede definir para todas las fuerzas centrales. [18] [19] Sin embargo, dado que la mayoría de las fuerzas centrales no producen órbitas cerradas (véase el teorema de Bertrand ), el vector análogo rara vez tiene una definición simple y generalmente es una función multivalor del ángulo θ entre r y .
La constancia del vector LRL también se puede derivar de la ecuación de Hamilton-Jacobi en coordenadas parabólicas ( ξ , η ) , que se definen por las ecuaciones donde r representa el radio en el plano de la órbita
La inversión de estas coordenadas es
La separación de la ecuación de Hamilton-Jacobi en estas coordenadas produce las dos ecuaciones equivalentes [17] [60]
donde Γ es una constante de movimiento. La resta y la reexpresión en términos de los momentos cartesianos p x y p y muestra que Γ es equivalente al vector LRL
La conexión entre la simetría rotacional descrita anteriormente y la conservación del vector LRL se puede cuantificar mediante el teorema de Noether . Este teorema, que se utiliza para hallar constantes de movimiento, establece que cualquier variación infinitesimal de las coordenadas generalizadas de un sistema físico
que hace que el Lagrangiano varíe hasta el primer orden por una derivada de tiempo total
corresponde a una cantidad conservada Γ
En particular, el componente vectorial LRL conservado A s corresponde a la variación en las coordenadas [61]
donde i es igual a 1, 2 y 3, siendo x i y p i los componentes i -ésimos de los vectores de posición y momento r y p , respectivamente; como es habitual, δ representa el delta de Kronecker . El cambio de primer orden resultante en el lagrangiano es
La sustitución en la fórmula general para la cantidad conservada Γ produce el componente conservado A s del vector LRL,
La derivación del teorema de Noether de la conservación del vector LRL A es elegante, pero tiene un inconveniente: la variación de coordenadas δx i involucra no solo la posición r , sino también el momento p o, equivalentemente, la velocidad v . [62] Este inconveniente se puede eliminar derivando en su lugar la conservación de A utilizando un enfoque iniciado por Sophus Lie . [63] [64] Específicamente, se puede definir una transformación de Lie [51] en la que las coordenadas r y el tiempo t se escalan por diferentes potencias de un parámetro λ (Figura 9),
Esta transformación cambia el momento angular total L y la energía E , pero conserva su producto EL 2 . Por lo tanto, la excentricidad e y la magnitud A se conservan, como se puede ver en la ecuación para A2
La dirección de A también se conserva, ya que los semiejes no se modifican mediante una escala global. Esta transformación también conserva la tercera ley de Kepler , es decir, que el semieje a y el período T forman una constante T 2 / a 3 .
A diferencia de los vectores de momento y momento angular p y L , no existe una definición universalmente aceptada del vector de Laplace-Runge-Lenz; en la literatura científica se utilizan varios factores de escala y símbolos diferentes. La definición más común se da arriba, pero otra alternativa común es dividir por la cantidad mk para obtener un vector de excentricidad conservada adimensional
donde v es el vector de velocidad. Este vector escalado e tiene la misma dirección que A y su magnitud es igual a la excentricidad de la órbita, por lo que se anula en órbitas circulares.
También son posibles otras versiones escaladas, por ejemplo, dividiendo A por m solamente o por p 0 que tiene las mismas unidades que el vector de momento angular L .
En casos excepcionales, el signo del vector LRL puede invertirse, es decir, escalarse en −1 . Otros símbolos comunes para el vector LRL incluyen a , R , F , J y V. Sin embargo, la elección de la escala y el símbolo para el vector LRL no afectan su conservación.
Un vector conservado alternativo es el vector binormal B estudiado por William Rowan Hamilton, [16]
que se conserva y apunta a lo largo del semieje menor de la elipse. (No está definido para excentricidad evanescente).
El vector LRL A = B × L es el producto vectorial de B y L (Figura 4). En la hodógrafa de momento de la sección correspondiente anterior, se ve fácilmente que B conecta el origen de los momentos con el centro de la hodógrafa circular y que posee magnitud A / L . En el perihelio, apunta en la dirección del momento.
El vector B se denomina "binormal" ya que es perpendicular tanto a A como a L. De manera similar al propio vector LRL, el vector binormal se puede definir con diferentes escalas y símbolos.
Los dos vectores conservados, A y B, se pueden combinar para formar un tensor diádico conservado W , [18] donde α y β son constantes de escala arbitrarias y representan el producto tensorial (que no está relacionado con el producto vectorial , a pesar de su símbolo similar). Escrita en componentes explícitos, esta ecuación se lee
Al ser perpendiculares entre sí, los vectores A y B pueden considerarse como los ejes principales del tensor conservado W , es decir, sus vectores propios escalados . W es perpendicular a L , ya que A y B también son perpendiculares a L , L ⋅ A = L ⋅ B = 0 .
Más directamente, esta ecuación se lee, en componentes explícitos,