En mecánica celeste , una órbita de Kepler (u órbita kepleriana , llamada así por el astrónomo alemán Johannes Kepler ) es el movimiento de un cuerpo en relación con otro, como una elipse , una parábola o una hipérbola , que forma un plano orbital bidimensional en el espacio tridimensional. Una órbita de Kepler también puede formar una línea recta . Considera solo la atracción gravitatoria puntual de dos cuerpos, descuidando las perturbaciones debidas a las interacciones gravitacionales con otros objetos, el arrastre atmosférico , la presión de la radiación solar , un cuerpo central no esférico , etc. Por lo tanto, se dice que es una solución de un caso especial del problema de los dos cuerpos , conocido como el problema de Kepler . Como teoría de la mecánica clásica , tampoco tiene en cuenta los efectos de la relatividad general . Las órbitas keplerianas se pueden parametrizar en seis elementos orbitales de varias formas.
En la mayoría de las aplicaciones, existe un gran cuerpo central, cuyo centro de masa se supone que es el centro de masa de todo el sistema. Por descomposición, las órbitas de dos objetos de masa similar pueden describirse como órbitas de Kepler alrededor de su centro de masa común, su baricentro .
Desde la antigüedad hasta los siglos XVI y XVII, se creía que los movimientos de los planetas seguían trayectorias geocéntricas perfectamente circulares , tal como lo enseñaban los filósofos griegos Aristóteles y Ptolomeo . Las variaciones en los movimientos de los planetas se explicaban mediante trayectorias circulares más pequeñas superpuestas a la trayectoria más grande (véase epiciclo ). A medida que las mediciones de los planetas se volvieron cada vez más precisas, se propusieron revisiones de la teoría. En 1543, Nicolás Copérnico publicó un modelo heliocéntrico del Sistema Solar , aunque todavía creía que los planetas viajaban en trayectorias perfectamente circulares centradas en el Sol. [1]
En 1601, Johannes Kepler adquirió las extensas y meticulosas observaciones de los planetas realizadas por Tycho Brahe . Kepler pasaría los siguientes cinco años tratando de ajustar las observaciones del planeta Marte a varias curvas. En 1609, Kepler publicó las dos primeras de sus tres leyes del movimiento planetario . La primera ley establece:
La órbita de cada planeta es una elipse con el Sol en un foco .
En términos más generales, la trayectoria de un objeto en movimiento kepleriano también puede seguir una parábola o una hipérbola , que, junto con las elipses, pertenecen a un grupo de curvas conocidas como secciones cónicas . Matemáticamente, la distancia entre un cuerpo central y un cuerpo en órbita se puede expresar como:
dónde:
Alternativamente, la ecuación se puede expresar como:
Donde se denomina semieje recto de la curva. Esta forma de la ecuación es particularmente útil cuando se trabaja con trayectorias parabólicas, para las cuales el semieje mayor es infinito.
A pesar de desarrollar estas leyes a partir de observaciones, Kepler nunca fue capaz de desarrollar una teoría para explicar estos movimientos. [2]
Entre 1665 y 1666, Isaac Newton desarrolló varios conceptos relacionados con el movimiento, la gravitación y el cálculo diferencial. Sin embargo, estos conceptos no fueron publicados hasta 1687 en los Principia , en los que expuso sus leyes del movimiento y su ley de la gravitación universal . La segunda de sus tres leyes del movimiento establece:
La aceleración de un cuerpo es paralela y directamente proporcional a la fuerza neta que actúa sobre el cuerpo, está en la dirección de la fuerza neta y es inversamente proporcional a la masa del cuerpo:
Dónde:
- es el vector de fuerza
- es la masa del cuerpo sobre el que actúa la fuerza
- es el vector de aceleración, la segunda derivada temporal del vector de posición
Estrictamente hablando, esta forma de la ecuación sólo se aplica a un objeto de masa constante, lo cual es válido según las suposiciones simplificadoras que se hacen a continuación.
La ley de gravitación de Newton establece:
Cada masa puntual atrae a todas las demás masas puntuales mediante una fuerza que apunta a lo largo de la línea que corta ambos puntos. La fuerza es proporcional al producto de las dos masas e inversamente proporcional al cuadrado de la distancia entre las masas puntuales:
dónde:
- es la magnitud de la fuerza gravitacional entre las dos masas puntuales
- es la constante gravitacional
- es la masa de la primera masa puntual
- es la masa de la segunda masa puntual
- es la distancia entre las dos masas puntuales
A partir de las leyes del movimiento y de la ley de la gravitación universal, Newton pudo derivar las leyes de Kepler, que son específicas del movimiento orbital en astronomía. Dado que las leyes de Kepler estaban bien respaldadas por datos de observación, esta coherencia proporcionó un fuerte respaldo a la validez de la teoría generalizada de Newton y unificó la mecánica celestial y ordinaria. Estas leyes del movimiento formaron la base de la mecánica celestial moderna hasta que Albert Einstein introdujo los conceptos de relatividad especial y general a principios del siglo XX. Para la mayoría de las aplicaciones, el movimiento kepleriano aproxima los movimientos de los planetas y satélites con grados relativamente altos de precisión y se utiliza ampliamente en astronomía y astrodinámica .
Para resolver el movimiento de un objeto en un sistema de dos cuerpos , se pueden hacer dos suposiciones simplificadoras:
Las formas de los grandes cuerpos celestes son próximas a las de las esferas. Por simetría, la fuerza gravitatoria neta que atrae un punto de masa hacia una esfera homogénea debe estar dirigida hacia su centro. El teorema de las capas (también demostrado por Isaac Newton) establece que la magnitud de esta fuerza es la misma que si toda la masa estuviera concentrada en el centro de la esfera, incluso si la densidad de la esfera varía con la profundidad (como ocurre en la mayoría de los cuerpos celestes). De esto se deduce inmediatamente que la atracción entre dos esferas homogéneas es como si ambas tuvieran su masa concentrada en su centro.
Los objetos más pequeños, como los asteroides o las naves espaciales, suelen tener una forma que se desvía mucho de la esférica, pero las fuerzas gravitacionales producidas por estas irregularidades suelen ser pequeñas en comparación con la gravedad del cuerpo central. La diferencia entre una forma irregular y una esfera perfecta también disminuye con la distancia, y la mayoría de las distancias orbitales son muy grandes en comparación con el diámetro de un cuerpo pequeño en órbita. Por lo tanto, para algunas aplicaciones, la irregularidad de la forma se puede ignorar sin un impacto significativo en la precisión. Este efecto es bastante notable en los satélites artificiales de la Tierra, especialmente en los que se encuentran en órbitas bajas.
Los planetas giran a velocidades variables y, por lo tanto, pueden adoptar una forma ligeramente achatada debido a la fuerza centrífuga. Con una forma tan achatada, la atracción gravitatoria se desviará un poco de la de una esfera homogénea. A distancias mayores, el efecto de esta achatación se vuelve insignificante. Los movimientos planetarios en el Sistema Solar pueden calcularse con suficiente precisión si se los trata como masas puntuales.
Dos objetos de masa puntual con masas y vectores de posición y relativos a algún marco de referencia inercial experimentan fuerzas gravitacionales:
donde es el vector de posición relativa de la masa 1 con respecto a la masa 2, expresado como:
y es el vector unitario en esa dirección y es la longitud de ese vector.
Dividiendo por sus respectivas masas y restando la segunda ecuación de la primera se obtiene la ecuación de movimiento para la aceleración del primer objeto con respecto al segundo:
donde es el parámetro gravitacional y es igual a
En muchas aplicaciones se puede hacer un tercer supuesto simplificador:
Esta suposición no es necesaria para resolver el problema simplificado de los dos cuerpos, pero simplifica los cálculos, en particular con satélites que orbitan alrededor de la Tierra y planetas que orbitan alrededor del Sol. Incluso la masa de Júpiter es menor que la del Sol por un factor de 1047, [3] lo que constituiría un error del 0,096% en el valor de α. Las excepciones notables incluyen el sistema Tierra-Luna (ratio de masas de 81,3), el sistema Plutón-Caronte (ratio de masas de 8,9) y los sistemas estelares binarios.
Bajo estas suposiciones, la ecuación diferencial para el caso de dos cuerpos puede resolverse completamente matemáticamente y la órbita resultante que sigue las leyes de Kepler del movimiento planetario se llama "órbita de Kepler". Las órbitas de todos los planetas son con gran precisión órbitas de Kepler alrededor del Sol. Las pequeñas desviaciones se deben a las atracciones gravitacionales mucho más débiles entre los planetas y, en el caso de Mercurio , a la relatividad general . Las órbitas de los satélites artificiales alrededor de la Tierra son, con una buena aproximación, órbitas de Kepler con pequeñas perturbaciones debidas a la atracción gravitacional del Sol, la Luna y el achatamiento de la Tierra. En aplicaciones de alta precisión para las que la ecuación de movimiento debe integrarse numéricamente teniendo en cuenta todas las fuerzas gravitacionales y no gravitacionales (como la presión de la radiación solar y el arrastre atmosférico ), los conceptos de órbita de Kepler son de suma importancia y se utilizan ampliamente.
Cualquier trayectoria kepleriana puede definirse mediante seis parámetros. El movimiento de un objeto que se mueve en el espacio tridimensional se caracteriza por un vector de posición y un vector de velocidad. Cada vector tiene tres componentes, por lo que el número total de valores necesarios para definir una trayectoria a través del espacio es seis. Una órbita se define generalmente mediante seis elementos (conocidos como elementos keplerianos ) que pueden calcularse a partir de la posición y la velocidad, tres de los cuales ya se han analizado. Estos elementos son convenientes porque de los seis, cinco son inmutables para una órbita no perturbada (un marcado contraste con dos vectores que cambian constantemente). La ubicación futura de un objeto dentro de su órbita se puede predecir y su nueva posición y velocidad se pueden obtener fácilmente a partir de los elementos orbitales.
Dos definen el tamaño y la forma de la trayectoria:
Tres definen la orientación del plano orbital :
Y por último:
Dado que , y son simplemente medidas angulares que definen la orientación de la trayectoria en el marco de referencia, no son estrictamente necesarias cuando se analiza el movimiento del objeto dentro del plano orbital. Se han mencionado aquí para completar, pero no son necesarias para las demostraciones que se presentan a continuación.
Para el movimiento bajo cualquier fuerza central, es decir, una fuerza paralela a r , el momento angular relativo específico permanece constante:
Dado que el producto vectorial del vector de posición y su velocidad permanece constante, deben estar en el mismo plano, ortogonal a . Esto implica que la función vectorial es una curva plana .
Debido a que la ecuación tiene simetría alrededor de su origen, es más fácil de resolver en coordenadas polares. Sin embargo, es importante tener en cuenta que la ecuación ( 1 ) se refiere a la aceleración lineal en lugar de la aceleración angular o radial . Por lo tanto, se debe tener cuidado al transformar la ecuación. Introduciendo un sistema de coordenadas cartesianas y vectores unitarios polares en el plano ortogonal a :
Ahora podemos reescribir la función vectorial y sus derivadas como:
(ver " Cálculo vectorial "). Sustituyendo estos en ( 1 ), encontramos:
Esto da la ecuación diferencial ordinaria en las dos variables y :
Para resolver esta ecuación, se deben eliminar todas las derivadas temporales. Esto da como resultado:
Tomando la derivada temporal de ( 3 ) se obtiene
Las ecuaciones ( 3 ) y ( 4 ) nos permiten eliminar las derivadas temporales de . Para eliminar las derivadas temporales de , se utiliza la regla de la cadena para encontrar las sustituciones adecuadas:
Usando estas cuatro sustituciones, se pueden eliminar todas las derivadas temporales en ( 2 ), obteniéndose una ecuación diferencial ordinaria para como función de
La ecuación diferencial ( 7 ) se puede resolver analíticamente mediante la sustitución de variables
Usando la regla de la cadena para la diferenciación se obtiene:
Usando las expresiones ( 10 ) y ( 9 ) para y se obtiene
con la solución general
donde e y son constantes de integración que dependen de los valores iniciales de s y
En lugar de utilizar la constante de integración explícitamente, se introduce la convención de que los vectores unitarios que definen el sistema de coordenadas en el plano orbital se seleccionan de modo que tome el valor cero y e sea positivo. Esto significa que es cero en el punto donde es máximo y, por lo tanto, es mínimo. Si se define el parámetro p como se tiene que
Otra forma de resolver esta ecuación sin el uso de ecuaciones diferenciales polares es la siguiente:
Defina un vector unitario , , tal que y . De ello se deduce que
Ahora consideremos
(ver producto triple vectorial ). Nótese que
Sustituyendo estos valores en la ecuación anterior obtenemos:
Integrando ambos lados:
donde c es un vector constante. Si le sumamos r obtenemos un resultado interesante: donde es el ángulo entre y . Resolviendo r :
Observe que son efectivamente las coordenadas polares de la función vectorial. Al realizar las sustituciones y , llegamos nuevamente a la ecuación
Esta es la ecuación en coordenadas polares para una sección cónica con origen en un punto focal. El argumento se llama "anomalía verdadera".
Observe también que, como es el ángulo entre el vector de posición y la constante de integración , el vector debe apuntar en la dirección del periapsis de la órbita. Podemos definir entonces el vector de excentricidad asociado a la órbita como:
donde es el vector de momento angular constante de la órbita, y es el vector de velocidad asociado con el vector de posición .
Obviamente, el vector de excentricidad , que tiene la misma dirección que la constante de integración , también apunta a la dirección del periapsis de la órbita y tiene la magnitud de la excentricidad orbital. Esto lo hace muy útil en la determinación de la órbita (OD) para los elementos orbitales de una órbita cuando se conoce un vector de estado [ ] o [ ].
Porque este es un círculo con radio p .
Porque esto es una elipse con
Porque esta es una parábola con distancia focal
Porque esto es una hipérbola con
La siguiente imagen ilustra un círculo (gris), una elipse (roja), una parábola (verde) y una hipérbola (azul).
El punto de la línea horizontal que sale a la derecha del foco es el punto para el cual la distancia al foco toma el valor mínimo, el pericentro. Para la elipse también hay un apocentro para el cual la distancia al foco toma el valor máximo. Para la hipérbola, el rango para es y para una parábola, el rango es
Utilizando la regla de la cadena para la diferenciación ( 5 ), la ecuación ( 2 ) y la definición de p como se obtiene que el componente de velocidad radial es
y que el componente tangencial (componente de velocidad perpendicular a ) es
La conexión entre el argumento polar y el tiempo t es ligeramente diferente para las órbitas elípticas e hiperbólicas.
Para una órbita elíptica se cambia a la " anomalía excéntrica " E para la cual
y por consiguiente
y el momento angular H es
Integrando con respecto al tiempo t se obtiene
bajo el supuesto de que se selecciona el tiempo tal que la constante de integración sea cero.
Como por definición de p se tiene
Esto se puede escribir
Para una órbita hiperbólica se utilizan las funciones hiperbólicas para la parametrización.
para lo cual uno tiene
y el momento angular H es
Integrando con respecto al tiempo t se obtiene
es decir
Para encontrar el tiempo t que corresponde a una cierta anomalía verdadera, se calcula el parámetro correspondiente E relacionado con el tiempo con la relación ( 27 ) para una órbita elíptica y con la relación ( 34 ) para una órbita hiperbólica.
Nótese que las relaciones ( 27 ) y ( 34 ) definen un mapeo entre los rangos
Para una órbita elíptica se obtiene de ( 20 ) y ( 21 ) que
y por lo tanto que
De ( 36 ) se sigue que
De la construcción geométrica que define la anomalía excéntrica se desprende que los vectores y están en el mismo lado del eje x . De esto se deduce que los vectores y están en el mismo cuadrante. Por lo tanto, se tiene que
Y eso
donde " " es el argumento polar del vector y se selecciona n de manera que
Para el cálculo numérico de la función estándar ATAN2(y,x) (o en doble precisión DATAN2(y,x)) disponible por ejemplo en el lenguaje de programación FORTRAN, se puede utilizar.
Tenga en cuenta que se trata de un mapeo entre los rangos
Para una órbita hiperbólica se obtiene de ( 28 ) y ( 29 ) que
y por lo tanto que
Como y tienen el mismo signo se deduce que
Esta relación es conveniente para pasar entre la "anomalía verdadera" y el parámetro E , que está conectado al tiempo a través de la relación ( 34 ). Nótese que se trata de una correspondencia entre los rangos y que se puede calcular utilizando la relación
De la relación ( 27 ) se deduce que el período orbital P para una órbita elíptica es
Como la energía potencial correspondiente al campo de fuerza de la relación ( 1 ) es , se deduce de ( 13 ), ( 14 ), ( 18 ) y ( 19 ) que la suma de la energía cinética y la energía potencial para una órbita elíptica es
y de ( 13 ), ( 16 ), ( 18 ) y ( 19 ) que la suma de la energía cinética y potencial para una órbita hiperbólica es
Con respecto al sistema de coordenadas inerciales en el plano orbital con respecto al pericentro, se obtiene de ( 18 ) y ( 19 ) que los componentes de velocidad son
La ecuación del centro relaciona la anomalía media con la anomalía verdadera para órbitas elípticas, para una excentricidad numérica pequeña.
Este es el " problema del valor inicial " para la ecuación diferencial ( 1 ), que es una ecuación de primer orden para el "vector de estado" de 6 dimensiones cuando se escribe como
Para cualquier valor del "vector de estado" inicial, la órbita de Kepler correspondiente a la solución de este problema de valor inicial se puede encontrar con el siguiente algoritmo:
Definir los vectores unitarios ortogonales mediante
con y
De ( 13 ), ( 18 ) y ( 19 ) se deduce que al establecer
y definiendo y tal que
dónde
Se obtiene una órbita de Kepler que para una anomalía verdadera tiene los mismos r y valores que los definidos por ( 50 ) y ( 51 ) .
Si esta órbita de Kepler también tiene los mismos vectores para esta anomalía verdadera que los definidos por ( 50 ) y ( 51 ), el vector de estado de la órbita de Kepler toma los valores deseados para la anomalía verdadera .
El sistema de coordenadas estándar fijo inercialmente en el plano orbital (con dirección desde el centro de la esfera homogénea al pericentro) que define la orientación de la sección cónica (elipse, parábola o hipérbola) se puede determinar entonces con la relación
Nótese que las relaciones ( 53 ) y ( 54 ) tienen una singularidad cuando y es decir
que es el caso de que se trata de una órbita circular que se ajusta al estado inicial
Para cualquier vector de estado, la órbita de Kepler correspondiente a este estado se puede calcular con el algoritmo definido anteriormente. Primero se determinan los parámetros a partir de y luego los vectores unitarios ortogonales en el plano orbital utilizando las relaciones ( 56 ) y ( 57 ).
Si ahora la ecuación de movimiento es
donde es una función distinta de los parámetros resultantes , , , , definidos por variarán todos con el tiempo a diferencia del caso de una órbita de Kepler para la cual solo variará el parámetro.
Se dice que la órbita de Kepler calculada de esta manera que tiene el mismo "vector de estado" que la solución de la "ecuación de movimiento" ( 59 ) en el tiempo t está "osculando" en ese momento.
Este concepto es útil, por ejemplo, en el caso en que:
es una pequeña "fuerza perturbadora" debida, por ejemplo, a una débil atracción gravitatoria de otros cuerpos celestes. Los parámetros de la órbita osculadora de Kepler cambiarán entonces sólo lentamente y la órbita osculadora de Kepler es una buena aproximación a la órbita real durante un período considerable de tiempo antes y después del momento de la osculación.
Este concepto también puede ser útil para un cohete durante un vuelo propulsado, ya que entonces indica en qué órbita Kepler continuaría el cohete en caso de que se desactive el empuje.
Para una órbita "casi circular", resulta útil el concepto de " vector de excentricidad ", definido como . De ( 53 ), ( 54 ) y ( 56 ) se deduce que
es decir es una función diferenciable suave del vector de estado también si este estado corresponde a una órbita circular.