En geometría , el teorema de rotación de Euler establece que, en el espacio tridimensional , cualquier desplazamiento de un cuerpo rígido tal que un punto del cuerpo rígido permanezca fijo, es equivalente a una única rotación alrededor de algún eje que pasa por el punto fijo . También significa que la composición de dos rotaciones es también una rotación. Por lo tanto, el conjunto de rotaciones tiene una estructura de grupo, conocida como grupo de rotación .
El teorema recibe su nombre de Leonhard Euler , quien lo demostró en 1775 mediante la geometría esférica . El eje de rotación se conoce como eje de Euler , representado típicamente por un vector unitario ê . Su producto por el ángulo de rotación se conoce como vector eje-ángulo . La extensión del teorema a la cinemática produce el concepto de eje instantáneo de rotación , una línea de puntos fijos.
En términos de álgebra lineal, el teorema establece que, en el espacio 3D, dos sistemas de coordenadas cartesianos cualesquiera con un origen común están relacionados por una rotación alrededor de un eje fijo. Esto también significa que el producto de dos matrices de rotación es nuevamente una matriz de rotación y que, para una matriz de rotación no idéntica, un valor propio es 1 y los otros dos son complejos, o ambos iguales a −1. El vector propio correspondiente a este valor propio es el eje de rotación que conecta los dos sistemas.
Euler enuncia el teorema de la siguiente manera: [1]
Teorema. Quomodocunque sphaera circa centrum suum conuertatur, sempre asignari potest diámetro, cuius directio in situ translato conueniat cum situ iniciali.
o (en inglés):
Cuando una esfera se mueve alrededor de su centro, siempre es posible encontrar un diámetro cuya dirección en la posición desplazada sea la misma que en la posición inicial.
La prueba original de Euler se realizó utilizando geometría esférica y por lo tanto siempre que habla de triángulos estos deben entenderse como triángulos esféricos .
Para llegar a una demostración, Euler analiza cómo se vería la situación si el teorema fuera cierto. Para ello, supongamos que la línea amarilla de la Figura 1 pasa por el centro de la esfera y es el eje de rotación que estamos buscando, y el punto O es uno de los dos puntos de intersección de ese eje con la esfera. Luego considera un círculo máximo arbitrario que no contiene a O (el círculo azul), y su imagen después de la rotación (el círculo rojo), que es otro círculo máximo que no contiene a O. Etiqueta un punto en su intersección como punto A. (Si los círculos coinciden, entonces A puede tomarse como cualquier punto en cualquiera de ellos; de lo contrario, A es uno de los dos puntos de intersección).
Ahora A está en el círculo inicial (el círculo azul), por lo que su imagen estará en el círculo transportado (rojo). Etiqueta esa imagen como punto a . Dado que A también está en el círculo transportado (rojo), es la imagen de otro punto que estaba en el círculo inicial (azul) y etiqueta esa preimagen como α (ver Figura 2 ). Luego considera los dos arcos que unen α y a con A . Estos arcos tienen la misma longitud porque el arco αA está mapeado en el arco Aa . Además, dado que O es un punto fijo, el triángulo αOA está mapeado en el triángulo AOa , por lo que estos triángulos son isósceles y el arco AO biseca el ángulo ∠ αAa .
Construyamos un punto que pueda ser invariante utilizando las consideraciones anteriores. Empecemos con el círculo máximo azul y su imagen bajo la transformación, que es el círculo máximo rojo como en la Figura 1. Sea el punto A un punto de intersección de esos círculos. Si la imagen de A bajo la transformación es el mismo punto, entonces A es un punto fijo de la transformación, y como el centro también es un punto fijo, el diámetro de la esfera que contiene a A es el eje de rotación y el teorema queda demostrado.
De lo contrario, etiquetamos la imagen de A como a y su preimagen como α , y conectamos estos dos puntos a A con arcos αA y Aa . Estos arcos tienen la misma longitud. Construyamos el círculo máximo que biseca a ∠ αAa y ubiquemos el punto O en ese círculo máximo de modo que los arcos AO y aO tengan la misma longitud, y llamemos a la región de la esfera que contiene a O y está limitada por los círculos máximos azul y rojo el interior de ∠ αAa . (Es decir, la región amarilla en la Figura 3 .) Entonces, dado que αA = Aa y O está en la bisectriz de ∠ αAa , también tenemos αO = aO .
Supongamos ahora que O′ es la imagen de O . Entonces sabemos que ∠ αAO = ∠ AaO′ y se conserva la orientación, [a] por lo que O′ debe ser interior a ∠ αAa . Ahora AO se transforma en aO′ , por lo que AO = aO′ . Como AO también tiene la misma longitud que aO , entonces aO = aO′ y ∠ AaO = ∠ aAO . Pero ∠ αAO = ∠ aAO , por lo que ∠ αAO = ∠ AaO y ∠ AaO = ∠ AaO′ . Por lo tanto , O′ es el mismo punto que O . En otras palabras, O es un punto fijo de la transformación, y como el centro también es un punto fijo, el diámetro de la esfera que contiene a O es el eje de rotación.
Euler también señala que O se puede hallar intersectando la bisectriz perpendicular de Aa con la bisectriz del ángulo ∠ αAa , una construcción que podría resultar más sencilla en la práctica. También propuso la intersección de dos planos:
Otra forma sencilla de hallar el eje de rotación es considerando el plano en el que se encuentran los puntos α , A , a . El eje de rotación es obviamente ortogonal a este plano y pasa por el centro C de la esfera.
Dado que para un cuerpo rígido cualquier movimiento que deja un eje invariante es una rotación, esto también demuestra que cualquier composición arbitraria de rotaciones es equivalente a una única rotación alrededor de un nuevo eje.
Una rotación espacial es una función lineal en correspondencia biunívoca con una matriz de rotación R de 3 × 3 que transforma un vector de coordenadas x en X , es decir Rx = X . Por lo tanto, otra versión del teorema de Euler es que para cada rotación R , existe un vector n distinto de cero para el cual Rn = n ; esto es exactamente la afirmación de que n es un vector propio de R asociado con el valor propio 1. Por lo tanto, basta con demostrar que 1 es un valor propio de R ; el eje de rotación de R será la línea μ n , donde n es el vector propio con valor propio 1.
Una matriz de rotación tiene la propiedad fundamental de que su inversa es su transpuesta, es decir
donde I es la matriz identidad 3 × 3 y el superíndice T indica la matriz transpuesta.
Calcule el determinante de esta relación para encontrar que una matriz de rotación tiene determinante ±1. En particular,
Una matriz de rotación con determinante +1 es una rotación propia, y una con determinante negativo −1 es una rotación impropia , es decir una reflexión combinada con una rotación propia.
Ahora se demostrará que una matriz de rotación propia R tiene al menos un vector invariante n , es decir, Rn = n . Como esto requiere que ( R − I ) n = 0 , vemos que el vector n debe ser un vector propio de la matriz R con valor propio λ = 1 . Por lo tanto, esto es equivalente a demostrar que det( R − I ) = 0 .
Utilice las dos relaciones
para cualquier matriz A de 3 × 3 y
(ya que det( R ) = 1 ) para calcular
Esto demuestra que λ = 1 es una raíz (solución) de la ecuación característica , es decir,
En otras palabras, la matriz R − I es singular y tiene un núcleo distinto de cero , es decir, hay al menos un vector distinto de cero, digamos n , para el cual
La línea μ n para μ real es invariante bajo R , es decir, μ n es un eje de rotación. Esto demuestra el teorema de Euler.
Se dice que dos matrices (que representan aplicaciones lineales) son equivalentes si existe un cambio de base que hace que una sea igual a la otra. Una matriz ortogonal propiamente dicha siempre es equivalente (en este sentido) a la siguiente matriz o a su reflexión vertical:
Entonces, cualquier matriz ortogonal es una rotación o una rotación impropia . Una matriz ortogonal general tiene solo un valor propio real, ya sea +1 o −1. Cuando es +1, la matriz es una rotación. Cuando es −1, la matriz es una rotación impropia.
Si R tiene más de un vector invariante entonces φ = 0 y R = I . Cualquier vector es un vector invariante de I .
Para demostrar la ecuación anterior es necesario recordar algunos hechos de la teoría de matrices.
Una matriz A de m × m tiene vectores propios ortogonales si y solo si A es normal , es decir, si A † A = AA † . [b] Este resultado es equivalente a afirmar que las matrices normales se pueden llevar a la forma diagonal mediante una transformación de similitud unitaria:
y U es unitaria, es decir,
Los valores propios α 1 , ..., α m son raíces de la ecuación característica. Si la matriz A es unitaria (y tenga en cuenta que las matrices unitarias son normales), entonces
y se deduce que los valores propios de una matriz unitaria están en el círculo unitario en el plano complejo:
Además, una matriz ortogonal (unitaria real) tiene valores propios en el círculo unitario en el plano complejo. Además, dado que su ecuación característica (un polinomio de orden m en λ ) tiene coeficientes reales, se deduce que sus raíces aparecen en pares complejos conjugados, es decir, si α es una raíz, entonces también lo es α ∗ . Hay 3 raíces, por lo que al menos una de ellas debe ser puramente real (+1 o −1).
Después de recordar estos hechos generales de la teoría de matrices, volvemos a la matriz de rotación R. De su realidad y ortogonalidad se deduce que podemos encontrar una U tal que:
Si se puede encontrar una matriz U que dé la forma anterior, y sólo hay un componente puramente real y es −1, entonces definimos que es una rotación impropia. Consideremos sólo el caso, entonces, de matrices R que son rotaciones propias (el tercer valor propio es sólo 1). La tercera columna de la matriz 3 × 3 U será entonces igual al vector invariante n . Escribiendo u 1 y u 2 para las dos primeras columnas de U , esta ecuación da
Si u 1 tiene valor propio 1, entonces φ = 0 y u 2 también tiene valor propio 1, lo que implica que en ese caso R = I . En general, sin embargo, como implica que también se cumple, por lo que se puede elegir para . De manera similar, puede resultar en un con solo entradas reales, para una matriz de rotación propia . Finalmente, la ecuación matricial se transforma por medio de una matriz unitaria,
Lo cual da
Las columnas de U ′ son ortonormales ya que es una matriz unitaria con solo entradas de valor real, debido a su definición anterior, que es el conjugado complejo de y que es un vector con componentes de valor real. La tercera columna sigue siendo n , las otras dos columnas de U ′ son perpendiculares a n . Ahora podemos ver cómo nuestra definición de rotación impropia se corresponde con la interpretación geométrica: una rotación impropia es una rotación alrededor de un eje (aquí, el eje correspondiente a la tercera coordenada) y una reflexión sobre un plano perpendicular a ese eje. Si solo nos restringimos a matrices con determinante 1, podemos ver que deben ser rotaciones propias. Este resultado implica que cualquier matriz ortogonal R correspondiente a una rotación propia es equivalente a una rotación sobre un ángulo φ alrededor de un eje n .
La traza (suma de elementos diagonales) de la matriz de rotación real dada anteriormente es 1 + 2 cos φ . Dado que una traza es invariante bajo una transformación de similitud de matriz ortogonal,
De ello se deduce que todas las matrices que son equivalentes a R mediante tales transformaciones de matrices ortogonales tienen la misma traza: la traza es una función de clase . Esta transformación de matrices es claramente una relación de equivalencia , es decir, todas esas matrices equivalentes forman una clase de equivalencia.
De hecho, todas las matrices de rotación 3 × 3 con rotación propia forman un grupo , usualmente denotado por SO(3) (el grupo ortogonal especial en 3 dimensiones) y todas las matrices con la misma traza forman una clase de equivalencia en este grupo. Todos los elementos de dicha clase de equivalencia comparten su ángulo de rotación , pero todas las rotaciones son alrededor de ejes diferentes. Si n es un vector propio de R con valor propio 1, entonces An es también un vector propio de ARA T , también con valor propio 1. A menos que A = I , n y An sean diferentes.
Supongamos que especificamos un eje de rotación mediante un vector unitario [ x , y , z ] y que tenemos una rotación infinitamente pequeña de ángulo Δ θ alrededor de ese vector. Desarrollando la matriz de rotación como una adición infinita y tomando el enfoque de primer orden, la matriz de rotación Δ R se representa como:
Una rotación finita a través del ángulo θ alrededor de este eje puede verse como una sucesión de pequeñas rotaciones alrededor del mismo eje. Aproximando Δ θ como θ/norte donde N es un número grande, una rotación de θ alrededor del eje puede representarse como:
Se puede observar que el teorema de Euler establece esencialmente que todas las rotaciones pueden representarse de esta forma. El producto A θ es el "generador" de la rotación particular, siendo el vector ( x , y , z ) asociado con la matriz A . Esto muestra que la matriz de rotación y el formato eje-ángulo están relacionados por la función exponencial.
Se puede derivar una expresión simple para el generador G . Se comienza con un plano arbitrario (en el espacio euclidiano) definido por un par de vectores unitarios perpendiculares a y b . En este plano se puede elegir un vector arbitrario x con perpendicular y . Luego se resuelve y en términos de x y se sustituye en una expresión para una rotación en un plano se obtiene la matriz de rotación R que incluye el generador G = ba T − ab T .
Para incluir vectores fuera del plano en la rotación, es necesario modificar la expresión anterior para R incluyendo dos operadores de proyección que particionen el espacio. Esta matriz de rotación modificada se puede reescribir como una función exponencial .
El análisis suele ser más sencillo en términos de estos generadores que de la matriz de rotación completa. El análisis en términos de los generadores se conoce como álgebra de Lie del grupo de rotación.
Del teorema de Euler se desprende que la orientación relativa de cualquier par de sistemas de coordenadas puede especificarse mediante un conjunto de tres números independientes. A veces se añade un cuarto número redundante para simplificar las operaciones con el álgebra de cuaterniones. Tres de estos números son los cosenos directores que orientan el vector propio. El cuarto es el ángulo respecto del vector propio que separa los dos conjuntos de coordenadas. Un conjunto de cuatro números de este tipo se denomina cuaternión .
Si bien el cuaternión descrito anteriormente no involucra números complejos , si se utilizan cuaterniones para describir dos rotaciones sucesivas, deben combinarse utilizando el álgebra de cuaterniones no conmutativa derivada por William Rowan Hamilton mediante el uso de números imaginarios.
El cálculo de la rotación mediante cuaterniones ha sustituido el uso de cosenos directores en aplicaciones aeroespaciales gracias a su reducción de los cálculos necesarios y su capacidad para minimizar los errores de redondeo . Además, en gráficos por ordenador resulta de gran utilidad la capacidad de realizar interpolaciones esféricas entre cuaterniones con relativa facilidad.
En dimensiones superiores, cualquier movimiento rígido que conserve un punto en dimensión 2 n o 2 n + 1 es una composición de como máximo n rotaciones en planos ortogonales de rotación , aunque estos planos no necesitan estar determinados de forma única, y un movimiento rígido puede fijar múltiples ejes. Además, cualquier movimiento rígido que conserve n puntos linealmente independientes, que abarcan un cuerpo n -dimensional en dimensión 2 n o 2 n + 1 , es un único plano de rotación . Dicho de otro modo, si dos cuerpos rígidos, con geometría idéntica, comparten al menos n puntos de ubicaciones "idénticas" dentro de sí mismos, cuya envoltura convexa es n -dimensional, entonces una única rotación planar puede hacer que uno cubra al otro con precisión en dimensión 2 n o 2 n + 1 .
Un movimiento rígido en tres dimensiones que no necesariamente fija un punto es un "movimiento helicoidal". Esto se debe a que una composición de una rotación con una traslación perpendicular al eje es una rotación sobre un eje paralelo, mientras que una composición con una traslación paralela al eje produce un movimiento helicoidal; véase eje helicoidal . Esto da lugar a la teoría del tornillo .