En álgebra lineal , las transformaciones lineales se pueden representar mediante matrices . Si es una transformación lineal que se asigna a y es un vector columna con entradas, entonces para alguna matriz , llamada matriz de transformación de . [ cita requerida ] Nótese que tiene filas y columnas, mientras que la transformación es de a . Existen expresiones alternativas de matrices de transformación que involucran vectores fila que son preferidas por algunos autores. [1] [2]
Las matrices permiten mostrar transformaciones lineales arbitrarias en un formato consistente, adecuado para el cálculo. [3] Esto también permite componer transformaciones fácilmente (multiplicando sus matrices).
Las transformaciones lineales no son las únicas que se pueden representar mediante matrices. Algunas transformaciones que no son lineales en un espacio euclidiano n-dimensional R n se pueden representar como transformaciones lineales en el espacio n +1-dimensional R n +1 . Estas incluyen tanto transformaciones afines (como la traslación ) como transformaciones proyectivas . Por esta razón, las matrices de transformación 4×4 se utilizan ampliamente en gráficos de computadora 3D . Estas matrices de transformación n +1-dimensionales se denominan, según su aplicación, matrices de transformación afines , matrices de transformación proyectivas o, de manera más general, matrices de transformación no lineal . Con respecto a una matriz n -dimensional, una matriz n +1-dimensional puede describirse como una matriz aumentada .
En las ciencias físicas , una transformación activa es aquella que realmente cambia la posición física de un sistema y tiene sentido incluso en ausencia de un sistema de coordenadas, mientras que una transformación pasiva es un cambio en la descripción de las coordenadas del sistema físico ( cambio de base ). La distinción entre transformaciones activas y pasivas es importante. Por defecto, cuando se habla de transformación , los matemáticos suelen referirse a transformaciones activas, mientras que los físicos pueden referirse a cualquiera de las dos.
Dicho de otra manera, una transformación pasiva se refiere a la descripción del mismo objeto visto desde dos marcos de coordenadas diferentes.
Si se tiene una transformación lineal en forma funcional, es fácil determinar la matriz de transformación A transformando cada uno de los vectores de la base estándar por T y luego insertando el resultado en las columnas de una matriz. En otras palabras,
Por ejemplo, la función es una transformación lineal. Al aplicar el proceso anterior (supongamos que n = 2 en este caso) se revela que
La representación matricial de vectores y operadores depende de la base elegida; una matriz similar resultará de una base alternativa. No obstante, el método para hallar los componentes sigue siendo el mismo.
Para elaborar, el vector se puede representar en vectores base, con coordenadas :
Ahora, exprese el resultado de la matriz de transformación A sobre , en la base dada:
Los elementos de la matriz A se determinan para una base dada E aplicando A a cada , y observando el vector de respuesta
Esta ecuación define los elementos deseados, , de la j -ésima columna de la matriz A . [4]
Sin embargo, existe una base especial para un operador en el que los componentes forman una matriz diagonal y, por lo tanto, la complejidad de la multiplicación se reduce a n . Ser diagonal significa que todos los coeficientes excepto son ceros dejando solo un término en la suma anterior. Los elementos diagonales supervivientes, , se conocen como valores propios y se designan con en la ecuación definitoria, que se reduce a . La ecuación resultante se conoce como ecuación de valores propios . [5] Los vectores propios y los valores propios se derivan de ella a través del polinomio característico .
Con la diagonalización , a menudo es posible traducir hacia y desde bases propias.
Las transformaciones geométricas más comunes que mantienen el origen fijo son lineales, entre ellas la rotación, el escalado, el corte, la reflexión y la proyección ortogonal; si una transformación afín no es una traslación pura, mantiene fijo algún punto, que puede elegirse como origen para que la transformación sea lineal. En dos dimensiones, las transformaciones lineales se pueden representar mediante una matriz de transformación de 2×2.
Un estiramiento en el plano xy es una transformación lineal que aumenta todas las distancias en una dirección particular por un factor constante pero no afecta las distancias en la dirección perpendicular. Solo consideramos estiramientos a lo largo del eje x y del eje y. Un estiramiento a lo largo del eje x tiene la forma x' = kx ; y' = y para alguna constante positiva k . (Tenga en cuenta que si k > 1 , entonces esto realmente es un "estiramiento"; si k < 1 , técnicamente es una "compresión", pero aún lo llamamos estiramiento. Además, si k = 1 , entonces la transformación es una identidad, es decir, no tiene efecto).
La matriz asociada a un estiramiento por un factor k a lo largo del eje x viene dada por:
De manera similar, un estiramiento por un factor k a lo largo del eje y tiene la forma x' = x ; y' = ky , por lo que la matriz asociada con esta transformación es
Si los dos estiramientos anteriores se combinan con valores recíprocos, la matriz de transformación representa una función de compresión : un cuadrado con lados paralelos a los ejes se transforma en un rectángulo que tiene la misma área que el cuadrado. El estiramiento y la compresión recíprocos dejan el área invariable.
Para una rotación con un ángulo θ en sentido antihorario (dirección positiva) alrededor del origen, la forma funcional es y . Escrita en forma matricial, se convierte en: [6]
De manera similar, para una rotación en el sentido de las agujas del reloj (dirección negativa) alrededor del origen, la forma funcional es y la forma matricial es:
Estas fórmulas suponen que el eje x apunta hacia la derecha y el eje y apunta hacia arriba.
Para el mapeo de corte (visualmente similar al inclinado), hay dos posibilidades.
Una fuerza cortante paralela al eje x tiene y . Escrito en forma matricial, esto se convierte en:
Una cizalladura paralela al eje y tiene y , que tiene forma matricial:
Para reflexionar sobre una recta que pasa por el origen, sea un vector en la dirección de la recta. Luego utilice la matriz de transformación:
Para proyectar un vector ortogonalmente sobre una recta que pasa por el origen, sea un vector en la dirección de la recta. Luego, utilice la matriz de transformación:
Al igual que ocurre con las reflexiones, la proyección ortogonal sobre una línea que no pasa por el origen es una transformación afín, no lineal.
Las proyecciones paralelas también son transformaciones lineales y pueden representarse simplemente mediante una matriz. Sin embargo, las proyecciones en perspectiva no lo son y para representarlas con una matriz se pueden utilizar coordenadas homogéneas .
La matriz para rotar un ángulo θ alrededor de cualquier eje definido por el vector unitario ( x , y , z ) es [7]
Para reflejar un punto a través de un plano (que pasa por el origen), se puede utilizar , donde es la matriz identidad 3×3 y es el vector unitario tridimensional para la normal vectorial del plano. Si la norma L 2 de , , y es la unidad, la matriz de transformación se puede expresar como:
Nótese que estos son casos particulares de una reflexión de Householder en dos y tres dimensiones. Una reflexión sobre una línea o plano que no pasa por el origen no es una transformación lineal, es una transformación afín . Como matriz de transformación afín de 4×4, se puede expresar de la siguiente manera (suponiendo que la normal es un vector unitario): donde para algún punto en el plano, o equivalentemente, .
Si el cuarto componente del vector es 0 en lugar de 1, entonces solo se refleja la dirección del vector y su magnitud permanece inalterada, como si se reflejara a través de un plano paralelo que pasa por el origen. Esta es una propiedad útil ya que permite la transformación tanto de vectores posicionales como de vectores normales con la misma matriz. Consulte las coordenadas homogéneas y las transformaciones afines a continuación para obtener más explicaciones.
Una de las principales motivaciones para utilizar matrices para representar transformaciones lineales es que las transformaciones pueden luego componerse e invertirse fácilmente .
La composición se logra mediante la multiplicación de matrices . Los vectores de fila y columna se procesan mediante matrices, las filas a la izquierda y las columnas a la derecha. Dado que el texto se lee de izquierda a derecha, se prefieren los vectores de columna cuando se componen matrices de transformación:
Si A y B son las matrices de dos transformaciones lineales, entonces el efecto de aplicar primero A y luego B a un vector columna viene dado por:
En otras palabras, la matriz de la transformación combinada A seguida de B es simplemente el producto de las matrices individuales.
Cuando A es una matriz invertible existe una matriz A −1 que representa una transformación que "deshace" A ya que su composición con A es la matriz identidad . En algunas aplicaciones prácticas, la inversión se puede calcular utilizando algoritmos de inversión generales o realizando operaciones inversas (que tienen una interpretación geométrica obvia, como rotar en dirección opuesta) y luego componiéndolas en orden inverso. Las matrices de reflexión son un caso especial porque son sus propias inversas y no necesitan calcularse por separado.
Para representar transformaciones afines con matrices, podemos utilizar coordenadas homogéneas . Esto significa representar un 2-vector ( x , y ) como un 3-vector ( x , y , 1), y lo mismo para dimensiones superiores. Con este sistema, la traslación se puede expresar con la multiplicación de matrices. La forma funcional queda así:
Todas las transformaciones lineales ordinarias se incluyen en el conjunto de transformaciones afines y pueden describirse como una forma simplificada de las transformaciones afines. Por lo tanto, cualquier transformación lineal también puede representarse mediante una matriz de transformación general. Esta última se obtiene expandiendo la matriz de transformación lineal correspondiente en una fila y una columna, llenando el espacio adicional con ceros, excepto la esquina inferior derecha, que debe establecerse en 1. Por ejemplo, la matriz de rotación en sentido antihorario de arriba se convierte en:
Al utilizar matrices de transformación que contienen coordenadas homogéneas, las traslaciones se vuelven lineales y, por lo tanto, se pueden mezclar sin problemas con todos los demás tipos de transformaciones. La razón es que el plano real se asigna al plano w = 1 en el espacio proyectivo real y, por lo tanto, la traslación en el espacio euclidiano real se puede representar como una cizalladura en el espacio proyectivo real. Aunque una traslación es una transformación no lineal en un espacio euclidiano 2-D o 3-D descrito por coordenadas cartesianas (es decir, no se puede combinar con otras transformaciones mientras se preserva la conmutatividad y otras propiedades), se convierte , en un espacio proyectivo 3-D o 4-D descrito por coordenadas homogéneas, en una transformación lineal simple (una cizalladura ).
Se pueden obtener más transformaciones afines mediante la composición de dos o más transformaciones afines. Por ejemplo, dada una traslación T' con un vector que gira R en un ángulo θ en sentido antihorario , una escala S con factores y una traslación T del vector, el resultado M de T'RST es: [8]
Al utilizar transformaciones afines, el componente homogéneo de un vector de coordenadas (normalmente llamado w ) nunca se modificará. Por lo tanto, se puede asumir con seguridad que siempre es 1 e ignorarlo. Sin embargo, esto no es así cuando se utilizan proyecciones en perspectiva.
Otro tipo de transformación, de importancia en los gráficos por ordenador en 3D , es la proyección en perspectiva . Mientras que las proyecciones paralelas se utilizan para proyectar puntos sobre el plano de la imagen a lo largo de líneas paralelas, la proyección en perspectiva proyecta puntos sobre el plano de la imagen a lo largo de líneas que emanan de un único punto, llamado centro de proyección. Esto significa que un objeto tiene una proyección menor cuando está lejos del centro de proyección y una proyección mayor cuando está más cerca (véase también función recíproca ).
La proyección en perspectiva más simple utiliza el origen como centro de proyección y el plano en como plano de la imagen. La forma funcional de esta transformación es entonces ; . Podemos expresar esto en coordenadas homogéneas como:
Luego de realizar la multiplicación de matrices , el componente homogéneo será igual al valor de y los otros tres no cambiarán. Por lo tanto, para volver a mapear al plano real debemos realizar la división homogénea o división en perspectiva dividiendo cada componente por :
Se pueden componer proyecciones de perspectiva más complicadas combinando esta con rotaciones, escalas, traslaciones y cortes para mover el plano de la imagen y el centro de proyección a donde se desee.