En matemáticas , las coordenadas homogéneas o coordenadas proyectivas , introducidas por August Ferdinand Möbius en su obra de 1827 Der barycentrische Calcul , [1] [2] [3] son un sistema de coordenadas utilizado en geometría proyectiva , al igual que las coordenadas cartesianas se utilizan en la geometría euclidiana . Tienen la ventaja de que las coordenadas de los puntos, incluidos los puntos en el infinito , se pueden representar utilizando coordenadas finitas. Las fórmulas que involucran coordenadas homogéneas suelen ser más simples y simétricas que sus contrapartes cartesianas. Las coordenadas homogéneas tienen una variedad de aplicaciones, incluidos los gráficos por computadora y la visión artificial en 3D , donde permiten que las transformaciones afines y, en general, las transformaciones proyectivas se representen fácilmente mediante una matriz . También se utilizan en algoritmos de criptografía de curva elíptica fundamental . [4]
Si las coordenadas homogéneas de un punto se multiplican por un escalar distinto de cero , las coordenadas resultantes representan el mismo punto. Dado que también se dan coordenadas homogéneas a los puntos en el infinito, el número de coordenadas necesario para permitir esta extensión es uno más que la dimensión del espacio proyectivo que se esté considerando. Por ejemplo, se requieren dos coordenadas homogéneas para especificar un punto en la línea proyectiva y se requieren tres coordenadas homogéneas para especificar un punto en el plano proyectivo.
El plano proyectivo real puede considerarse como el plano euclidiano con puntos adicionales añadidos, que se denominan puntos en el infinito , y se considera que se encuentran en una nueva línea, la línea en el infinito . Hay un punto en el infinito correspondiente a cada dirección (dada numéricamente por la pendiente de una línea), definida informalmente como el límite de un punto que se mueve en esa dirección alejándose del origen. Se dice que las líneas paralelas en el plano euclidiano se intersecan en un punto en el infinito correspondiente a su dirección común. Dado un punto en el plano euclidiano, para cualquier número real distinto de cero , la terna se denomina conjunto de coordenadas homogéneas para el punto. Según esta definición, multiplicar las tres coordenadas homogéneas por un factor común distinto de cero da un nuevo conjunto de coordenadas homogéneas para el mismo punto. En particular, es un sistema de coordenadas homogéneas para el punto . Por ejemplo, el punto cartesiano se puede representar en coordenadas homogéneas como o . Las coordenadas cartesianas originales se recuperan dividiendo las dos primeras posiciones por la tercera. Por lo tanto, a diferencia de las coordenadas cartesianas, un único punto puede representarse mediante infinitas coordenadas homogéneas.
La ecuación de una línea que pasa por el origen puede escribirse donde y no son ambos . En forma paramétrica esto puede escribirse . Sea , por lo que las coordenadas de un punto en la línea pueden escribirse . En coordenadas homogéneas esto se convierte en . En el límite, cuando se acerca al infinito, en otras palabras, cuando el punto se aleja del origen, se acerca a y las coordenadas homogéneas del punto se convierten en . Por lo tanto, definimos como las coordenadas homogéneas del punto en el infinito correspondientes a la dirección de la línea . Como cualquier línea del plano euclidiano es paralela a una línea que pasa por el origen, y dado que las líneas paralelas tienen el mismo punto en el infinito, al punto infinito en cada línea del plano euclidiano se le han dado coordenadas homogéneas.
Para resumir:
Se omite la tripleta y no representa ningún punto. El origen del plano euclidiano está representado por . [5]
Algunos autores utilizan notaciones diferentes para las coordenadas homogéneas que ayudan a distinguirlas de las coordenadas cartesianas. El uso de dos puntos en lugar de comas, por ejemplo en lugar de , enfatiza que las coordenadas deben considerarse proporciones. [6] Los corchetes, como en , enfatizan que varios conjuntos de coordenadas están asociados con un solo punto. [7] Algunos autores usan una combinación de dos puntos y corchetes, como en . [8]
La discusión en la sección precedente se aplica análogamente a espacios proyectivos distintos del plano. Por lo tanto, los puntos en la línea proyectiva pueden representarse por pares de coordenadas , no ambos cero. En este caso, el punto en el infinito es . De manera similar, los puntos en el espacio proyectivo se representan por -tuplas. [9]
El uso de números reales da coordenadas homogéneas de puntos en el caso clásico de los espacios proyectivos reales, sin embargo, se puede utilizar cualquier campo , en particular, los números complejos se pueden utilizar para el espacio proyectivo complejo . Por ejemplo, la línea proyectiva compleja utiliza dos coordenadas complejas homogéneas y se conoce como la esfera de Riemann . Se pueden utilizar otros campos, incluidos los campos finitos .
También se pueden crear coordenadas homogéneas para espacios proyectivos con elementos de un anillo de división (un cuerpo oblicuo). Sin embargo, en este caso se debe tener cuidado de tener en cuenta el hecho de que la multiplicación puede no ser conmutativa . [10]
Para el anillo general A , se puede definir una línea proyectiva sobre A con factores homogéneos actuando a la izquierda y el grupo lineal proyectivo actuando a la derecha.
Otra definición del plano proyectivo real se puede dar en términos de clases de equivalencia . Para elementos distintos de cero de , se define como que hay un distinto de cero de modo que . Entonces es una relación de equivalencia y el plano proyectivo se puede definir como las clases de equivalencia de Si es uno de los elementos de la clase de equivalencia, entonces se toman como coordenadas homogéneas de .
Las líneas en este espacio se definen como conjuntos de soluciones de ecuaciones de la forma donde no todos los , y son cero. La satisfacción de la condición depende solo de la clase de equivalencia de por lo que la ecuación define un conjunto de puntos en el plano proyectivo. La aplicación define una inclusión del plano euclidiano al plano proyectivo y el complemento de la imagen es el conjunto de puntos con . La ecuación es una ecuación de una línea en el plano proyectivo (ver definición de una línea en el plano proyectivo), y se llama línea en el infinito.
Las clases de equivalencia, , son las líneas que pasan por el origen sin el origen. El origen no juega un papel esencial en la discusión anterior, por lo que se puede agregar nuevamente sin cambiar las propiedades del plano proyectivo. Esto produce una variación en la definición, a saber, el plano proyectivo se define como el conjunto de líneas en que pasan por el origen y las coordenadas de un elemento distinto de cero de una línea se toman como coordenadas homogéneas de la línea. Estas líneas ahora se interpretan como puntos en el plano proyectivo.
Nuevamente, esta discusión se aplica análogamente a otras dimensiones. Por lo tanto, el espacio proyectivo de dimensión n se puede definir como el conjunto de líneas que pasan por el origen en . [11]
Las coordenadas homogéneas no están determinadas de forma única por un punto, por lo que una función definida en las coordenadas, por ejemplo , no determina una función definida en puntos como sucede con las coordenadas cartesianas. Pero una condición definida en las coordenadas, como podría utilizarse para describir una curva, determina una condición en puntos si la función es homogénea . En concreto, supongamos que existe una función tal que
Si un conjunto de coordenadas representa el mismo punto que entonces se puede escribir para algún valor distinto de cero de . Entonces
Un polinomio de grado se puede convertir en un polinomio homogéneo reemplazando con , con y multiplicando por , en otras palabras definiendo
La función resultante es un polinomio, por lo que tiene sentido extender su dominio a ternas donde . El proceso se puede invertir estableciendo , o
La ecuación puede entonces considerarse como la forma homogénea de y define la misma curva cuando se restringe al plano euclidiano. Por ejemplo, la forma homogénea de la ecuación de la línea es [12]
La ecuación de una línea en el plano proyectivo puede darse como donde , y son constantes. Cada triple determina una línea, la línea determinada no cambia si se multiplica por un escalar distinto de cero, y al menos uno de , y debe ser distinto de cero. Por lo tanto, el triple puede tomarse como coordenadas homogéneas de una línea en el plano proyectivo, es decir, coordenadas de línea en oposición a coordenadas de punto. Si en las letras , y se toman como variables y , y se toman como constantes, entonces la ecuación se convierte en una ecuación de un conjunto de líneas en el espacio de todas las líneas en el plano. Geométricamente representa el conjunto de líneas que pasan por el punto y puede interpretarse como la ecuación del punto en coordenadas de línea. De la misma manera, a los planos en el espacio tridimensional se les pueden dar conjuntos de cuatro coordenadas homogéneas, y así sucesivamente para dimensiones superiores. [13]
La misma relación, , puede considerarse como la ecuación de una línea o como la ecuación de un punto. En general, no hay diferencia ni algebraica ni lógica entre coordenadas homogéneas de puntos y líneas. Por lo tanto, la geometría plana con puntos como elementos fundamentales y la geometría plana con líneas como elementos fundamentales son equivalentes excepto por la interpretación. Esto conduce al concepto de dualidad en geometría proyectiva, el principio de que los papeles de los puntos y las líneas pueden intercambiarse en un teorema en geometría proyectiva y el resultado también será un teorema. Análogamente, la teoría de puntos en el espacio tridimensional proyectivo es dual a la teoría de planos en el espacio tridimensional proyectivo, y así sucesivamente para dimensiones superiores. [14]
La asignación de coordenadas a líneas en un espacio proyectivo tridimensional es más complicada, ya que parecería que se requieren un total de 8 coordenadas, ya sean las coordenadas de dos puntos que se encuentran en la línea o dos planos cuya intersección es la línea. Un método útil, debido a Julius Plücker , crea un conjunto de seis coordenadas como determinantes a partir de las coordenadas homogéneas de dos puntos y de la línea. La incrustación de Plücker es la generalización de esto para crear coordenadas homogéneas de elementos de cualquier dimensión en un espacio proyectivo de dimensión . [15] [16]
La forma homogénea de la ecuación de un círculo en el plano proyectivo real o complejo es . La intersección de esta curva con la línea en el infinito se puede encontrar haciendo . Esto produce la ecuación que tiene dos soluciones sobre los números complejos, dando lugar a los puntos con coordenadas homogéneas y en el plano proyectivo complejo. Estos puntos se denominan puntos circulares en el infinito y pueden considerarse como los puntos de intersección comunes de todos los círculos. Esto se puede generalizar a curvas de orden superior como curvas algebraicas circulares . [17]
Así como la selección de los ejes en el sistema de coordenadas cartesianas es algo arbitraria, la selección de un único sistema de coordenadas homogéneo entre todos los sistemas posibles es algo arbitraria. Por lo tanto, es útil saber cómo se relacionan entre sí los diferentes sistemas.
Sean ) coordenadas homogéneas de un punto en el plano proyectivo. Una matriz fija con determinante distinto de cero , define un nuevo sistema de coordenadas por la ecuación La multiplicación de por un escalar da como resultado la multiplicación de por el mismo escalar, y , y no pueden ser todos a menos que , y sean todos cero ya que es no singular. Por lo tanto son un nuevo sistema de coordenadas homogéneas para el mismo punto del plano proyectivo.
La formulación original de coordenadas homogéneas de Möbius especificaba la posición de un punto como centro de masas (o baricentro) de un sistema de tres masas puntuales situadas en los vértices de un triángulo fijo. Los puntos dentro del triángulo se representan con masas positivas y los puntos fuera del triángulo se representan con masas negativas. Multiplicar las masas del sistema por un escalar no afecta al centro de masas, por lo que se trata de un caso especial de un sistema de coordenadas homogéneas.
Sean , y tres rectas en el plano y definamos un conjunto de coordenadas , y de un punto como las distancias con signo desde a estas tres rectas. Estas se denominan coordenadas trilineales de con respecto al triángulo cuyos vértices son las intersecciones por pares de las rectas. Estrictamente hablando, estas no son homogéneas, ya que los valores de , y se determinan con exactitud, no solo hasta la proporcionalidad. Sin embargo, existe una relación lineal entre ellas, por lo que estas coordenadas se pueden hacer homogéneas permitiendo que múltiplos de representen el mismo punto. De manera más general, , y se pueden definir como constantes , y multiplicadas por las distancias a , y , lo que da como resultado un sistema diferente de coordenadas homogéneas con el mismo triángulo de referencia. Este es, de hecho, el tipo más general de sistema de coordenadas homogéneas para puntos en el plano si ninguna de las rectas es la recta en el infinito. [18]
Las coordenadas homogéneas son omnipresentes en los gráficos por ordenador porque permiten representar operaciones vectoriales habituales como la traslación , la rotación , el escalado y la proyección en perspectiva como una matriz por la que se multiplica el vector. Mediante la regla de la cadena, cualquier secuencia de dichas operaciones se puede multiplicar en una única matriz, lo que permite un procesamiento sencillo y eficiente. Por el contrario, utilizando coordenadas cartesianas, las traslaciones y la proyección en perspectiva no se pueden expresar como multiplicaciones de matrices, aunque otras operaciones sí pueden. Las modernas tarjetas gráficas OpenGL y Direct3D aprovechan las coordenadas homogéneas para implementar un sombreador de vértices de forma eficiente utilizando procesadores vectoriales con registros de 4 elementos. [19] [20]
Por ejemplo, en la proyección en perspectiva, una posición en el espacio se asocia con la línea que la une a un punto fijo llamado centro de proyección . Luego, el punto se asigna a un plano al encontrar el punto de intersección de ese plano y la línea. Esto produce una representación precisa de cómo aparece un objeto tridimensional ante el ojo. En la situación más simple, el centro de proyección es el origen y los puntos se asignan al plano , trabajando por el momento en coordenadas cartesianas. Para un punto dado en el espacio, , el punto donde se cruzan la línea y el plano es . Si descartamos la coordenada ahora superflua , esto se convierte en . En coordenadas homogéneas, el punto se representa por y el punto al que se asigna en el plano se representa por , por lo que la proyección se puede representar en forma de matriz como Las matrices que representan otras transformaciones geométricas se pueden combinar con esta y entre sí mediante la multiplicación de matrices. Como resultado, cualquier proyección en perspectiva del espacio se puede representar como una sola matriz. [21] [22]