Coordenadas homogéneas

En matemáticas , las coordenadas homogéneas o coordenadas proyectivas , introducidas por August Ferdinand Möbius en su obra de 1827 Der barycentrische Calcul , ^[1]^[2]^[3] son un sistema de coordenadas utilizado en geometría proyectiva , al igual que las coordenadas cartesianas se utilizan en geometría euclidiana . Tienen la ventaja de que las coordenadas de los puntos, incluidos los puntos en el infinito , se pueden representar utilizando coordenadas finitas. Las fórmulas que involucran coordenadas homogéneas suelen ser más simples y simétricas que sus contrapartes cartesianas. Las coordenadas homogéneas tienen una variedad de aplicaciones, incluidos los gráficos por computadora y la visión artificial en 3D , donde permiten que las transformaciones afines y, en general, las transformaciones proyectivas se representen fácilmente mediante una matriz . También se utilizan en algoritmos fundamentales de criptografía de curva elíptica . ^[4]

Si las coordenadas homogéneas de un punto se multiplican por un escalar distinto de cero , las coordenadas resultantes representan el mismo punto. Dado que también se dan coordenadas homogéneas a los puntos en el infinito, el número de coordenadas necesario para permitir esta extensión es uno más que la dimensión del espacio proyectivo que se está considerando. Por ejemplo, se requieren dos coordenadas homogéneas para especificar un punto en la línea proyectiva y se requieren tres coordenadas homogéneas para especificar un punto en el plano proyectivo.

Introducción

El plano proyectivo real puede considerarse como el plano euclidiano con puntos adicionales agregados, que se denominan puntos en el infinito , y se considera que se encuentran en una nueva línea, la línea en el infinito . Hay un punto en el infinito correspondiente a cada dirección (dada numéricamente por la pendiente de una línea), definida informalmente como el límite de un punto que se mueve en esa dirección alejándose del origen. Se dice que las líneas paralelas en el plano euclidiano se intersecan en un punto en el infinito correspondiente a su dirección común. Dado un punto en el plano euclidiano, para cualquier número real distinto de cero , la terna se denomina conjunto de coordenadas homogéneas para el punto. Según esta definición, multiplicar las tres coordenadas homogéneas por un factor común distinto de cero da un nuevo conjunto de coordenadas homogéneas para el mismo punto. En particular, es un sistema de coordenadas homogéneas para el punto . Por ejemplo, el punto cartesiano se puede representar en coordenadas homogéneas como o . Las coordenadas cartesianas originales se recuperan dividiendo las dos primeras posiciones por la tercera. Por lo tanto, a diferencia de las coordenadas cartesianas, un único punto puede representarse mediante infinitas coordenadas homogéneas. ${\estilo de visualización (x,y)}$ ${\estilo de visualización Z}$ ${\estilo de visualización (xZ,yZ,Z)}$ ${\estilo de visualización (x,y,1)}$ ${\estilo de visualización (x,y)}$ ${\estilo de visualización (1,2)}$ ${\estilo de visualización (1,2,1)}$ ${\estilo de visualización (2,4,2)}$

La ecuación de una línea que pasa por el origen puede escribirse donde y no son ambos . En forma paramétrica esto puede escribirse . Sea , por lo que las coordenadas de un punto en la línea pueden escribirse . En coordenadas homogéneas esto se convierte en . En el límite, cuando se acerca al infinito, en otras palabras, cuando el punto se aleja del origen, se acerca a y las coordenadas homogéneas del punto se convierten en . Por lo tanto, definimos como las coordenadas homogéneas del punto en el infinito correspondientes a la dirección de la línea . Como cualquier línea del plano euclidiano es paralela a una línea que pasa por el origen, y dado que las líneas paralelas tienen el mismo punto en el infinito, al punto infinito en cada línea del plano euclidiano se le han dado coordenadas homogéneas. ${\estilo de visualización (0,0)}$ $nx+mi=0$ ${\estilo de visualización n}$ ${\estilo de visualización m}$ ${\estilo de visualización 0}$ $x=mt,y=-nt$ $Z=1/t$ $(m/Z,-n/Z)$ ${\estilo de visualización (m,-n,Z)}$ ${\estilo de visualización t}$ ${\estilo de visualización Z}$ ${\estilo de visualización 0}$ $(m,-n,0)$ $(m,-n,0)$ $nx+mi=0$

Para resumir:

Cualquier punto en el plano proyectivo está representado por una tripleta , llamada 'coordenadas homogéneas' o 'coordenadas proyectivas' del punto, donde , y no son todas . ${\estilo de visualización (X, Y, Z)}$ ${\estilo de visualización X}$ ${\estilo de visualización Y}$ ${\estilo de visualización Z}$ ${\estilo de visualización 0}$
El punto representado por un conjunto dado de coordenadas homogéneas no cambia si las coordenadas se multiplican por un factor común.
Por el contrario, dos conjuntos de coordenadas homogéneas representan el mismo punto si y sólo si uno se obtiene del otro multiplicando todas las coordenadas por la misma constante distinta de cero.
Cuando el punto no está representado es el punto en el plano euclidiano. ${\estilo de visualización Z}$ ${\estilo de visualización 0}$ ${\estilo de visualización (X/Z,Y/Z)}$
Cuando el punto representado es un punto en el infinito. ${\estilo de visualización Z}$ ${\estilo de visualización 0}$

Se omite la tripleta y no representa ningún punto. El origen del plano euclidiano está representado por . ^[5] ${\estilo de visualización (0,0,0)}$ ${\estilo de visualización (0,0,1)}$

Notación

Algunos autores utilizan notaciones diferentes para las coordenadas homogéneas que ayudan a distinguirlas de las coordenadas cartesianas. El uso de dos puntos en lugar de comas, por ejemplo en lugar de , enfatiza que las coordenadas deben considerarse proporciones. ^[6] Los corchetes, como en , enfatizan que varios conjuntos de coordenadas están asociados con un solo punto. ^[7] Algunos autores usan una combinación de dos puntos y corchetes, como en . ^[8] ${\estilo de visualización (x:y:z)}$ ${\estilo de visualización (x,y,z)}$ ${\estilo de visualización [x,y,z]}$ ${\estilo de visualización [x:y:z]}$

Otras dimensiones

La discusión en la sección precedente se aplica análogamente a espacios proyectivos distintos del plano. Por lo tanto, los puntos en la línea proyectiva pueden representarse por pares de coordenadas , no ambos cero. En este caso, el punto en el infinito es . De manera similar, los puntos en el espacio proyectivo se representan por -tuplas. ^[9] ${\estilo de visualización (x,y)}$ ${\estilo de visualización (1,0)}$ ${\estilo de visualización n}$ ${\estilo de visualización (n+1)}$

Otros espacios proyectivos

El uso de números reales da coordenadas homogéneas de puntos en el caso clásico de los espacios proyectivos reales, sin embargo, se puede utilizar cualquier campo , en particular, los números complejos se pueden utilizar para el espacio proyectivo complejo . Por ejemplo, la línea proyectiva compleja utiliza dos coordenadas complejas homogéneas y se conoce como la esfera de Riemann . Se pueden utilizar otros campos, incluidos los campos finitos .

También se pueden crear coordenadas homogéneas para espacios proyectivos con elementos de un anillo de división (un cuerpo sesgado). Sin embargo, en este caso se debe tener cuidado de tener en cuenta el hecho de que la multiplicación puede no ser conmutativa . ^[10]

Para el anillo general A , se puede definir una línea proyectiva sobre A con factores homogéneos actuando a la izquierda y el grupo lineal proyectivo actuando a la derecha.

Definición alternativa

Otra definición del plano proyectivo real se puede dar en términos de clases de equivalencia . Para elementos distintos de cero de , se define como que hay un distinto de cero de modo que . Entonces es una relación de equivalencia y el plano proyectivo se puede definir como las clases de equivalencia de Si es uno de los elementos de la clase de equivalencia, entonces se toman como coordenadas homogéneas de . $\mathbb {R} ^{3}$ ${\ Displaystyle (x_ {1}, y_ {1}, z_ {1}) \ sim (x_ {2}, y_ {2}, z_ {2})}$ ${\estilo de visualización \lambda}$ $(x_{1},y_{1},z_{1})=(\lambda x_{2},\lambda y_{2},\lambda z_{2})$ ${\estilo de visualización \sim}$ $\mathbb {R} ^{3}\setminus \izquierda\{0\derecha\}.$ ${\estilo de visualización (x,y,z)}$ ${\estilo de visualización p}$ ${\estilo de visualización p}$

Las líneas en este espacio se definen como conjuntos de soluciones de ecuaciones de la forma donde no todos los , y son cero. La satisfacción de la condición depende solo de la clase de equivalencia de por lo que la ecuación define un conjunto de puntos en el plano proyectivo. La aplicación define una inclusión del plano euclidiano al plano proyectivo y el complemento de la imagen es el conjunto de puntos con . La ecuación es una ecuación de una línea en el plano proyectivo (ver definición de una línea en el plano proyectivo), y se llama línea en el infinito. $ax+by+cz=0$ ${\estilo de visualización a}$ ${\estilo de visualización b}$ ${\estilo de visualización c}$ $ax+by+cz=0$ ${\estilo de visualización (x,y,z),}$ $(x,y)\rightarrow (x,y,1)$ $z=0$ $z=0$

Las clases de equivalencia, , son las líneas que pasan por el origen sin el origen. El origen no juega un papel esencial en la discusión anterior, por lo que se puede agregar nuevamente sin cambiar las propiedades del plano proyectivo. Esto produce una variación en la definición, a saber, el plano proyectivo se define como el conjunto de líneas en que pasan por el origen y las coordenadas de un elemento distinto de cero de una línea se toman como coordenadas homogéneas de la línea. Estas líneas ahora se interpretan como puntos en el plano proyectivo. ${\estilo de visualización p}$ $\mathbb {R} ^{3}$ ${\estilo de visualización (x,y,z)}$

Nuevamente, esta discusión se aplica análogamente a otras dimensiones. Por lo tanto, el espacio proyectivo de dimensión n se puede definir como el conjunto de líneas que pasan por el origen en . ^[11] $\mathbb {R} ^{n+1}$

Homogeneidad

Las coordenadas homogéneas no están determinadas de forma única por un punto, por lo que una función definida en las coordenadas, por ejemplo , no determina una función definida en puntos como sucede con las coordenadas cartesianas. Pero una condición definida en las coordenadas, como podría utilizarse para describir una curva, determina una condición en puntos si la función es homogénea . En concreto, supongamos que existe una función tal que $f(x,y,z)$ $f(x,y,z)=0$ ${\estilo de visualización k}$

$f(\lambda x,\lambda y,\lambda z)=\lambda ^{k}f(x,y,z).$

Si un conjunto de coordenadas representa el mismo punto que entonces se puede escribir para algún valor distinto de cero de . Entonces ${\estilo de visualización (x,y,z)}$ $(\lambda x,\lambda y,\lambda z)$ ${\estilo de visualización \lambda}$

$f(x,y,z)=0\iff f(\lambda x,\lambda y,\lambda z)=\lambda ^{k}f(x,y,z)=0.$

Un polinomio de grado se puede convertir en un polinomio homogéneo reemplazando con , con y multiplicando por , en otras palabras definiendo $g(x,y)$ ${\estilo de visualización k}$ ${\estilo de visualización x}$ ${\estilo de visualización x/z}$ ${\estilo de visualización y}$ ${\estilo de visualización y/z}$ $estilo de visualización z^{k}}$

$f(x,y,z)=z^{k}g(x/z,y/z).$

La función resultante es un polinomio, por lo que tiene sentido extender su dominio a ternas donde . El proceso se puede invertir estableciendo , o ${\estilo de visualización f}$ $z=0$ $z=1$

$g(x,y)=f(x,y,1).$

La ecuación puede entonces considerarse como la forma homogénea de y define la misma curva cuando se restringe al plano euclidiano. Por ejemplo, la forma homogénea de la ecuación de la línea es ^[12] $f(x,y,z)=0$ $g(x,y)=0$ $ax+by+c=0$ $ax+by+cz=0.$

Coordenadas de línea y dualidad

La ecuación de una línea en el plano proyectivo puede darse como donde , y son constantes. Cada triple determina una línea, la línea determinada no cambia si se multiplica por un escalar distinto de cero, y al menos uno de , y debe ser distinto de cero. Por lo tanto, el triple puede tomarse como coordenadas homogéneas de una línea en el plano proyectivo, es decir, coordenadas de línea en oposición a coordenadas de punto. Si en las letras , y se toman como variables y , y se toman como constantes, entonces la ecuación se convierte en una ecuación de un conjunto de líneas en el espacio de todas las líneas en el plano. Geométricamente representa el conjunto de líneas que pasan por el punto y puede interpretarse como la ecuación del punto en coordenadas de línea. De la misma manera, a los planos en el espacio tridimensional se les pueden dar conjuntos de cuatro coordenadas homogéneas, y así sucesivamente para dimensiones superiores. ^[13] $sx+ty+uz=0$ $s$ $t$ $u$ $(s,t,u)$ $s$ $t$ $u$ $(s,t,u)$ $sx+ty+uz=0$ $s$ $t$ $u$ $x$ $y$ $z$ $(x,y,z)$

La misma relación, , puede considerarse como la ecuación de una línea o como la ecuación de un punto. En general, no hay diferencia ni algebraica ni lógica entre coordenadas homogéneas de puntos y líneas. Por lo tanto, la geometría plana con puntos como elementos fundamentales y la geometría plana con líneas como elementos fundamentales son equivalentes excepto por la interpretación. Esto conduce al concepto de dualidad en geometría proyectiva, el principio de que los papeles de los puntos y las líneas pueden intercambiarse en un teorema en geometría proyectiva y el resultado también será un teorema. Análogamente, la teoría de puntos en el espacio tridimensional proyectivo es dual a la teoría de planos en el espacio tridimensional proyectivo, y así sucesivamente para dimensiones superiores. ^[14] $sx+ty+uz=0$

Coordenadas de Plücker

La asignación de coordenadas a líneas en un espacio proyectivo tridimensional es más complicada, ya que parecería que se requieren un total de 8 coordenadas, ya sean las coordenadas de dos puntos que se encuentran en la línea o dos planos cuya intersección es la línea. Un método útil, debido a Julius Plücker , crea un conjunto de seis coordenadas como determinantes a partir de las coordenadas homogéneas de dos puntos y de la línea. La incrustación de Plücker es la generalización de esto para crear coordenadas homogéneas de elementos de cualquier dimensión en un espacio proyectivo de dimensión . ^[15]^[16] $x_{i}y_{j}-x_{j}y_{i}(1\leq i<j\leq 4)$ $(x_{1},x_{2},x_{3},x_{4})$ $(y_{1},y_{2},y_{3},y_{4})$ $m$ $n$

Puntos circulares

La forma homogénea de la ecuación de un círculo en el plano proyectivo real o complejo es . La intersección de esta curva con la línea en el infinito se puede encontrar haciendo . Esto produce la ecuación que tiene dos soluciones sobre los números complejos, dando lugar a los puntos con coordenadas homogéneas y en el plano proyectivo complejo. Estos puntos se denominan puntos circulares en el infinito y pueden considerarse como los puntos de intersección comunes de todos los círculos. Esto se puede generalizar a curvas de orden superior como curvas algebraicas circulares . ^[17] $x_{2}+y_{2}+2axz+2byz+cz_{2}=0$ $z=0$ $x_{2}+y_{2}=0$ $(1,i,0)$ $(1,-i,0)$

Cambio de sistemas de coordenadas

Así como la selección de los ejes en el sistema de coordenadas cartesianas es algo arbitraria, la selección de un único sistema de coordenadas homogéneo entre todos los sistemas posibles es algo arbitraria. Por lo tanto, es útil saber cómo se relacionan entre sí los diferentes sistemas.

Sean ) coordenadas homogéneas de un punto en el plano proyectivo. Una matriz fija con determinante distinto de cero , define un nuevo sistema de coordenadas por la ecuación La multiplicación de por un escalar da como resultado la multiplicación de por el mismo escalar, y , y no pueden ser todos a menos que , y sean todos cero ya que es no singular. Por lo tanto son un nuevo sistema de coordenadas homogéneas para el mismo punto del plano proyectivo. $(x,y,z$ $A={\begin{pmatrix}a&b&c\\d&e&f\\g&h&i\end{pmatrix}},$ $(X,Y,Z)$ ${\begin{pmatrix}X\\Y\\Z\end{pmatrix}}=A{\begin{pmatrix}x\\y\\z\end{pmatrix}}.$ $(x,y,z)$ $(X,Y,Z)$ $X$ $Y$ $Z$ $0$ $x$ $y$ $z$ $A$ $(X,Y,Z)$

Coordenadas baricéntricas

La formulación original de coordenadas homogéneas de Möbius especificaba la posición de un punto como centro de masas (o baricentro) de un sistema de tres masas puntuales situadas en los vértices de un triángulo fijo. Los puntos dentro del triángulo se representan con masas positivas y los puntos fuera del triángulo se representan con masas negativas. Multiplicar las masas del sistema por un escalar no afecta al centro de masas, por lo que se trata de un caso especial de un sistema de coordenadas homogéneas.

Coordenadas trilineales

Sean , y tres rectas en el plano y definamos un conjunto de coordenadas , y de un punto como las distancias con signo desde a estas tres rectas. Estas se denominan coordenadas trilineales de con respecto al triángulo cuyos vértices son las intersecciones por pares de las rectas. Estrictamente hablando, estas no son homogéneas, ya que los valores de , y se determinan exactamente, no solo hasta la proporcionalidad. Sin embargo, existe una relación lineal entre ellas, por lo que estas coordenadas se pueden hacer homogéneas permitiendo que múltiplos de representen el mismo punto. De manera más general, , y se pueden definir como constantes , y multiplicado por las distancias a , y , lo que da como resultado un sistema diferente de coordenadas homogéneas con el mismo triángulo de referencia. Este es, de hecho, el tipo más general de sistema de coordenadas homogéneas para puntos en el plano si ninguna de las rectas es la recta en el infinito. ^[18] $l$ $m$ $n$ $X$ $Y$ $Z$ $p$ $p$ $p$ $X$ $Y$ $Z$ $(X,Y,Z)$ $X$ $Y$ $Z$ $p$ $r$ $q$ $l$ $m$ $n$

Uso en gráficos por computadora y visión artificial.

Las coordenadas homogéneas son omnipresentes en los gráficos por ordenador porque permiten representar operaciones vectoriales habituales como la traslación , la rotación , el escalado y la proyección en perspectiva como una matriz por la que se multiplica el vector. Mediante la regla de la cadena, cualquier secuencia de dichas operaciones se puede multiplicar en una única matriz, lo que permite un procesamiento sencillo y eficiente. Por el contrario, utilizando coordenadas cartesianas, las traslaciones y la proyección en perspectiva no se pueden expresar como multiplicaciones de matrices, aunque otras operaciones sí pueden. Las modernas tarjetas gráficas OpenGL y Direct3D aprovechan las coordenadas homogéneas para implementar un sombreador de vértices de forma eficiente utilizando procesadores vectoriales con registros de 4 elementos. ^[19]^[20]

Por ejemplo, en la proyección en perspectiva, una posición en el espacio se asocia con la línea que la une a un punto fijo llamado centro de proyección . Luego, el punto se asigna a un plano al encontrar el punto de intersección de ese plano y la línea. Esto produce una representación precisa de cómo aparece un objeto tridimensional ante el ojo. En la situación más simple, el centro de proyección es el origen y los puntos se asignan al plano , trabajando por el momento en coordenadas cartesianas. Para un punto dado en el espacio, , el punto donde se cruzan la línea y el plano es . Si descartamos la coordenada ahora superflua , esto se convierte en . En coordenadas homogéneas, el punto se representa por y el punto al que se asigna en el plano se representa por , por lo que la proyección se puede representar en forma de matriz como Las matrices que representan otras transformaciones geométricas se pueden combinar con esta y entre sí mediante la multiplicación de matrices. Como resultado, cualquier proyección en perspectiva del espacio se puede representar como una sola matriz. ^[21]^[22] $z=1$ $(x,y,z)$ $(x/z,y/z,1)$ $z$ $(x/z,y/z)$ $(x,y,z)$ $(xw,yw,zw,w)$ $(xw,yw,zw)$ ${\begin{pmatrix}1&0&0&0\\0&1&0&0\\0&0&1&0\end{pmatrix}}$

Notas

^ August Ferdinand Möbius: Der barycentrische Calcul , Verlag von Johann Ambrosius Barth, Leipzig, 1827.
^ O'Connor, John J.; Robertson, Edmund F. , "August Ferdinand Möbius", Archivo de Historia de las Matemáticas MacTutor , Universidad de St Andrews
^ Smith, David Eugene (1906). Historia de las matemáticas modernas. J. Wiley & Sons. pág. 53.
^ Igoe, Kevin; McGrew, David; Salter, Margaret (febrero de 2011). "Algoritmos fundamentales de criptografía de curva elíptica".
^ Para la sección: Jones 1912, págs. 120–122
^ Bosques 1922
^ Garner 1981
^ Miranda 1995
^ Bôcher 1907, págs. 13-14
^ Garner 1981, págs. 32-33
^ Para la sección: Cox, Little & O'Shea 2007, págs. 360–362
^ Para la sección: Miranda 1995, p. 14 y Jones 1912, p. 120
^ Bôcher 1907, pp. 107–108 (adaptado al plano según la nota al pie de la p. 108)
^ Woods 1922, págs. 2, 40
^ Wilczynski 1906, pág. 50
^ Bôcher 1907, pág. 110
^ Jones 1912, pág. 204
^ Jones 1912, págs. 452 y siguientes
^ "Ventanas gráficas y recorte (Direct3D 9) (Windows)". msdn.microsoft.com . Consultado el 10 de abril de 2018 .
^ Shreiner, Dave; Woo, Mason; Neider, Jackie; Davis, Tom; "OpenGL Programming Guide", 4th Edition, ISBN 978-0-321-17348-5 , publicado en diciembre de 2004. Página 38 y Apéndice F (pp. 697-702) Analice cómo OpenGL utiliza coordenadas homogéneas en su flujo de renderizado. La página 2 indica que OpenGL es una interfaz de software para hardware de gráficos .
^ Mortenson, Michael E. (1999). Matemáticas para aplicaciones gráficas de computadora . Industrial Press Inc. p. 318. ISBN 0-8311-3111-X.
^ McConnell, Jeffrey J. (2006). Gráficos informáticos: teoría y práctica. Jones & Bartlett Learning. pág. 120. ISBN 0-7637-2250-2.

Referencias

Bôcher, Maxime (1907). Introducción al álgebra superior. Macmillan. pp. 11 y siguientes.
Briot, Charles; Bouquet, Jean Claude (1896). Elementos de geometría analítica de dos dimensiones. Trad. J. H. Boyd. Compañía de libros escolares Werner. Pág. 380.
Cox, David A.; Little, John B.; O'Shea, Donal (2007). Ideales, variedades y algoritmos. Springer. pág. 357. ISBN 978-0-387-35650-1.
Garner, Lynn E. (1981), Un esquema de geometría proyectiva , North Holland, ISBN 0-444-00423-8
Jones, Alfred Clement (1912). Introducción a la geometría algebraica. Clarendon.
Miranda, Rick (1995). Curvas algebraicas y superficies de Riemann. Librería AMS. pág. 13. ISBN 0-8218-0268-2.
Wilczynski, Ernest Julius (1906). Geometría diferencial proyectiva de curvas y superficies regladas. BG Teubner.
Woods, Frederick S. (1922). Geometría superior. Ginn and Co., págs. 27 y siguientes.

Lectura adicional

Stillwell, John (2002). Matemáticas y su historia. Springer. pp. 134 y siguientes. ISBN 0-387-95336-1.

Rogers, David F. (1976). Elementos matemáticos para gráficos por computadora . McGraw Hill. ISBN 0070535272.

Enlaces externos

Wikimedia Commons tiene medios relacionados con Geometría proyectiva .

Jules Bloomenthal y Jon Rokne, Coordenadas homogéneas [1] Archivado el 26 de febrero de 2021 en Wayback Machine.
Ching-Kuang Shene, coordenadas homogéneas [2]
Wolfram MathWorld