stringtranslate.com

Coordenadas homogéneas

Curva racional de Bézier – curva polinómica definida en coordenadas homogéneas (azul) y su proyección en el plano – curva racional (rojo)

En matemáticas , las coordenadas homogéneas o coordenadas proyectivas , introducidas por August Ferdinand Möbius en su obra de 1827 Der barycentrische Calcul , [1] [2] [3] son ​​un sistema de coordenadas utilizado en la geometría proyectiva , al igual que las coordenadas cartesianas se utilizan en la geometría euclidiana . . Tienen la ventaja de que las coordenadas de los puntos, incluidos los puntos en el infinito , se pueden representar mediante coordenadas finitas. Las fórmulas que involucran coordenadas homogéneas suelen ser más simples y simétricas que sus contrapartes cartesianas. Las coordenadas homogéneas tienen una variedad de aplicaciones, que incluyen gráficos por computadora y visión por computadora en 3D , donde permiten que las transformaciones afines y, en general, las transformaciones proyectivas se representen fácilmente mediante una matriz . También se utilizan en algoritmos fundamentales de criptografía de curva elíptica . [4]

Si las coordenadas homogéneas de un punto se multiplican por un escalar distinto de cero , las coordenadas resultantes representan el mismo punto. Dado que también se dan coordenadas homogéneas a puntos en el infinito, el número de coordenadas necesarias para permitir esta extensión es uno más que la dimensión del espacio proyectivo que se está considerando. Por ejemplo, se requieren dos coordenadas homogéneas para especificar un punto en la línea proyectiva y se requieren tres coordenadas homogéneas para especificar un punto en el plano proyectivo.

Introducción

El plano proyectivo real puede considerarse como el plano euclidiano al que se le añaden puntos adicionales, que se denominan puntos en el infinito , y se considera que se encuentran sobre una nueva recta, la recta en el infinito . Hay un punto en el infinito correspondiente a cada dirección (dado numéricamente por la pendiente de una recta), definido informalmente como el límite de un punto que se mueve en esa dirección alejándose del origen. Se dice que las rectas paralelas en el plano euclidiano se cortan en un punto en el infinito correspondiente a su dirección común. Dado un punto ( x , y ) en el plano euclidiano, para cualquier número real Z distinto de cero , el triple ( xZ , yZ , Z ) se denomina conjunto de coordenadas homogéneas para el punto. Según esta definición, multiplicar las tres coordenadas homogéneas por un factor común distinto de cero da un nuevo conjunto de coordenadas homogéneas para el mismo punto. En particular, ( x , y , 1) es un sistema de coordenadas homogéneo para el punto ( x , y ) . Por ejemplo, el punto cartesiano (1, 2) se puede representar en coordenadas homogéneas como (1, 2, 1) o (2, 4, 2) . Las coordenadas cartesianas originales se recuperan dividiendo las dos primeras posiciones por la tercera. Así, a diferencia de las coordenadas cartesianas, un único punto puede representarse mediante infinitas coordenadas homogéneas.

La ecuación de una recta que pasa por el origen (0, 0) se puede escribir nx + my = 0 donde n y m no son ambos 0. En forma paramétrica esto se puede escribir x = mt , y = − nt . Sea Z = 1/ t , por lo que las coordenadas de un punto de la recta se pueden escribir ( m / Z , − n / Z ) . En coordenadas homogéneas esto se convierte en ( m , − n , Z ) . En el límite, cuando t tiende a infinito, es decir, cuando el punto se aleja del origen, Z tiende a 0 y las coordenadas homogéneas del punto pasan a ser ( m , − n , 0 ) . Así definimos ( m , − n , 0 ) como las coordenadas homogéneas del punto en el infinito correspondiente a la dirección de la recta nx + my = 0 . Como cualquier línea del plano euclidiano es paralela a una línea que pasa por el origen, y dado que las líneas paralelas tienen el mismo punto en el infinito, al punto infinito en cada línea del plano euclidiano se le han dado coordenadas homogéneas.

Para resumir:

La tripleta (0, 0, 0) se omite y no representa ningún punto. El origen del plano euclidiano está representado por (0, 0, 1) . [5]

Notación

Algunos autores utilizan notaciones diferentes para coordenadas homogéneas que ayudan a distinguirlas de las coordenadas cartesianas. El uso de dos puntos en lugar de comas, por ejemplo ( x : y : z ) en lugar de ( x , y , z ) , enfatiza que las coordenadas deben considerarse proporciones. [6] Los corchetes, como en [ x , y , z ] enfatizan que múltiples conjuntos de coordenadas están asociados con un solo punto. [7] Algunos autores utilizan una combinación de dos puntos y corchetes, como en [ x : y : z ]. [8]

Otras dimensiones

La discusión de la sección anterior se aplica de manera análoga a espacios proyectivos distintos del plano. Entonces, los puntos en la línea proyectiva pueden representarse mediante pares de coordenadas ( x , y ) , no ambas cero. En este caso, el punto en el infinito es (1, 0) . De manera similar, los puntos en el espacio proyectivo n están representados por ( n  + 1) -tuplas. [9]

Otros espacios proyectivos

El uso de números reales proporciona coordenadas homogéneas de puntos en el caso clásico de los espacios proyectivos reales; sin embargo, se puede usar cualquier campo , en particular, los números complejos se pueden usar para espacios proyectivos complejos . Por ejemplo, la recta proyectiva compleja utiliza dos coordenadas complejas homogéneas y se conoce como esfera de Riemann . Se pueden utilizar otros campos, incluidos los campos finitos .

También se pueden crear coordenadas homogéneas para espacios proyectivos con elementos de un anillo de división (un campo sesgado). Sin embargo, en este caso hay que tener cuidado de tener en cuenta el hecho de que la multiplicación puede no ser conmutativa . [10]

Para el anillo general A , se puede definir una línea proyectiva sobre A con factores homogéneos actuando a la izquierda y el grupo lineal proyectivo actuando a la derecha.

Definición alternativa

Otra definición del plano proyectivo real puede darse en términos de clases de equivalencia . Para elementos distintos de cero de R 3 , defina ( x 1 , y 1 , z 1 ) ~ ( x 2 , y 2 , z 2 ) para significar que hay un λ distinto de cero de modo que ( x 1 , y 1 , z 1 ) = ( λx 2 , λy 2 , λz 2 ) . Entonces ~ es una relación de equivalencia y el plano proyectivo se puede definir como las clases de equivalencia de R 3 ∖ {0}. Si ( x , y , z ) es uno de los elementos de la clase de equivalencia p , entonces se consideran coordenadas homogéneas de p .

Las líneas en este espacio se definen como conjuntos de soluciones de ecuaciones de la forma ax + by + cz = 0 donde no todos a , b y c son cero. La satisfacción de la condición ax + by + cz = 0 depende sólo de la clase de equivalencia de ( x , y , z ), por lo que la ecuación define un conjunto de puntos en el plano proyectivo. El mapeo ( x , y ) → ( x , y , 1 ) define una inclusión del plano euclidiano al plano proyectivo y el complemento de la imagen es el conjunto de puntos con z = 0 . La ecuación z = 0 es una ecuación de una recta en el plano proyectivo (ver definición de recta en el plano proyectivo), y se llama recta en el infinito .

Las clases de equivalencia, p , son las líneas que pasan por el origen sin el origen. El origen realmente no juega un papel esencial en la discusión anterior, por lo que se puede volver a agregar sin cambiar las propiedades del plano proyectivo. Esto produce una variación en la definición, es decir, el plano proyectivo se define como el conjunto de líneas en R 3 que pasan por el origen y las coordenadas de un elemento distinto de cero ( x , y , z ) de una línea se toman como coordenadas homogéneas de la línea. Estas líneas ahora se interpretan como puntos en el plano proyectivo.

Nuevamente, esta discusión se aplica de manera análoga a otras dimensiones. Entonces, el espacio proyectivo de dimensión n se puede definir como el conjunto de líneas que pasan por el origen en R n +1 . [11]

Homogeneidad

Las coordenadas homogéneas no están determinadas únicamente por un punto, por lo que una función definida en las coordenadas, digamos f ( x , y , z ) , no determina una función definida en puntos como ocurre con las coordenadas cartesianas. Pero una condición f ( x , y , z ) = 0 definida en las coordenadas, como podría usarse para describir una curva, determina una condición en los puntos si la función es homogénea . Específicamente, supongamos que existe un k tal que

Si un conjunto de coordenadas representa el mismo punto que ( x , y , z ) , entonces se puede escribir x , λ y , λ z ) para algún valor distinto de cero de λ. Entonces

Un polinomio g ( x , y ) de grado k se puede convertir en un polinomio homogéneo reemplazando x por x / z , y por y / z y multiplicando por z k , en otras palabras definiendo

La función resultante f es un polinomio, por lo que tiene sentido extender su dominio a triples donde z = 0 . El proceso se puede revertir estableciendo z = 1 , o

La ecuación f ( x , y , z ) = 0 puede considerarse entonces como la forma homogénea de g ( x , y ) = 0 y define la misma curva cuando se restringe al plano euclidiano. Por ejemplo, la forma homogénea de la ecuación de la recta ax + by + c = 0 es ax + by + cz = 0. [12]

Coordenadas de línea y dualidad.

La ecuación de una recta en el plano proyectivo se puede dar como sx + ty + uz = 0 donde s , t y u son constantes. Cada triplete ( s , t , u ) determina una recta, la recta determinada no cambia si se multiplica por un escalar distinto de cero, y al menos uno de s , t y u debe ser distinto de cero. Por lo tanto, la tripleta ( s , t , u ) puede considerarse coordenadas homogéneas de una línea en el plano proyectivo, es decir, coordenadas de línea en lugar de coordenadas de puntos. Si en sx  +  ty  +  uz  = 0 las letras s , t y u se toman como variables y x , y y z se toman como constantes, entonces la ecuación se convierte en una ecuación de un conjunto de líneas en el espacio de todas las líneas en el plano. . Geométricamente representa el conjunto de rectas que pasan por el punto ( x , y , z ) y puede interpretarse como la ecuación del punto en coordenadas de recta. De la misma manera, a los planos en el espacio tridimensional se les pueden dar conjuntos de cuatro coordenadas homogéneas, y así sucesivamente para dimensiones superiores. [13]

La misma relación, sx + ty + uz = 0 , puede considerarse como la ecuación de una recta o como la ecuación de un punto. En general, no existe diferencia ni algebraica ni lógicamente entre coordenadas homogéneas de puntos y rectas. Entonces, la geometría plana con puntos como elementos fundamentales y la geometría plana con líneas como elementos fundamentales son equivalentes excepto para la interpretación. Esto lleva al concepto de dualidad en geometría proyectiva, el principio de que los roles de puntos y líneas se pueden intercambiar en un teorema de geometría proyectiva y el resultado también será un teorema. De manera análoga, la teoría de los puntos en el espacio tridimensional proyectivo es dual a la teoría de los planos en el espacio tridimensional proyectivo, y así sucesivamente para dimensiones superiores. [14]

Coordenadas de Plücker

Asignar coordenadas a líneas en un espacio tridimensional proyectivo es más complicado ya que parecería que se requieren un total de 8 coordenadas, ya sea las coordenadas de dos puntos que se encuentran en la línea o dos planos cuya intersección es la línea. Un método útil, debido a Julius Plücker , crea un conjunto de seis coordenadas como los determinantes x i y jx j y i (1 ≤ i < j ≤ 4) a partir de las coordenadas homogéneas de dos puntos ( x 1 , x 2 , x 3 , x 4 ) y ( y 1 , y 2 , y 3 , y 4 ) en la recta. La incrustación de Plücker es la generalización de esto para crear coordenadas homogéneas de elementos de cualquier dimensión m en un espacio proyectivo de dimensión n . [15] [16]

Puntos circulares

La forma homogénea de la ecuación de un círculo en el plano proyectivo real o complejo es x 2 + y 2 + 2 axz + 2 byz + c z 2 = 0 . La intersección de esta curva con la línea en el infinito se puede encontrar estableciendo z = 0 . Esto produce la ecuación x 2 + y 2 = 0 que tiene dos soluciones sobre los números complejos, dando lugar a los puntos con coordenadas homogéneas (1, i , 0) y (1, − i , 0) en el plano proyectivo complejo. Estos puntos se denominan puntos circulares en el infinito y pueden considerarse como puntos comunes de intersección de todos los círculos. Esto se puede generalizar a curvas de orden superior como curvas algebraicas circulares . [17]

Cambio de sistemas de coordenadas.

Así como la selección de ejes en el sistema de coordenadas cartesiano es algo arbitraria, la selección de un único sistema de coordenadas homogéneo entre todos los sistemas posibles es algo arbitraria. Por tanto, es útil saber cómo se relacionan los diferentes sistemas entre sí.

Sean ( x , y , z ) coordenadas homogéneas de un punto en el plano proyectivo. Una matriz fija

determinante( X , Y , Z )
( x , y , z )( X , Y , Z )XYZxyzA( X , Y , Z )

Coordenadas baricéntricas

La formulación original de coordenadas homogéneas de Möbius especificaba la posición de un punto como centro de masa (o baricentro) de un sistema de tres masas puntuales colocadas en los vértices de un triángulo fijo. Los puntos dentro del triángulo se representan mediante masas positivas y los puntos fuera del triángulo se representan permitiendo masas negativas. Multiplicar las masas del sistema por un escalar no afecta el centro de masa, por lo que este es un caso especial de un sistema de coordenadas homogéneo.

Coordenadas trilineales

Sean l , m , n tres líneas en el plano y definan un conjunto de coordenadas X , Y y Z de un punto p como las distancias con signo de p a estas tres líneas. Éstas se denominan coordenadas trilineales de p con respecto al triángulo cuyos vértices son las intersecciones por pares de las líneas. Estrictamente hablando, estos no son homogéneos, ya que los valores de X , Y y Z se determinan exactamente, no sólo según la proporcionalidad. Sin embargo, existe una relación lineal entre ellas, por lo que estas coordenadas pueden volverse homogéneas permitiendo que múltiplos de ( X , Y , Z ) representen el mismo punto. De manera más general, X , Y y Z se pueden definir como constantes p , r y q multiplicadas por las distancias a l , myn , lo que da como resultado un sistema diferente de coordenadas homogéneas con el mismo triángulo de referencia . Este es, de hecho, el tipo más general de sistema de coordenadas homogéneas para puntos en el plano si ninguna de las rectas es la recta en el infinito. [18]

Uso en gráficos por computadora y visión por computadora.

Las coordenadas homogéneas son omnipresentes en los gráficos por computadora porque permiten que operaciones vectoriales comunes como traslación , rotación , escala y proyección en perspectiva se representen como una matriz por la cual se multiplica el vector. Según la regla de la cadena, cualquier secuencia de dichas operaciones se puede multiplicar en una única matriz, lo que permite un procesamiento simple y eficiente. Por el contrario, al utilizar coordenadas cartesianas, las traslaciones y la proyección en perspectiva no se pueden expresar como multiplicaciones de matrices, aunque otras operaciones sí. Las tarjetas gráficas OpenGL y Direct3D modernas aprovechan las coordenadas homogéneas para implementar un sombreador de vértices de manera eficiente utilizando procesadores vectoriales con registros de 4 elementos. [19] [20]

Por ejemplo, en la proyección en perspectiva, una posición en el espacio está asociada con la línea que va desde este hasta un punto fijo llamado centro de proyección . Luego, el punto se asigna a un plano encontrando el punto de intersección de ese plano y la línea. Esto produce una representación precisa de cómo aparece un objeto tridimensional ante el ojo. En la situación más simple, el centro de proyección es el origen y los puntos se asignan al plano z = 1 , trabajando para el momento en coordenadas cartesianas. Para un punto dado en el espacio, ( x , y , z ) , el punto donde la línea y el plano se cruzan es ( x / z , y / z , 1) . Al eliminar la coordenada z ahora superflua , esto se convierte en ( x / z , y / z ) . En coordenadas homogéneas, el punto ( x , y , z ) está representado por ( xw , yw , zw , w ) y el punto al que se asigna en el plano está representado por ( xw , yw , zw ) , por lo que se puede representar la proyección. en forma matricial como

[21] [22]

Notas

  1. ^ August Ferdinand Möbius: Der barycentrische Calcul , Verlag von Johann Ambrosius Barth, Leipzig, 1827.
  2. ^ O'Connor, John J.; Robertson, Edmund F. , "August Ferdinand Möbius", Archivo MacTutor de Historia de las Matemáticas , Universidad de St Andrews
  3. ^ Smith, David Eugene (1906). Historia de las Matemáticas Modernas. J. Wiley e hijos. pag. 53.
  4. ^ Yo, Kevin; McGrew, David; Salter, Margaret (febrero de 2011). "Algoritmos fundamentales de criptografía de curva elíptica".
  5. ^ Para la sección: Jones 1912, págs. 120-122
  6. ^ Bosques 1922
  7. ^ Garner 1981
  8. ^ Miranda 1995
  9. ^ Bôcher 1907, págs. 13-14
  10. ^ Garner 1981, págs. 32-33
  11. ^ Para la sección: Cox, Little & O'Shea 2007, págs. 360–362
  12. ^ Para la sección: Miranda 1995, p. 14 y Jones 1912, pág. 120
  13. Bôcher 1907, págs. 107-108 (adaptado al plano según la nota a pie de página de la pág. 108)
  14. ^ Woods 1922, págs.2, 40
  15. ^ Wilczynski 1906, pag. 50
  16. ^ Bôcher 1907, pag. 110
  17. ^ Jones 1912, pag. 204
  18. ^ Jones 1912, págs. 452 y siguientes
  19. ^ "Ventanas gráficas y recorte (Direct3D 9) (Windows)". msdn.microsoft.com . Consultado el 10 de abril de 2018 .
  20. ^ Shreiner, Dave; Woo, masón; Más abajo, Jackie; Davis, Tom; "Guía de programación OpenGL", cuarta edición, ISBN 978-0-321-17348-5 , publicada en diciembre de 2004. Página 38 y Apéndice F (págs. 697-702) Analice cómo OpenGL utiliza coordenadas homogéneas en su proceso de renderizado. La página 2 indica que OpenGL es una interfaz de software para hardware de gráficos
  21. ^ Mortenson, Michael E. (1999). Matemáticas para aplicaciones de gráficos por computadora . Prensa industrial Inc. pág. 318.ISBN 0-8311-3111-X.
  22. ^ McConnell, Jeffrey J. (2006). Gráficos por computadora: de la teoría a la práctica. Aprendizaje de Jones y Bartlett. pag. 120.ISBN 0-7637-2250-2.

Referencias

Otras lecturas

enlaces externos