Rectificación de imagen

La rectificación de imágenes es un proceso de transformación que se utiliza para proyectar imágenes en un plano de imagen común. Este proceso tiene varios grados de libertad y existen muchas estrategias para transformar imágenes al plano común. La rectificación de imágenes se utiliza en visión estéreo por computadora para simplificar el problema de encontrar puntos coincidentes entre imágenes (es decir, el problema de correspondencia ) y en sistemas de información geográfica (SIG) para fusionar imágenes tomadas desde múltiples perspectivas en un sistema de coordenadas de mapa común.

En visión por computadora

La visión estéreo por computadora toma dos o más imágenes con posiciones relativas conocidas de la cámara que muestran un objeto desde diferentes puntos de vista. Luego, para cada píxel, determina la profundidad del punto de escena correspondiente (es decir, la distancia desde la cámara) encontrando primero píxeles coincidentes (es decir, píxeles que muestran el mismo punto de escena) en las otras imágenes y luego aplicando triangulación a las coincidencias encontradas para determinar su profundidad. La búsqueda de coincidencias en visión estéreo está restringida por la geometría epipolar : la coincidencia de cada píxel en otra imagen solo se puede encontrar en una línea llamada línea epipolar. Si dos imágenes son coplanares, es decir, se tomaron de manera que la cámara derecha solo esté desplazada horizontalmente en comparación con la cámara izquierda (sin moverse hacia el objeto ni rotarse), entonces la línea epipolar de cada píxel es horizontal y está en la misma posición vertical que esa. píxel. Sin embargo, en entornos generales (la cámara se mueve hacia el objeto o gira) las líneas epipolares están inclinadas. La rectificación de imágenes deforma ambas imágenes de manera que parezcan tomadas con solo un desplazamiento horizontal y, como consecuencia, todas las líneas epipolares son horizontales, lo que simplifica ligeramente el proceso de coincidencia estéreo. Sin embargo, tenga en cuenta que la rectificación no cambia fundamentalmente el proceso de coincidencia estéreo: busca en líneas, inclinadas antes y horizontales después de la rectificación.

La rectificación de imágenes también es una alternativa equivalente (y más utilizada ^[1] ) a la coplanaridad perfecta de la cámara. Incluso con equipos de alta precisión, la rectificación de imágenes generalmente se realiza porque puede resultar poco práctico mantener una coplanaridad perfecta entre las cámaras.

La rectificación de imágenes sólo se puede realizar con dos imágenes a la vez y la rectificación simultánea de más de dos imágenes generalmente es imposible. ^[2]

Transformación

Si las imágenes a rectificar se toman de pares de cámaras sin distorsión geométrica , este cálculo se puede realizar fácilmente con una transformación lineal . La rotación X e Y coloca las imágenes en el mismo plano, la escala hace que los marcos de la imagen tengan el mismo tamaño y la rotación Z y los ajustes de inclinación hacen que las filas de píxeles de la imagen se alineen directamente ^{[ cita necesaria ]} . Es necesario conocer la alineación rígida de las cámaras (mediante calibración) y la transformación utiliza los coeficientes de calibración. ^[3]

Al realizar la transformación, si las propias cámaras están calibradas para parámetros internos, una matriz esencial proporciona la relación entre las cámaras. El caso más general (sin calibración de cámara) está representado por la matriz fundamental . Si no se conoce la matriz fundamental, es necesario encontrar correspondencias de puntos preliminares entre imágenes estéreo para facilitar su extracción. ^[3]

Algoritmos

Hay tres categorías principales de algoritmos de rectificación de imágenes: rectificación plana, ^[4] rectificación cilíndrica ^[1] y rectificación polar. ^[5]^[6]^[7]

Detalles de implementacion

Todas las imágenes rectificadas satisfacen las dos propiedades siguientes: ^[8]

Todas las líneas epipolares son paralelas al eje horizontal.
Los puntos correspondientes tienen coordenadas verticales idénticas.

Para transformar el par de imágenes original en un par de imágenes rectificadas, es necesario encontrar una transformación proyectiva H. Se imponen restricciones a H para satisfacer las dos propiedades anteriores. Por ejemplo, restringir las líneas epipolares para que sean paralelas al eje horizontal significa que los epipolos deben asignarse al punto infinito [1,0,0] ^T en coordenadas homogéneas . Incluso con estas restricciones, H todavía tiene cuatro grados de libertad. ^[9] También es necesario encontrar una H' coincidente para rectificar la segunda imagen de un par de imágenes. Una mala elección de H y H' puede dar lugar a imágenes rectificadas que cambian drásticamente de escala o se distorsionan gravemente.

Existen muchas estrategias diferentes para elegir una transformada proyectiva H para cada imagen entre todas las soluciones posibles. Un método avanzado es minimizar la disparidad o diferencia de mínimos cuadrados de los puntos correspondientes en el eje horizontal del par de imágenes rectificadas. ^[9] Otro método es separar H en una transformación proyectiva especializada, una transformación de similitud y una transformación de corte para minimizar la distorsión de la imagen. ^[8] Un método simple es rotar ambas imágenes para que se vean perpendiculares a la línea que une sus centros ópticos colectivos, girar los ejes ópticos para que el eje horizontal de cada imagen apunte en la dirección del centro óptico de la otra imagen y finalmente escalar la imagen más pequeña. imagen para que coincida para la correspondencia línea a línea. ^[2] Este proceso se demuestra en el siguiente ejemplo.

Ejemplo

Conjunto de imágenes 2D del ejemplo. Las imágenes originales están tomadas desde diferentes perspectivas (fila 1). Usando transformaciones sistemáticas del ejemplo (filas 2 y 3), podemos transformar ambas imágenes de modo que los puntos correspondientes estén en las mismas líneas de escaneo horizontales (fila 4).

Nuestro modelo para este ejemplo se basa en un par de imágenes que observan un punto 3D P , que corresponde a p y p' en las coordenadas de píxeles de cada imagen. O y O' representan los centros ópticos de cada cámara, con matrices de cámara conocidas y (asumimos que el origen mundial está en la primera cámara). Describiremos y representaremos brevemente los resultados de un enfoque simple para encontrar una transformación proyectiva H y H' que rectifique el par de imágenes de la escena de ejemplo. $M=K[I~0]$ $M'=K'[R~T]$

Primero, calculamos los epipolos, e y e' en cada imagen:

e=M{\begin{bmatrix}O'\\1\end{bmatrix}}=M{\begin{bmatrix}-R^{T}T\\1\end{bmatrix}}=K[ I~0]{\begin{bmatrix}-R^{T}T\\1\end{bmatrix}}=-KR^{T}T

e'=M'{\begin{bmatrix}O\\1\end{bmatrix}}=M'{\begin{bmatrix}0\\1\end{bmatrix}}=K'[R~T ]{\begin{bmatrix}0\\1\end{bmatrix}}=K'T

En segundo lugar, encontramos una transformación proyectiva H ₁ que rota nuestra primera imagen para que sea paralela a la línea de base que conecta O y O' (fila 2, columna 1 del conjunto de imágenes 2D). Esta rotación se puede encontrar utilizando el producto cruzado entre los ejes ópticos original y deseado. ^[2] A continuación, encontramos la transformación proyectiva H ₂ que toma la imagen rotada y la tuerce para que el eje horizontal se alinee con la línea base. Si se calcula correctamente, esta segunda transformación debería asignar la e al infinito en el eje x (fila 3, columna 1 del conjunto de imágenes 2D). Finalmente, defina como transformación proyectiva para rectificar la primera imagen. $H=H_{2}H_{1}$

En tercer lugar, mediante una operación equivalente, podemos encontrar H' para rectificar la segunda imagen (columna 2 del conjunto de imágenes 2D). Tenga en cuenta que H' ₁ debe girar el eje óptico de la segunda imagen para que quede paralelo al eje óptico transformado de la primera imagen. Una estrategia es elegir un plano paralelo a la línea donde se cruzan los dos ejes ópticos originales para minimizar la distorsión del proceso de reproyección. ^[10] En este ejemplo, simplemente definimos H' usando la matriz de rotación R y la transformación proyectiva inicial H como . $H'=HR^{T}$

Finalmente, escalamos ambas imágenes a la misma resolución aproximada y alineamos los epipolos ahora horizontales para facilitar el escaneo horizontal en busca de correspondencias (fila 4 del conjunto de imágenes 2D).

Tenga en cuenta que es posible realizar este y otros algoritmos similares sin tener las matrices de parámetros de la cámara M y M' . Todo lo que se requiere es un conjunto de siete o más correspondencias de imagen a imagen para calcular las matrices y epipolos fundamentales. ^[9]

En el sistema de información geográfica.

La rectificación de imágenes en SIG convierte imágenes a un sistema de coordenadas de mapa estándar. Esto se hace haciendo coincidir los puntos de control terrestre (GCP) en el sistema de mapeo con los puntos de la imagen. Estos GCP calculan las transformaciones de imágenes necesarias. ^[11]

Se producen las principales dificultades en el proceso.

cuando la precisión de los puntos del mapa no se conoce bien
cuando las imágenes carecen de puntos claramente identificables que se correspondan con los mapas.

Los mapas que se utilizan con imágenes rectificadas son no topográficos. Sin embargo, las imágenes a utilizar pueden contener distorsiones debido al terreno. La ortorrectificación de imágenes elimina además estos efectos. ^[11]

La rectificación de imágenes es una característica estándar disponible en los paquetes de software SIG.

Ver también

Referencias

^ ab Oram, Daniel (2001). Rectificación para cualquier geometría epipolar .
^ abc Szeliski, Richard (2010). Visión por computadora: Algoritmos y aplicaciones. Saltador. ISBN 9781848829350.
^ ab Fusiello, Andrea (17 de marzo de 2000). "Rectificación epipolar". Archivado desde el original el 13 de noviembre de 2015 . Consultado el 9 de junio de 2008 .
^ Fusiello, Andrea; Trucco, Emanuele; Verri, Alessandro (2 de marzo de 2000). "Un algoritmo compacto para la rectificación de pares estéreo" (PDF) . Visión artificial y aplicaciones . 12 : 16–22. doi :10.1007/s001380050120. S2CID 13250851. Archivado desde el original (PDF) el 23 de septiembre de 2015 . Consultado el 8 de junio de 2010 .
^ Pollefeys, Marc; Koch, Reinhard; Van Gool, Luc (1999). "Un método de rectificación sencillo y eficaz para el movimiento general" (PDF) . Proc. Conferencia internacional sobre visión por computadora : 496–501 . Consultado el 19 de enero de 2011 .
^ Lim, Ser-Nam; Mittal, Anurag; Davis, Larry; Paragios, Nikos. «Rectificación estéreo no calibrada para vigilancia 3D automática» (PDF) . Congreso Internacional sobre Procesamiento de Imágenes . 2 : 1357. Archivado desde el original (PDF) el 21 de agosto de 2010 . Consultado el 8 de junio de 2010 .
^ Roberto, Rafael; Teichrieb, Verónica; Kelner, Judith (2009). "Retificação Cilíndrica: um método eficaz para retificar um par de imágenes" (PDF) . Talleres de Sibgrapi 2009 - Trabajos de Pregrado (en portugués). Archivado desde el original (PDF) el 6 de julio de 2011 . Consultado el 5 de marzo de 2011 .
^ ab Bucle, Charles; Zhang, Zhengyou (1999). "Cálculo de homografías rectificadoras para visión estereoscópica" (PDF) . Actas. Conferencia de la IEEE Computer Society de 1999 sobre visión por computadora y reconocimiento de patrones (n.º de catálogo PR00149) . págs. 125-131. CiteSeerX 10.1.1.34.6182 . doi :10.1109/CVPR.1999.786928. ISBN 978-0-7695-0149-9. S2CID 157172 . Consultado el 9 de noviembre de 2014 .
^ a B C Hartley, Richard; Zisserman, Andrés (2003). Geometría de vista múltiple en visión por computadora. Prensa de la Universidad de Cambridge. ISBN 9780521540513.
^ Forsyth, David A.; Ponce, Jean (2002). Visión por computadora: un enfoque moderno . Referencia técnica profesional de Prentice Hall.
^ ab Fogel, David. "Rectificación de imágenes con funciones de base radial". Archivado desde el original el 24 de mayo de 2008 . Consultado el 9 de junio de 2008 .

Hartley, Rhode Island (1999). "Teoría y Práctica de la Rectificación Proyectiva". Revista Internacional de Visión por Computadora . 35 (2): 115-127. doi :10.1023/A:1008115206617. S2CID 406463.
Pollefeys, Marc. «Rectificación polar» . Consultado el 9 de junio de 2007 .
Shapiro, Linda G .; Stockman, George C. (2001). Visión por computador . Prentice Hall. págs.580. ISBN 978-0-13-030796-5.

Otras lecturas

Computación de homografías de rectificación para visión estéreo por Charles Loop y Zhengyou Zhang (8 de abril de 1999) Microsoft Research
Visión por computadora: algoritmos y aplicaciones, sección 11.1.1 "Rectificación" por Richard Szeliski (3 de septiembre de 2010) Springer