La rectificación de imágenes es un proceso de transformación que se utiliza para proyectar imágenes en un plano de imagen común. Este proceso tiene varios grados de libertad y existen muchas estrategias para transformar imágenes al plano común. La rectificación de imágenes se utiliza en visión estéreo por computadora para simplificar el problema de encontrar puntos coincidentes entre imágenes (es decir, el problema de correspondencia ) y en sistemas de información geográfica (SIG) para fusionar imágenes tomadas desde múltiples perspectivas en un sistema de coordenadas de mapa común.
La visión estéreo por computadora toma dos o más imágenes con posiciones relativas conocidas de la cámara que muestran un objeto desde diferentes puntos de vista. Luego, para cada píxel, determina la profundidad del punto de escena correspondiente (es decir, la distancia desde la cámara) encontrando primero píxeles coincidentes (es decir, píxeles que muestran el mismo punto de escena) en las otras imágenes y luego aplicando triangulación a las coincidencias encontradas para determinar su profundidad. La búsqueda de coincidencias en visión estéreo está restringida por la geometría epipolar : la coincidencia de cada píxel en otra imagen solo se puede encontrar en una línea llamada línea epipolar. Si dos imágenes son coplanares, es decir, se tomaron de manera que la cámara derecha solo esté desplazada horizontalmente en comparación con la cámara izquierda (sin moverse hacia el objeto ni rotarse), entonces la línea epipolar de cada píxel es horizontal y está en la misma posición vertical que esa. píxel. Sin embargo, en entornos generales (la cámara se mueve hacia el objeto o gira) las líneas epipolares están inclinadas. La rectificación de imágenes deforma ambas imágenes de manera que parezcan tomadas con solo un desplazamiento horizontal y, como consecuencia, todas las líneas epipolares son horizontales, lo que simplifica ligeramente el proceso de coincidencia estéreo. Sin embargo, tenga en cuenta que la rectificación no cambia fundamentalmente el proceso de coincidencia estéreo: busca en líneas, inclinadas antes y horizontales después de la rectificación.
La rectificación de imágenes también es una alternativa equivalente (y más utilizada [1] ) a la coplanaridad perfecta de la cámara. Incluso con equipos de alta precisión, la rectificación de imágenes generalmente se realiza porque puede resultar poco práctico mantener una coplanaridad perfecta entre las cámaras.
La rectificación de imágenes sólo se puede realizar con dos imágenes a la vez y la rectificación simultánea de más de dos imágenes generalmente es imposible. [2]
Si las imágenes a rectificar se toman de pares de cámaras sin distorsión geométrica , este cálculo se puede realizar fácilmente con una transformación lineal . La rotación X e Y coloca las imágenes en el mismo plano, la escala hace que los marcos de la imagen tengan el mismo tamaño y la rotación Z y los ajustes de inclinación hacen que las filas de píxeles de la imagen se alineen directamente [ cita necesaria ] . Es necesario conocer la alineación rígida de las cámaras (mediante calibración) y la transformación utiliza los coeficientes de calibración. [3]
Al realizar la transformación, si las propias cámaras están calibradas para parámetros internos, una matriz esencial proporciona la relación entre las cámaras. El caso más general (sin calibración de cámara) está representado por la matriz fundamental . Si no se conoce la matriz fundamental, es necesario encontrar correspondencias de puntos preliminares entre imágenes estéreo para facilitar su extracción. [3]
Hay tres categorías principales de algoritmos de rectificación de imágenes: rectificación plana, [4] rectificación cilíndrica [1] y rectificación polar. [5] [6] [7]
Todas las imágenes rectificadas satisfacen las dos propiedades siguientes: [8]
Para transformar el par de imágenes original en un par de imágenes rectificadas, es necesario encontrar una transformación proyectiva H. Se imponen restricciones a H para satisfacer las dos propiedades anteriores. Por ejemplo, restringir las líneas epipolares para que sean paralelas al eje horizontal significa que los epipolos deben asignarse al punto infinito [1,0,0] T en coordenadas homogéneas . Incluso con estas restricciones, H todavía tiene cuatro grados de libertad. [9] También es necesario encontrar una H' coincidente para rectificar la segunda imagen de un par de imágenes. Una mala elección de H y H' puede dar lugar a imágenes rectificadas que cambian drásticamente de escala o se distorsionan gravemente.
Existen muchas estrategias diferentes para elegir una transformada proyectiva H para cada imagen entre todas las soluciones posibles. Un método avanzado es minimizar la disparidad o diferencia de mínimos cuadrados de los puntos correspondientes en el eje horizontal del par de imágenes rectificadas. [9] Otro método es separar H en una transformación proyectiva especializada, una transformación de similitud y una transformación de corte para minimizar la distorsión de la imagen. [8] Un método simple es rotar ambas imágenes para que se vean perpendiculares a la línea que une sus centros ópticos colectivos, girar los ejes ópticos para que el eje horizontal de cada imagen apunte en la dirección del centro óptico de la otra imagen y finalmente escalar la imagen más pequeña. imagen para que coincida para la correspondencia línea a línea. [2] Este proceso se demuestra en el siguiente ejemplo.
Nuestro modelo para este ejemplo se basa en un par de imágenes que observan un punto 3D P , que corresponde a p y p' en las coordenadas de píxeles de cada imagen. O y O' representan los centros ópticos de cada cámara, con matrices de cámara conocidas y (asumimos que el origen mundial está en la primera cámara). Describiremos y representaremos brevemente los resultados de un enfoque simple para encontrar una transformación proyectiva H y H' que rectifique el par de imágenes de la escena de ejemplo.
Primero, calculamos los epipolos, e y e' en cada imagen:
En segundo lugar, encontramos una transformación proyectiva H 1 que rota nuestra primera imagen para que sea paralela a la línea de base que conecta O y O' (fila 2, columna 1 del conjunto de imágenes 2D). Esta rotación se puede encontrar utilizando el producto cruzado entre los ejes ópticos original y deseado. [2] A continuación, encontramos la transformación proyectiva H 2 que toma la imagen rotada y la tuerce para que el eje horizontal se alinee con la línea base. Si se calcula correctamente, esta segunda transformación debería asignar la e al infinito en el eje x (fila 3, columna 1 del conjunto de imágenes 2D). Finalmente, defina como transformación proyectiva para rectificar la primera imagen.
En tercer lugar, mediante una operación equivalente, podemos encontrar H' para rectificar la segunda imagen (columna 2 del conjunto de imágenes 2D). Tenga en cuenta que H' 1 debe girar el eje óptico de la segunda imagen para que quede paralelo al eje óptico transformado de la primera imagen. Una estrategia es elegir un plano paralelo a la línea donde se cruzan los dos ejes ópticos originales para minimizar la distorsión del proceso de reproyección. [10] En este ejemplo, simplemente definimos H' usando la matriz de rotación R y la transformación proyectiva inicial H como .
Finalmente, escalamos ambas imágenes a la misma resolución aproximada y alineamos los epipolos ahora horizontales para facilitar el escaneo horizontal en busca de correspondencias (fila 4 del conjunto de imágenes 2D).
Tenga en cuenta que es posible realizar este y otros algoritmos similares sin tener las matrices de parámetros de la cámara M y M' . Todo lo que se requiere es un conjunto de siete o más correspondencias de imagen a imagen para calcular las matrices y epipolos fundamentales. [9]
La rectificación de imágenes en SIG convierte imágenes a un sistema de coordenadas de mapa estándar. Esto se hace haciendo coincidir los puntos de control terrestre (GCP) en el sistema de mapeo con los puntos de la imagen. Estos GCP calculan las transformaciones de imágenes necesarias. [11]
Se producen las principales dificultades en el proceso.
Los mapas que se utilizan con imágenes rectificadas son no topográficos. Sin embargo, las imágenes a utilizar pueden contener distorsiones debido al terreno. La ortorrectificación de imágenes elimina además estos efectos. [11]
La rectificación de imágenes es una característica estándar disponible en los paquetes de software SIG.