stringtranslate.com

Resección de cámara

La resección de la cámara es el proceso de estimar los parámetros de un modelo de cámara estenopeica que se aproxima a la cámara que produjo una fotografía o un vídeo determinados; determina qué rayo de luz entrante está asociado con cada píxel de la imagen resultante. Básicamente, el proceso determina la pose de la cámara estenopeica.

Por lo general, los parámetros de la cámara se representan en una matriz de proyección de 3 × 4 llamada matriz de la cámara . Los parámetros extrínsecos definen la pose de la cámara (posición y orientación), mientras que los parámetros intrínsecos especifican el formato de la imagen de la cámara (distancia focal, tamaño de píxel y origen de la imagen).

Este proceso se denomina a menudo calibración geométrica de la cámara o simplemente calibración de la cámara , aunque ese término también puede referirse a la calibración de la cámara fotométrica o restringirse a la estimación de los parámetros intrínsecos únicamente. La orientación exterior y la orientación interior se refieren a la determinación de los parámetros extrínsecos e intrínsecos únicamente, respectivamente.

La calibración clásica de la cámara requiere objetos especiales en la escena, lo que no es necesario en la calibración automática de la cámara . La resección de la cámara se utiliza a menudo en la aplicación de la visión estereoscópica , donde las matrices de proyección de dos cámaras se utilizan para calcular las coordenadas del mundo 3D de un punto visto por ambas cámaras.

Formulación

La matriz de proyección de la cámara se deriva de los parámetros intrínsecos y extrínsecos de la cámara y, a menudo, se representa mediante una serie de transformaciones; por ejemplo, una matriz de parámetros intrínsecos de la cámara, una matriz de rotación de 3 × 3 y un vector de traslación. La matriz de proyección de la cámara se puede utilizar para asociar puntos en el espacio de imagen de una cámara con ubicaciones en el espacio del mundo 3D.

Coordenadas homogéneas

En este contexto, se utiliza para representar la posición de un punto 2D en coordenadas de píxeles y se utiliza para representar la posición de un punto 3D en coordenadas del mundo . En ambos casos, se representan en coordenadas homogéneas (es decir, tienen un último componente adicional, que inicialmente es, por convención, un 1), que es la notación más común en robótica y transformaciones de cuerpos rígidos .

Proyección

En referencia al modelo de cámara estenopeica , se utiliza una matriz de cámara para denotar un mapeo proyectivo de coordenadas del mundo a coordenadas de píxeles .

donde . por convención son las coordenadas x e y del píxel en la cámara, es la matriz intrínseca como se describe a continuación, y forman la matriz extrínseca como se describe a continuación. son las coordenadas de la fuente del rayo de luz que llega al sensor de la cámara en coordenadas del mundo, en relación con el origen del mundo. Al dividir el producto de la matriz por , se puede encontrar el valor teórico para las coordenadas del píxel.

Parámetros intrínsecos

Contiene 5 parámetros intrínsecos del modelo de cámara específico. Estos parámetros abarcan la longitud focal , el formato del sensor de imagen y el punto principal de la cámara . Los parámetros y representan la longitud focal en términos de píxeles, donde y son las inversas del ancho y la altura de un píxel en el plano de proyección y es la longitud focal en términos de distancia. [1] representa el coeficiente de inclinación entre los ejes x e y, y a menudo es 0. y representan el punto principal, que idealmente estaría en el centro de la imagen.

Los parámetros intrínsecos no lineales, como la distorsión de la lente, también son importantes, aunque no se pueden incluir en el modelo de cámara lineal descrito por la matriz de parámetros intrínsecos. Muchos algoritmos de calibración de cámaras modernos también estiman estos parámetros intrínsecos en forma de técnicas de optimización no lineal. Esto se hace en forma de optimización de la cámara y de los parámetros de distorsión en forma de lo que generalmente se conoce como ajuste de haz .

Parámetros extrínsecos

son los parámetros extrínsecos que denotan las transformaciones del sistema de coordenadas de coordenadas mundiales 3D a coordenadas de cámara 3D. De manera equivalente, los parámetros extrínsecos definen la posición del centro de la cámara y el rumbo de la cámara en coordenadas mundiales. es la posición del origen del sistema de coordenadas mundiales expresada en coordenadas del sistema de coordenadas centrado en la cámara. a menudo se considera erróneamente la posición de la cámara. La posición, , de la cámara expresada en coordenadas mundiales es (ya que es una matriz de rotación ).

La calibración de la cámara se utiliza a menudo como una etapa temprana en la visión por computadora .

Cuando se utiliza una cámara , la luz del entorno se enfoca en un plano de imagen y se captura. Este proceso reduce las dimensiones de los datos captados por la cámara de tres a dos (la luz de una escena 3D se almacena en una imagen 2D). Por lo tanto, cada píxel del plano de imagen corresponde a un haz de luz de la escena original.

Algoritmos

Existen muchos enfoques diferentes para calcular los parámetros intrínsecos y extrínsecos de una configuración de cámara específica. Los más comunes son:

  1. Método de transformación lineal directa (DLT)
  2. El método de Zhang
  3. El método de Tsai
  4. Método de Selby (para cámaras de rayos X)

El método de Zhang

El método de Zhang [2] [3] es un método de calibración de cámaras que utiliza técnicas de calibración tradicionales (puntos de calibración conocidos) y técnicas de autocalibración (correspondencia entre los puntos de calibración cuando están en diferentes posiciones). Para realizar una calibración completa mediante el método de Zhang, se requieren al menos tres imágenes diferentes del objetivo/calibre de calibración, ya sea moviendo el calibre o la propia cámara. Si algunos de los parámetros intrínsecos se proporcionan como datos (ortogonalidad de la imagen o coordenadas del centro óptico), el número de imágenes necesarias se puede reducir a dos.

En un primer paso, se determina una aproximación de la matriz de proyección estimada entre el objetivo de calibración y el plano de la imagen utilizando el método DLT . [4] Posteriormente, se aplican técnicas de autocalibración para obtener la imagen de la matriz cónica absoluta. [5] La principal contribución del método de Zhang es cómo, dadas las poses del objetivo de calibración, extraer una matriz intrínseca restringida , junto con instancias de y parámetros de calibración.

Derivación

Supongamos que tenemos una homografía que asigna puntos en un "plano de sonda" a puntos en la imagen.

Los puntos circulares se encuentran tanto en nuestro plano de sonda como en la cónica absoluta . Por supuesto, estar en significa que también se proyectan en la imagen de la cónica absoluta (IAC) , por lo tanto y . Los puntos circulares se proyectan como

.

En realidad podemos ignorarlo y sustituir nuestra nueva expresión por lo siguiente:

Algoritmo de Tsai

El algoritmo de Tsai, un método importante para la calibración de cámaras, implica varios pasos detallados para determinar con precisión la orientación y la posición de una cámara en el espacio 3D. El procedimiento, aunque técnico, se puede dividir en tres etapas principales:

Calibración inicial

El proceso comienza con la etapa de calibración inicial , donde la cámara captura una serie de imágenes. Estas imágenes, que a menudo presentan un patrón de calibración conocido como un tablero de ajedrez, se utilizan para estimar parámetros intrínsecos de la cámara, como la distancia focal y el centro óptico. [6] En algunas aplicaciones, se utilizan variantes del objetivo de tablero de ajedrez que son resistentes a las oclusiones parciales. Dichos objetivos, como ChArUco [7] y PuzzleBoard [8], simplifican la medición de distorsiones en las esquinas del sensor de la cámara.

Estimación de la pose

Tras la calibración inicial, el algoritmo realiza una estimación de la posición . Esto implica calcular la posición y la orientación de la cámara en relación con un objeto conocido en la escena. El proceso normalmente requiere identificar puntos específicos en el patrón de calibración y calcular los vectores de rotación y traslación de la cámara.

Refinamiento de parámetros

La fase final es el refinamiento de los parámetros . En esta etapa, el algoritmo refina los coeficientes de distorsión de la lente, abordando las distorsiones radiales y tangenciales. Se realiza una optimización adicional de los parámetros internos y externos de la cámara para mejorar la precisión de la calibración.

Este enfoque estructurado ha posicionado al algoritmo de Tsai como una técnica fundamental tanto en la investigación académica como en las aplicaciones prácticas dentro de la robótica y la metrología industrial.

Método de Selby (para cámaras de rayos X)

El método de calibración de cámaras de Selby [9] aborda la calibración automática de los sistemas de cámaras de rayos X. Los sistemas de cámaras de rayos X, que constan de un tubo generador de rayos X y un detector de estado sólido, se pueden modelar como sistemas de cámaras estenopeicas, que comprenden 9 parámetros intrínsecos y extrínsecos de la cámara. El registro basado en la intensidad basado en una imagen de rayos X arbitraria y un modelo de referencia (como un conjunto de datos tomográficos) se puede utilizar para determinar los parámetros relativos de la cámara sin la necesidad de un cuerpo de calibración especial o ningún dato de verdad fundamental.

Véase también

Referencias

  1. ^ Richard Hartley y Andrew Zisserman (2003). Geometría de vista múltiple en visión artificial . Cambridge University Press. pp. 155–157. ISBN 0-521-54051-8.
  2. ^ Z. Zhang, "Una nueva técnica flexible para la calibración de cámaras", Archivado el 3 de diciembre de 2015 en Wayback Machine , IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 22, n.º 11, páginas 1330-1334, 2000
  3. ^ P. Sturm y S. Maybank, "Sobre la calibración de cámaras basadas en planos: un algoritmo general, singularidades, aplicaciones", Archivado el 4 de marzo de 2016 en Wayback Machine , en Actas de la Conferencia IEEE sobre Visión artificial y reconocimiento de patrones (CVPR), páginas 432–437, Fort Collins, CO, EE. UU., junio de 1999
  4. ^ Abdel-Aziz, YI, Karara, HM "Transformación lineal directa de las coordenadas del comparador en coordenadas del espacio del objeto en fotogrametría de corto alcance Archivado el 2 de agosto de 2019 en Wayback Machine ", Actas del Simposio sobre Fotogrametría de Corto Alcance (pp. 1-18), Falls Church, VA: Sociedad Estadounidense de Fotogrametría, (1971)
  5. ^ Luong, Q.-T.; Faugeras, OD (1997-03-01). "Autocalibración de una cámara móvil a partir de correspondencias puntuales y matrices fundamentales". Revista internacional de visión artificial . 22 (3): 261–289. doi :10.1023/A:1007982716991. ISSN  1573-1405.
  6. ^ Roger Y. Tsai, "Una técnica de calibración de cámara versátil para metrología de visión artificial 3D de alta precisión utilizando cámaras y lentes de TV disponibles comercialmente", IEEE Journal of Robotics and Automation , vol. RA-3, n.º 4, agosto de 1987
  7. ^ OpenCV. https://docs.opencv.org/3.4/df/d4a/tutorial_charuco_detection.html.
  8. ^ P. Stelldinger, et al. "PuzzleBoard: un nuevo patrón de calibración de cámara con codificación de posición". Conferencia alemana sobre reconocimiento de patrones. (2024). https://users.informatik.haw-hamburg.de/~stelldinger/pub/PuzzleBoard/.
  9. ^ Boris Peter Selby et al., "Posicionamiento del paciente con autocalibración del detector de rayos X para terapia guiada por imágenes" Archivado el 10 de noviembre de 2023 en Wayback Machine , Australasian Physical & Engineering Science in Medicine, vol. 34, n.º 3, páginas 391-400, 2011

Enlaces externos