En los campos de la informática y la visión artificial , la pose (o pose espacial ) representa la posición y orientación de un objeto, generalmente en tres dimensiones . [1] Las poses a menudo se almacenan internamente como matrices de transformación . [2] [3] El término “pose” es en gran medida sinónimo del término “transformación”, pero una transformación a menudo puede incluir escala , mientras que la pose no. [4] [5]
En la visión artificial, la postura de un objeto suele estimarse a partir de la información que ingresa la cámara mediante el proceso de estimación de la postura . Esta información puede utilizarse, por ejemplo, para permitir que un robot manipule un objeto o para evitar moverse hacia él en función de su posición y orientación percibidas en el entorno. Otras aplicaciones incluyen el reconocimiento de movimientos esqueléticos.
La tarea específica de determinar la postura de un objeto en una imagen (o imágenes estereoscópicas, secuencia de imágenes) se denomina estimación de la postura . Los problemas de estimación de la postura se pueden resolver de diferentes maneras según la configuración del sensor de imagen y la metodología elegida. Se pueden distinguir tres clases de metodologías:
La resección de la cámara es el proceso de estimar los parámetros de un modelo de cámara estenopeica que se aproxima a la cámara que produjo una fotografía o un vídeo determinados; determina qué rayo de luz entrante está asociado con cada píxel de la imagen resultante. Básicamente, el proceso determina la pose de la cámara estenopeica.
Por lo general, los parámetros de la cámara se representan en una matriz de proyección de 3 × 4 llamada matriz de la cámara . Los parámetros extrínsecos definen la pose de la cámara (posición y orientación), mientras que los parámetros intrínsecos especifican el formato de la imagen de la cámara (distancia focal, tamaño de píxel y origen de la imagen).
Este proceso se denomina a menudo calibración geométrica de la cámara o simplemente calibración de la cámara, aunque ese término también puede referirse a la calibración fotométrica de la cámara o restringirse a la estimación de los parámetros intrínsecos únicamente. La orientación exterior y la orientación interior se refieren a la determinación de los parámetros extrínsecos e intrínsecos únicamente, respectivamente.
La calibración clásica de la cámara requiere objetos especiales en la escena, lo que no es necesario en la calibración automática de la cámara .
La resección de cámara se utiliza a menudo en la aplicación de visión estéreo , donde las matrices de proyección de dos cámaras se utilizan para calcular las coordenadas del mundo 3D de un punto visto por ambas cámaras.