Computación visual

Computación visual es un término genérico para todas las disciplinas informáticas que tratan con imágenes y modelos 3D , como gráficos por computadora , procesamiento de imágenes , visualización , visión por computadora , imágenes computacionales , realidad virtual y aumentada y procesamiento de video . La computación visual también incluye aspectos de reconocimiento de patrones , interacción persona-computadora , aprendizaje automático y bibliotecas digitales. Los desafíos principales son la adquisición, procesamiento, análisis y representación de información visual (principalmente imágenes y videos). Las áreas de aplicación incluyen control de calidad industrial, procesamiento y visualización de imágenes médicas, topografía, robótica, sistemas multimedia, patrimonio virtual, efectos especiales en películas y televisión y juegos de computadora.

Historia y descripción general

Computación visual ^[1] es un término bastante nuevo, que adquirió su significado actual alrededor de 2005, cuando se celebró por primera vez el Simposio Internacional sobre Computación Visual. ^[2] Las áreas de la tecnología informática relativas a las imágenes, como los formatos de imágenes, los métodos de filtrado, los modelos de color y las métricas de imágenes, tienen en común muchos métodos y algoritmos matemáticos. Cuando los científicos informáticos que trabajan en disciplinas informáticas que involucran imágenes, como gráficos por computadora , procesamiento de imágenes y visión por computadora , notaron que sus métodos y aplicaciones se superponían cada vez más, comenzaron a usar el término "computación visual" para describir estos campos colectivamente. Y también los métodos de programación en hardware gráfico, los trucos de manipulación para manejar grandes cantidades de datos, los libros de texto y las conferencias, las comunidades científicas de estas disciplinas y los grupos de trabajo en las empresas se entremezclan cada vez más.

Además, las aplicaciones necesitaban cada vez más técnicas de más de uno de estos campos al mismo tiempo. Para generar modelos muy detallados de objetos complejos se necesita reconocimiento de imágenes , sensores 3D y algoritmos de reconstrucción , y para mostrar estos modelos de manera creíble se necesitan técnicas de renderizado realistas con simulación de iluminación compleja. Los gráficos en tiempo real son la base del software de realidad virtual y aumentada utilizable. Una buena segmentación de los órganos es la base para la manipulación interactiva de visualizaciones 3D de exploraciones médicas. El control de robots necesita el reconocimiento de objetos como modelo de su entorno. Y todos los dispositivos (computadoras) necesitan interfaces gráficas de usuario ergonómicas.

Aunque muchos problemas se consideran resueltos dentro de las comunidades científicas de las subdisciplinas que componen la computación visual (principalmente bajo supuestos idealistas), un desafío importante de la computación visual en su conjunto es la integración de estas soluciones parciales en productos aplicables. Esto incluye abordar muchos problemas prácticos, como abordar una multitud de hardware, el uso de datos reales (que a menudo son erróneos y/o de tamaño gigantesco) y la operación por parte de usuarios no capacitados. En este sentido, la informática visual es más que la suma de sus subdisciplinas , es el siguiente paso hacia sistemas aptos para su uso real en todos los ámbitos utilizando imágenes u objetos 3D en el ordenador.

Disciplinas de computación visual

Al menos las siguientes disciplinas son subcampos de la informática visual. Se pueden encontrar descripciones más detalladas de cada uno de estos campos en las páginas especiales vinculadas.

Gráficos por computadora y animación por computadora.

Gráficos por computadora es un término general para todas las técnicas que producen imágenes como resultado con la ayuda de una computadora. Transformar la descripción de objetos en imágenes bonitas se llama renderizado , que siempre es un compromiso entre la calidad de la imagen y el tiempo de ejecución.

Análisis de imágenes y visión por computadora.

Las técnicas que pueden extraer información del contenido de las imágenes se denominan técnicas de análisis de imágenes . La visión por computadora es la capacidad de las computadoras (o de los robots) para reconocer su entorno e interpretarlo correctamente.

Visualización y análisis visual.

La visualización se utiliza para producir imágenes que comunicarán mensajes. Los datos pueden ser abstractos o concretos, a menudo sin componentes geométricos a priori. El análisis visual describe la disciplina del análisis visual interactivo de datos, también descrita como "la ciencia del razonamiento analítico respaldado por la interfaz visual interactiva". ^[3]

Modelado geométrico e impresión 3D.

Para representar objetos para renderizar se necesitan métodos y estructuras de datos especiales, que se incluyen en el término modelado geométrico . Además de describir técnicas geométricas interactivas, los datos de sensores se utilizan cada vez más para reconstruir modelos geométricos. Los algoritmos para el control eficiente de impresoras 3D también pertenecen al campo de la computación visual.

Procesamiento de imágenes y edición de imágenes.

A diferencia del análisis de imágenes, el procesamiento de imágenes manipula las imágenes para producir mejores imágenes. "Mejor" puede tener significados muy diferentes dependiendo de la aplicación respectiva. Además, debe diferenciarse de la edición de imágenes , que describe la manipulación interactiva (o automatizada mediante algoritmos informáticos) de imágenes basada en la validación humana.

Realidad virtual y aumentada

Las técnicas que producen la sensación de inmersión en un mundo ficticio se denominan realidad virtual (VR). Los requisitos para la realidad virtual incluyen pantallas montadas en la cabeza , seguimiento en tiempo real y renderizado en tiempo real de alta calidad. La realidad aumentada permite al usuario ver el entorno real además de los objetos virtuales, que aumentan esta realidad. Los requisitos de precisión en cuanto a velocidad de renderizado y precisión de seguimiento son aquí significativamente mayores.

La interacción persona-ordenador

La planificación, diseño y uso de interfaces entre personas y ordenadores no forma parte únicamente de todo sistema que implique imágenes. Debido al gran ancho de banda del canal visual humano (ojo), las imágenes también son una parte preferida de las interfaces de usuario ergonómicas en cualquier sistema, de modo que la interacción persona-computadora también es una parte integral de la computación visual.

Notas a pie de página

^ Frank Nielsen (2005). Computación visual: geometría, gráficos y visión . Medios de Charles River. ISBN 978-1584504276.
^ "Simposio Internacional sobre Computación Visual". ISVC . 2018-03-10 . Consultado el 7 de enero de 2023 .
^ [Thomas, JJ y Cook, KA (Eds) (2005). Un camino iluminado: la agenda de investigación y desarrollo para análisis visual, IEEE Computer Society Press, ISBN 0-7695-2323-4 ]

enlaces externos

Computación visual del grupo de investigación de Microsoft
Computación visual en NVidia
Grupo de Computación Visual de la Universidad de Harvard
Grupo de Computación Visual en la Universidad de Brown
Grupo de Computación Visual de la Universidad de Rochester
Centro de Computación Visual en KAUST
Investigación Aplicada en Computación Visual (Fraunhofer IGD)
Instituto de Computación Visual (Hochschule Bonn-Rhein-Sieg, Sankt Augustin)
Centro de Investigación VRVis para Realidad Virtual y Visualización (Viena, Austria)
Grupo de Computación Visual @ HTW Berlín (Alemania)
Computación Visual @ Universidad de Coburg (Alemania)