Las imágenes generadas por computadora ( CGI ) son una tecnología o aplicación específica de gráficos de computadora para crear o mejorar imágenes en arte , medios impresos , simuladores , videos y videojuegos. Estas imágenes son estáticas (es decir, imágenes fijas ) o dinámicas (es decir, imágenes en movimiento). CGI se refiere tanto a gráficos de computadora 2D como (más frecuentemente) a gráficos de computadora 3D con el propósito de diseñar personajes, mundos virtuales o escenas y efectos especiales (en películas , programas de televisión, comerciales, etc.). La aplicación de CGI para crear/mejorar animaciones se llama animación por computadora o animación CGI .
El primer largometraje en utilizar CGI así como la composición de película de acción real con CGI fue Vértigo , [1] que utilizó gráficos de computadora abstractos de John Whitney en los créditos iniciales de la película. El primer largometraje en hacer uso de CGI con acción real en la historia de la película fue la película de 1973 Westworld . [2] Otras películas tempranas que incorporaron CGI incluyen Star Wars: Episodio IV (1977), [2] Tron (1982), Star Trek II: La ira de Khan (1982), [2] Golgo 13: El profesional (1983), [3] El último caza estelar (1984), [4] El joven Sherlock Holmes (1985), The Abyss (1989), Terminator 2: el juicio final (1991), Jurassic Park (1993) y Toy Story (1995). El primer video musical en utilizar CGI fue Adventures in Success (1983) de Will Powers . [5]
Antes de que la CGI se generalizara en el cine, la realidad virtual, la informática personal y los juegos, una de las primeras aplicaciones prácticas de la CGI fue para la aviación y el entrenamiento militar, a saber, el simulador de vuelo . Los sistemas visuales desarrollados en simuladores de vuelo también fueron un precursor importante de los gráficos por ordenador tridimensionales y los sistemas de imágenes generadas por ordenador (CGI) actuales. Es decir, porque el objeto de la simulación de vuelo era reproducir en tierra el comportamiento de una aeronave en vuelo. Gran parte de esta reproducción tenía que ver con una síntesis visual creíble que imitaba la realidad. [6] El generador de imágenes digitales Link (DIG) de la empresa Singer (Singer-Link) se consideró uno de los sistemas CGI de primera generación del mundo. [7] Era un sistema en tiempo real, con capacidad 3D, día/anochecer/noche que utilizaban los transbordadores de la NASA, los F-111, los Black Hawk y los B-52. El generador de imágenes digitales de Link tenía una arquitectura que proporcionaba un sistema visual que correspondía de forma realista con la vista del piloto. [8] La arquitectura básica del DIG y las mejoras posteriores contenían un administrador de escenas seguido de un procesador geométrico, un procesador de video y dentro de la pantalla con el objetivo final de un sistema visual que procesara texturas realistas, sombreado, capacidades de translucidez y libre de aliasing. [9]
En combinación con la necesidad de combinar la síntesis virtual con los requisitos de entrenamiento a nivel militar, las tecnologías CGI aplicadas en la simulación de vuelo a menudo estaban años por delante de lo que habría estado disponible en la informática comercial o incluso en el cine de alto presupuesto. Los primeros sistemas CGI solo podían representar objetos que consistieran en polígonos planos. Los avances en algoritmos y electrónica en los sistemas visuales de simuladores de vuelo y CGI en los años 1970 y 1980 influyeron en muchas tecnologías que aún se utilizan en CGI modernas, añadiendo la capacidad de superponer texturas sobre las superficies, así como de hacer que las imágenes pasen de un nivel de detalle al siguiente de manera fluida. [10]
La evolución de la CGI condujo al surgimiento de la cinematografía virtual en la década de 1990, donde la visión de la cámara simulada no está limitada por las leyes de la física. La disponibilidad de software CGI y el aumento de la velocidad de las computadoras han permitido que los artistas individuales y las pequeñas empresas produzcan películas, juegos y obras de arte de calidad profesional desde sus computadoras hogareñas.
Las imágenes animadas no sólo forman parte de las imágenes generadas por ordenador; los paisajes de aspecto natural (como los paisajes fractales ) también se generan mediante algoritmos informáticos . Una forma sencilla de generar superficies fractales es utilizar una extensión del método de malla triangular , basándose en la construcción de algún caso especial de una curva de De Rham , por ejemplo, el desplazamiento del punto medio . [11] Por ejemplo, el algoritmo puede empezar con un triángulo grande, luego hacer un zoom recursivo dividiéndolo en cuatro triángulos de Sierpinski más pequeños , y luego interpolar la altura de cada punto a partir de sus vecinos más cercanos. [11] La creación de una superficie browniana puede lograrse no sólo añadiendo ruido a medida que se crean nuevos nodos, sino añadiendo ruido adicional en múltiples niveles de la malla. [11] Por tanto, se puede crear un mapa topográfico con distintos niveles de altura utilizando algoritmos fractales relativamente sencillos. Algunos fractales típicos y fáciles de programar utilizados en CGI son el fractal de plasma y el fractal de falla más dramático . [12]
Se han investigado y desarrollado muchas técnicas específicas para producir efectos generados por computadora altamente enfocados, por ejemplo, el uso de modelos específicos para representar la erosión química de las piedras para modelar la erosión y producir una "apariencia envejecida" para una superficie de piedra determinada. [13]
Los arquitectos modernos utilizan los servicios de empresas de gráficos por ordenador para crear modelos tridimensionales tanto para los clientes como para los constructores. Estos modelos generados por ordenador pueden ser más precisos que los dibujos tradicionales. La animación arquitectónica (que proporciona películas animadas de edificios, en lugar de imágenes interactivas) también se puede utilizar para ver la posible relación que tendrá un edificio en relación con el entorno y los edificios que lo rodean. El procesamiento de espacios arquitectónicos sin el uso de herramientas de papel y lápiz es ahora una práctica ampliamente aceptada con una serie de sistemas de diseño arquitectónico asistido por ordenador. [14]
Las herramientas de modelado arquitectónico permiten a un arquitecto visualizar un espacio y realizar "recorridos" de manera interactiva, proporcionando así "entornos interactivos" tanto a nivel urbano como de construcción. [15] Las aplicaciones específicas en arquitectura no solo incluyen la especificación de estructuras de edificios (como paredes y ventanas) y recorridos, sino también los efectos de la luz y cómo la luz solar afectará un diseño específico en diferentes momentos del día. [16] [17]
Las herramientas de modelado arquitectónico se basan cada vez más en Internet. Sin embargo, la calidad de los sistemas basados en Internet aún está por detrás de los sofisticados sistemas de modelado internos. [18]
En algunas aplicaciones, las imágenes generadas por ordenador se utilizan para realizar "ingeniería inversa" de edificios históricos. Por ejemplo, una reconstrucción generada por ordenador del monasterio de Georgenthal , en Alemania, se obtuvo a partir de las ruinas del monasterio, pero ofrece al espectador una "imagen y una sensación" de cómo habría sido el edificio en su época. [19]
Los modelos generados por computadora que se utilizan en la animación esquelética no siempre son anatómicamente correctos. Sin embargo, organizaciones como el Scientific Computing and Imaging Institute han desarrollado modelos anatómicamente correctos basados en computadora. Los modelos anatómicos generados por computadora se pueden utilizar tanto con fines instructivos como operativos. Hasta la fecha, los estudiantes de medicina siguen utilizando una gran cantidad de imágenes médicas producidas por artistas , como las imágenes de Frank H. Netter , por ejemplo, las imágenes cardíacas. Sin embargo, se están volviendo disponibles varios modelos anatómicos en línea.
Una radiografía de un paciente no es una imagen generada por ordenador, ni siquiera si está digitalizada. Sin embargo, en aplicaciones que implican tomografías computarizadas, se produce automáticamente un modelo tridimensional a partir de muchas radiografías de un solo corte, lo que produce una "imagen generada por ordenador". Las aplicaciones que implican imágenes por resonancia magnética también reúnen una serie de "instantáneas" (en este caso mediante pulsos magnéticos) para producir una imagen interna compuesta.
En las aplicaciones médicas modernas, los modelos específicos del paciente se construyen en "cirugía asistida por computadora". Por ejemplo, en el reemplazo total de rodilla , la construcción de un modelo detallado específico del paciente se puede utilizar para planificar cuidadosamente la cirugía. [20] Estos modelos tridimensionales generalmente se extraen de múltiples tomografías computarizadas de las partes apropiadas de la propia anatomía del paciente. Dichos modelos también se pueden utilizar para planificar implantes de válvulas aórticas , uno de los procedimientos comunes para tratar enfermedades cardíacas . Dado que la forma, el diámetro y la posición de las aberturas coronarias pueden variar mucho de un paciente a otro, la extracción (de tomografías computarizadas ) de un modelo que se parezca mucho a la anatomía de la válvula de un paciente puede ser muy beneficiosa para planificar el procedimiento. [21]
Los modelos de tela generalmente se dividen en tres grupos:
Hasta la fecha, lograr que la ropa de un personaje digital se pliegue automáticamente de forma natural sigue siendo un desafío para muchos animadores. [23]
Además de su uso en películas, publicidad y otros modos de exhibición pública, las imágenes de ropa generadas por computadora son utilizadas ahora de manera rutinaria por las principales firmas de diseño de moda. [24]
El desafío de reproducir imágenes de piel humana implica tres niveles de realismo:
Las características visibles más finas, como las arrugas finas y los poros de la piel, tienen un tamaño de aproximadamente 100 μm o 0,1 milímetros . La piel se puede modelar como una función de textura bidireccional (BTF) de 7 dimensiones o como un conjunto de funciones de distribución de dispersión bidireccional (BSDF) sobre las superficies del objetivo.
La visualización interactiva es la representación de datos que pueden variar dinámicamente y que permiten al usuario ver los datos desde múltiples perspectivas. Las áreas de aplicación pueden variar significativamente, desde la visualización de los patrones de flujo en dinámica de fluidos hasta aplicaciones específicas de diseño asistido por computadora . [26] Los datos representados pueden corresponder a escenas visuales específicas que cambian a medida que el usuario interactúa con el sistema; por ejemplo, los simuladores, como los simuladores de vuelo , hacen un uso extensivo de técnicas CGI para representar el mundo. [27]
En el nivel abstracto, un proceso de visualización interactiva implica una "tubería de datos" en la que los datos sin procesar se gestionan y filtran hasta obtener una forma que los haga adecuados para la representación. Esto se suele llamar "datos de visualización" . A continuación, los datos de visualización se asignan a una "representación de visualización" que se puede introducir en un sistema de representación. Esto suele denominarse "representación renderizable" . Esta representación se renderiza entonces como una imagen que se puede visualizar. [27] A medida que el usuario interactúa con el sistema (por ejemplo, utilizando controles de joystick para cambiar su posición dentro del mundo virtual), los datos sin procesar se introducen a través de la tubería para crear una nueva imagen renderizada, lo que a menudo hace que la eficiencia computacional en tiempo real sea una consideración clave en dichas aplicaciones. [27] [28]
Si bien las imágenes de paisajes generadas por computadora pueden ser estáticas, la animación por computadora solo se aplica a imágenes dinámicas que se asemejan a una película. Sin embargo, en general, el término animación por computadora se refiere a imágenes dinámicas que no permiten la interacción del usuario, y el término mundo virtual se utiliza para los entornos animados interactivos.
La animación por ordenador es, en esencia, un sucesor digital del arte de la animación stop motion de modelos 3D y de la animación cuadro por cuadro de ilustraciones 2D. Las animaciones generadas por ordenador son más controlables que otros procesos más físicos, como la construcción de miniaturas para tomas con efectos o la contratación de extras para escenas con multitudes, y porque permiten la creación de imágenes que no serían posibles utilizando ninguna otra tecnología. También pueden permitir que un solo artista gráfico produzca dicho contenido sin el uso de actores, decorados costosos o accesorios.
Para crear la ilusión de movimiento, se muestra una imagen en la pantalla de la computadora y se reemplaza repetidamente por una nueva imagen que es similar a la imagen anterior, pero ligeramente adelantada en el dominio del tiempo (generalmente a una velocidad de 24 o 30 cuadros por segundo). Esta técnica es idéntica a la que se usa para lograr la ilusión de movimiento en la televisión y en las películas .
Un modelo de texto a imagen es un modelo de aprendizaje automático que toma una descripción en lenguaje natural de entrada y produce una imagen que coincide con esa descripción.
Los modelos de texto a imagen comenzaron a desarrollarse a mediados de la década de 2010, durante los inicios del auge de la IA , como resultado de los avances en redes neuronales profundas . En 2022, se comenzó a considerar el resultado de modelos de texto a imagen de última generación, como DALL-E 2 de OpenAI , Imagen de Google Brain , Stable Diffusion de Stability AI y Midjourney , para acercarse a la calidad de las fotografías reales y el arte dibujado por humanos .
Los modelos de texto a imagen son generalmente modelos de difusión latente , que combinan un modelo de lenguaje , que transforma el texto de entrada en una representación latente , y un modelo de imagen generativa , que produce una imagen condicionada a esa representación. Los modelos más eficaces generalmente se han entrenado con cantidades masivas de datos de imágenes y texto extraídos de la web . [29]Un mundo virtual es un entorno simulado y basado en agentes que permite a los usuarios interactuar con personajes animados artificialmente (por ejemplo, un agente de software ) o con otros usuarios físicos, mediante el uso de avatares . Los mundos virtuales están destinados a que sus usuarios los habiten e interactúen, y el término hoy en día se ha convertido en gran medida en sinónimo de entornos virtuales 3D interactivos, donde los usuarios toman la forma de avatares visibles para otros gráficamente. [30] Estos avatares generalmente se representan como representaciones gráficas textuales, bidimensionales o tridimensionales , aunque son posibles otras formas [31] (sensaciones auditivas [32] y táctiles, por ejemplo). Algunos mundos virtuales, pero no todos, permiten múltiples usuarios.
Las imágenes generadas por ordenador se han utilizado en los tribunales, principalmente desde principios de la década de 2000. Sin embargo, algunos expertos han argumentado que son perjudiciales. Se utilizan para ayudar a los jueces o al jurado a visualizar mejor la secuencia de eventos, pruebas o hipótesis. [33] Sin embargo, un estudio de 1997 demostró que las personas son físicos poco intuitivos y se dejan influenciar fácilmente por las imágenes generadas por ordenador. [34] Por lo tanto, es importante que los jurados y otros encargados de tomar decisiones legales sean conscientes de que dichas pruebas son simplemente una representación de una posible secuencia de eventos.
Las visualizaciones meteorológicas fueron la primera aplicación de CGI en televisión. Una de las primeras empresas en ofrecer sistemas informáticos para generar gráficos meteorológicos fue ColorGraphics Weather Systems en 1979 con el "LiveLine", basado en un ordenador Apple II , y los modelos posteriores de ColorGraphics utilizaron ordenadores Cromemco equipados con su tarjeta gráfica de vídeo Dazzler .
En la actualidad, en el campo de la predicción meteorológica se ha vuelto común mostrar videos de imágenes en movimiento completo captadas en tiempo real por múltiples cámaras y otros dispositivos de captura de imágenes. Junto con símbolos gráficos en 3D y mapeados a un modelo geoespacial virtual común, estas visualizaciones animadas constituyen la primera aplicación real de CGI a la televisión.
La CGI se ha vuelto común en la transmisión de deportes. Los lugares de deportes y entretenimiento cuentan con contenido transparente y superpuesto a través de transmisiones de cámaras rastreadas para una mejor visualización por parte de la audiencia. Los ejemplos incluyen la línea amarilla de " primer down " que se ve en las transmisiones televisivas de juegos de fútbol americano que muestra la línea que el equipo ofensivo debe cruzar para recibir un primer down. La CGI también se usa en asociación con el fútbol y otros eventos deportivos para mostrar anuncios comerciales superpuestos en la vista del área de juego. Secciones de campos de rugby y campos de cricket también muestran imágenes patrocinadas. Las transmisiones de natación a menudo agregan una línea a través de los carriles para indicar la posición del poseedor del récord actual a medida que avanza una carrera para permitir que los espectadores comparen la carrera actual con el mejor desempeño. Otros ejemplos incluyen el seguimiento del disco de hockey y las anotaciones del rendimiento de los autos de carrera [35] y las trayectorias de las bolas de snooker. [36] [37] A veces, la CGI en la televisión con una alineación correcta con el mundo real se ha denominado realidad aumentada .
Las imágenes generadas por computadora se utilizan a menudo junto con la captura de movimiento para cubrir mejor los fallos que presentan la CGI y la animación.Las imágenes generadas por ordenador tienen una aplicación práctica limitada por el grado de realismo que pueden tener. Las imágenes generadas por ordenador que no son realistas o que están mal gestionadas pueden dar lugar al efecto del valle inquietante . [38] Este efecto se refiere a la capacidad humana de reconocer cosas que se parecen mucho a los humanos, pero que son ligeramente diferentes. Esta capacidad es un defecto de las imágenes normales generadas por ordenador que, debido a la compleja anatomía del cuerpo humano, a menudo no consiguen reproducirlas a la perfección. Los artistas pueden utilizar la captura de movimiento para obtener imágenes de un ser humano realizando una acción y luego reproducirlas a la perfección con imágenes generadas por ordenador para que parezcan normales.
La falta de modelos digitales anatómicamente correctos contribuye a la necesidad de la captura de movimiento cuando se utiliza con imágenes generadas por computadora. Debido a que las imágenes generadas por computadora reflejan solo el exterior, o la piel, del objeto que se está renderizando, no logran capturar las interacciones infinitesimalmente pequeñas entre los grupos de músculos entrelazados que se utilizan en las habilidades motoras finas, como el habla. El movimiento constante de la cara al emitir sonidos con los labios y la lengua en forma, junto con las expresiones faciales que acompañan al habla, son difíciles de replicar a mano. [39] La captura de movimiento puede capturar el movimiento subyacente de los músculos faciales y replicar mejor la imagen que acompaña al audio.
{{cite book}}
: CS1 maint: multiple names: authors list (link){{cite journal}}
: CS1 maint: multiple names: authors list (link){{cite web}}
: CS1 maint: multiple names: authors list (link)