Escalado de imagen

En gráficos por computadora e imágenes digitales , el escalado de la imagen se refiere al cambio de tamaño de una imagen digital. En tecnología de vídeo, la ampliación del material digital se conoce como upscaling o mejora de resolución .

Al escalar una imagen gráfica vectorial , las primitivas gráficas que componen la imagen se pueden escalar mediante transformaciones geométricas sin pérdida de calidad de la imagen . Al escalar una imagen de gráficos rasterizados , se debe generar una nueva imagen con un número mayor o menor de píxeles. En el caso de reducir el número de píxeles (reducir), esto suele provocar una pérdida visible de calidad. Desde el punto de vista del procesamiento de señales digitales , el escalado de gráficos rasterizados es un ejemplo bidimensional de conversión de frecuencia de muestreo , la conversión de una señal discreta de una frecuencia de muestreo (en este caso, la frecuencia de muestreo local) a otra.

Matemático

El escalado de imágenes se puede interpretar como una forma de remuestreo o reconstrucción de imágenes desde el punto de vista del teorema de muestreo de Nyquist . Según el teorema, la reducción de resolución a una imagen más pequeña a partir de un original de mayor resolución sólo se puede llevar a cabo después de aplicar un filtro anti-aliasing 2D adecuado para evitar artefactos de aliasing. La imagen se reduce a la información que puede contener la imagen más pequeña.

En el caso del muestreo ascendente, un filtro de reconstrucción reemplaza al filtro anti-aliasing.

Imagen original de 160x160px
Imagen original en dominio de frecuencia espacial.
Filtrado de paso bajo 2D , pero aún a 160x160px
Imagen filtrada en el dominio de frecuencia espacial.

Imagen filtrada de paso bajo de 160x160px 4× reducida a 40x40px
4× muestreo ascendente de Fourier de una imagen reducida de 40x40px a 160x160px (reconstrucción correcta)
4× muestreo ascendente de Fourier de una imagen disminuida de 40x40px a 160x160px (con alias)

Un enfoque más sofisticado para la ampliación trata el problema como un problema inverso , resolviendo la cuestión de generar una imagen plausible que, cuando se reduce, se parecería a la imagen de entrada. Para ello se han aplicado diversas técnicas, incluidas técnicas de optimización con términos de regularización y el uso de aprendizaje automático a partir de ejemplos.

Algoritmos

El tamaño de una imagen se puede cambiar de varias maneras.

Interpolación del vecino más cercano

Una de las formas más sencillas de aumentar el tamaño de la imagen es la interpolación del vecino más cercano , reemplazando cada píxel con el píxel más cercano en la salida; para la ampliación, esto significa que estarán presentes varios píxeles del mismo color. Esto puede preservar los detalles nítidos en el pixel art, pero también introducir irregularidades en imágenes que antes eran suaves. 'Más cercano' en el vecino más cercano no tiene por qué ser el más cercano matemáticamente. Una implementación común es redondear siempre hacia cero. Redondear de esta manera produce menos artefactos y es más rápido de calcular. ^{[ cita necesaria ]}

Algoritmos bilineales y bicúbicos.

La interpolación bilineal funciona interpolando valores de color de píxeles, introduciendo una transición continua en la salida incluso cuando el material original tiene transiciones discretas. Aunque esto es deseable para imágenes de tonos continuos, este algoritmo reduce el contraste (bordes nítidos) de una manera que puede ser indeseable para el arte lineal. La interpolación bicúbica produce resultados sustancialmente mejores, con un aumento en el costo computacional. ^{[ cita necesaria ]}

Remuestreo de Sinc y Lanczos

El remuestreo sinc , en teoría, proporciona la mejor reconstrucción posible para una señal perfectamente limitada en banda. En la práctica, las suposiciones detrás del remuestreo sinc no se cumplen completamente en las imágenes digitales del mundo real. El remuestreo de Lanczos , una aproximación al método sinc, produce mejores resultados. La interpolación bicúbica puede considerarse como una aproximación computacionalmente eficiente al remuestreo de Lanczos. ^{[ cita necesaria ]}

Muestreo de cajas

Una debilidad de los algoritmos bilineales, bicúbicos y relacionados es que muestrean un número específico de píxeles. Al reducir la escala por debajo de un cierto umbral, como más del doble para todos los algoritmos de bimuestreo, los algoritmos muestrearán píxeles no adyacentes, lo que resulta en pérdida de datos y resultados aproximados. ^{[ cita necesaria ]}

La solución trivial a este problema es el muestreo de cuadros, que consiste en considerar el píxel de destino como un cuadro en la imagen original y muestrear todos los píxeles dentro del cuadro. Esto garantiza que todos los píxeles de entrada contribuyan a la salida. La principal debilidad de este algoritmo es que es difícil de optimizar. ^{[ cita necesaria ]}

mapa mip

Otra solución al problema de la reducción de escala del bimuestreo son los mapas mip . Un mapa MIP es un conjunto preescalado de copias reducidas. Al reducir la escala, el mapa MIP más grande más cercano se utiliza como origen para garantizar que no se escale por debajo del umbral útil de la escala bilineal. Este algoritmo es rápido y fácil de optimizar. Es estándar en muchos marcos, como OpenGL . El coste es utilizar más memoria de imágenes, exactamente un tercio más en la implementación estándar.

Métodos de transformada de Fourier

La interpolación simple basada en la transformada de Fourier rellena el dominio de la frecuencia con componentes cero (un enfoque suave basado en ventanas reduciría el timbre ). Además de la buena conservación (o recuperación) de los detalles, destacan los zumbidos y el sangrado circular del contenido desde el borde izquierdo al derecho (y al revés).

Interpolación dirigida al borde

Los algoritmos de interpolación dirigida a los bordes tienen como objetivo preservar los bordes de la imagen después del escalado, a diferencia de otros algoritmos, que pueden introducir artefactos de escalera.

Ejemplos de algoritmos para esta tarea incluyen Nueva interpolación dirigida por bordes (NEDI), ^[1]^[2] Interpolación de imágenes guiada por bordes (EGGI), ^[3] Interpolación iterativa basada en curvatura (ICBI), ^{[ cita necesaria ]} y Cúbico direccional Interpolación de convolución (DCCI). ^[4] Un análisis de 2013 encontró que DCCI tenía las mejores puntuaciones en PSNR y SSIM en una serie de imágenes de prueba. ^[5]

hqx

Para ampliar gráficos de computadora con baja resolución y/o pocos colores (generalmente de 2 a 256 colores), se pueden lograr mejores resultados mediante hqx u otros algoritmos de escalado de pixel art . Estos producen bordes nítidos y mantienen un alto nivel de detalle.

Vectorización

La extracción de vectores, o vectorización , ofrece otro enfoque. La vectorización primero crea una representación vectorial independiente de la resolución del gráfico a escalar. Luego, la versión independiente de la resolución se representa como una imagen rasterizada con la resolución deseada. Esta técnica es utilizada por Adobe Illustrator , Live Trace e Inkscape . ^[6] Los gráficos vectoriales escalables se adaptan bien a imágenes geométricas simples, mientras que a las fotografías no les va bien con la vectorización debido a su complejidad.

Redes neuronales convolucionales profundas

Este método utiliza el aprendizaje automático para obtener imágenes más detalladas, como fotografías y obras de arte complejas. Los programas que utilizan este método incluyen waifu2x , Imglarger y Neural Enhance.

Demostración del escalado convencional frente al escalado Waifu2x con reducción de ruido, utilizando un detalle de Phosphorus y Hesperus por Evelyn De Morgan . Haga clic para ver tamaños completos.
Imagen original
Imagen mejorada al 200 % con PaintShop Pro
Imagen mejorada al 200% usando waifu2x en modo Foto con reducción de ruido media
Imagen mejorada un 400% usando Topaz AI Gigapixel con baja reducción de ruido
Imagen mejorada al 400% usando RealSR DF2K-JPEG

El software impulsado por IA, como MyHeritage Photo Enhancer, permite agregar detalles y nitidez a fotografías históricas, donde no están presentes en el original.

Fotografía de baja calidad de 270 × 368 píxeles de John Howard Lindauer , escaneada de un directorio de la legislatura estatal
La misma imagen mejorada y ampliada a 2160×2944 píxeles con Photo Enhancer de MyHeritage

Aplicaciones

General

El escalado de imágenes se utiliza, entre otras aplicaciones, en navegadores web , ^[7] editores de imágenes , visores de imágenes y archivos, lupas de software, zoom digital, el proceso de generación de imágenes en miniatura y cuando se generan imágenes a través de pantallas o impresoras.

Video

Esta aplicación es la ampliación de imágenes para sistemas de cine en casa para dispositivos de salida preparados para HDTV a partir de contenido en resolución PAL, por ejemplo, desde un reproductor de DVD. La ampliación se realiza en tiempo real y la señal de salida no se guarda.

Escalado de pixel art

Como los gráficos de pixel art suelen ser de baja resolución, dependen de la colocación cuidadosa de los píxeles individuales, a menudo con una paleta de colores limitada. Esto da como resultado gráficos que se basan en señales visuales estilizadas para definir formas complejas con poca resolución, hasta píxeles individuales. Esto hace que escalar el pixel art sea un problema particularmente difícil.

Se desarrollaron algoritmos especializados ^{[8] para manejar gráficos de pixel art, ya que los algoritmos de escala tradicionales no tienen en cuenta las señales de percepción.}

Dado que una aplicación típica es mejorar la apariencia de los videojuegos de cuarta generación y anteriores en emuladores de arcade y consolas , muchas están diseñadas para ejecutarse en tiempo real para imágenes de entrada pequeñas a 60 fotogramas por segundo.

En hardware rápido, estos algoritmos son adecuados para juegos y otros procesamientos de imágenes en tiempo real. Estos algoritmos proporcionan gráficos nítidos y nítidos, al tiempo que minimizan el desenfoque. Los algoritmos de arte de escalado se han implementado en una amplia gama de emuladores como HqMAME y DOSBox , así como en motores de juegos 2D y recreaciones de motores de juegos como ScummVM . Obtuvieron reconocimiento entre los jugadores, para quienes estas tecnologías alentaron un resurgimiento de las experiencias de juego de los años 80 y 90. ^{[ cita necesaria ]}

Estos filtros se utilizan actualmente en emuladores comerciales de Xbox Live , Virtual Console y PSN para permitir que los juegos clásicos de baja resolución sean más atractivos visualmente en las pantallas HD modernas . Los juegos lanzados recientemente que incorporan estos filtros incluyen Sonic's Ultimate Genesis Collection , Castlevania: The Dracula X Chronicles , Castlevania: Symphony of the Night y Akumajō Dracula X Chi no Rondo .

Escalado en tiempo real

Varias empresas han desarrollado técnicas para mejorar los fotogramas de vídeo en tiempo real , como cuando se dibujan en la pantalla de un videojuego. El supermuestreo de aprendizaje profundo (DLSS) de Nvidia utiliza el aprendizaje profundo para muestrear imágenes de menor resolución a una resolución más alta para mostrarlas en monitores de computadora de mayor resolución. ^[9]FidelityFX Super Resolución 1.0 (FSR) de AMD no emplea aprendizaje automático, sino que utiliza algoritmos tradicionales escritos a mano para lograr una ampliación espacial en unidades de sombreado tradicionales. FSR 2.0 utiliza ampliación temporal, nuevamente con un algoritmo ajustado manualmente. Los ajustes preestablecidos estandarizados de FSR no se aplican y algunos títulos, como Dota 2, ofrecen controles deslizantes de resolución. ^[10] Otras tecnologías incluyen Intel XeSS y Nvidia Image Scaler (NIS). ^[11]^[12]

Ver también

Referencias

Wikimedia Commons tiene medios relacionados con el escalado de imágenes .

^ "Interpolación dirigida por bordes" . Consultado el 19 de febrero de 2016 .
^ Xin Li; Michael T. Huerto. "INTERPOLACIÓN DIRIGIDA DE NUEVO BORDE" (PDF) . Conferencia internacional IEEE 2000 sobre procesamiento de imágenes : 311. Archivado desde el original (PDF) el 14 de febrero de 2016.
^ Zhang, D.; Xiaolin Wu (2006). "Un algoritmo de interpolación de imágenes guiado por bordes mediante filtrado direccional y fusión de datos". Transacciones IEEE sobre procesamiento de imágenes . 15 (8): 2226–38. Código Bib : 2006ITIP...15.2226Z. doi :10.1109/TIP.2006.877407. PMID 16900678. S2CID 9760560.
^ Dengwen Zhou; Xiao Liu Shen. "Ampliación de imágenes mediante interpolación de convolución cúbica direccional" . Consultado el 13 de septiembre de 2015 .
^ Shaode Yu; Rongmao Li; Rui Zhang; Mou An; Shibin Wu; Yaoqin Xie (2013). "Evaluación del rendimiento de métodos de interpolación dirigida por bordes para imágenes sin ruido". arXiv : 1303.6455 [cs.CV].
^ Johannes Kopf y Dani Lischinski (2011). "Despixelizar Pixel Art". Transacciones ACM sobre gráficos . 30 (4): 99:1–99:8. doi :10.1145/2010324.1964994. Archivado desde el original el 1 de septiembre de 2015 . Consultado el 24 de octubre de 2012 .
^ Análisis de algoritmos de escalado de imágenes utilizados por navegadores web populares.
^ "Escaladores de píxeles" . Consultado el 19 de febrero de 2016 .
^ "NVIDIA DLSS: respuestas a sus preguntas". www.nvidia.com . Archivado desde el original el 5 de octubre de 2021 . Consultado el 13 de octubre de 2021 .
^ "Dota 2 de Valve agrega súper resolución AMD FidelityFX - Phoronix". www.phoronix.com . Archivado desde el original el 21 de julio de 2021 . Consultado el 13 de octubre de 2021 .
^ Gartenberg, Chaim (19 de agosto de 2021). "Intel muestra su respuesta al DLSS de Nvidia, que llegará a las GPU Arc en 2022". El borde . Archivado desde el original el 19 de agosto de 2021 . Consultado el 13 de octubre de 2021 .
^ "¿Qué es el escalado de imágenes de Nvidia? Explicación de la mejora de la tecnología". Tendencias digitales . 16 de noviembre de 2021 . Consultado el 3 de diciembre de 2021 .