Artefacto de compresión

Imagen original, con buenos bordes de texto y gradación de color.

Pérdida de claridad en los bordes y "borrosidad" en el tono en la compresión JPEG intensa

Un artefacto de compresión (o artefacto ) es una distorsión notable de los medios (incluidas imágenes , audio y video ) causada por la aplicación de la compresión con pérdida . La compresión de datos con pérdida implica descartar algunos de los datos de los medios para que sean lo suficientemente pequeños como para almacenarse dentro del espacio de disco deseado o transmitirse ( transmitirse ) dentro del ancho de banda disponible (conocido como la velocidad de datos o velocidad de bits ). Si el compresor no puede almacenar suficientes datos en la versión comprimida, el resultado es una pérdida de calidad o la introducción de artefactos. El algoritmo de compresión puede no ser lo suficientemente inteligente como para discriminar entre distorsiones de poca importancia subjetiva y aquellas objetables para el usuario.

Los artefactos de compresión digital más comunes son los bloques DCT, causados por el algoritmo de compresión de transformada de coseno discreta (DCT) utilizado en muchos estándares de medios digitales , como los formatos de archivos de video JPEG , MP3 y MPEG . ^[1]^[2]^[3] Estos artefactos de compresión aparecen cuando se aplica una compresión fuerte, ^[1] y ocurren a menudo en medios digitales comunes, como DVD , formatos de archivos de computadora comunes como JPEG, MP3 y MPEG, y algunas alternativas al disco compacto , como el formato MiniDisc de Sony . Los medios sin comprimir (como en Laserdiscs , Audio CD y archivos WAV ) o los medios comprimidos sin pérdida (como FLAC o PNG ) no sufren artefactos de compresión.

La minimización de los artefactos perceptibles es un objetivo clave en la implementación de un algoritmo de compresión con pérdida. Sin embargo, ocasionalmente se producen artefactos intencionalmente con fines artísticos, un estilo conocido como glitch art ^{[4] o datamoshing}^[5] .

En términos técnicos, un artefacto de compresión es una clase particular de error de datos que suele ser consecuencia de la cuantificación en la compresión de datos con pérdida. Cuando se utiliza la codificación de transformación , normalmente asume la forma de una de las funciones base del espacio de transformación del codificador.

Imágenes

Ilustración del efecto de la compresión JPEG en una imagen ligeramente ruidosa con una mezcla de texto y espacios en blanco. El texto es una captura de pantalla de una conversación de Wikipedia con ruido añadido (intensidad 10 en Paint.NET). Un fotograma de la animación se guardó como JPEG (calidad 90) y se volvió a cargar. A continuación, ambos fotogramas se ampliaron con un factor de 4 (interpolación del vecino más cercano).

Al realizar la codificación de transformada de coseno discreta (DCT) ^[1] basada en bloques para cuantificación , como en imágenes comprimidas en JPEG , pueden aparecer varios tipos de artefactos.

Zumbido
Contorno ^{[ aclaración necesaria ]}
Posterización
Ruido de escalera ( aliasing ) a lo largo de los bordes curvos
Bloques en regiones "ocupadas" (artefactos de límites de bloques, a veces llamados (macro)bloqueos, acolchados o tableros de ajedrez)

Otros algoritmos con pérdida, que utilizan la comparación de patrones para eliminar la duplicación de símbolos similares, son propensos a introducir errores difíciles de detectar en el texto impreso. Por ejemplo, los números "6" y "8" pueden ser reemplazados. Se ha observado que esto sucede con JBIG2 en ciertas fotocopiadoras. ^[6]^[7]

Artefactos en los límites de bloques

Artefactos de codificación de bloques en una imagen JPEG. Los bloques planos son causados por una cuantificación gruesa. Las discontinuidades en los límites de los bloques de transformación son visibles.

A bajas tasas de bits, cualquier esquema de codificación basado en bloques con pérdida introduce artefactos visibles en los bloques de píxeles y en los límites de los bloques. Estos límites pueden ser límites de bloques de transformación, límites de bloques de predicción o ambos, y pueden coincidir con los límites de macrobloques . El término macrobloqueo se utiliza comúnmente independientemente de la causa del artefacto. Otros nombres incluyen bloqueo, ^[8] mosaico , ^[9] pixelado, acolchado y tablero de ajedrez.

Los artefactos de bloque son el resultado del principio mismo de la codificación de transformación de bloque . La transformación (por ejemplo, la transformada de coseno discreta) se aplica a un bloque de píxeles y, para lograr una compresión sin pérdida, se cuantifican los coeficientes de transformación de cada bloque . Cuanto menor sea la tasa de bits, más burdamente se representan los coeficientes y más coeficientes se cuantifican a cero. Estadísticamente, las imágenes tienen más contenido de baja frecuencia que de alta frecuencia, por lo que es el contenido de baja frecuencia el que permanece después de la cuantificación, lo que da como resultado bloques borrosos y de baja resolución. En el caso más extremo, solo se conserva el coeficiente DC, es decir, el coeficiente que representa el color promedio de un bloque, y el bloque de transformación es solo de un solo color después de la reconstrucción.

Como este proceso de cuantificación se aplica individualmente en cada bloque, los bloques vecinos cuantifican los coeficientes de forma diferente, lo que genera discontinuidades en los límites de los bloques. Estas son más visibles en áreas planas, donde hay pocos detalles que enmascaren el efecto.

Reducción de artefactos en la imagen

Se han propuesto varios enfoques para reducir los efectos de compresión de imágenes, pero para utilizar técnicas de compresión/descompresión estandarizadas y conservar los beneficios de la compresión (por ejemplo, menores costos de transmisión y almacenamiento), muchos de estos métodos se centran en el "posprocesamiento", es decir, procesar las imágenes cuando se reciben o se ven. No se ha demostrado que ninguna técnica de posprocesamiento mejore la calidad de la imagen en todos los casos; en consecuencia, ninguna ha obtenido una aceptación generalizada, aunque algunas se han implementado y se utilizan en sistemas propietarios. Muchos programas de edición de fotografías, por ejemplo, tienen algoritmos propietarios de reducción de artefactos JPEG incorporados. Los equipos de consumo a menudo denominan a este posprocesamiento "Reducción de ruido MPEG". ^[10]

Los artefactos de contorno en JPEG se pueden convertir en "granos" más agradables, no muy distintos de los que se encuentran en las películas fotográficas con valores ISO altos. En lugar de simplemente multiplicar los coeficientes cuantificados por el paso de cuantificación $Q$ correspondiente a la frecuencia 2D, se puede añadir ruido inteligente en forma de un número aleatorio en el intervalo $[- Q /2; Q /2]$ al coeficiente descuantificado. Este método se puede incorporar como parte integral de los descompresores JPEG que funcionan con los billones de imágenes JPEG existentes y futuras. Como tal, no es una técnica de "posprocesamiento". ^[11]

El problema del timbre se puede reducir en el momento de la codificación sobrepasando los valores DCT, lo que suprime los anillos. ^[12]

La posterización generalmente sólo ocurre con baja calidad, cuando se le da poca importancia a los valores de DC. Ajustar la tabla de cuantificación ayuda. ^[13]

Video

Cuando se utiliza la predicción de movimiento, como en MPEG-1 , MPEG-2 o MPEG-4 , los artefactos de compresión tienden a permanecer en varias generaciones de cuadros descomprimidos y se mueven con el flujo óptico de la imagen, lo que genera un efecto peculiar, a medio camino entre un efecto de pintura y una "suciedad" que se mueve con los objetos en la escena.

Los errores de datos en el flujo de bits comprimido, posiblemente debidos a errores de transmisión, pueden dar lugar a errores similares a grandes errores de cuantificación, o pueden interrumpir el análisis del flujo de datos por completo durante un breve período de tiempo, lo que provoca la "ruptura" de la imagen. Cuando se han producido errores graves en el flujo de bits, los decodificadores continúan aplicando actualizaciones a la imagen dañada durante un breve intervalo, lo que crea un efecto de "imagen fantasma", hasta que reciben el siguiente fotograma comprimido de forma independiente. En la codificación de imágenes MPEG, estos se conocen como " fotogramas I ", donde "I" significa "intra". Hasta que llega el siguiente fotograma I, el decodificador puede realizar la ocultación de errores .

Artefactos en los límites del bloque de compensación de movimiento

Las discontinuidades en los límites de los bloques pueden ocurrir en los bordes de los bloques de predicción de compensación de movimiento . En la compresión de video con compensación de movimiento, la imagen actual se predice desplazando bloques (macrobloques, particiones o unidades de predicción) de píxeles de fotogramas decodificados previamente. Si dos bloques vecinos usan vectores de movimiento diferentes, habrá una discontinuidad en el borde entre los bloques.

Ruido de mosquito

Los artefactos de compresión de video incluyen resultados acumulativos de la compresión de las imágenes fijas que lo componen, por ejemplo, el zumbido u otra actividad en los bordes de las imágenes fijas sucesivas aparece en secuencia como un borrón brillante de puntos alrededor de los bordes, llamado ruido de mosquito , ya que se asemejan a mosquitos revoloteando alrededor del objeto. ^[14]^[15] El llamado "ruido de mosquito" es causado por el algoritmo de compresión de transformada de coseno discreta (DCT) basado en bloques utilizado en la mayoría de los estándares de codificación de video , como los formatos MPEG . ^[3]

Reducción de artefactos de video

Los artefactos en los límites de los bloques se pueden reducir aplicando un filtro de desbloqueo . Al igual que en la codificación de imágenes fijas, es posible aplicar un filtro de desbloqueo a la salida del decodificador como posprocesamiento.

En la codificación de vídeo con predicción de movimiento con un bucle de predicción cerrado, el codificador utiliza la salida del decodificador como referencia de predicción a partir de la cual se predicen los fotogramas futuros. Para ello, el codificador integra conceptualmente un decodificador. Si este "decodificador" realiza un desbloqueo, la imagen desbloqueada se utiliza como imagen de referencia para la compensación de movimiento, lo que mejora la eficiencia de la codificación al evitar la propagación de artefactos de bloqueo a través de los fotogramas. Esto se conoce como filtro de desbloqueo en bucle. Las normas que especifican un filtro de desbloqueo en bucle incluyen VC-1 , H.263 Annex J, H.264/AVC y H.265/HEVC .

Audio

La compresión de audio con pérdida generalmente funciona con un modelo psicoacústico, un modelo de percepción auditiva humana. Los formatos de audio con pérdida generalmente implican el uso de una transformación del dominio de tiempo/frecuencia, como una transformada de coseno discreta modificada . Con el modelo psicoacústico, se explotan los efectos de enmascaramiento, como el enmascaramiento de frecuencia y el enmascaramiento temporal, de modo que no se graban los sonidos que deberían ser imperceptibles. Por ejemplo, en general, los seres humanos no pueden percibir un tono suave reproducido simultáneamente con un tono similar pero más fuerte. Una técnica de compresión con pérdida podría identificar este tono suave e intentar eliminarlo. Además, el ruido de cuantificación se puede "ocultar" donde estaría enmascarado por sonidos más prominentes. Con baja compresión, se utiliza un modelo psicoacústico conservador con tamaños de bloque pequeños.

Cuando el modelo psicoacústico es inexacto, cuando el tamaño del bloque de transformación está restringido o cuando se utiliza una compresión agresiva, esto puede generar artefactos de compresión. Los artefactos de compresión en el audio comprimido suelen aparecer como zumbidos, pre-eco , "artefactos de birdie", cortes, traqueteos, gorjeos, zumbidos metálicos, una sensación bajo el agua, silbidos o "granulosidad".

Un ejemplo de artefactos de compresión en el audio es el aplauso en un archivo de audio relativamente comprimido (por ejemplo, un MP3 de 96 kbit/s). En general, los tonos musicales tienen formas de onda repetidas y variaciones de volumen más predecibles, mientras que el aplauso es esencialmente aleatorio, por lo que es difícil de comprimir. Una pista de aplausos muy comprimida puede tener "timbres metálicos" y otros artefactos de compresión.

Uso artístico

Arte de video con fallas (advertencia de epilepsia)

Ejemplo de datamoshing

Un ejemplo de una imagen "frita" hecha a partir de una foto de una lata de Pepsi Diet

Los artefactos de compresión pueden usarse intencionalmente como un estilo visual, a veces conocido como glitch art . El glitch art de Rosa Menkman hace uso de artefactos de compresión , ^[16] particularmente los bloques de transformada de coseno discreto (bloques DCT) que se encuentran en la mayoría de los formatos de compresión de datos de medios digitales , como imágenes digitales JPEG y audio digital MP3 . ^[2] En imágenes fijas, un ejemplo son los JPEG del fotógrafo alemán Thomas Ruff , que usa artefactos JPEG intencionales como base del estilo de la imagen. ^[17]^[18]

En el videoarte , una técnica utilizada es el datamoshing , donde se intercalan dos videos de modo que los fotogramas intermedios se interpolan desde dos fuentes separadas. Otra técnica implica simplemente la transcodificación de un formato de video con pérdida a otro, lo que explota la diferencia en cómo los códecs de video separados procesan la información de movimiento y color. ^[19] La técnica fue iniciada por los artistas Bertrand Planes en colaboración con Christian Jacquemin en 2006 con DivXPrime, ^[20] Sven König, Takeshi Murata , Jacques Perconte y Paul B. Davis en colaboración con Paperrad , y más recientemente utilizada por David OReilly y dentro de los videos musicales de Chairlift y por Nabil Elderkin en el video musical " Welcome to Heartbreak " para Kanye West . ^[21]^[22]

También existe un género de memes en Internet en el que imágenes a menudo sin sentido se comprimen deliberadamente, a veces varias veces, para lograr un efecto cómico. Las imágenes creadas con esta técnica suelen denominarse "fritas". ^[23]

Véase también

Wikimedia Commons tiene medios relacionados con Artefactos de compresión .

Referencias

^ abc Katsaggelos, Aggelos K.; Babacan, S. Derin; Chun-Jen, Tsai (2009). "Capítulo 15: Restauración iterativa de imágenes". La guía esencial para el procesamiento de imágenes . Academic Press . págs. 349–383. ISBN 9780123744579.
^ ab Alikhani, Darya (1 de abril de 2015). «Más allá de la resolución: el arte glitch de Rosa Menkman». POSTmatter . Archivado desde el original el 19 de octubre de 2019. Consultado el 19 de octubre de 2019 .
^ ab "Mosquito noise". PC Magazine . Consultado el 19 de octubre de 2019 .
^ Geere, Duncan (13 de diciembre de 2011). «Glitch art created by 'databending'» (Arte con fallos creado mediante 'manipulación de datos'). Wired . Consultado el 23 de diciembre de 2011 .
^ Baker-Smith, Ben (28 de abril de 2009). «Datamoshing – The Beauty of Glitch». Bitsynthesis.com. Archivado desde el original el 16 de noviembre de 2010. Consultado el 28 de abril de 2009 .
^ "Los escáneres y fotocopiadoras Xerox alteran aleatoriamente los números en los documentos escaneados". 2 de agosto de 2013. Consultado el 4 de agosto de 2013 .
^ "Las fotocopiadoras Xerox confusas reescriben documentos, según un experto". BBC News . 6 de agosto de 2013 . Consultado el 6 de agosto de 2013 .
^ Amiri, Sekine Asadi; Hassanpour, Hamid (1 de abril de 2018). "Compresión de imágenes usando JPEG con efectos de bloqueo reducidos mediante submuestreo adaptativo y representación dispersa de imágenes con autoaprendizaje". Herramientas y aplicaciones multimedia . 77 (7): 8677–8693. doi :10.1007/s11042-017-4763-1. ISSN 1573-7721 . Consultado el 8 de marzo de 2024 .
^ Watkinson, John (2004). El manual de MPEG de John Watkinson. Taylor y Francisco. ISBN 9780240805788.
^ "PC Magazine, Definición de artefactos de bloqueo". Archivado desde el original el 7 de octubre de 2012 . Consultado el 23 de septiembre de 2020 .
^ Hudson, Graham; Léger, Alain; Niss, Birger; Sebestyén, István; Vaaben, Jørgen (31 de agosto de 2018). "Estándar JPEG.1 25 años: razones pasadas, presentes y futuras del éxito". Revista de imágenes electrónicas . 27 (4): 1. doi : 10.1117/1.JEI.27.4.040901 . S2CID 52164892.
^ Richter, Thomas (septiembre de 2016). "JPEG en ESTEROIDES: técnicas de optimización comunes para la compresión de imágenes JPEG". Conferencia internacional IEEE sobre procesamiento de imágenes (ICIP) de 2016. págs. 61–65. doi :10.1109/ICIP.2016.7532319. ISBN 978-1-4673-9961-6.S2CID14922251 .
^ "kornelski/jpeg-compresor". GitHub . 16 de noviembre de 2020.
^ Le Dinh, Phuc-Tue; Patry, Jacques. "Artefactos de compresión de vídeo y reducción de ruido MPEG". Incrustado . Consultado el 19 de febrero de 2016 .
^ " 3.9 ruido de mosquito: Forma de distorsión por actividad de borde que a veces se asocia con el movimiento y que se caracteriza por artefactos móviles y/o patrones de ruido irregulares superpuestos sobre los objetos (similares a un mosquito volando alrededor de la cabeza y los hombros de una persona)." Rec. UIT-T P.930 (08/96) Principios de un sistema de degradación de referencia para vídeo
^ Menkman, Rosa (octubre de 2011). The Glitch Moment(um) (PDF) . Instituto de Culturas de Red. ISBN 978-90-816021-6-7. Recuperado el 19 de octubre de 2019 .
^ jpegs , Thomas Ruff , Aperture , 31 de mayo de 2009, 132 págs., ISBN 978-1-59711-093-8
^ Reseña: jpegs de Thomas Ruff, por Jörg Colberg , 17 de abril de 2009
^ Anoniem zei (19 de febrero de 2009). "Del artefacto de compresión al filtro". Rosa-menkman.blogspot.com . Consultado el 23 de diciembre de 2011 .
^ Jacquemin, cristiano (2008). "Le bug dans l'oeuvre DivXPrime de Bertrand Planes: Invención y mutación. En, Ivan Toulouse y Daniel Danétis, editores, Eurêka: Le moment de l'invention, un dialog entre art et science, L'Harmattan, París" (PDF) ) . págs. 245-256 . Consultado el 5 de noviembre de 2012 .
^ Pixel Bleed, de John Michael Boling. Rhizome . 25 de febrero de 2009.
^ Rodríguez, Jayson (18 de febrero de 2009). «Kanye West lanza un nuevo vídeo en su sitio web – MTV News». Mtv.com. Archivado desde el original el 19 de febrero de 2009. Consultado el 23 de diciembre de 2011 .
^ Matsakis, Louise (30 de agosto de 2017). «Cómo freír un meme». Vice . Consultado el 27 de julio de 2021 .

Enlaces externos

DivXPrime Primeros experimentos conocidos de software de mezcla de datos de video de Bertrand Planes y Christian Jacquemin (basado en el algoritmo Xvid)
Teaser de "Sonic birth", cortometraje dirigido por Jérome Blanquet, efecto datamoshing de David Olivari, producido por [Metronomic]. Película completa: "Sonic birth"
datamosher Un software de datamoshing de vídeo GPL.
Ejemplo de artefactos de compresión de vídeo pesados.
JPEG Tutor, una aplicación interactiva que le permite investigar los efectos de cambiar la matriz de cuantificación.
Desbloqueo y eliminación de anillos de JPEG: software Matlab y complemento Photoshop