stringtranslate.com

Artefactos de timbre

Imagen que muestra artefactos de timbre. 3 niveles a cada lado de la transición: sobreimpulso, primer timbre y segundo timbre (débil).
Misma imagen sin artefactos de timbre.

En el procesamiento de señales , particularmente en el procesamiento de imágenes digitales , los artefactos de timbre son artefactos que aparecen como señales espurias cerca de transiciones bruscas en una señal. Visualmente, aparecen como bandas o "fantasmas" cerca de los bordes; audiblemente, aparecen como "ecos" cercanos a transitorios , particularmente sonidos de instrumentos de percusión ; Los más notables son los preecos . El término "timbre" se debe a que la señal de salida oscila a un ritmo que se desvanece alrededor de una transición brusca en la entrada, similar a una campana después de ser tocada. Como ocurre con otros artefactos, su minimización es un criterio en el diseño de filtros .

Introducción

La causa principal de los artefactos de timbre es el exceso y las oscilaciones en la respuesta escalonada de un filtro.

La causa principal de los artefactos de timbre se debe a que una señal tiene una banda limitada (específicamente, no tiene frecuencias altas) o pasa a través de un filtro de paso bajo ; esta es la descripción en el dominio de la frecuencia . En términos del dominio del tiempo , la causa de este tipo de timbre son las ondulaciones en la función sinc , [1] que es la respuesta al impulso (representación en el dominio del tiempo) de un filtro de paso bajo perfecto. Matemáticamente, esto se llama fenómeno de Gibbs .

Se puede distinguir el exceso (y la insuficiencia), que ocurre cuando las transiciones se acentúan (la salida es más alta que la entrada) del timbre, donde después de un exceso, la señal se sobrecorrige y ahora está por debajo del valor objetivo; Estos fenómenos a menudo ocurren juntos y, por lo tanto, a menudo se combinan y se denominan conjuntamente "sonidos".

El término "timbre" se usa con mayor frecuencia para ondulaciones en el dominio del tiempo , aunque a veces también se usa para efectos en el dominio de la frecuencia : [2] la ventana de un filtro en el dominio del tiempo mediante una función rectangular provoca ondulaciones en el dominio de la frecuencia para el mismo La razón es que un filtro de paso bajo de pared de ladrillos (función rectangular en el dominio de la frecuencia ) provoca ondulaciones en el dominio del tiempo , siendo en cada caso la transformada de Fourier de la función rectangular la función sinc.

Hay artefactos relacionados causados ​​por otros efectos en el dominio de la frecuencia y artefactos similares debido a causas no relacionadas.

Causas

Descripción

La función sinc , la respuesta de impulso para un filtro de paso bajo ideal , que ilustra el timbre de un impulso.
El fenómeno de Gibbs , que ilustra el timbre de una función escalonada .

Por definición, el timbre ocurre cuando una entrada no oscilante produce una salida oscilante: formalmente, cuando una señal de entrada que es monótona en un intervalo tiene una respuesta de salida que no es monótona. Esto ocurre más severamente cuando la respuesta de impulso o la respuesta de paso de un filtro tiene oscilaciones; de manera menos formal, si para una entrada de pico, respectivamente una entrada de paso (una transición brusca), la salida tiene golpes. El timbre se refiere más comúnmente al timbre de paso, y ese será el enfoque.

El timbre está estrechamente relacionado con el sobreimpulso y el subimpulso, que es cuando la salida toma valores superiores al valor de entrada máximo (respectivamente, inferior al mínimo): uno puede tener uno sin el otro, pero en casos importantes, como una baja filtro de paso , uno primero tiene un sobreimpulso, luego la respuesta rebota por debajo del nivel de estado estable, provocando el primer anillo, y luego oscila hacia adelante y hacia atrás por encima y por debajo del nivel de estado estable. Por lo tanto, el sobrepaso es el primer paso del fenómeno, mientras que el timbre es el segundo paso y los siguientes. Debido a esta estrecha conexión, los términos a menudo se combinan, donde "sonido" se refiere tanto al sobrepaso inicial como a los timbres posteriores.

Si uno tiene un filtro lineal invariante en el tiempo (LTI), entonces puede entender el filtro y el timbre en términos de la respuesta al impulso (la vista en el dominio del tiempo), o en términos de su transformada de Fourier, la respuesta en frecuencia (la vista en el dominio de la frecuencia). . El timbre es un artefacto en el dominio del tiempo , y en el diseño de filtros se compensa con las características deseadas en el dominio de la frecuencia: la respuesta de frecuencia deseada puede causar timbres, mientras que reducir o eliminar el timbre puede empeorar la respuesta de frecuencia.

filtro de sincronización

La integral sinusoidal para valores positivos, que muestra oscilación.

El ejemplo central, y a menudo lo que se entiende por "artefactos de timbre", es el filtro de paso bajo ideal ( de pared de ladrillos ) , el filtro sinc . Esto tiene una función de respuesta al impulso oscilatorio, como se ilustra arriba, y la respuesta escalonada (su integral, la integral sinusoidal ) también presenta oscilaciones, como se ilustra a la derecha.

Estos artefactos de timbre no son el resultado de una implementación imperfecta o de ventanas: el filtro de paso bajo ideal, si bien posee la respuesta de frecuencia deseada, necesariamente causa artefactos de timbre en el dominio del tiempo .

Dominio del tiempo

En términos de respuesta al impulso, la correspondencia entre estos artefactos y el comportamiento de la función es la siguiente:

Volviendo a la respuesta escalonada, la respuesta escalonada es la integral de la respuesta al impulso ; formalmente, el valor de la respuesta al escalón en el tiempo a es la integral de la respuesta al impulso. Por tanto, los valores de la respuesta escalonada pueden entenderse en términos de integrales de cola de la respuesta al impulso.

Supongamos que la integral general de la respuesta al impulso es 1, por lo que envía una entrada constante a la misma constante que la salida; de lo contrario, el filtro tiene ganancia y el escalado por ganancia da una integral de 1.

La respuesta al impulso puede tener muchos lóbulos negativos y, por lo tanto, muchas oscilaciones, cada una de las cuales produce un anillo, aunque estos decaen para los filtros prácticos y, por lo tanto, generalmente solo se ven unos pocos anillos, siendo el primero el más pronunciado.

Tenga en cuenta que si la respuesta al impulso tiene lóbulos negativos pequeños y lóbulos positivos más grandes, entonces exhibirá un zumbido pero no un sobrepaso o un sobrepaso: la integral de cola siempre estará entre 0 y 1, pero oscilará hacia abajo en cada lóbulo negativo. Sin embargo, en el filtro sinc, los lóbulos disminuyen monótonamente en magnitud y alternan en signo, como en la serie armónica alterna , y por lo tanto las integrales de cola también alternan en signo, por lo que exhiben sobreimpulso y zumbido.

Por el contrario, si la respuesta al impulso es siempre no negativa, por lo que no tiene lóbulos negativos (la función es una distribución de probabilidad ), entonces la respuesta al escalón no exhibirá ni un timbre ni un sobreimpulso o un subimpulso: será una función monótona que crecerá de 0 a 1, como una función de distribución acumulativa . Por tanto, la solución básica desde la perspectiva del dominio del tiempo es utilizar filtros con respuesta de impulso no negativa.

Dominio de la frecuencia

La perspectiva del dominio de la frecuencia es que el timbre es causado por el corte brusco en la banda de paso rectangular en el dominio de la frecuencia y, por lo tanto, se reduce mediante una atenuación más suave , como se analiza a continuación. [1] [4]

Soluciones

Las soluciones dependen de los parámetros del problema: si la causa es un filtro de paso bajo, se puede elegir un diseño de filtro diferente, lo que reduce los artefactos a expensas de un peor rendimiento en el dominio de la frecuencia. Por otro lado, si la causa es una señal de banda limitada, como en JPEG, no se puede simplemente reemplazar un filtro, y los artefactos de timbre pueden resultar difíciles de solucionar: están presentes en JPEG 2000 y en muchos códecs de compresión de audio (en la forma de preeco ), como se analiza en los ejemplos.

Filtro de paso bajo

La función gaussiana no es negativa ni oscilante, por lo que no provoca sobrepasos ni zumbidos.

Si la causa es el uso de un filtro de paso bajo de pared de ladrillos, se puede reemplazar el filtro por uno que reduzca los artefactos en el dominio del tiempo, a costa del rendimiento en el dominio de la frecuencia. Esto se puede analizar desde la perspectiva del dominio del tiempo o del dominio de la frecuencia.

En el dominio del tiempo, la causa es una respuesta impulsiva que oscila, asumiendo valores negativos. Esto se puede resolver utilizando un filtro cuya respuesta al impulso no sea negativa y no oscile, pero comparta los rasgos deseados. Por ejemplo, para un filtro de paso bajo, el filtro gaussiano no es negativo ni oscilatorio, por lo que no provoca ningún timbre. Sin embargo, no es tan bueno como un filtro de paso bajo: se desvanece en la banda de paso y pierde en la banda de parada : en términos de imagen, un filtro gaussiano "difumina" la señal, lo que refleja la atenuación de las señales de frecuencia más altas deseadas en la banda de paso.

Una solución general es utilizar una función de ventana en el filtro sinc, que corta o reduce los lóbulos negativos: estos eliminan y reducen respectivamente el exceso y el zumbido. Tenga en cuenta que truncar algunos pero no todos los lóbulos elimina el zumbido más allá de ese punto, pero no reduce la amplitud del zumbido que no está truncado (porque está determinado por el tamaño del lóbulo) y aumenta la magnitud del sobreimpulso. si el último lóbulo no cortado es negativo, ya que la magnitud del sobrepaso es la integral de la cola, que ya no se cancela con lóbulos positivos.

Además, en implementaciones prácticas al menos se trunca sinc; de lo contrario, se deben usar infinitos puntos de datos (o más bien, todos los puntos de la señal) para calcular cada punto de la salida; el truncamiento corresponde a una ventana rectangular y hace que el filtro sea prácticamente implementable. , pero la respuesta de frecuencia ya no es perfecta. [5] De hecho, si uno toma un filtro de paso bajo de pared de ladrillos (sinc en el dominio del tiempo, rectangular en el dominio de la frecuencia) y lo trunca (multiplica con una función rectangular en el dominio del tiempo), esto convoluciona el dominio de la frecuencia con sinc ( Transformada de Fourier de la función rectangular) y provoca un zumbido en el dominio de la frecuencia , [2] que se conoce como ondulación . En símbolos, la frecuencia que suena en la banda de parada también se denomina lóbulos laterales . Es deseable una respuesta plana en la banda de paso, por lo que se utilizan ventanas con funciones cuya transformada de Fourier tiene menos oscilaciones, por lo que el comportamiento en el dominio de la frecuencia es mejor.

La multiplicación en el dominio del tiempo corresponde a la convolución en el dominio de la frecuencia, por lo que multiplicar un filtro por una función de ventana corresponde a convolucionar la transformada de Fourier del filtro original por la transformada de Fourier de la ventana, lo que tiene un efecto de suavizado, es decir, ventana en el tiempo. El dominio corresponde al suavizado en el dominio de la frecuencia y reduce o elimina el exceso y el timbre. [6]

En el dominio de la frecuencia , la causa puede interpretarse como un corte brusco (de pared de ladrillos) y una reducción del timbre mediante el uso de un filtro con una atenuación más suave. [1] Este es el caso del filtro gaussiano, cuyo diagrama de Bode de magnitud es una parábola que se abre hacia abajo (caída cuadrática), ya que su transformada de Fourier es nuevamente gaussiana, por lo tanto (hasta la escala) : tomando logaritmos se obtiene

En los filtros electrónicos , el equilibrio entre la respuesta en el dominio de la frecuencia y los artefactos de timbre en el dominio del tiempo está bien ilustrado por el filtro Butterworth : la respuesta en frecuencia de un filtro Butterworth desciende linealmente en la escala logarítmica, y un filtro de primer orden tiene una pendiente de −6 dB por octava , un filtro de segundo orden –12 dB por octava y un filtro de orden n con pendiente de dB por octava; en el límite, esto se acerca a un filtro de pared de ladrillos. Por lo tanto, entre estos, el filtro de primer orden se ejecuta más lentamente y, por lo tanto, presenta la menor cantidad de artefactos en el dominio del tiempo, pero presenta la mayor cantidad de fugas en la banda de parada, mientras que a medida que aumenta el orden, la fuga disminuye, pero los artefactos aumentan. [4]

Beneficios

Si bien los artefactos de timbre generalmente se consideran indeseables, el exceso inicial (halo) en las transiciones aumenta la acutancia (nitidez aparente) al aumentar la derivada a lo largo de la transición y, por lo tanto, puede considerarse una mejora. [8]

Fenómenos relacionados

Excederse

La función sinc tiene integrales de cola negativas, por lo tanto, tiene sobreimpulso.

Otro artefacto es el sobrepaso (y el subpaso), que se manifiesta no como anillos, sino como un mayor salto en la transición. Está relacionado con el zumbido y, a menudo, ocurre en combinación con él.

El exceso y el defecto son causados ​​por una cola negativa: en el sinc, la integral desde el primer cero hasta el infinito, incluido el primer lóbulo negativo. Mientras que el timbre es causado por una cola positiva siguiente : en sinc, la integral desde el segundo cero hasta el infinito, incluido el primer lóbulo positivo no central. Por lo tanto, el sobreimpulso es necesario para el timbre, [ dudoso ] pero puede ocurrir por separado: por ejemplo, el filtro Lanczos de dos lóbulos tiene solo un lóbulo negativo en cada lado, sin ningún lóbulo positivo siguiente, y por lo tanto exhibe un sobreimpulso pero no timbre, mientras que el filtro Lanczos de 3 lóbulos exhibe sobreimpulso y zumbido, aunque la ventana lo reduce en comparación con el filtro sinc o el filtro sinc truncado.

De manera similar, el núcleo de convolución utilizado en la interpolación bicúbica es similar a una ventana sinc de 2 lóbulos, adopta valores negativos y, por lo tanto, produce artefactos de exceso, que aparecen como halos en las transiciones.

Recorte

Lo que sigue del exceso y del defecto es el recorte . Si la señal está limitada, por ejemplo, un entero de 8 o 16 bits, este exceso o defecto puede exceder el rango de valores permitidos, provocando así recorte.

Estrictamente hablando, el recorte es causado por la combinación de exceso y precisión numérica limitada, pero está estrechamente asociado con el timbre y, a menudo, ocurre en combinación con él.

El recorte también puede ocurrir por razones no relacionadas, debido a que una señal simplemente excede el rango de un canal.

Por otro lado, se puede aprovechar el recorte para ocultar los timbres en las imágenes. Algunos códecs JPEG modernos, como mozjpeg e ISO libjpeg , utilizan este truco para reducir el timbre provocando deliberadamente sobrepasos en los resultados de IDCT. [9] Esta idea se originó en un parche mozjpeg. [10]

Zumbido y ondulación

Respuesta de frecuencia de un filtro Chebyshev de quinto orden , que presenta ondulación .

En el procesamiento de señales y campos relacionados, el fenómeno general de la oscilación en el dominio del tiempo se llama timbre , mientras que las oscilaciones en el dominio de la frecuencia generalmente se denominan ondulación , aunque generalmente no "ondulación".

Una fuente clave de ondulación en el procesamiento de señales digitales es el uso de funciones de ventana : si se toma un filtro de respuesta de impulso infinito (IIR), como el filtro sinc, y se le aplica una ventana para que tenga una respuesta de impulso finita , como en el diseño de ventana método , entonces la respuesta de frecuencia del filtro resultante es la convolución de la respuesta de frecuencia del filtro IIR con la respuesta de frecuencia de la función de ventana. En particular, la respuesta de frecuencia del filtro rectangular es la función sinc (la función rectangular y la función sinc son duales de Fourier entre sí) y, por lo tanto, el truncamiento de un filtro en el dominio del tiempo corresponde a la multiplicación por el filtro rectangular, por lo tanto, la convolución por el filtro sinc en el dominio de la frecuencia, provocando ondulaciones. En particular, truncar la función sinc en sí produce en el dominio del tiempo y en el dominio de la frecuencia, así como el filtrado de paso bajo (truncar en el dominio de la frecuencia) causa timbres en el dominio del tiempo, truncar en el dominio del tiempo (ventana mediante un filtro rectangular) provoca ondulaciones en el dominio de la frecuencia.

Ejemplos

JPEG

Ejemplo extremo de artefactos JPEG, incluido el timbre: anillos cian (= blanco menos rojo) alrededor de una estrella roja.

La compresión JPEG puede introducir artefactos de timbre en transiciones bruscas, que son particularmente visibles en el texto.

Esto se debe a la pérdida de componentes de alta frecuencia, como en el timbre de respuesta escalonada. JPEG utiliza bloques de 8×8 , sobre los cuales se realiza la transformada de coseno discreto (DCT). La DCT es una transformada relacionada con Fourier y el timbre se produce debido a la pérdida de componentes de alta frecuencia o pérdida de precisión en los componentes de alta frecuencia.

También pueden ocurrir en el borde de una imagen: dado que JPEG divide las imágenes en bloques de 8×8, si una imagen no tiene un número entero de bloques, el borde no se puede codificar fácilmente y soluciones como rellenar con un borde negro crean un transición brusca en la fuente, por lo tanto, artefactos sonoros en la imagen codificada.

El timbre también se produce en JPEG 2000 basado en wavelets .

JPEG y JPEG 2000 tienen otros artefactos, como se ilustra arriba, como bloqueo (" jaggies ") y ocupación de los bordes (" ruido de mosquito "), aunque estos se deben a características específicas de los formatos y no suenan como se explica aquí.

Algunas ilustraciones:

preeco

En el procesamiento de señales de audio , el timbre puede provocar que se produzcan ecos antes y después de los transitorios , como el sonido impulsivo de los instrumentos de percusión , como los platillos (esto es un timbre impulsivo ). El eco ( causal ) después del transitorio no se escucha porque está enmascarado por el transitorio, un efecto llamado enmascaramiento temporal . Por lo tanto, sólo se escucha el eco ( anticausal ) anterior al transitorio, y el fenómeno se denomina preeco .

Este fenómeno se produce como un artefacto de compresión en los algoritmos de compresión de audio que utilizan transformadas relacionadas con Fourier , como MP3 , AAC y Vorbis .

Fenómenos similares

Otros fenómenos tienen síntomas similares a los zumbidos, pero por lo demás tienen causas distintas. En los casos en los que estos causan artefactos circulares alrededor de fuentes puntuales, se los puede denominar "anillos" debido a la forma redonda (formalmente, un anillo ), que no está relacionada con el fenómeno de frecuencia de "timbre" (decaimiento oscilatorio) que se analiza en esta página. .

Realce de bordes

La mejora de bordes , que tiene como objetivo aumentar los bordes, puede causar fenómenos de timbre, particularmente cuando se aplica repetidamente, como por ejemplo, si se usa un reproductor de DVD seguido de un televisor. Esto se puede hacer mediante filtrado de paso alto , en lugar de filtrado de paso bajo. [4]

Funciones especiales

El patrón de Airy , causado por la difracción de Fraunhofer .

Muchas funciones especiales exhiben una caída oscilatoria y, por lo tanto, al convolucionar con dicha función se produce un zumbido en la salida; se pueden considerar estos zumbidos o restringir el término a artefactos no deseados en el procesamiento de señales en el dominio de la frecuencia.

La difracción de Fraunhofer produce el disco de Airy como función de dispersión puntual , que tiene un patrón de timbre.

La función de Bessel del primer tipo, que está relacionada con la función de Airy , presenta tal decaimiento.

En las cámaras, una combinación de desenfoque y aberración esférica puede producir artefactos circulares (patrones de "anillos"). Sin embargo, el patrón de estos artefactos no tiene por qué ser similar a un zumbido (como se analiza en esta página): pueden exhibir una caída oscilatoria (círculos de intensidad decreciente) u otros patrones de intensidad, como una única banda brillante.

Interferencia

El efecto fantasma es una forma de interferencia televisiva en la que se repite una imagen. Aunque esto no es un timbre, puede interpretarse como una convolución con una función, que es 1 en el origen y ε (la intensidad del fantasma) a cierta distancia, que es formalmente similar a las funciones anteriores (un único pico discreto, en lugar de que la oscilación continua).

Destello de lente

En fotografía, el destello de lente es un defecto en el que pueden aparecer varios círculos alrededor de las luces y con fantasmas a lo largo de una foto, debido a la luz no deseada, como el reflejo y la dispersión de elementos en la lente.

Ilusiones visuales

Pueden ocurrir ilusiones visuales en las transiciones, como en las bandas de Mach , que perceptualmente exhiben un sobreimpulso o sobreimpulso similar al fenómeno de Gibbs.

Ver también

Referencias

  1. ^ abc Bankman, Isaac N. (2000), Manual de imágenes médicas, Academic Press, ISBN 978-0-12-077790-7, sección I.6, Mejora: técnicas en el dominio de la frecuencia, pág. dieciséis
  2. ^ ab Procesamiento de señales digitales, por JSChitode, Publicaciones técnicas, 2008, ISBN 978-81-8431-346-8 , 4 - 70 
  3. ^ Glassner, Andrew S (2004), Principios de síntesis de imágenes digitales (2 ed.), Morgan Kaufmann, ISBN 978-1-55860-276-2, pag. 518
  4. ^ abc Procesamiento de imágenes por microscopio, por Qiang Wu, Fatima Merchant, Kenneth Castleman, ISBN 978-0-12-372578-3 p. 71 
  5. ^ (Allen & Mills 2004) Sección 9.3.1.1 Filtros ideales: paso bajo, p. 621
  6. ^ (Allen y Mills 2004) pág. 623
  7. ^ Manual de aplicaciones de amplificador operacional, de Walter G. Jung, Newnes, 2004, ISBN 978-0-7506-7844-5 , p. 332 
  8. ^ Mitchell, Don P.; Netravali, Arun N. (agosto de 1988). Filtros de reconstrucción en infografía (PDF) . Conferencia internacional ACM SIGGRAPH sobre gráficos por computadora y técnicas interactivas. vol. 22. págs. 221-228. doi :10.1145/54852.378514. ISBN 0-89791-275-6.
  9. ^ Richter, Thomas (septiembre de 2016). "JPEG en ESTEROIDES: técnicas de optimización comunes para la compresión de imágenes JPEG". Conferencia internacional IEEE 2016 sobre procesamiento de imágenes (ICIP) . págs. 61–65. doi :10.1109/ICIP.2016.7532319. ISBN 978-1-4673-9961-6. S2CID  14922251.
  10. ^ Lesiński, Kornel. "Deringing en DCT mediante sobreimpulso y recorte". kornel.ski .