Modelado de ruido

El modelado de ruido es una técnica que se utiliza normalmente en el procesamiento de audio , imágenes y vídeo digitales , normalmente en combinación con el tramado , como parte del proceso de cuantificación o reducción de la profundidad de bits de una señal . Su finalidad es aumentar la relación señal-ruido aparente de la señal resultante. Para ello, se altera la forma espectral del error que se introduce mediante el tramado y la cuantificación, de forma que la potencia del ruido se encuentre en un nivel inferior en las bandas de frecuencia en las que el ruido se considera menos deseable y en un nivel correspondientemente superior en las bandas en las que se considera más deseable. Un algoritmo de modelado de ruido popular utilizado en el procesamiento de imágenes se conoce como « tramado de Floyd Steinberg »; y muchos algoritmos de modelado de ruido utilizados en el procesamiento de audio se basan en un modelo de « umbral absoluto de audición ».

Operación

Cualquier bucle de retroalimentación funciona como un filtro . La modelación de ruido funciona colocando el ruido de cuantificación en un bucle de retroalimentación diseñado para filtrar el ruido como se desee.

Ejemplo de filtro boxcar de paso bajo

Por ejemplo, considere el sistema de retroalimentación:

y[n]=x[n]+b\cdot e[n-1],

donde $b$ es una constante, $n$ es el número de ciclo, $x [n]$ es el valor de muestra de entrada, $y [n]$ es el valor que se está cuantificando y $e [n]$ es su error de cuantificación:

\ e[n]=y_{\text{cuantizado}}[n]-y[n].

En este modelo, cuando se reduce la profundidad de bits de cualquier muestra, se mide el error de cuantificación y en el siguiente ciclo se suma con la siguiente muestra anterior a la cuantificación. El efecto es que el error de cuantificación se filtra con un filtro de paso bajo de 2 muestras (también conocido como filtro de media móvil simple ). Como resultado, en comparación con antes, el error de cuantificación tiene menor potencia en frecuencias más altas y mayor potencia en frecuencias más bajas. La frecuencia de corte del filtro se puede ajustar modificando $b$ , la proporción de error de la muestra anterior que se realimenta.

Filtros de respuesta de impulso en general

En términos más generales, se puede utilizar cualquier filtro FIR o IIR para crear una curva de respuesta de frecuencia más compleja . Dichos filtros se pueden diseñar utilizando el método de mínimos cuadrados ponderados . ^[1] En el caso del audio digital, normalmente la función de ponderación utilizada es una dividida por el umbral absoluto de la curva de audición, es decir

\ W(f)={\frac {1}{A(f)}}.

Dithering

Agregar una cantidad adecuada de tramado durante la cuantificación evita errores determinables correlacionados con la señal. Si no se utiliza tramado, el modelado de ruido funciona de manera efectiva simplemente como modelado de distorsión: empuja la energía de distorsión a diferentes bandas de frecuencia, pero sigue siendo distorsión. Si se agrega tramado al proceso como

\ y[n]=x[n]+b\cdot e[n-1]+\mathrm {dither} ,

Entonces el error de cuantificación realmente se convierte en ruido, y el proceso realmente produce modelado de ruido.

En audio digital

Tono sinusoidal de 750 Hz muestreado a 48 kHz y cuantificado a 4 bits sin dithering ni modelado de ruido. Este proceso introduce un error de redondeo periódico con muestras de período de 64, que se percibe en el dominio de la frecuencia como armónicos que alcanzan valores tan altos como −40 dB con respecto al tono de referencia.
El mismo tono puro con tramado triangular pero sin modelado de ruido. Observe que la potencia general del ruido ha aumentado, pero ninguna frecuencia supera los −60 dB.
El mismo tono puro con tramado triangular y modelado de ruido. Observe que el ruido es más bajo (−80 dB) alrededor de los 4 kHz, donde el oído es más sensible.

El modelado de ruido en audio se aplica más comúnmente como un esquema de reducción de bits. La forma más básica de tramado es el ruido blanco plano. Sin embargo, el oído es menos sensible a ciertas frecuencias que a otras a niveles bajos (consulte Contorno de igual volumen ). Al utilizar el modelado de ruido, el error de cuantificación se puede distribuir de manera efectiva, de modo que una mayor parte se concentre en frecuencias que no se pueden escuchar tan bien y una menor parte en frecuencias que sí se pueden escuchar. El resultado es que donde el oído es más crítico, el error de cuantificación se puede reducir en gran medida y donde los oídos son menos sensibles, el ruido es mucho mayor. Esto puede dar una reducción de ruido percibido de 4 bits en comparación con el tramado directo. ^[2] Por lo tanto, aunque las muestras de 16 bits solo tienen 96 dB de rango dinámico en todo el espectro (consulte los cálculos de distorsión de cuantificación ), el tramado en forma de ruido puede, sin embargo, aumentar el rango dinámico de audio percibido a 120 dB. ^[3]

Modelado de ruido y convertidores de 1 bit

Desde aproximadamente 1989, los moduladores delta-sigma de 1 bit se han utilizado en convertidores analógicos a digitales . Esto implica muestrear el audio a una velocidad muy alta (2,8224 millones de muestras por segundo , por ejemplo), pero utilizando solo un bit. Debido a que solo se utiliza 1 bit, este convertidor solo tiene 6,02 dB de rango dinámico . Sin embargo, el piso de ruido se extiende a lo largo de todo el rango de frecuencia sin alias por debajo de la frecuencia de Nyquist de 1,4112 MHz. La modelación de ruido se utiliza para reducir el ruido presente en el rango audible (20 Hz a 20 kHz) y aumentar el ruido por encima del rango audible. Esto da como resultado un rango dinámico de banda ancha de solo 7,78 dB, pero no es consistente entre bandas de frecuencia, y en las frecuencias más bajas (el rango audible) el rango dinámico es mucho mayor: más de 100 dB. La modelación de ruido está inherentemente incorporada en los moduladores delta-sigma.

El convertidor de 1 bit es la base del formato DSD de Sony. Una crítica al convertidor de 1 bit (y por lo tanto al sistema DSD) es que, como solo se utiliza 1 bit tanto en la señal como en el bucle de retroalimentación, no se pueden utilizar cantidades adecuadas de tramado en el bucle de retroalimentación y se puede escuchar distorsión en algunas condiciones (más discusión en Direct Stream Digital § DSD vs. PCM ). ^[4]^[5]

La mayoría de los convertidores A/D fabricados desde el año 2000 utilizan moduladores delta-sigma multibit o multinivel que producen una salida de más de 1 bit para que se pueda agregar la oscilación adecuada en el bucle de retroalimentación. Para el muestreo PCM tradicional , la señal se diezma a 44,1 kHz u otras frecuencias de muestreo adecuadas.

En los ADC modernos

Analog Devices utiliza lo que ellos denominan "Noise Shaping Requantizer" ^[6] y Texas Instruments utiliza lo que ellos denominan "SNRBoost" ^[7]^[8] para reducir el nivel de ruido aproximadamente 30 dB en comparación con las frecuencias circundantes. Esto tiene el costo de una operación no continua, pero produce una agradable forma de bañera en el nivel de ruido del espectro. Esto se puede combinar con otras técnicas como Bit-Boost ^{[ especificar ]} para mejorar aún más la resolución del espectro.

Referencias

^ Verhelst, Werner; De Koning, Dreten (24 de octubre de 2001). Diseño de filtro de modelado de ruido para la recuantificación de señales mínimamente audibles . Taller IEEE sobre aplicaciones del procesamiento de señales al audio y la acústica. IEEE .
^ Gerzon, Michael ; Peter Craven; Robert Stuart; Rhonda Wilson (16–19 de marzo de 1993). Mejoras en CD y otros medios digitales lineales mediante ruido psicoacústico . 94.ª Convención de la Sociedad de Ingeniería de Audio , Berlín. AES . Preimpresión 3501.
^ "Las descargas de música 24/192 son una auténtica tontería". xiph.org . Consultado el 1 de agosto de 2015 .
^ Lipschitz, Stanley P.; Vanderkooy, John (22 de septiembre de 2000). "Por qué la conversión sigma-delta profesional de 1 bit es una mala idea" (PDF) . Archivado desde el original (PDF) el 2 de noviembre de 2022.
^ Lipshitz, Stanley P.; Vanderkooy, John (12 de mayo de 2001). "Por qué la conversión sigma-delta de 1 bit no es adecuada para aplicaciones de alta calidad" (PDF) . Archivado (PDF) desde el original el 30 de abril de 2023. Consultado el 28 de agosto de 2023 .
^ Receptor de banda ancha IF AD6677 de 80 MHz (en la página 23)
^ Uso de ventanas con la tecnología SNRBoost3G (PDF)
^ Comprensión del comportamiento de baja amplitud de los conversores analógico-digitales de 11 bits (PDF)