stringtranslate.com

Codificación de subbandas

Diagrama de flujo de señal de codificación y decodificación de subbandas

En el procesamiento de señales , la codificación de subbanda ( SBC ) es cualquier forma de codificación de transformada que divide una señal en varias bandas de frecuencia diferentes , generalmente mediante una transformada rápida de Fourier , y codifica cada una de ellas de forma independiente. Esta descomposición suele ser el primer paso en la compresión de datos para señales de audio y vídeo.

SBC es la técnica principal utilizada en muchos algoritmos populares de compresión de audio con pérdida, incluido MP3 .

Codificación de señales de audio

La forma más sencilla de codificar digitalmente señales de audio es la modulación por código de pulsos (PCM), que se utiliza en CD de audio , grabaciones DAT , etc. La digitalización transforma las señales continuas en discretas muestreando la amplitud de una señal a intervalos uniformes y redondeándolas al valor más cercano representable con el número de bits disponible . Este proceso es fundamentalmente inexacto e implica dos errores: error de discretización , por muestreo a intervalos, y error de cuantificación , por redondeo.

Cuantos más bits se utilicen para representar cada muestra, más fina será la granularidad de la representación digital y, por lo tanto, menor será el error de cuantificación. Estos errores de cuantificación pueden considerarse un tipo de ruido, porque son efectivamente la diferencia entre la fuente original y su representación binaria. Con PCM, los efectos audibles de estos errores pueden mitigarse con tramado y utilizando suficientes bits para garantizar que el ruido sea lo suficientemente bajo como para ser enmascarado por la propia señal o por otras fuentes de ruido. Es posible obtener una señal de alta calidad, pero a costa de una alta tasa de bits (por ejemplo, más de 700 kbit/s para un canal de audio de CD). En efecto, se desperdician muchos bits en la codificación de partes enmascaradas de la señal porque PCM no hace suposiciones sobre cómo escucha el oído humano.

Las técnicas de codificación reducen la tasa de bits explotando características conocidas del sistema auditivo. Un método clásico es el PCM no lineal, como el algoritmo μ-law . Las señales pequeñas se digitalizan con una granularidad más fina que las grandes; el efecto es agregar ruido que es proporcional a la intensidad de la señal. El formato de archivo Au de Sun para sonido es un ejemplo popular de codificación mu-law. El uso de codificación mu-law de 8 bits reduciría la tasa de bits por canal del audio de CD a aproximadamente 350 kbit/s, la mitad de la tasa estándar. Debido a que este método simple solo explota mínimamente los efectos de enmascaramiento, produce resultados que a menudo son audiblemente inferiores en comparación con el original.

Principios básicos

La utilidad del SBC se ilustra mejor con un ejemplo específico. Cuando se utiliza para la compresión de audio, el SBC aprovecha el enmascaramiento auditivo en el sistema auditivo . Los oídos humanos normalmente son sensibles a una amplia gama de frecuencias, pero cuando hay una señal suficientemente fuerte en una frecuencia, el oído no escuchará señales más débiles en frecuencias cercanas. Decimos que la señal más fuerte enmascara a las más suaves.

La idea básica de SBC es permitir una reducción de datos descartando información sobre frecuencias enmascaradas. El resultado difiere de la señal original, pero si la información descartada se elige con cuidado, la diferencia no será perceptible o, lo que es más importante, cuestionable.

En primer lugar, un banco de filtros digitales divide el espectro de la señal de entrada en una cierta cantidad (por ejemplo, 32) de subbandas. El modelo psicoacústico analiza la energía en cada una de estas subbandas, así como en la señal original, y calcula los umbrales de enmascaramiento utilizando información psicoacústica. Cada una de las muestras de subbanda se cuantifica y codifica de manera que el ruido de cuantificación se mantenga por debajo del umbral de enmascaramiento calculado dinámicamente. El paso final es formatear todas estas muestras cuantificadas en grupos de datos llamados cuadros, para facilitar la reproducción final por parte de un decodificador.

La descodificación es mucho más sencilla que la codificación, ya que no interviene ningún modelo psicoacústico. Se descomprimen los fotogramas, se decodifican las muestras de subbanda y un mapeo de frecuencia-tiempo reconstruye una señal de audio de salida.

Aplicaciones

A finales de los años 1980, un organismo de normalización, el Moving Picture Experts Group (MPEG), desarrolló estándares para la codificación de audio y vídeo. La codificación de subbanda es la base del popular formato MP3 (más conocido como MPEG-1 Audio Layer III ), por ejemplo.

La codificación de subbanda se utiliza en el códec G.722 , que utiliza modulación de código de pulso diferencial adaptativa de subbanda (SB - ADPCM ) con una velocidad de bits de 64 kbit/s. En la técnica SB-ADPCM, la banda de frecuencia se divide en dos subbandas (superior e inferior) y las señales de cada subbanda se codifican utilizando ADPCM.

Enlaces externos