stringtranslate.com

Codificación de subbanda

Diagrama de flujo de señal de codificación y decodificación de subbanda

En el procesamiento de señales , la codificación de subbanda ( SBC ) es cualquier forma de codificación por transformada que divide una señal en varias bandas de frecuencia diferentes , generalmente mediante el uso de una transformada rápida de Fourier , y codifica cada una de forma independiente. Esta descomposición suele ser el primer paso en la compresión de datos para señales de audio y vídeo.

SBC es la técnica central utilizada en muchos algoritmos populares de compresión de audio con pérdida, incluido MP3 .

Codificación de señales de audio.

La forma más sencilla de codificar digitalmente señales de audio es la modulación de código de pulso (PCM), que se utiliza en CD de audio , grabaciones DAT , etc. La digitalización transforma señales continuas en discretas muestreando la amplitud de una señal a intervalos uniformes y redondeándola al valor más cercano representable con el número de bits disponible . Este proceso es fundamentalmente inexacto e implica dos errores: error de discretización , procedente del muestreo a intervalos, y error de cuantificación , procedente del redondeo.

Cuantos más bits se utilicen para representar cada muestra, más fina será la granularidad de la representación digital y, por tanto, menor será el error de cuantificación. Estos errores de cuantificación pueden considerarse como un tipo de ruido, porque en realidad son la diferencia entre la fuente original y su representación binaria. Con PCM, los efectos audibles de estos errores se pueden mitigar con tramado y utilizando suficientes bits para garantizar que el ruido sea lo suficientemente bajo como para ser enmascarado por la propia señal o por otras fuentes de ruido. Es posible obtener una señal de alta calidad, pero a costa de una alta tasa de bits (por ejemplo, más de 700 kbit/s para un canal de audio de CD). En efecto, muchos bits se desperdician al codificar porciones enmascaradas de la señal porque PCM no hace suposiciones sobre cómo escucha el oído humano.

Las técnicas de codificación reducen la tasa de bits aprovechando características conocidas del sistema auditivo. Un método clásico es el PCM no lineal, como el algoritmo de ley μ . Las señales pequeñas se digitalizan con una granularidad más fina que las grandes; el efecto es agregar ruido que es proporcional a la intensidad de la señal. El formato de archivo Au de Sun para sonido es un ejemplo popular de codificación mu-law. El uso de codificación de ley mu de 8 bits reduciría la tasa de bits por canal de audio de CD a aproximadamente 350 kbit/s, la mitad de la tasa estándar. Debido a que este sencillo método sólo explota mínimamente los efectos de enmascaramiento, produce resultados que a menudo son audiblemente inferiores en comparación con el original.

Principios básicos

La utilidad del SBC quizás se ilustra mejor con un ejemplo específico. Cuando se utiliza para la compresión de audio, SBC explota el enmascaramiento auditivo en el sistema auditivo . Los oídos humanos normalmente son sensibles a una amplia gama de frecuencias, pero cuando hay una señal suficientemente fuerte en una frecuencia, el oído no escuchará señales más débiles en frecuencias cercanas. Decimos que la señal más fuerte enmascara las más suaves.

La idea básica de SBC es permitir una reducción de datos descartando información sobre frecuencias que están enmascaradas. El resultado difiere de la señal original, pero si la información descartada se elige cuidadosamente, la diferencia no será perceptible o, lo que es más importante, objetable.

Primero, un banco de filtros digitales divide el espectro de la señal de entrada en un cierto número (por ejemplo, 32) de subbandas. El modelo psicoacústico analiza la energía en cada una de estas subbandas, así como en la señal original, y calcula umbrales de enmascaramiento utilizando información psicoacústica. Cada una de las muestras de subbanda se cuantifica y codifica para mantener el ruido de cuantificación por debajo del umbral de enmascaramiento calculado dinámicamente. El paso final es formatear todas estas muestras cuantificadas en grupos de datos llamados cuadros, para facilitar la eventual reproducción por parte de un decodificador.

Decodificar es mucho más fácil que codificar, ya que no interviene ningún modelo psicoacústico. Las tramas se descomprimen, las muestras de subbanda se decodifican y un mapeo frecuencia-tiempo reconstruye una señal de audio de salida.

Aplicaciones

A finales de la década de 1980, un organismo de normalización, el Grupo de Expertos en Imágenes en Movimiento (MPEG), desarrolló estándares para la codificación de audio y vídeo. La codificación de subbanda reside en el corazón del popular formato MP3 (más conocido como MPEG-1 Audio Layer III ), por ejemplo.

La codificación de subbanda se utiliza en el códec G.722 , que utiliza modulación de código de impulsos diferencial adaptativa de subbanda (SB- ADPCM ) con una velocidad binaria de 64 kbit/s. En la técnica SB-ADPCM, la banda de frecuencia se divide en dos subbandas (superior e inferior) y las señales de cada subbanda se codifican mediante ADPCM.

enlaces externos