Replicación de banda espectral

La replicación de banda espectral ( SBR ) es una tecnología para mejorar los códecs de audio o voz , especialmente a velocidades de bits bajas y se basa en la redundancia armónica en el dominio de la frecuencia.

Se puede combinar con cualquier códec de compresión de audio : el propio códec transmite las frecuencias bajas y medias del espectro, mientras que SBR replica el contenido de frecuencias más altas transponiendo armónicos de las frecuencias bajas y medias en el decodificador. ^[1] Alguna información de orientación para la reconstrucción de la envolvente espectral de alta frecuencia se transmite como información secundaria.

Cuando es necesario, también reconstruye o mezcla de forma adaptativa información similar al ruido en bandas de frecuencia seleccionadas para replicar fielmente señales que originalmente no contenían componentes tonales o que estos contenían pocos.

La idea de SBR se basa en el principio de que la parte psicoacústica del cerebro humano tiende a analizar frecuencias más altas con menor precisión; por lo tanto, los fenómenos armónicos asociados con el proceso de replicación de la banda espectral solo necesitan ser precisos en un sentido perceptivo y no técnica o matemáticamente exactos.

Historia y uso

Una empresa sueca, Coding Technologies (adquirida por Dolby en 2007), desarrolló y fue pionera en el uso de SBR en su códec derivado de MPEG-2 AAC llamado aacPlus, que apareció por primera vez en 2001. Este códec se presentó a MPEG y formó la base de MPEG-4 High-Efficiency AAC (HE-AAC), estandarizado en 2003. ^[2] Lars Liljeryd , Kristofer Kjörling y Martin Dietz recibieron el premio IEEE Masaru Ibuka Consumer Electronics Award en 2013 por su trabajo en el desarrollo y comercialización de HE-AAC. ^[3]^[4] El método SBR de Coding Technologies también se ha utilizado con WMA 10 Professional para crear WMA 10 Pro LBR, y con MP3 para crear mp3PRO .

HE-AAC que utiliza SBR se utiliza en sistemas de transmisión como DAB+ , Digital Radio Mondiale (incluido xHE-AAC ), HD Radio y XM Satellite Radio . ^[5]

Si el reproductor no es capaz de utilizar la información secundaria que se ha transmitido junto con los datos de audio comprimidos "normales", es posible que aún pueda reproducir los datos de "banda base" (por ejemplo, muestreados a 22,05 kHz en lugar de 44,1 kHz) como de costumbre, lo que da como resultado un sonido opaco (ya que faltan las frecuencias altas), pero en general aceptable. Este es el caso, por ejemplo, si se reproduce un archivo mp3PRO con un software MP3 que no puede utilizar la información SBR.

La parte CELT de Opus realiza un plegado espectral en el nivel de bin MDCT, lo que la convierte en una técnica mucho menos avanzada pero con menor retardo en comparación con SBR. ^[6]

Dolby Digital Plus (E-AC3) realiza la extensión espectral (SPX). La SPX reduce los componentes de alta frecuencia a metadatos y es similar al cálculo de acoplamiento multicanal de E-AC3. ^[7] Dolby AC-4 amplía la técnica a la extensión espectral avanzada (A-SPX), con la opción de intercalar con datos regulares, no extendidos, en el dominio del tiempo o la frecuencia. Como resultado, la SPX se puede desactivar de forma selectiva para las partes difíciles. ^[8]

Métodos

La codificación de SBR produce una señal de audio con una resolución reducida (normalmente 2:1) e información de guía. En una publicación anterior, se describe que los datos de guía se producen mediante un análisis de filtro de espejo en cuadratura (QMF) y un estimador de envolvente . ^[9]

La decodificación de SBR requiere transponer armónicos, un caso de estiramiento del tiempo de audio y escala de tono . ^[10]

Un enfoque tradicional comienza con pequeños intervalos de transformada de Fourier discreta (DFT), ajustes de fase, IDFT y finaliza con superposición-adición. Este método es sensible a las señales transitorias que pueden causar ecos, por lo que se requiere cierto relleno (50 % en USAC) en la DFT.
Un enfoque más nuevo es el QMF. Un solo banco de filtros puede realizar una operación completa de estiramiento temporal y escala de tono para lograr una menor complejidad computacional.

Véase también

Enlaces externos

Explicación de SBR en Wayback Machine (archivado el 27 de diciembre de 2014) Página de Coding Technologies que describe SBR, tal como apareció en 2007 en la adquisición de Dolby

Referencias

^ Novak, Clark. "Replicación de banda espectral y codificación aacPlus: una descripción general" (PDF) . Archivado desde el original (PDF) el 30 de noviembre de 2010. Consultado el 8 de febrero de 2010 .
^ ISO (2003). «Extensión del ancho de banda, ISO/IEC 14496-3:2001/Amd 1:2003». ISO . Consultado el 13 de octubre de 2009 .
^ "Premio IEEE Masaru Ibuka de Electrónica de Consumo". IEEE.org . Archivado desde el original el 8 de abril de 2010. Consultado el 7 de julio de 2015 .
^ "Entrevista con Martin Dietz, Kristofer Kjörling y Lars Liljeryd". YouTube . Consultado el 7 de julio de 2015 .
^ "XM Radio – Datos breves". Archivado desde el original el 15 de noviembre de 2006. Consultado el 8 de febrero de 2010 .
^ Jean-Marc Valin; Gregory Maxwell; Timothy B. Terriberry; Koen Vos (17–20 de octubre de 2013). «Codificación musical de alta calidad y bajo retardo en el códec Opus» (PDF) . www.xiph.org . Nueva York, NY: Xiph.Org Foundation. p. 2. Archivado desde el original (PDF) el 14 de julio de 2018. Consultado el 19 de agosto de 2014 .
^ Andersen, Robert Loring; Crockett, B.; Davidson, G.; Davis, Mark; Fielder, L.; Turner, Stephen C.; Vinton, M.; Williams, P. (1 de octubre de 2004). "Introducción a Dolby Digital Plus, una mejora del sistema de codificación Dolby Digital" (PDF) . Journal of The Audio Engineering Society . Archivado desde el original (PDF) el 19 de noviembre de 2016.
^ "Dolby® AC-4: Entrega de audio para servicios de entretenimiento de próxima generación" (PDF) .
^ Ekstrand, Per (noviembre de 2022). "Extensión del ancho de banda de señales de audio mediante replicación de banda espectral" (PDF) . Actas del 1.er taller IEEE Benelux sobre procesamiento y codificación de audio basados en modelos (MPCA-2002), Lovaina, Bélgica .
^ Zhong, Haishan; Villemoes, Lars; Ekstrand, Per; Disch, Sascha; Nagel, Frederik; Wilde, Stephan; Chong, Kok Seng; Norimatsu, Takeshi (19 de octubre de 2011). "Replicación de banda espectral armónica basada en QMF". Sociedad de Ingeniería de Audio.