Replicación de bandas espectrales

La replicación de banda espectral ( SBR ) es una tecnología para mejorar los códecs de audio o voz , especialmente a velocidades de bits bajas y se basa en la redundancia armónica en el dominio de la frecuencia.

Se puede combinar con cualquier códec de compresión de audio : el códec en sí transmite las frecuencias bajas y medias del espectro, mientras que SBR replica el contenido de frecuencias más altas transponiendo armónicos de las frecuencias bajas y medias en el decodificador. ^[1] Parte de la información de orientación para la reconstrucción de la envolvente espectral de alta frecuencia se transmite como información secundaria.

Cuando es necesario, también reconstruye o mezcla de forma adaptativa información similar al ruido en bandas de frecuencia seleccionadas para replicar fielmente señales que originalmente contenían menos o ningún componente tonal.

La idea del SBR se basa en el principio de que la parte psicoacústica del cerebro humano tiende a analizar frecuencias más altas con menos precisión; por lo tanto, los fenómenos armónicos asociados con el proceso de replicación de la banda espectral sólo necesitan ser precisos en un sentido perceptivo y no técnica o matemáticamente exactos.

Historia y uso

Una empresa sueca Coding Technologies (adquirida por Dolby en 2007) desarrolló y fue pionera en el uso de SBR en su códec derivado de MPEG-2 AAC llamado aacPlus, que apareció por primera vez en 2001. Este códec se presentó a MPEG y formó la base de MPEG- 4 AAC de alta eficiencia (HE-AAC), estandarizado en 2003. ^[2] Lars Liljeryd , Kristofer Kjörling y Martin Dietz recibieron el premio IEEE Masaru Ibuka Consumer Electronics Award en 2013 por su trabajo en el desarrollo y comercialización de HE-AAC. ^[3]^[4] El método SBR de Coding Technologies también se ha utilizado con WMA 10 Professional para crear WMA 10 Pro LBR y con MP3 para crear mp3PRO .

HE-AAC que utiliza SBR se utiliza en sistemas de transmisión como DAB+ , Digital Radio Mondiale (incluido xHE-AAC ), HD Radio y XM Satellite Radio . ^[5]

Si el reproductor no es capaz de utilizar la información secundaria que se ha transmitido junto con los datos de audio comprimidos "normales", es posible que aún pueda reproducir los datos de "banda base" (por ejemplo, muestreados a 22,05 kHz en lugar de 44,1 kHz) como de costumbre. lo que da como resultado un sonido apagado (ya que faltan las frecuencias altas), pero por lo demás aceptable. Este es, por ejemplo, el caso si un archivo mp3PRO se reproduce con un software MP3 incapaz de utilizar la información SBR.

La parte CELT de Opus realiza un plegado espectral en el nivel del contenedor MDCT, lo que la convierte en una técnica mucho menos avanzada pero con menor retraso en comparación con SBR. ^[6]

Dolby Digital Plus (E-AC3) realiza la extensión espectral (SPX). SPX reduce los componentes de alta frecuencia a metadatos y es similar al cálculo de acoplamiento multicanal E-AC3. ^[7] Dolby AC-4 expande la técnica a Advanced Spectral Extension (A-SPX), con la opción de entrelazar con datos regulares no extendidos en el dominio del tiempo o la frecuencia. Como resultado, SPX se puede desactivar selectivamente para partes difíciles. ^[8]

Métodos

La codificación de SBR produce una señal de audio reducida (generalmente 2:1) e información de guía. En una de las primeras publicaciones, se describe que los datos guía se producen mediante un análisis de filtro de espejo de cuadratura (QMF) y un estimador de envolvente . ^[9]

La decodificación de SBR requiere la transposición de armónicos, un caso de estiramiento del tiempo de audio y escalado de tono . ^[10]

Un enfoque tradicional comienza con pequeños intervalos de transformada discreta de Fourier (DFT), ajustes de fase, IDFT y termina con superposición-suma. Este método es sensible a señales transitorias que pueden causar ecos y requieren algo de relleno (50% en USAC) en el DFT.
Un enfoque más nuevo es el QMF. Un solo banco de filtros puede realizar una operación completa de extensión de tiempo y escala de tono para una menor complejidad computacional.

Ver también

enlaces externos

SBR explicó en la página Coding Technologies de Wayback Machine (archivada el 27 de diciembre de 2014) que describe SBR, tal como apareció en 2007 en la adquisición de Dolby.

Referencias

^ Novak, Clark. "Replicación de banda espectral y codificación aacPlus: descripción general" (PDF) . Archivado desde el original (PDF) el 30 de noviembre de 2010 . Consultado el 8 de febrero de 2010 .
^ ISO (2003). "Extensión de ancho de banda, ISO/IEC 14496-3:2001/Amd 1:2003". YO ASI . Consultado el 13 de octubre de 2009 .
^ "Premio IEEE Masaru Ibuka a la electrónica de consumo". IEEE.org . Consultado el 7 de julio de 2015 .
^ "Entrevista con Martin Dietz, Kristofer Kjörling y Lars Liljeryd". YouTube . Consultado el 7 de julio de 2015 .
^ "XM Radio - Datos breves". Archivado desde el original el 15 de noviembre de 2006 . Consultado el 8 de febrero de 2010 .
^ Jean-Marc Valin; Gregorio Maxwell; Timothy B. Terriberry; Koen Vos (17 al 20 de octubre de 2013). "Codificación de música de alta calidad y bajo retardo en el códec Opus" (PDF) . www.xiph.org . Nueva York, NY: Fundación Xiph.Org. pag. 2. Archivado desde el original (PDF) el 14 de julio de 2018 . Consultado el 19 de agosto de 2014 .
^ Andersen, Robert Loring; Crockett, B.; Davidson, G.; Davis, Marcos; Campo, L.; Turner, Stephen C.; Vinton, M.; Williams, P. (1 de octubre de 2004). "Introducción a Dolby Digital Plus, una mejora del sistema de codificación Dolby Digital" (PDF) . Revista de la Sociedad de Ingeniería de Audio .
^ "Dolby® AC-4: entrega de audio para servicios de entretenimiento de próxima generación" (PDF) .
^ Ekstrand, Per (noviembre de 2022). "Extensión del ancho de banda de señales de audio mediante replicación de banda espectral" (PDF) . Proc.1er Taller IEEE Benelux sobre procesamiento y codificación de audio basado en modelos (MPCA-2002), Lovaina, Bélgica .
^ Zhong, Haishan; Villemoes, Lars; Ekstrand, Per; Disch, Sascha; Nagel, Federico; Wilde, Esteban; Chong, Kok Seng; Norimatsu, Takeshi (19 de octubre de 2011). "Replicación de banda espectral armónica basada en QMF". Sociedad de Ingeniería de Audio.