La replicación de banda espectral ( SBR ) es una tecnología para mejorar los códecs de audio o voz , especialmente a velocidades de bits bajas y se basa en la redundancia armónica en el dominio de la frecuencia.
Se puede combinar con cualquier códec de compresión de audio : el códec en sí transmite las frecuencias bajas y medias del espectro, mientras que SBR replica el contenido de frecuencias más altas transponiendo armónicos de las frecuencias bajas y medias en el decodificador. [1] Parte de la información de orientación para la reconstrucción de la envolvente espectral de alta frecuencia se transmite como información secundaria.
Cuando es necesario, también reconstruye o mezcla de forma adaptativa información similar al ruido en bandas de frecuencia seleccionadas para replicar fielmente señales que originalmente contenían menos o ningún componente tonal.
La idea del SBR se basa en el principio de que la parte psicoacústica del cerebro humano tiende a analizar frecuencias más altas con menos precisión; por lo tanto, los fenómenos armónicos asociados con el proceso de replicación de la banda espectral sólo necesitan ser precisos en un sentido perceptivo y no técnica o matemáticamente exactos.
Una empresa sueca Coding Technologies (adquirida por Dolby en 2007) desarrolló y fue pionera en el uso de SBR en su códec derivado de MPEG-2 AAC llamado aacPlus, que apareció por primera vez en 2001. Este códec se presentó a MPEG y formó la base de MPEG- 4 AAC de alta eficiencia (HE-AAC), estandarizado en 2003. [2] Lars Liljeryd , Kristofer Kjörling y Martin Dietz recibieron el premio IEEE Masaru Ibuka Consumer Electronics Award en 2013 por su trabajo en el desarrollo y comercialización de HE-AAC. [3] [4] El método SBR de Coding Technologies también se ha utilizado con WMA 10 Professional para crear WMA 10 Pro LBR y con MP3 para crear mp3PRO .
HE-AAC que utiliza SBR se utiliza en sistemas de transmisión como DAB+ , Digital Radio Mondiale (incluido xHE-AAC ), HD Radio y XM Satellite Radio . [5]
Si el reproductor no es capaz de utilizar la información secundaria que se ha transmitido junto con los datos de audio comprimidos "normales", es posible que aún pueda reproducir los datos de "banda base" (por ejemplo, muestreados a 22,05 kHz en lugar de 44,1 kHz) como de costumbre. lo que da como resultado un sonido apagado (ya que faltan las frecuencias altas), pero por lo demás aceptable. Este es, por ejemplo, el caso si un archivo mp3PRO se reproduce con un software MP3 incapaz de utilizar la información SBR.
La parte CELT de Opus realiza un plegado espectral en el nivel del contenedor MDCT, lo que la convierte en una técnica mucho menos avanzada pero con menor retraso en comparación con SBR. [6]
Dolby Digital Plus (E-AC3) realiza la extensión espectral (SPX). SPX reduce los componentes de alta frecuencia a metadatos y es similar al cálculo de acoplamiento multicanal E-AC3. [7] Dolby AC-4 expande la técnica a Advanced Spectral Extension (A-SPX), con la opción de entrelazar con datos regulares no extendidos en el dominio del tiempo o la frecuencia. Como resultado, SPX se puede desactivar selectivamente para partes difíciles. [8]
La codificación de SBR produce una señal de audio reducida (generalmente 2:1) e información de guía. En una de las primeras publicaciones, se describe que los datos guía se producen mediante un análisis de filtro de espejo de cuadratura (QMF) y un estimador de envolvente . [9]
La decodificación de SBR requiere la transposición de armónicos, un caso de estiramiento del tiempo de audio y escalado de tono . [10]