stringtranslate.com

Dolby Digital Plus

Dolby Digital Plus , también conocido como Enhanced AC-3 (y comúnmente abreviado como DDP , DD+ , E-AC-3 o EC-3 ), es un esquema de compresión de audio digital desarrollado por Dolby Labs para el transporte y almacenamiento de audio multicanal. audio digital. Es un sucesor de Dolby Digital (AC-3) y tiene una serie de mejoras con respecto a ese códec, incluida la compatibilidad con una gama más amplia de velocidades de datos (32 kbit/s a 6144 kbit/s), un mayor número de canales y soporte para múltiples programas (a través de substreams), así como herramientas adicionales (algoritmos) para representar datos comprimidos y contrarrestar artefactos. Mientras que Dolby Digital (AC-3) admite hasta cinco canales de audio de ancho de banda completo a una velocidad de bits máxima de 640 kbit/s, E-AC-3 admite hasta 15 canales de audio de ancho de banda completo a una velocidad de bits máxima de 6,144  Mbit/s .

El conjunto completo de especificaciones técnicas para E-AC-3 (y AC-3) está estandarizado y publicado en el Anexo E de ATSC A/52:2012, [1] así como en el Anexo E de ETSI TS 102 366. [2]

Detalles técnicos

Especificaciones

Dolby Digital Plus es capaz de lo siguiente:

Estructura

Un servicio Dolby Digital Plus consta de una o más subtransmisiones . Hay tres tipos de subcorrientes:

Todas las transmisiones DD+ deben contener al menos una subtransmisión independiente o una subtransmisión heredada, que contenga los primeros (o únicos) 5.1 canales del programa de audio principal. Se pueden usar subtransmisiones independientes adicionales para programas de audio secundarios, como bandas sonoras en idiomas extranjeros, comentarios o descripciones/voces en off para personas con discapacidad visual. Se pueden proporcionar subtransmisiones dependientes para programas que tengan canales de escenario sonoro adicionales más allá de 5.1.

Dentro de cada subflujo, se prevé la codificación de cinco canales de ancho de banda completo, un canal de baja frecuencia y un canal de acoplamiento. El canal de acoplamiento se utiliza para información de frecuencia media a alta que es común a múltiples canales de ancho de banda completo. Su contenido se mezcla con los otros canales de la manera prescrita por los metadatos, el decodificador no lo reproduce como un canal discreto.

Dolby Digital Plus incluye metadatos completos de flujo de bits para el control del decodificador sobre el volumen de salida (a través de dialnorm), mezcla descendente y control de rango dinámico reversible (a través de DRC).

Sintaxis

Dolby Digital Plus es nominalmente un protocolo alineado de 16 bits, aunque muy pocos campos en la sintaxis respetan los límites de bytes o palabras. Como muchos elementos de sintaxis son opcionales o de longitud variable, incluidos algunos cuya presencia o longitud depende de complejos cálculos anteriores, y hay poca redundancia en la sintaxis, DD+ puede ser extremadamente difícil de analizar correctamente, con análisis sintácticamente válidos pero incorrectos que se producen fácilmente. por codificadores defectuosos.

Una secuencia DD+ es una colección de paquetes de cuadros de sincronización de longitud fija , cada uno de los cuales corresponde a 256, 512, 768 o 1536 muestras de audio consecutivas en el dominio del tiempo. (El caso de 1536 muestras es el caso más común y corresponde a Dolby Digital; las longitudes de subtrama más cortas están diseñadas para su uso en aplicaciones interactivas como videojuegos donde reducir la latencia del codificador es una preocupación importante). Cada cuadro de sincronización se puede descodificar de forma independiente y pertenece a una subsecuencia específica dentro del servicio. Un syncframe consta de los siguientes elementos de sintaxis (algunos de los cuales pueden omitirse cuando un servicio Dolby Digital Plus se encapsula en otro formato o transporte):

Almacenamiento de coeficientes de transformación.

En el corazón de Dolby Digital y DD+ se encuentra una transformada de coseno discreta modificada (MDCT), que se utiliza para transformar la señal de audio al dominio de la frecuencia; dentro de cada bloque se pueden transmitir hasta 256 coeficientes de frecuencia. Los coeficientes se transmiten en formato binario de punto flotante, con los exponentes transmitidos por separado de las mantisas. Esto permite una codificación altamente eficiente.

Los exponentes de cada canal están codificados en un formato diferencial muy empaquetado, y los deltas entre contenedores de frecuencia consecutivos (distintos del primero) se proporcionan en la secuencia. Se utilizan tres formatos, o estrategias exponenciales ; estos se conocen como "D15", "D25" y "D45". En D15, cada contenedor tiene un exponente único, mientras que en D25 y D45, los valores delta corresponden a pares o cuádruples de contenedores de frecuencia. Los bloques de audio distintos del primero en un cuadro de sincronización también pueden reutilizar el conjunto de exponentes del bloque anterior (esto es necesario para los canales que usan la Transformación Híbrida Adaptativa).

Los exponentes decodificados, junto con un conjunto de parámetros de metadatos, se utilizan para derivar los punteros de asignación de bits (BAP), que especifican el número de bits asignados a cada mantisa. A los contenedores que corresponden a frecuencias en las que la audición humana es más precisa se les asignan más bits; A los contenedores que corresponden a frecuencias a las que los humanos son menos sensibles se les asignan menos. Se puede asignar cualquier valor entre cero y 16 bits para cada mantisa; si se transmiten cero bits, se puede aplicar opcionalmente una función de oscilación para generar el coeficiente de frecuencia.

Algoritmo

Dolby Digital Plus, como muchos códecs de audio con pérdida, utiliza una representación de la señal en el dominio de frecuencia fuertemente cuantificada para lograr una ganancia de codificación ; Esta sección describe el funcionamiento de la transformación base, así como varias "herramientas" opcionales especificadas por el estándar, que se utilizan para lograr una mayor compresión o reducir los artefactos de codificación audibles. [3]

Transformada de coseno discreta modificada

Tanto el codificador Dolby Digital como el DD+ convierten una señal de audio multicanal al dominio de la frecuencia utilizando la transformada de coseno discreta modificada (MDCT), con una longitud de bloque conmutable de 256 o 512 muestras (la última se usa con señales estacionarias, la primera con señales transitorias). ). A continuación, la representación en el dominio de la frecuencia se cuantifica según un modelo psicoacústico y se transmite. Se utiliza un formato de punto flotante para los coeficientes de frecuencia, y las mantisas y los exponentes se almacenan y transmiten por separado, y ambos están muy comprimidos.

Transformada híbrida adaptativa (AHT)

Para señales muy estacionarias, como notas largas en una interpretación musical, se utiliza la Transformación Híbrida Adaptativa (AHT). Esta herramienta es exclusiva de Dolby Digital Plus (y no es compatible con Dolby Digital) y utiliza una transformada de coseno discreta (DCT) de tipo II adicional para combinar seis bloques de transformación adyacentes (ubicados dentro de un cuadro de sincronización) en un bloque efectivamente más largo. Además de la transformación de dos etapas, se utiliza una estructura de asignación de bits diferente y se implementan dos formas de representar mantisas codificadas: uso de cuantificación vectorial , que proporciona la ganancia de codificación más alta, y uso de cuantificación adaptada a ganancia (GAQ). cuando se requiere una mayor fidelidad de la señal. La cuantificación adaptativa de ganancia se puede habilitar de forma independiente para cada contenedor de frecuencia dentro de un canal y permite la codificación de mantisa de longitud variable.

Acoplamiento

Como muchos programas de audio multicanal tienen altos grados de correlación entre canales individuales, normalmente se utiliza un canal de acoplamiento. La información de alta frecuencia que es común entre dos o más canales se transmite en un canal separado (uno que no es reproducido por un decodificador, sino que sólo se mezcla con los canales originales) conocido como canal de acoplamiento; junto con coeficientes conocidos como "coordenadas de acoplamiento" que guían al decodificador sobre cómo reconstruir los canales originales.

Dolby Digital Plus admite una versión más elaborada de la herramienta de acoplamiento conocida como Enhanced Coupling (ECPL). Este algoritmo, que es considerablemente más caro de procesar (tanto para codificadores como para decodificadores) permite incluir información de fase en las coordenadas de acoplamiento, permitiendo preservar las relaciones de fase entre canales que están acoplados.

Extensión espectral

Dolby Digital Plus proporciona otra herramienta para las altas frecuencias. Como los componentes de alta frecuencia son a menudo armónicos de sonidos de baja frecuencia, Spectral Extension (SPX) permite sintetizar algorítmicamente componentes de alta frecuencia a partir de componentes de baja frecuencia. Esta herramienta también es exclusiva de Dolby Digital Plus y no es compatible con Dolby Digital.

Rematrización

Los programas estéreo suelen rematrizarse y codificarse como canal L+R y LR. Esto se hace para aumentar la ganancia de codificación (el canal LR normalmente puede estar muy comprimido y la posterior desmatrización provocará que se cancelen muchos artefactos de compresión) y para preservar las relaciones de fase necesarias para la reproducción adecuada de material codificado en Dolby Surround .

Procesamiento transitorio previo al ruido

El procesamiento transitorio de pre-ruido (TPNP) es una herramienta específica de Dolby Digital Plus para reducir los artefactos resultantes de la cuantificación de la señal y otras técnicas de compresión. A diferencia de las otras herramientas descritas anteriormente, que operan en el dominio de la frecuencia y preceden a la conversión nuevamente a muestras PCM, TPNP es una herramienta que esencialmente realiza una operación de cortar y pegar en ventana en la señal en el dominio del tiempo para borrar ciertos artefactos de cuantificación predecibles.

Relación con Dolby Digital y Dolby Atmos

Los flujos de bits Dolby Digital Plus no son directamente compatibles con los decodificadores Dolby Digital heredados . Sin embargo, Dolby Digital Plus es un superconjunto funcional de Dolby Digital, y los decodificadores incluyen un componente obligatorio que convierte directamente (sin decodificar ni recodificar) el flujo de bits Dolby Digital Plus en un flujo de bits Dolby Digital (que funciona a 640 kbit/s) para su transporte. a través de conexiones S/PDIF heredadas (incluido S/PDIF a través de HDMI) a decodificadores externos (por ejemplo, AVR, etc.). Todos los decodificadores Dolby Digital Plus pueden decodificar flujos de bits Dolby Digital.

Sin embargo, los flujos de bits Dolby Atmos están codificados para ser compatibles con versiones anteriores de los decodificadores Dolby Digital Plus y, como tal, Dolby Atmos puede ser decodificado por dispositivos compatibles con Dolby Digital Plus. Dolby lo ha comercializado como la variación de compresión con pérdida de Dolby Atmos bajo la etiqueta "Dolby Digital Plus Atmos" para diferenciarlo del original sin pérdidas basado en DolbyHD. La mayoría de los flujos de bits Dolby Digital Plus ahora están codificados en codificación Atmos.


Compresión de rango dinámico

Uno de los objetivos del diseño de DD+ es la reproducción de calidad en una variedad de entornos, desde cines en casa y otros entornos controlados acústicamente donde es factible la reproducción de alto rango dinámico, hasta entornos portátiles y automotrices donde hay mucho ruido de fondo y puede ser necesaria la compresión del rango dinámico. para hacer audibles todas las partes de un programa de audio.

DD+ proporciona los siguientes modos de funcionamiento para diferentes entornos de oyente/espectador.

Modos de funcionamiento del decodificador Dolby Digital Plus:

Nota: Todos los modos de funcionamiento del decodificador (enumerados anteriormente) están disponibles en todos los decodificadores Dolby Digital Plus. El modo de funcionamiento predeterminado se rige por la categoría del dispositivo y la aplicación. En algunos dispositivos, los usuarios también pueden tener la opción (a través del menú) de seleccionar un modo alternativo que se adapte a sus gustos y/o aplicaciones particulares.

Además, Dolby Digital y DD+ contienen metadatos adicionales para permitir una traducción sin errores a canales descendentes de rango restringido, como la modulación de RF, donde una amplitud excesiva de la señal de salida puede provocar una distorsión significativa o errores de modulación.

Encapsulación, uso y almacenamiento de transmisiones Dolby Digital

Transporte físico para dispositivos de consumo.

IEC 61937-3: define cómo transmitir flujos de bits Dolby Digital (AC-3) y Dolby Digital Plus (E-AC-3) a través de una interfaz IEC 60958/61937 (S/PDIF). Sin embargo, la interfaz S/PDIF tiene un ancho de banda insuficiente para transportar flujos de bits Dolby Digital Plus (E-AC-3) a la velocidad de datos de 3,0 Mbit/s especificada por HD DVD; son posibles velocidades de datos más bajas.

Muchos equipos de consumo, e incluso algunos equipos profesionales, no reconocen Dolby Digital Plus como un formato codificado y tratarán las señales DD+ a través de una interfaz S/PDIF o similar, o almacenadas en un archivo .WAV o formato contenedor similar, como si fueron datos PCM lineales. Esto no es problemático si los datos se pasan sin cambios, pero cualquier escalado de ganancia o conversión de frecuencia de muestreo, operaciones que son auditivamente inofensivas para los datos PCM, corromperán y destruirán una transmisión Dolby Digital Plus. (Es más probable que los códecs más antiguos, como DTS o AC-3, sean reconocidos como formatos comprimidos y protegidos de dicho procesamiento).

Dolby Digital Plus puede transmitirse a través de HDMI 1.3 o posterior, según IEC 61937-3.

Transporte físico para dispositivos y aplicaciones profesionales.

Como la interfaz AES-3 es analógica profesional a S/PDIF, las transmisiones Dolby Digital Plus pueden transmitirse a través de conexiones AES-3 con suficiente ancho de banda y/o a través de otras interfaces que encapsulan AES-3 (como SMPTE 259M y SMPTE 299M). audio incorporado). Los estándares adicionales promulgados por SMPTE especifican la codificación de transportes Dolby, incluidos Dolby Digital, Dolby Digital Plus y Dolby E (un códec exclusivo para profesionales utilizado en aplicaciones de audio/vídeo) en una interfaz AES. El estándar SMPTE 337 especifica la señalización y el transporte de señales que no son audio PCM a través de una interfaz AES-3, y el estándar SMPTE 340-2008 especifica cómo se transmitirán Dolby Digital Plus y Dolby Digital a través de esa interfaz. La combinación de SMPTE 340-2008 y 337M permite almacenar y transportar el flujo de bits Dolby Digital Plus dentro de flujos de trabajo profesionales de producción, contribución y distribución antes de su emisión a los consumidores.

Transmisión de consumo en sistemas de televisión digital.

El Comité de Sistemas Avanzados de Televisión especifica DD+ o Dolby Digital como el códec de audio principal para el sistema de televisión digital ATSC , y se usa comúnmente para otras aplicaciones DTV (como transmisiones por cable y satélite) en países que usan ATSC para televisión digital.

Para la transmisión (emisión) a los consumidores, el flujo de bits Dolby Digital Plus se empaqueta en un flujo elemental MPEG y se multiplexa (con video) en un flujo de transporte MPEG. En los sistemas ATSC, la especificación para transportar Dolby Digital Plus se describe en ATSC A/53 Parte 3 y Parte 6. En los sistemas DVB, la especificación para transportar Dolby Digital Plus se describe en ETSI TS 101 154 y ETSI EN 300 468.

Dolby Digital Plus se utiliza cada vez más en los sistemas de televisión digital, en particular en los sistemas de cable y satélite, como sustituto de Dolby Digital. Muchas de estas aplicaciones no aprovechan su mayor número de canales ni su capacidad para admitir múltiples programas independientes; en cambio, se utiliza como un códec de mayor eficiencia que el AC-3.

Disco HD DVD y Blu-ray

Tanto el ya desaparecido estándar HD DVD como el Blu-ray Disc incluyen Dolby Digital Plus. Es un componente obligatorio del HD DVD y un componente opcional del Blu-ray. El número máximo de canales codificados discretos es el mismo para ambos formatos: 7.1. Sin embargo, HD DVD y Blu-ray imponen diferentes limitaciones técnicas a los códecs de audio compatibles. Por lo tanto, el uso de DD+ difiere sustancialmente entre HD DVD y Blu-ray Disc.

En HD DVD, DD+ está designado como códec de audio obligatorio. Una película HD DVD puede utilizar DD+ como pista de audio principal (o única). Se requiere un reproductor HD DVD para admitir audio DD+ decodificarlo y enviarlo a las tomas de salida del reproductor. Tal como se almacena en el disco, el flujo de bits DD+ puede transportar cualquier número de canales de audio hasta el máximo permitido, a cualquier velocidad de bits hasta 3,0 Mbit/s.

En Blu-ray Disc, DD+ es un códec opcional y se implementa como una extensión de una pista de audio "central" AC-3 5.1. El núcleo AC-3 está codificado a 640 kbit/s, transporta 5 canales primarios (y 1 LFE) y cualquier reproductor de Blu-ray Disc puede reproducirlo de forma independiente como pista de audio de una película. El flujo de bits de extensión DD+ se utiliza en reproductores que lo admiten reemplazando los canales traseros en la configuración 5.1 con versiones de mayor fidelidad, además de proporcionar una posible extensión de canal a 6.1 o 7.1. A la pista de audio completa se le permite una tasa de bits combinada de 1,7 Mbit/s: 640 kbit/s para el núcleo AC-3 5.1 y 1 Mbit/s para la extensión DD+. Durante la reproducción, tanto el flujo de bits principal como el de extensión contribuyen a la salida de audio final, de acuerdo con las reglas integradas en los metadatos del flujo de bits. [4] [ se necesita una mejor fuente ]

Reproductores multimedia y downmixing

Generalmente, un flujo de bits Dolby Digital Plus sólo se puede transportar a través de un enlace HDMI 1.3 o superior. Los receptores más antiguos admiten versiones anteriores de HDMI o solo admiten el sistema S/PDIF para audio digital o entradas analógicas.

Para enlaces que no son HDMI 1.3, el reproductor puede decodificar el audio y luego transmitirlo a través de una variedad de métodos diferentes.

La mayoría de los receptores y reproductores admiten S/PDIF. Esta conexión digital de ancho de banda inferior no es capaz de transmitir audio PCM sin pérdidas con más de dos canales, pero un reproductor puede transmitir una secuencia de audio compatible con S/PDIF al receptor de una de las siguientes maneras:

Si el reproductor necesita decodificar el audio de un receptor que no sea HDMI 1.3, los resultados deberían ser predecibles. La especificación DD+ define explícitamente los modos y la mecánica de mezcla , por lo que cualquier campo sonoro fuente (hasta 14.1) se puede reproducir de forma predecible para cualquier entorno de escucha (hasta un solo canal).

Ver también

Referencias

  1. ^ Comité de sistemas de televisión avanzados (17 de diciembre de 2012), Estándar ATSC: Compresión de audio digital (AC-3, E-AC-3) (PDF) , Washington, DC: Autor, ATSC A/52:2012
  2. ^ Estándar de compresión de audio digital (AC-3, AC-3 mejorado) (PDF) , Instituto Europeo de Normas de Telecomunicaciones, 20 de septiembre de 2017, ETSI TS 102 366 V1.4.1 (2017-09 , consultado el 21 de septiembre de 2023
  3. ^ Andersen, Robert Loring; Crockett, B.; Davidson, G.; Davis, Marcos; Campo, L.; Turner, Stephen C.; Vinton, M.; Williams, P. (1 de octubre de 2004). "Introducción a Dolby Digital Plus, una mejora del sistema de codificación Dolby Digital" (PDF) . Revista de la Sociedad de Ingeniería de Audio . Archivado desde el original (PDF) el 19 de noviembre de 2016.
  4. ^ "avcodec/eac3: agregue soporte para transmisión dependiente · FFmpeg/FFmpeg@ae92970". GitHub . Consultado el 10 de junio de 2019 .