stringtranslate.com

Codificación de audio avanzada de alta eficiencia

Estructura jerárquica del perfil AAC, perfil HE-AAC y perfil HE-AAC v2, y compatibilidad entre ellos. El decodificador de perfil HE-AAC es totalmente capaz de decodificar cualquier flujo de perfil AAC. De manera similar, el decodificador HE-AAC v2 puede manejar todos los flujos de perfil HE-AAC, así como todos los flujos de perfil AAC. Basado en la especificación técnica MPEG-4 Parte 3. [1]
Evolución del perfil MPEG-2 AAC-LC (baja complejidad) y el tipo de objeto MPEG-4 AAC-LC al perfil HE-AAC v2. [2]

La codificación de audio avanzada de alta eficiencia ( HE-AAC ) es un formato de codificación de audio para la compresión de datos con pérdida de audio digital definido como un perfil de audio MPEG-4 en ISO / IEC 14496–3. Es una extensión de AAC de baja complejidad (AAC-LC) optimizada para aplicaciones de baja tasa de bits , como la transmisión de audio . El perfil de uso HE-AAC v1 utiliza replicación de banda espectral (SBR) para mejorar la eficiencia de compresión de la transformada de coseno discreta modificada (MDCT) en el dominio de la frecuencia . [3] El perfil de uso HE-AAC v2 combina SBR con estéreo paramétrico (PS) para mejorar aún más la eficiencia de compresión de las señales estéreo.

HE-AAC se utiliza en estándares de radio digital como HD Radio , [4] DAB+ y Digital Radio Mondiale .

Historia

El progenitor de HE-AAC fue desarrollado por Coding Technologies combinando MPEG-2 AAC-LC con un mecanismo patentado para replicación de banda espectral (SBR), que será utilizado por XM Radio para su servicio de radio satelital. Posteriormente, Coding Technologies presentó su mecanismo SBR a MPEG como base de lo que finalmente se convirtió en HE-AAC.

HE-AAC v1 fue estandarizado como perfil de audio MPEG-4 en 2003 por MPEG y publicado como parte de la especificación ISO/IEC 14496-3:2001/Amd 1:2003 [5] .

El perfil HE-AAC v2 se estandarizó en 2006 según ISO/IEC 14496-3:2005/Amd 2:2006. [dieciséis ]

Partes de la especificación HE-AAC habían sido estandarizadas y publicadas previamente por varios organismos en 3GPP TS 26.401 , [7] ETSI TS 126 401 V6.1.0 , [8] ISO/IEC 14496-3:2001/Amd.1:2003 y ISO/IEC 14496-3:2001/Enmienda 2:2004 .[9]

En ese momento, Coding Technologies ya había comenzado a utilizar los nombres comerciales AAC+ y aacPlus para lo que ahora se conoce como HE-AAC v1, y aacPlus v2 y eAAC+ para lo que ahora se conoce como HE-AAC v2.

Calidad percibida

Las pruebas indican que el material decodificado a partir de HE-AAC de 64 kbit/s no tiene una calidad de audio similar a la del material decodificado de MP3 a 128 kbit/s utilizando codificadores de alta calidad. [10] [11] [12] [13] La prueba, teniendo en cuenta la distribución de la tasa de bits y RMSD , es un empate entre mp3PRO , HE-AAC y Ogg Vorbis .

Pruebas controladas adicionales realizadas por 3GPP durante su proceso de especificación de revisión 6 indican que HE-AAC y HE-AAC v2 proporcionan una calidad de audio "buena" para música a velocidades de bits bajas (por ejemplo, 24 kbit/s).

En 2011, una prueba de escucha pública [14] que comparó los dos codificadores HE-AAC mejor calificados en ese momento con Opus y Ogg Vorbis indicó que Opus tenía una superioridad estadísticamente significativa a 64 kbit/s sobre todos los demás competidores, y Apple, que ocupaba el segundo lugar. La implementación de HE-AAC fue estadísticamente superior a Ogg Vorbis y Nero HE-AAC, que estaban empatados en el tercer lugar.

Los decodificadores MPEG-2 y MPEG-4 AAC-LC sin soporte SBR decodificarán la parte AAC-LC del audio, lo que dará como resultado una salida de audio con solo la mitad de la frecuencia de muestreo, reduciendo así el ancho de banda de audio. Esto generalmente da como resultado que la parte de gama alta o agudos de la señal de audio falte en el producto de audio.

Apoyo

Codificación

Los codificadores de archivos y streaming Opticodec-PC de Orban fueron los primeros codificadores disponibles comercialmente que admitían AAC-LC /HE-AAC en 2003. Ahora están obsoletos y reemplazados por codificadores StreamS de StreamS/Modulation Index con muchas más funciones, incluida la compatibilidad con xHE-AAC. / Codificación unificada de voz y audio . Ahora se utilizan en algunos de los proveedores de contenido más importantes y se consideran el estándar de la industria para la codificación en vivo.

Sony admite la codificación HE-AAC desde la versión 4 de SonicStage.

iTunes 9 admite codificación y reproducción HE-AAC. [15] [16]

Nero ha lanzado un codificador HE-AAC de línea de comandos gratuito, Nero AAC Codec , [17] y también admite HE-AAC dentro del paquete de software Nero.

Squeeze Compression Suite de Sorenson Media incluye un codificador HE-AACv1 y está disponible tanto para macOS como para Windows .

El consorcio 3GPP publicó el código fuente de un codificador HE-AACv2 de referencia que parece ofrecer una calidad competitiva. [18]

Winamp Pro también admite la extracción de música a HE-AAC. Utilizando un complemento de transcodificación para la biblioteca multimedia de Winamp, cualquier archivo se puede transcodificar a HE-AAC. [19]

XLD, un programa de codificación de audio de macOS, ofrece codificación desde cualquiera de sus formatos compatibles a HE-AAC.

Nokia PC Suite puede codificar archivos de audio al formato eAAC+ antes de transmitirlos al teléfono móvil.

Los codificadores HE-AAC v1 y v2 los proporciona la biblioteca Fraunhofer FDK AAC en Android 4.1 y versiones posteriores. [20]

Descodificación

HE-AAC es compatible con la biblioteca de decodificación FAAD/ FAAD2 de código abierto y todos los reproductores que la incorporan, como VLC media player , Winamp , foobar2000 , Audacious Media Player y SonicStage .

El códec Nero AAC admite la decodificación HE y HEv2 AAC.

Los clientes de AOL Radio y Pandora Radio también utilizan HE-AAC para ofrecer música de alta fidelidad a bajas velocidades de bits.

iTunes 9.2 e iOS 4 incluyen decodificación completa de transmisiones estéreo paramétricas HE-AAC v2.

Dolby lanzó los decodificadores y codificadores Dolby Pulse en septiembre de 2008. HE-AAC v2 es el núcleo de Dolby Pulse, por lo que los archivos y transmisiones codificados en Dolby Pulse se reproducirán en decodificadores AAC, HE-AAC v1 y v2. Por el contrario, los archivos y transmisiones codificados en AAC, HE-AAC v1 o v2 se reproducirán en decodificadores Dolby Pulse.

Dolby Pulse proporciona las siguientes capacidades adicionales además de HE-AAC v2:

Dolby también ha lanzado un decodificador para PC como SDK adecuado para la integración en aplicaciones de PC que requieren capacidades de reproducción Dolby Pulse, HE-AAC o AAC.

Los decodificadores HE-AAC v2 se proporcionan en todas las versiones de Android. [20] La decodificación está a cargo de Fraunhofer FDK AAC desde la versión 4.1 de Android.

Clientela

Aspectos de promoción

Marcas comerciales y etiquetado.

HE-AAC se comercializa bajo la marca comercial aacPlus de Coding Technologies y bajo la marca comercial Nero Digital de Nero AG. Sony Ericsson, Nokia y Samsung utilizan AAC+ para etiquetar la compatibilidad con HE-AAC v1 y eAAC+ para etiquetar la compatibilidad con HE-AAC v2 en sus teléfonos. Motorola usa AAC+ para indicar HE-AAC v1 y "AAC+ mejorado" para indicar HE-AAC v2. [ cita necesaria ]

Licencias y patentes

Las empresas titulares de patentes para HE-AAC han formado un consorcio de patentes administrado por Via Licensing Corporation [27] para proporcionar un punto único de licencia para los fabricantes de productos.

Se requieren licencias de patentes para las empresas de productos finales que fabrican productos de hardware o software que incluyen codificadores y/o decodificadores HE-AAC. [28] A diferencia del formato MP3 antes del 23 de abril de 2017, [29] los propietarios de contenido no están obligados a pagar tarifas de licencia para distribuir contenido en HE-AAC.

Estándares

El perfil HE-AAC se estandarizó por primera vez en ISO/IEC 14496-3:2001/Amd 1:2003. [5] El perfil HE-AAC v2 (HE-AAC con estéreo paramétrico) se especificó por primera vez en ISO/IEC 14496-3:2005/Amd 2:2006. [1] [6] [30] La herramienta de codificación estéreo paramétrica utilizada por HE-AAC v2 se estandarizó en 2004 y se publicó como ISO/IEC 14496-3:2001/Amd 2:2004. [9] [7]

La versión actual de MPEG-4 Audio (incluidos los estándares HE-AAC) está publicada en ISO/IEC 14496-3:2009.

AacPlus mejorado es un formato de compresión de audio requerido en las especificaciones técnicas 3GPP para servicios multimedia 3G UMTS y debe ser compatible con el subsistema multimedia IP (IMS), el servicio de mensajería multimedia (MMS), el servicio de transmisión/multidifusión multimedia (MBMS) y el servicio transparente de extremo a extremo. Servicio de transmisión por conmutación de paquetes (PSS). [31] [32] [33] [34] La versión 2 de HE-AAC fue estandarizada con el nombre de Enhanced aacPlus por 3GPP para servicios multimedia 3G UMTS en septiembre de 2004 (3GPP TS 26.401). [35]

La codificación de audio HE-AAC y HE-AAC v2 para aplicaciones DVB está estandarizada por TS 101 154. [36] [37] AacPlus v2 de Coding Technologies [38] también está estandarizada por ETSI como TS 102 005 para servicios satelitales a dispositivos portátiles (DVB-SH) por debajo de 3 GHz.

En diciembre de 2007, Brasil comenzó a transmitir el estándar DTV terrestre llamado International ISDB-Tb que implementa codificación de video H.264 con audio AAC-LC en el programa principal (simple o múltiple) y video H.264 con audio HE-AACv2 en el sub móvil 1Seg. -programa.

Versiones

El siguiente es el resumen de las diferentes versiones de HE-AAC:

Ver también

Notas

  1. ^ Para ofrecer transmisión de audio, lo más probable es que los datos AAC se transmitan en formato de intercambio de datos de audio (ADIF) o mediante flujo de transporte de datos de audio (ADTS). Puede analizar estos contenedores y crear etiquetas de audio FLV para utilizar el archivo de audio con el modo de generación de datos. [25]

Referencias

  1. ^ abc ISO/IEC JTC1/SC29/WG11/N7016 (2005-01-11), Texto de ISO/IEC 14496-3:2001/FPDAM 4, Codificación de audio sin pérdidas (ALS), nuevos perfiles de audio y extensiones BSAC, archivado desde el original (DOC) el 12 de mayo de 2014 , consultado el 9 de octubre de 2009{{citation}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  2. ^ Fraunhofer IIS, tecnología de audio y vídeo MPEG-4 (PDF) , consultado el 15 de octubre de 2009[ enlace muerto ]
  3. ^ Herré, J.; Dietz, M. (2008). "Codificación AAC MPEG-4 de alta eficiencia [Estándares en pocas palabras]". Revista de procesamiento de señales IEEE . 25 (3): 137-142. Código Bib : 2008 ISPM...25..137H. doi :10.1109/MSP.2008.918684.
  4. ^ "Recibiendo NRSC-5". teoría.io . 9 de junio de 2017. Archivado desde el original el 20 de agosto de 2017 . Consultado el 14 de abril de 2018 .
  5. ^ ab ISO (2003). "Extensión de ancho de banda, ISO/IEC 14496-3:2001/Amd 1:2003". YO ASI. Archivado desde el original el 4 de enero de 2012 . Consultado el 13 de octubre de 2009 .
  6. ^ ab ISO (2006). "Audio Lossless Coding (ALS), nuevos perfiles de audio y extensiones BSAC, ISO/IEC 14496-3:2005/Amd 2:2006". YO ASI. Archivado desde el original el 4 de enero de 2012 . Consultado el 13 de octubre de 2009 .
  7. ^ ab 3GPP (30 de septiembre de 2004). "3GPP TS 26.401 V6.0.0 (2004-09), funciones de procesamiento de audio del códec de audio general; códec de audio general aacPlus mejorado; descripción general (versión 6)" (DOC) . 3GPP. Archivado desde el original el 19 de agosto de 2006 . Consultado el 13 de octubre de 2009 .{{cite web}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  8. ^ 3GPP (4 de enero de 2005). "ETSI TS 126 401 V6.1.0 (2004-12) - Sistema universal de telecomunicaciones móviles (UMTS); Funciones generales de procesamiento de audio del códec de audio; Códec de audio general aacPlus mejorado; Descripción general (3GPP TS 26.401 versión 6.1.0 Versión 6)". 3GPP . Consultado el 13 de octubre de 2009 .{{cite web}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  9. ^ ab ISO (2004). "Codificación paramétrica para audio de alta calidad, ISO/IEC 14496-3:2001/Amd 2:2004". YO ASI. Archivado desde el original el 4 de enero de 2012 . Consultado el 13 de octubre de 2009 .
  10. ^ "Resultados de la prueba de escucha a 64 kbit/s". 23 de junio de 2007. Archivado desde el original el 23 de junio de 2007 . Consultado el 3 de mayo de 2018 .{{cite web}}: Mantenimiento CS1: bot: estado de la URL original desconocido ( enlace )
  11. ^ "Prueba de escucha multiformato a 48 kbps - TERMINADA". www.hidrogenaud.io . Archivado desde el original el 8 de julio de 2014 . Consultado el 3 de mayo de 2018 .
  12. ^ "Prueba de escucha personal de 80 kbps (verano de 2005)". www.hidrogenaud.io . Archivado desde el original el 8 de julio de 2014 . Consultado el 3 de mayo de 2018 .
  13. ^ "MP3 – WMA – AAC – OGG – calidad de 96 kbps (evaluación) - Traitement Audio - Video & Son - FORUM HardWare.fr". foro.hardware.fr . Archivado desde el original el 15 de julio de 2012 . Consultado el 3 de mayo de 2018 .
  14. ^ "Página de resultados no oficiales de la prueba de escucha multiformato de Hydrogen audio 2011". gente.xiph.org . Archivado desde el original el 25 de julio de 2012 . Consultado el 3 de mayo de 2018 .
  15. ^ "Apple - iTunes - Conozca las funciones de iTunes 10". Archivado desde el original el 29 de marzo de 2011 . Consultado el 29 de marzo de 2011 .
  16. ^ "iTunes". Manzana . Archivado desde el original el 29 de marzo de 2011 . Consultado el 3 de mayo de 2018 .
  17. ^ "Códec Nero AAC". Archivado desde el original el 11 de diciembre de 2009 . Consultado el 23 de noviembre de 2009 .
  18. ^ Bouvigne, Gabriel (20 de marzo de 2006). "Resultados de las pruebas públicas de AAC de 48 kbps". MP3'Tecnología. Archivado desde el original el 24 de julio de 2008 . Consultado el 5 de septiembre de 2008 .
  19. ^ "Descarga gratuita Winamp Transcoder 2.0". www.free-codecs.com . Archivado desde el original el 20 de agosto de 2008 . Consultado el 3 de mayo de 2018 .
  20. ^ ab "Formatos multimedia compatibles". Google. Archivado desde el original el 11 de marzo de 2012 . Consultado el 10 de octubre de 2013 .
  21. ^ "iPod touch: formatos de archivo compatibles". Soporte de Apple . Consultado el 7 de abril de 2019 .
  22. ^ "AIMPAR". www.aimp.ru. _ Archivado desde el original el 8 de noviembre de 2014 . Consultado el 3 de mayo de 2018 .
  23. ^ "Adobe Flash Player". www.adobe.com . Archivado desde el original el 23 de julio de 2008 . Consultado el 3 de mayo de 2018 .
  24. ^ "Adobe trae video HD y audio de alta calidad a Flash usando H.264, AAC (¿compatible con iPhone Flash?) - MacDailyNews - Bienvenido a casa". macdailynews.com . 21 de agosto de 2007. Archivado desde el original el 21 de junio de 2015 . Consultado el 3 de mayo de 2018 .
  25. ^ "Reproducción de transmisión de audio de Icecast en Flash Player: Adobe Developer Connection". www.adobe.com . Archivado desde el original el 16 de marzo de 2015 . Consultado el 3 de mayo de 2018 .
  26. ^ "Productos Orban Codec ~ Códec Opticodec-PC 1020". Archivado desde el original el 18 de marzo de 2015 . Consultado el 19 de octubre de 2014 .
  27. ^ Mediante licencia. "Programas de licencias". Archivado desde el original el 13 de mayo de 2017 . Consultado el 11 de mayo de 2017 .
  28. ^ Mediante licencia. "Preguntas frecuentes sobre licencias AAC". Archivado desde el original el 22 de mayo de 2017 . Consultado el 11 de mayo de 2017 .
  29. ^ Thompson. "Licencias de MP3 Thomson / FhG". Archivado desde el original el 17 de enero de 2017.
  30. ^ Mihir Mody (6 de junio de 2005). "La compresión de audio se vuelve mejor y más compleja". Embedded.com . Consultado el 13 de octubre de 2009 .[ enlace muerto permanente ]
  31. ^ ETSI (2009-04) ETSI TS 126234 V8.2.0 (2009-04); 3GPP TS 26.234; Servicio de transmisión por secuencias con conmutación de paquetes (PSS) transparente de extremo a extremo; Protocolos y códecs Archivado el 1 de diciembre de 2008 en la página 58 de Wayback Machine. Recuperado el 2 de junio de 2009.
  32. ^ ETSI (2009-01) ETSI TS 126140 V8.0.0 (2009-01); 3GPP TS 26.140; Servicio de mensajería multimedia (MMS); Formatos y códigos de medios Archivado el 6 de diciembre de 2008 en la página 11 de Wayback Machine. Recuperado el 2 de junio de 2009.
  33. ^ ETSI (2009-01) ETSI TS 126141 V8.0.0 (2009-01); 3GPP TS 26.141; Mensajería y Presencia del Sistema Multimedia IP (IMS); Formatos multimedia y códecs Archivado el 7 de octubre de 2008 en la página 10 de Wayback Machine . Recuperado el 2 de junio de 2009.
  34. ^ 3GPP (2009). "ETSI TS 126 346 V8.3.0 (2009-06); 3GPP TS 26.346; Servicio de transmisión/multidifusión multimedia (MBMS); Protocolos y códecs". ETSI . pag. 85. Archivado desde el original el 4 de octubre de 2008 . Consultado el 13 de octubre de 2009 .{{cite web}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  35. ^ 3GPP (2004). "3GPP TS 26.401 - Funciones generales de procesamiento de audio del códec de audio; Códec de audio general aacPlus mejorado; Descripción general". 3GPP. Archivado desde el original el 4 de octubre de 2008 . Consultado el 13 de octubre de 2009 .{{cite web}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  36. ^ ETSI TS 101154 v1.5.1: Especificación para el uso de codificación de audio y vídeo en aplicaciones de radiodifusión basadas en el flujo de transporte MPEG-2
  37. ^ ETSI (31 de marzo de 2009). "TS 101 154 versión 1.9.1 - Difusión de vídeo digital (DVB); Especificación para el uso de codificación de vídeo y audio en aplicaciones de radiodifusión basadas en el flujo de transporte MPEG-2". ETSI. Archivado desde el original el 14 de abril de 2013 . Consultado el 13 de octubre de 2009 .
  38. ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 26 de octubre de 2006 . Consultado el 29 de enero de 2007 .{{cite web}}: Mantenimiento CS1: copia archivada como título ( enlace )
  39. ^ "xHE-AAC". Instituto Fraunhofer de Circuitos Integrados IIS . Consultado el 3 de enero de 2021 .

enlaces externos