stringtranslate.com

Codificación de audio avanzada de alta eficiencia

Estructura jerárquica del perfil AAC, perfil HE-AAC y perfil HE-AAC v2, y compatibilidad entre ellos. El decodificador de perfil HE-AAC es totalmente capaz de decodificar cualquier flujo de perfil AAC. De manera similar, el decodificador HE-AAC v2 puede manejar todos los flujos de perfil HE-AAC, así como todos los flujos de perfil AAC. Basado en la especificación técnica MPEG-4 Parte 3. [1]
Evolución del perfil MPEG-2 AAC-LC (baja complejidad) y del tipo de objeto MPEG-4 AAC-LC al perfil HE-AAC v2. [2]

La codificación de audio avanzada de alta eficiencia ( HE-AAC ) es un formato de codificación de audio para la compresión de datos con pérdida de audio digital definido como un perfil de audio MPEG-4 en ISO / IEC 14496–3. Es una extensión de AAC de baja complejidad (AAC-LC) optimizada para aplicaciones de baja tasa de bits , como la transmisión de audio . El perfil de uso HE-AAC v1 utiliza replicación de banda espectral (SBR) para mejorar la eficiencia de compresión de la transformada de coseno discreta modificada (MDCT) en el dominio de la frecuencia . [3] El perfil de uso HE-AAC v2 acopla SBR con estéreo paramétrico (PS) para mejorar aún más la eficiencia de compresión de señales estéreo.

HE-AAC se utiliza en estándares de radio digital como HD Radio , [4] DAB+ y Digital Radio Mondiale .

Historia

El progenitor del formato HE-AAC fue desarrollado por Coding Technologies combinando MPEG-2 AAC-LC con un mecanismo propietario de replicación de banda espectral (SBR), para que XM Radio lo utilizara en su servicio de radio satelital. Posteriormente, Coding Technologies presentó su mecanismo SBR a MPEG como base de lo que finalmente se convirtió en HE-AAC.

HE-AAC v1 fue estandarizado como un perfil de audio MPEG-4 en 2003 por MPEG y publicado como parte de la especificación ISO/IEC 14496-3:2001/Amd 1:2003 [5] .

El perfil HE-AAC v2 se estandarizó en 2006 según ISO/IEC 14496-3:2005/Amd 2:2006. [1] [6]

Partes de la especificación HE-AAC habían sido previamente estandarizadas y publicadas por varios organismos en 3GPP TS 26.401 , [7] ETSI TS 126 401 V6.1.0 , [8] ISO/IEC 14496-3:2001/Amd.1:2003 e ISO/IEC 14496-3:2001/Amd 2:2004 . [9]

En ese momento, Coding Technologies ya había comenzado a utilizar los nombres comerciales AAC+ y aacPlus para lo que ahora se conoce como HE-AAC v1, y aacPlus v2 y eAAC+ para lo que ahora se conoce como HE-AAC v2.

Calidad percibida

Las pruebas indican que el material decodificado de HE-AAC de 64 kbit/s no tiene una calidad de audio similar al material decodificado de MP3 a 128 kbit/s utilizando codificadores de alta calidad. [10] [11] [12] [13] La prueba, teniendo en cuenta la distribución de la tasa de bits y RMSD , es un empate entre mp3PRO , HE-AAC y Ogg Vorbis .

Pruebas controladas adicionales realizadas por 3GPP durante su proceso de especificación de revisión 6 indican que HE-AAC y HE-AAC v2 proporcionan una calidad de audio "buena" para música a velocidades de bits bajas (por ejemplo, 24 kbit/s).

En 2011, una prueba de escucha pública [14] que comparaba los dos codificadores HE-AAC mejor calificados en ese momento con Opus y Ogg Vorbis indicó que Opus tenía una superioridad estadísticamente significativa a 64 kbit/s sobre todos los demás contendientes, y colocó en segundo lugar la implementación de HE-AAC de Apple como estadísticamente superior a Ogg Vorbis y Nero HE-AAC, que estaban empatados en el tercer lugar.

Los decodificadores MPEG-2 y MPEG-4 AAC-LC sin compatibilidad con SBR decodificarán la parte AAC-LC del audio, lo que dará como resultado una salida de audio con solo la mitad de la frecuencia de muestreo, lo que reduce el ancho de banda del audio. Esto generalmente da como resultado que la parte de gama alta o agudos de la señal de audio no se muestre en el producto de audio.

Apoyo

Codificación

Los codificadores de archivos y streaming Orban Opticodec-PC fueron los primeros codificadores disponibles comercialmente compatibles con AAC-LC /HE-AAC en 2003. Ahora están obsoletos y han sido reemplazados por codificadores StreamS de StreamS/Modulation Index con muchas más funciones, incluida la compatibilidad con xHE-AAC / codificación unificada de voz y audio . Ahora se utilizan en algunos de los proveedores de contenido más importantes y se consideran el estándar de la industria para la codificación en vivo.

Sony admite la codificación HE-AAC desde la versión 4 de SonicStage.

iTunes 9 admite la codificación y reproducción HE-AAC. [15] [16]

Nero ha lanzado un codificador HE-AAC de línea de comandos gratuito, Nero AAC Codec , [17] y también admite HE-AAC dentro del paquete de software Nero.

Squeeze Compression Suite de Sorenson Media incluye un codificador HE-AACv1 y está disponible tanto para macOS como para Windows .

El consorcio 3GPP publicó el código fuente de un codificador de referencia HE-AACv2 que parece ofrecer una calidad competitiva. [18]

Winamp Pro también permite copiar música a formato HE-AAC. Mediante un complemento de transcodificación para la biblioteca multimedia de Winamp, cualquier archivo se puede transcodificar a formato HE-AAC. [19]

XLD, un programa de codificación de audio para macOS, ofrece codificación desde cualquiera de sus formatos compatibles a HE-AAC.

Nokia PC Suite puede codificar archivos de audio al formato eAAC+ antes de transmitirlos al teléfono móvil.

Los codificadores HE-AAC v1 y v2 son proporcionados por la biblioteca Fraunhofer FDK AAC en Android 4.1 y versiones posteriores. [20]

Descodificación

HE-AAC es compatible con la biblioteca de decodificación de código abierto FAAD/ FAAD2 y todos los reproductores que la incorporan, como VLC media player , Winamp , foobar2000 , Audacious Media Player y SonicStage .

El códec Nero AAC admite la decodificación de AAC HE y HEv2.

Los clientes de AOL Radio y Pandora Radio también utilizan HE-AAC para ofrecer música de alta fidelidad a tasas de bits bajas.

iTunes 9.2 e iOS 4 incluyen decodificación completa de transmisiones estéreo paramétricas HE-AAC v2.

Dolby lanzó los decodificadores y codificadores Dolby Pulse en septiembre de 2008. HE-AAC v2 es el núcleo de Dolby Pulse, por lo que los archivos y transmisiones codificados en Dolby Pulse se reproducirán en decodificadores AAC, HE-AAC v1 y v2. Por el contrario, los archivos y transmisiones codificados en AAC, HE-AAC v1 o v2 se reproducirán en decodificadores Dolby Pulse.

Dolby Pulse ofrece las siguientes capacidades adicionales además de HE-AAC v2:

Dolby también ha lanzado un decodificador para PC como SDK adecuado para su integración en aplicaciones de PC que requieran capacidades de reproducción Dolby Pulse, HE-AAC o AAC.

Los decodificadores HE-AAC v2 se proporcionan en todas las versiones de Android. [20] La decodificación está a cargo de Fraunhofer FDK AAC desde la versión 4.1 de Android.

Clientela

Aspectos de promoción

Marcas comerciales y etiquetado

HE-AAC se comercializa bajo la marca comercial aacPlus de Coding Technologies y bajo la marca comercial Nero Digital de Nero AG. Sony Ericsson, Nokia y Samsung utilizan AAC+ para indicar la compatibilidad con HE-AAC v1 y eAAC+ para indicar la compatibilidad con HE-AAC v2 en sus teléfonos. Motorola utiliza AAC+ para indicar HE-AAC v1 y "AAC+ Enhanced" para indicar HE-AAC v2. [ cita requerida ]

Licencias y patentes

Las empresas que poseen patentes para HE-AAC han formado un fondo de patentes administrado por Via Licensing Corporation [27] para proporcionar un único punto de licencia para los fabricantes de productos.

Se requieren licencias de patentes para las empresas de productos finales que fabrican productos de hardware o software que incluyen codificadores y/o decodificadores HE-AAC. [28] A diferencia del formato MP3 antes del 23 de abril de 2017, [29] los propietarios de contenido no están obligados a pagar tarifas de licencia para distribuir contenido en HE-AAC.

Normas

El perfil HE-AAC se estandarizó por primera vez en ISO/IEC 14496-3:2001/Amd 1:2003. [5] El perfil HE-AAC v2 (HE-AAC con estéreo paramétrico) se especificó por primera vez en ISO/IEC 14496-3:2005/Amd 2:2006. [1] [6] [30] La herramienta de codificación estéreo paramétrica utilizada por HE-AAC v2 se estandarizó en 2004 y se publicó como ISO/IEC 14496-3:2001/Amd 2:2004. [9] [7]

La versión actual del audio MPEG-4 (incluidos los estándares HE-AAC) está publicada en ISO/IEC 14496-3:2009.

El formato de compresión de audio Enhanced aacPlus es obligatorio en las especificaciones técnicas 3GPP para los servicios multimedia 3G UMTS y debería ser compatible con el Subsistema Multimedia IP (IMS), el Servicio de Mensajería Multimedia (MMS), el Servicio de Transmisión/Multidifusión Multimedia (MBMS) y el Servicio de Transmisión por Conmutación de Paquetes de Extremo a Extremo Transparente (PSS). [31] [32] [33] [34] La versión 2 de HE-AAC fue estandarizada con el nombre de Enhanced aacPlus por 3GPP para los servicios multimedia 3G UMTS en septiembre de 2004 (3GPP TS 26.401). [35]

La codificación de audio HE-AAC y HE-AAC v2 para aplicaciones DVB está estandarizada por TS 101 154. [36] [37] AacPlus v2 de Coding Technologies [38] también está estandarizado por ETSI como TS 102 005 para servicios satelitales para dispositivos portátiles (DVB-SH) por debajo de 3 GHz.

En diciembre de 2007, Brasil inició la transmisión del estándar DTV terrestre llamado ISDB-Tb Internacional que implementa codificación de video H.264 con audio AAC-LC en el programa principal (simple o múltiple) y video H.264 con audio HE-AACv2 en el subprograma móvil 1Seg.

Versiones

A continuación se presenta el resumen de las diferentes versiones de HE-AAC:

Véase también

Notas

  1. ^ Para transmitir audio en tiempo real, lo más probable es que los datos AAC se transmitan en formato de intercambio de datos de audio (ADIF) o mediante flujo de transporte de datos de audio (ADTS). Puede analizar estos contenedores y crear etiquetas de audio FLV para usar el archivo de audio con el modo de generación de datos. [25]

Referencias

  1. ^ abc ISO/IEC JTC1/SC29/WG11/N7016 (2005-01-11), Texto de ISO/IEC 14496-3:2001/FPDAM 4, Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC, archivado desde el original (DOC) el 2014-05-12 , recuperado 2009-10-09{{citation}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  2. ^ Fraunhofer IIS, Tecnología de audio y video MPEG-4 (PDF) , consultado el 15 de octubre de 2009[ enlace muerto ]
  3. ^ Herre, J.; Dietz, M. (2008). "Codificación AAC de alta eficiencia MPEG-4 [Estándares en pocas palabras]". Revista IEEE Signal Processing . 25 (3): 137–142. Bibcode :2008ISPM...25..137H. doi :10.1109/MSP.2008.918684.
  4. ^ "Recibiendo NRSC-5". theori.io . 9 de junio de 2017. Archivado desde el original el 20 de agosto de 2017 . Consultado el 14 de abril de 2018 .
  5. ^ ab ISO (2003). "Extensión del ancho de banda, ISO/IEC 14496-3:2001/Amd 1:2003". ISO. Archivado desde el original el 4 de enero de 2012. Consultado el 13 de octubre de 2009 .
  6. ^ ab ISO (2006). "Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC, ISO/IEC 14496-3:2005/Amd 2:2006". ISO. Archivado desde el original el 4 de enero de 2012. Consultado el 13 de octubre de 2009 .
  7. ^ ab 3GPP (30 de septiembre de 2004). «3GPP TS 26.401 V6.0.0 (9 de septiembre de 2004), Funciones de procesamiento de audio del códec de audio general; Códec de audio general aacPlus mejorado; Descripción general (versión 6)» (DOC) . 3GPP. Archivado desde el original el 19 de agosto de 2006. Consultado el 13 de octubre de 2009 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  8. ^ 3GPP (4 de enero de 2005). «ETSI TS 126 401 V6.1.0 (12 de enero de 2004): Sistema universal de telecomunicaciones móviles (UMTS); Funciones generales de procesamiento de audio del códec de audio; Códec de audio general aacPlus mejorado; Descripción general (3GPP TS 26.401 versión 6.1.0 Release 6)». 3GPP . Consultado el 13 de octubre de 2009 .{{cite web}}: CS1 maint: nombres numéricos: lista de autores ( enlace )
  9. ^ ab ISO (2004). "Codificación paramétrica para audio de alta calidad, ISO/IEC 14496-3:2001/Amd 2:2004". ISO. Archivado desde el original el 4 de enero de 2012. Consultado el 13 de octubre de 2009 .
  10. ^ "Resultados de la prueba de escucha a 64 kbit/s". 23 de junio de 2007. Archivado desde el original el 23 de junio de 2007 . Consultado el 3 de mayo de 2018 .{{cite web}}: CS1 maint: bot: original URL status unknown (link)
  11. ^ "Prueba de escucha multiformato a 48 kbps - FINALIZADA". www.hydrogenaud.io . Archivado desde el original el 8 de julio de 2014 . Consultado el 3 de mayo de 2018 .
  12. ^ "Prueba de escucha personal a 80 kbps (verano de 2005)". www.hydrogenaud.io . Archivado desde el original el 8 de julio de 2014 . Consultado el 3 de mayo de 2018 .
  13. ^ "MP3 – WMA – AAC – OGG – calidad de 96 kbps (evaluación) - Traitement Audio - Video & Son - FORUM HardWare.fr". foro.hardware.fr . Archivado desde el original el 15 de julio de 2012 . Consultado el 3 de mayo de 2018 .
  14. ^ "Página de resultados no oficiales de la prueba de escucha multiformato Hydrogen Audio 2011". people.xiph.org . Archivado desde el original el 25 de julio de 2012. Consultado el 3 de mayo de 2018 .
  15. ^ "Apple - iTunes - Conoce las características de iTunes 10". Archivado desde el original el 29 de marzo de 2011. Consultado el 29 de marzo de 2011 .
  16. ^ "iTunes". Apple . Archivado desde el original el 29 de marzo de 2011 . Consultado el 3 de mayo de 2018 .
  17. ^ "Nero AAC Codec". Archivado desde el original el 11 de diciembre de 2009. Consultado el 23 de noviembre de 2009 .
  18. ^ Bouvigne, Gabriel (20 de marzo de 2006). «Resultados de pruebas públicas de AAC a 48 kbps». MP3'Tech. Archivado desde el original el 24 de julio de 2008. Consultado el 5 de septiembre de 2008 .
  19. ^ "Descarga gratuita de Winamp Transcoder 2.0". www.free-codecs.com . Archivado desde el original el 20 de agosto de 2008. Consultado el 3 de mayo de 2018 .
  20. ^ ab "Formatos multimedia admitidos". Google. Archivado desde el original el 11 de marzo de 2012. Consultado el 10 de octubre de 2013 .
  21. ^ "iPod touch: formatos de archivo compatibles". Soporte técnico de Apple . Consultado el 7 de abril de 2019 .
  22. ^ "AIMP". www.aimp.ru . Archivado desde el original el 8 de noviembre de 2014 . Consultado el 3 de mayo de 2018 .
  23. ^ "Adobe Flash Player". www.adobe.com . Archivado desde el original el 23 de julio de 2008. Consultado el 3 de mayo de 2018 .
  24. ^ "Adobe incorpora vídeo HD y audio de alta calidad a Flash mediante H.264, AAC (¿compatible con Flash en iPhone?) – MacDailyNews - Welcome Home". macdailynews.com . 21 de agosto de 2007. Archivado desde el original el 21 de junio de 2015 . Consultado el 3 de mayo de 2018 .
  25. ^ "Reproducción de audio en streaming de Icecast en Flash Player - Adobe Developer Connection". www.adobe.com . Archivado desde el original el 16 de marzo de 2015 . Consultado el 3 de mayo de 2018 .
  26. ^ "Productos de códec Orban ~ Códec Opticodec-PC 1020". Archivado desde el original el 18 de marzo de 2015. Consultado el 19 de octubre de 2014 .
  27. ^ Vía Licencias. «Programas de licencias». Archivado desde el original el 13 de mayo de 2017. Consultado el 11 de mayo de 2017 .
  28. ^ Vía Licencias. "Preguntas frecuentes sobre licencias de AAC". Archivado desde el original el 22 de mayo de 2017. Consultado el 11 de mayo de 2017 .
  29. ^ Thomson. «Licencias de MP3 de Thomson/FhG». Archivado desde el original el 17 de enero de 2017.
  30. ^ Mihir Mody (6 de junio de 2005). "La compresión de audio se vuelve mejor y más compleja". Embedded.com . Consultado el 13 de octubre de 2009 .[ enlace muerto permanente ]
  31. ^ ETSI (2009-04) ETSI TS 126 234 V8.2.0 (2009-04); 3GPP TS 26.234; Servicio de transmisión por conmutación de paquetes (PSS) transparente de extremo a extremo; Protocolos y códecs Archivado el 1 de diciembre de 2008 en Wayback Machine . Página 58. Recuperado el 2 de junio de 2009.
  32. ^ ETSI (2009-01) ETSI TS 126 140 V8.0.0 (2009-01); 3GPP TS 26.140; Servicio de mensajería multimedia (MMS); Formatos y códigos de medios Archivado el 6 de diciembre de 2008 en Wayback Machine . Página 11. Recuperado el 2 de junio de 2009.
  33. ^ ETSI (2009-01) ETSI TS 126 141 V8.0.0 (2009-01); 3GPP TS 26.141; Mensajería y presencia del sistema multimedia IP (IMS); Formatos multimedia y códecs Archivado el 7 de octubre de 2008 en Wayback Machine . Página 10. Recuperado el 2 de junio de 2009.
  34. ^ 3GPP (2009). «ETSI TS 126 346 V8.3.0 (2009-06); 3GPP TS 26.346; Multimedia Broadcast/Multicast Service (MBMS); Protocols and codecs». ETSI . p. 85. Archivado desde el original el 2008-10-04 . Consultado el 2009-10-13 .{{cite web}}: CS1 maint: numeric names: authors list (link)
  35. ^ 3GPP (2004). «3GPP TS 26.401 - Funciones generales de procesamiento de audio del códec de audio; Códec de audio general aacPlus mejorado; Descripción general». 3GPP. Archivado desde el original el 4 de octubre de 2008. Consultado el 13 de octubre de 2009 .{{cite web}}: CS1 maint: numeric names: authors list (link)
  36. ^ ETSI TS 101 154 v1.5.1: Especificación para el uso de codificación de video y audio en aplicaciones de transmisión basadas en el flujo de transporte MPEG-2
  37. ^ ETSI (31 de marzo de 2009). «TS 101 154 versión 1.9.1 - Transmisión de vídeo digital (DVB); Especificación para el uso de codificación de vídeo y audio en aplicaciones de transmisión basadas en el flujo de transporte MPEG-2». ETSI. Archivado desde el original el 14 de abril de 2013. Consultado el 13 de octubre de 2009 .
  38. ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 26 de octubre de 2006. Consultado el 29 de enero de 2007 .{{cite web}}: CS1 maint: archived copy as title (link)
  39. ^ "xHE-AAC". Instituto Fraunhofer de Circuitos Integrados IIS . Consultado el 3 de enero de 2021 .

Enlaces externos