stringtranslate.com

Codificación de audio avanzada

Advanced Audio Coding ( AAC ) es un estándar de codificación de audio para la compresión de audio digital con pérdida . Fue diseñado para ser el sucesor del formato MP3 y, en general, logra una mayor calidad de sonido que el MP3 a la misma velocidad de bits . [4]

AAC ha sido estandarizado por ISO e IEC como parte de las especificaciones MPEG-2 y MPEG-4 . [5] [6] Parte de AAC, HE-AAC ("AAC+"), es parte de MPEG-4 Audio y se adopta en los estándares de radio digital DAB+ y Digital Radio Mondiale , y los estándares de televisión móvil DVB-H y ATSC-M/H .

AAC admite la inclusión de 48 canales de audio de ancho de banda completo (hasta 96 kHz) en una secuencia más 16 canales de efectos de baja frecuencia ( LFE , limitados a 120 Hz), hasta 16 canales de "acoplamiento" o diálogo y hasta 16 secuencias de datos. La calidad para estéreo es satisfactoria para requisitos modestos a 96 kbit/s en modo estéreo conjunto ; sin embargo, la transparencia de alta fidelidad exige velocidades de datos de al menos 128 kbit/s ( VBR ). Las pruebas [ ¿cuáles? ] de audio MPEG-4 han demostrado que AAC cumple con los requisitos denominados "transparentes" para la UIT a 128 kbit/s para estéreo y 384 kbit/s para audio 5.1 . [7] AAC utiliza solo un algoritmo de transformada de coseno discreta modificada (MDCT), lo que le da una mayor eficiencia de compresión que MP3, que utiliza un algoritmo de codificación híbrido que es parte MDCT y parte FFT . [4]

AAC es el formato de audio predeterminado o estándar para iPhone , iPod , iPad , Nintendo DSi , Nintendo 3DS , Apple Music , [a] iTunes , DivX Plus Web Player , PlayStation 4 y varios teléfonos Nokia Series 40. Es compatible con una amplia gama de dispositivos y software como PlayStation Vita , Wii , reproductores de audio digitales como Sony Walkman o SanDisk Clip , dispositivos Android y BlackBerry , varios sistemas de audio en el tablero de instrumentos del automóvil, [ ¿cuándo? ] [ vago ] y también es uno de los formatos de audio utilizados en el reproductor web Spotify . [8]

Historia

Fondo

La transformada de coseno discreta (DCT), un tipo de codificación de transformada para compresión con pérdida , fue propuesta por Nasir Ahmed en 1972, y desarrollada por Ahmed con T. Natarajan y KR Rao en 1973, publicando sus resultados en 1974. [9] [10] [11] Esto condujo al desarrollo de la transformada de coseno discreta modificada (MDCT), propuesta por JP Princen, AW Johnson y AB Bradley en 1987, [12] siguiendo el trabajo anterior de Princen y Bradley en 1986. [13] El estándar de codificación de audio MP3 introducido en 1992 utilizó un algoritmo de codificación híbrido que es parte MDCT y parte FFT . [14] AAC utiliza un algoritmo puramente MDCT, lo que le da una mayor eficiencia de compresión que MP3. [4] El desarrollo avanzó aún más cuando Lars Liljeryd introdujo un método que redujo radicalmente la cantidad de información necesaria para almacenar la forma digitalizada de una canción o discurso. [15]

AAC fue desarrollado con la cooperación y contribuciones de empresas como Bell Labs , Fraunhofer IIS , Dolby Laboratories , LG Electronics , NEC , Panasonic , Sony Corporation , [1] ETRI , JVC Kenwood , Philips , Microsoft y NTT . [16] Fue declarado oficialmente estándar internacional por el Moving Picture Experts Group en abril de 1997. Se especifica tanto como Parte 7 del estándar MPEG-2 como Subparte 4 en la Parte 3 del estándar MPEG-4 . [17]

Normalización

En 1997, AAC se introdujo por primera vez como MPEG-2 Parte 7 , formalmente conocida como ISO / IEC 13818-7:1997 . Esta parte de MPEG-2 era una parte nueva, ya que MPEG-2 ya incluía MPEG-2 Parte 3 , formalmente conocida como ISO/IEC 13818-3: MPEG-2 BC (compatible con versiones anteriores). [18] [19] Por lo tanto, MPEG-2 Parte 7 también se conoce como MPEG-2 NBC (no compatible con versiones anteriores), porque no es compatible con los formatos de audio MPEG-1 ( MP1 , MP2 y MP3 ). [18] [20] [21] [22]

La Parte 7 del MPEG-2 definió tres perfiles: perfil de baja complejidad (AAC-LC/LC-AAC), perfil principal (AAC Main) y perfil de frecuencia de muestreo escalable (AAC-SSR). El perfil AAC-LC consta de un formato base muy parecido al formato de codificación PAC (Perceptual Audio Coding) de AT&T, [23] [24] [25] con la adición de modelado de ruido temporal (TNS), [26] la ventana Kaiser (descrita a continuación), un cuantificador no uniforme y una reelaboración del formato de flujo de bits para manejar hasta 16 canales estéreo, 16 canales mono, 16 canales de efecto de baja frecuencia (LFE) y 16 canales de comentarios en un flujo de bits. El perfil principal agrega un conjunto de predictores recursivos que se calculan en cada toma del banco de filtros. El SSR utiliza un banco de filtros PQMF de 4 bandas, con cuatro bancos de filtros más cortos a continuación, para permitir frecuencias de muestreo escalables.

En 1999, se actualizó la Parte 7 del MPEG-2 y se incluyó en la familia de estándares MPEG-4 y pasó a conocerse como MPEG-4 Parte 3 , MPEG-4 Audio o ISO/IEC 14496-3:1999 . Esta actualización incluyó varias mejoras. Una de estas mejoras fue la adición de tipos de objetos de audio que se utilizan para permitir la interoperabilidad con una amplia gama de otros formatos de audio como TwinVQ , CELP , HVXC , síntesis de voz y audio estructurado MPEG-4 . Otra adición notable en esta versión del estándar AAC es la sustitución de ruido perceptual (PNS). En ese sentido, los perfiles AAC (perfiles AAC-LC, AAC Main y AAC-SSR) se combinan con la sustitución de ruido perceptual y se definen en el estándar de audio MPEG-4 como tipos de objetos de audio. [27] Los tipos de objetos de audio MPEG-4 se combinan en cuatro perfiles de audio MPEG-4: principal (que incluye la mayoría de los tipos de objetos de audio MPEG-4), escalable (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, síntesis de tabla de ondas, TTSI), voz (CELP, HVXC, TTSI) y síntesis de baja velocidad (síntesis de tabla de ondas, TTSI). [27] [28]

El software de referencia para MPEG-4 Parte 3 se especifica en MPEG-4 Parte 5 y los flujos de bits de conformidad se especifican en MPEG-4 Parte 4. El audio MPEG-4 sigue siendo compatible con versiones anteriores de MPEG-2 Parte 7. [29]

La versión 2 de audio MPEG-4 (ISO/IEC 14496-3:1999/Amd 1:2000) definió nuevos tipos de objetos de audio: el tipo de objeto AAC de bajo retardo ( AAC-LD ), el tipo de objeto de codificación aritmética de bits (BSAC), la codificación de audio paramétrica utilizando versiones armónicas y de línea individual más ruido y resistentes a errores (ER) de los tipos de objetos. [30] [31] [32] También definió cuatro nuevos perfiles de audio: Perfil de audio de alta calidad, Perfil de audio de bajo retardo, Perfil de audio natural y Perfil de interconexión de audio móvil. [33]

El perfil HE-AAC (AAC LC con SBR ) y el perfil AAC (AAC LC) se estandarizaron por primera vez en ISO/IEC 14496-3:2001/Amd 1:2003. [34] El perfil HE-AAC v2 (AAC LC con SBR y estéreo paramétrico) se especificó por primera vez en ISO/IEC 14496-3:2005/Amd 2:2006. [35] [36] [37] El tipo de objeto de audio estéreo paramétrico utilizado en HE-AAC v2 se definió por primera vez en ISO/IEC 14496-3:2001/Amd 2:2004. [38] [39] [40]

La versión actual del estándar AAC está definida en ISO/IEC 14496-3:2009. [41]

AAC+ v2 también está estandarizado por ETSI ( Instituto Europeo de Normas de Telecomunicaciones ) como TS 102005. [38]

El estándar MPEG-4 Parte 3 también contiene otras formas de comprimir el sonido, entre ellas los formatos de compresión sin pérdida, el audio sintético y los formatos de compresión de baja tasa de bits que se utilizan generalmente para el habla.

Mejoras del AAC respecto al MP3

Advanced Audio Coding está diseñado para ser el sucesor del MPEG-1 Audio Layer 3 , conocido como formato MP3, que fue especificado por ISO / IEC en 11172-3 ( MPEG-1 Audio) y 13818-3 ( MPEG-2 Audio).

Las mejoras incluyen:

En general, el formato AAC permite a los desarrolladores una mayor flexibilidad para diseñar códecs que el MP3 y corrige muchas de las opciones de diseño adoptadas en la especificación de audio MPEG-1 original. Esta mayor flexibilidad suele conducir a estrategias de codificación más concurrentes y, como resultado, a una compresión más eficiente. Esto es especialmente cierto a velocidades de bits muy bajas, donde la codificación estéreo superior, la MDCT pura y los mejores tamaños de ventana de transformación hacen que el MP3 no pueda competir.

Si bien el formato MP3 tiene un soporte de hardware y software casi universal, principalmente porque MP3 fue el formato elegido durante los primeros años cruciales de intercambio y distribución generalizada de archivos de música a través de Internet, AAC es un fuerte contendiente debido a un apoyo inquebrantable de la industria. [42]

Funcionalidad

AAC es un algoritmo de codificación de audio de banda ancha que explota dos estrategias de codificación principales para reducir drásticamente la cantidad de datos necesarios para representar audio digital de alta calidad:

El proceso de codificación real consta de los siguientes pasos:

El estándar de audio MPEG-4 no define un conjunto único o pequeño de esquemas de compresión altamente eficientes, sino más bien una compleja caja de herramientas para realizar una amplia gama de operaciones, desde codificación de voz de baja tasa de bits hasta codificación de audio de alta calidad y síntesis de música.

Los codificadores AAC pueden cambiar dinámicamente entre un solo bloque MDCT de longitud de 1024 puntos u 8 bloques de 128 puntos (o entre 960 puntos y 120 puntos, respectivamente).

Codificación modular

AAC adopta un enfoque modular para la codificación. Según la complejidad del flujo de bits que se va a codificar, el rendimiento deseado y el resultado aceptable, los implementadores pueden crear perfiles para definir cuál de un conjunto específico de herramientas desean utilizar para una aplicación en particular.

El estándar MPEG-2 Parte 7 (codificación de audio avanzada) se publicó por primera vez en 1997 y ofrece tres perfiles predeterminados: [2] [44]

El estándar MPEG-4 Parte 3 (MPEG-4 Audio) definió varias herramientas de compresión nuevas (también conocidas como tipos de objetos de audio ) y su uso en perfiles completamente nuevos. AAC no se utiliza en algunos de los perfiles de audio MPEG-4. El perfil AAC LC, el perfil AAC Main y el perfil AAC SSR de MPEG-2 Parte 7 se combinan con la sustitución de ruido perceptual y se definen en el estándar de audio MPEG-4 como tipos de objetos de audio (bajo el nombre AAC LC, AAC Main y AAC SSR). Estos se combinan con otros tipos de objetos en los perfiles de audio MPEG-4. [27] A continuación se muestra una lista de algunos perfiles de audio definidos en el estándar MPEG-4: [35] [45]

Una de las muchas mejoras en el audio MPEG-4 es un tipo de objeto llamado predicción a largo plazo (LTP), que es una mejora del perfil principal que utiliza un predictor directo con menor complejidad computacional. [29]

Kit de herramientas de protección contra errores de AAC

La aplicación de protección contra errores permite la corrección de errores hasta cierto punto. Los códigos de corrección de errores suelen aplicarse por igual a toda la carga útil. Sin embargo, dado que las distintas partes de una carga útil AAC muestran una sensibilidad diferente a los errores de transmisión, este no sería un enfoque muy eficiente.

La carga útil AAC se puede subdividir en partes con diferentes sensibilidades de error.

CAA resistente a errores (ER)

Se pueden utilizar técnicas de resiliencia ante errores (ER) para hacer que el esquema de codificación sea más robusto frente a los errores.

Para AAC, se desarrollaron y definieron tres métodos personalizados en MPEG-4 Audio

Retardo bajo de AAC

Los estándares de codificación de audio MPEG-4 Low Delay ( AAC-LD ), Enhanced Low Delay (AAC-ELD) y Enhanced Low Delay v2 (AAC-ELDv2), tal como se definen en ISO/IEC 14496-3:2009 e ISO/IEC 14496-3:2009/Amd 3, están diseñados para combinar las ventajas de la codificación de audio perceptual con el bajo retardo necesario para la comunicación bidireccional. Se derivan estrechamente del formato de codificación de audio avanzada (AAC) MPEG-2. [47] [48] [49] GSMA recomienda AAC-ELD como códec de voz de banda superancha en el perfil IMS para el servicio de videoconferencia de alta definición (HDVC). [50]

Licencias y patentes

No se requieren licencias ni pagos para que un usuario transmita o distribuya audio en formato AAC. [51] Esta razón por sí sola podría haber hecho que AAC sea un formato más atractivo para distribuir audio que su predecesor MP3, particularmente para la transmisión de audio (como la radio por Internet) dependiendo del caso de uso.

Sin embargo, se requiere una licencia de patente para todos los fabricantes o desarrolladores de códecs AAC "para usuarios finales" . [52] Los términos (según lo revelado a la SEC) utilizan precios por unidad. En el caso del software, cada computadora que ejecuta el software debe considerarse una "unidad" separada. [53]

Solía ​​ser común que las implementaciones de software libre y de código abierto como FFmpeg y FAAC solo se distribuyeran en forma de código fuente para no "suministrar de otra manera" un códec AAC. Sin embargo, desde entonces FFmpeg se ha vuelto más indulgente con los asuntos de patentes: las compilaciones "gyan.dev" recomendadas por el sitio oficial ahora contienen su códec AAC, y la página legal de FFmpeg establece que el cumplimiento de la ley de patentes es responsabilidad del usuario. [54] (Consulte a continuación Productos que admiten AAC, Software). El Proyecto Fedora , una comunidad respaldada por Red Hat , ha importado la "Versión modificada de terceros de la biblioteca de códecs AAC Fraunhofer FDK para Android" a sus repositorios el 25 de septiembre de 2018, [55] y ha habilitado el codificador y decodificador AAC nativo de FFmpeg para su paquete ffmpeg-free el 31 de enero de 2023. [56]

Los titulares de patentes de AAC incluyen a Bell Labs , Dolby , ETRI , Fraunhofer , JVC Kenwood , LG Electronics , Microsoft , NEC , NTT (y su subsidiaria NTT Docomo ), Panasonic , Philips y Sony Corporation . [16] [1] Según la lista de patentes de los términos de la SEC, la última patente de AAC de referencia expira en 2028, y la última patente para todas las extensiones de AAC mencionadas expira en 2031. [57]

Extensiones y mejoras

Se han añadido algunas extensiones al primer estándar AAC (definido en MPEG-2 Parte 7 en 1997):

Formatos de contenedores

Además de MP4 , 3GP y otros formatos de contenedor basados ​​en el formato de archivo de medios base ISO para almacenamiento de archivos, los datos de audio AAC se empaquetaron primero en un archivo para el estándar MPEG-2 utilizando el Formato de Intercambio de Datos de Audio (ADIF), [62] que consiste en un solo encabezado seguido de los bloques de datos de audio AAC sin procesar. [63] Sin embargo, si los datos se van a transmitir dentro de un flujo de transporte MPEG-2, se utiliza un formato de autosincronización llamado Flujo de Transporte de Datos de Audio ( ADTS ), que consiste en una serie de cuadros, cada cuadro con un encabezado seguido de los datos de audio AAC. [62] Este archivo y formato basado en transmisión se definen en MPEG-2 Parte 7 , pero solo se consideran informativos por MPEG-4, por lo que un decodificador MPEG-4 no necesita soportar ninguno de los formatos. [62] Estos contenedores, así como un flujo AAC sin procesar, pueden tener la extensión de archivo .aac. La Parte 3 del MPEG-4 también define su propio formato de sincronización automática llamado Low Overhead Audio Stream (LOAS) que encapsula no solo AAC, sino también cualquier esquema de compresión de audio MPEG-4 como TwinVQ y ALS . Este formato es el que se definió para su uso en flujos de transporte DVB cuando los codificadores usan extensiones SBR o AAC estéreo paramétrico . Sin embargo, está restringido a un solo flujo AAC no multiplexado. Este formato también se conoce como Low Overhead Audio Transport Multiplex (LATM), que es simplemente una versión de flujo múltiple intercalado de un LOAS. [62]

Productos que admiten CAA

Estándares de HDTV

ISDB-T japonés

En diciembre de 2003, Japón comenzó a transmitir la norma DTV terrestre ISDB-T , que implementa video MPEG-2 y audio MPEG-2 AAC. En abril de 2006, Japón comenzó a transmitir el subprograma móvil ISDB-T, llamado 1seg, que fue la primera implementación de video H.264/AVC con audio HE-AAC en el servicio de transmisión de HDTV terrestre del planeta.

ISDB-Tb internacional

En diciembre de 2007, Brasil inició la transmisión del estándar DTV terrestre llamado ISDB-Tb internacional que implementa codificación de video H.264/AVC con audio AAC-LC en el programa principal (simple o múltiple) y video H.264/AVC con audio HE-AACv2 en el subprograma móvil 1seg.

DVB

El ETSI , el organismo que rige los estándares para la suite DVB , admite la codificación de audio AAC, HE-AAC y HE-AAC v2 en aplicaciones DVB desde al menos 2004. [64] Las transmisiones DVB que utilizan la compresión H.264 para video normalmente utilizan HE-AAC para audio. [ cita requerida ]

Hardware

iTunes y iPod

En abril de 2003, Apple atrajo la atención del público general sobre el formato AAC al anunciar que sus productos iTunes e iPod admitirían canciones en formato MPEG-4 AAC (a través de una actualización de firmware para iPods más antiguos). Los clientes podían descargar música en un formato AAC de 128 kbit/s restringido a la gestión de derechos digitales (DRM) de código cerrado (véase FairPlay ) a través de iTunes Store o crear archivos sin DRM a partir de sus propios CD utilizando iTunes. En años posteriores, Apple comenzó a ofrecer videos musicales y películas, que también utilizan AAC para la codificación de audio.

El 29 de mayo de 2007, Apple comenzó a vender canciones y vídeos musicales de las discográficas participantes a una tasa de bits más alta (256 kbit/s cVBR) y sin DRM, un formato denominado "iTunes Plus". Estos archivos en su mayoría se adhieren al estándar AAC y se pueden reproducir en muchos productos que no son de Apple, pero incluyen información personalizada de iTunes, como la carátula del álbum y un recibo de compra, para identificar al cliente en caso de que el archivo se filtre en redes peer-to-peer . Sin embargo, es posible eliminar estas etiquetas personalizadas para restablecer la interoperabilidad con reproductores que se ajusten estrictamente a la especificación AAC. A partir del 6 de enero de 2009, casi toda la música en la iTunes Store de la región de EE. UU. pasó a estar libre de DRM, y el resto pasó a estar libre de DRM a fines de marzo de 2009. [65]

iTunes ofrece una opción de codificación de "velocidad de bits variable" que codifica pistas AAC en el esquema de velocidad de bits variable restringida (una variante menos estricta de la codificación ABR); sin embargo, la API QuickTime subyacente ofrece un verdadero perfil de codificación VBR. [66]

A partir de septiembre de 2009, Apple agregó soporte para HE-AAC (que es parte integral del estándar MP4) sólo para transmisiones de radio, no para reproducción de archivos, e iTunes aún carece de soporte para codificación VBR real.

Otros reproductores portátiles

Teléfonos móviles

Durante varios años, muchos teléfonos móviles de fabricantes como Nokia , Motorola , Samsung , Sony Ericsson , BenQ-Siemens y Philips han sido compatibles con la reproducción de AAC. El primer teléfono de este tipo fue el Nokia 5510 lanzado en 2002, que también reproduce MP3. Sin embargo, este teléfono fue un fracaso comercial [ cita requerida ] y estos teléfonos con reproductores de música integrados no ganaron popularidad hasta 2005, cuando continuó la tendencia de tener compatibilidad con AAC y MP3. La mayoría de los nuevos teléfonos inteligentes y teléfonos con temas musicales admiten la reproducción de estos formatos.

Otros dispositivos

Software

Casi todos los reproductores multimedia actuales incluyen decodificadores integrados para AAC o pueden utilizar una biblioteca para decodificarlo. En Microsoft Windows , DirectShow se puede utilizar de esta manera con los filtros correspondientes para habilitar la reproducción de AAC en cualquier reproductor basado en DirectShow . Mac OS X admite AAC a través de las bibliotecas QuickTime .

Adobe Flash Player , desde la versión 9 actualización 3, también puede reproducir secuencias AAC. [72] [73] Dado que Flash Player también es un complemento del navegador, también puede reproducir archivos AAC a través de un navegador.

El firmware de código abierto de Rockbox (disponible para varios reproductores portátiles) también ofrece soporte para AAC en distintos grados, dependiendo del modelo de reproductor y del perfil AAC.

El soporte opcional para iPod (reproducción de archivos AAC sin protección) para Xbox 360 está disponible como descarga gratuita desde Xbox Live . [74]

La siguiente es una lista no exhaustiva de otras aplicaciones de reproducción de software:

Algunos de estos reproductores (por ejemplo, foobar2000, Winamp y VLC) también admiten la decodificación de ADTS (Audio Data Transport Stream) mediante el protocolo SHOUTcast . Los complementos para Winamp y foobar2000 permiten la creación de dichas transmisiones.

Audio digital Nero

En mayo de 2006, Nero AG lanzó una herramienta de codificación AAC gratuita, Nero Digital Audio (la parte del códec AAC se ha convertido en Nero AAC Codec ), [75] que es capaz de codificar transmisiones LC-AAC, HE-AAC y HE-AAC v2. La herramienta es solo una herramienta de interfaz de línea de comandos. También se incluye una utilidad independiente para decodificar a PCM WAV .

Varias herramientas, incluido el reproductor de audio foobar2000 y MediaCoder, pueden proporcionar una GUI para este codificador.

FAAC y FAAD2

FAAC y FAAD2 son las siglas de Freeware Advanced Audio Coder y Decoder 2 respectivamente. FAAC admite los tipos de objetos de audio LC, Main y LTP. [76] FAAD2 admite los tipos de objetos de audio LC, Main, LTP, SBR y PS. [77] Aunque FAAD2 es software libre , FAAC no es software libre.

Instituto Fraunhofer FDK AAC

Un codificador/decodificador de código abierto creado por Fraunhofer incluido en Android se ha portado a otras plataformas. El codificador AAC nativo de FFmpeg no es compatible con HE-AAC y HE-AACv2, pero la GPL 2.0+ de ffmpeg no es compatible con FDK AAC, por lo que ffmpeg con libfdk-aac no es redistribuible. El codificador QAAC que utiliza Core Media Audio de Apple sigue siendo de mayor calidad que FDK.

FFmpeg y Libav

El codificador AAC nativo creado en libavcodec de FFmpeg y bifurcado con Libav se consideró experimental y deficiente. Se realizó una cantidad significativa de trabajo para la versión 3.0 de FFmpeg (febrero de 2016) para hacer que su versión fuera utilizable y competitiva con el resto de los codificadores AAC. [78] Libav no ha fusionado este trabajo y continúa utilizando la versión anterior del codificador AAC. Estos codificadores tienen licencia LGPL de código abierto y se pueden crear para cualquier plataforma en la que se puedan crear los marcos FFmpeg o Libav.

Tanto FFmpeg como Libav pueden utilizar la biblioteca Fraunhofer FDK AAC a través de libfdk-aac, y aunque el codificador nativo de FFmpeg se ha vuelto estable y lo suficientemente bueno para el uso común, FDK todavía se considera el codificador de mayor calidad disponible para usar con FFmpeg. [79] Libav también recomienda usar FDK AAC si está disponible. [80] FFmpeg 4.4 y superiores también pueden usar el codificador audiotoolbox de Apple. [79]

Aunque el codificador AAC nativo solo produce AAC-LC, el decodificador nativo de ffmpeg puede manejar una amplia gama de formatos de entrada.

Véase también

Notas

  1. ^ solo se usa en el reproductor web, Google Home , Amazon Alexa y la aplicación de Microsoft Windows .

Referencias

  1. ^ abc "Via Licensing anuncia la actualización de la licencia de patente conjunta de AAC". Business Wire . 5 de enero de 2009 . Consultado el 18 de junio de 2019 .
  2. ^ ab ISO (1997). «ISO/IEC 13818-7:1997, Tecnología de la información — Codificación genérica de imágenes en movimiento e información de audio asociada — Parte 7: Codificación de audio avanzada (AAC)». Archivado desde el original el 25 de septiembre de 2012. Consultado el 18 de julio de 2010 .
  3. ^ Advanced Audio Coding (MPEG-4) (borrador completo). Sustainability of Digital Formats (Sostenibilidad de los formatos digitales). Washington, DC: Biblioteca del Congreso. 22 de junio de 2010. Consultado el 1 de diciembre de 2021 .
  4. ^ abc Brandenburg, Karlheinz (1999). "MP3 y AAC explicados" (PDF) . Archivado desde el original (PDF) el 13 de febrero de 2017.
  5. ^ ISO (2006) ISO/IEC 13818-7:2006 – Tecnología de la información — Codificación genérica de imágenes en movimiento e información de audio asociada — Parte 7: Codificación de audio avanzada (AAC) Archivado el 3 de marzo de 2016 en Wayback Machine , consultado el 6 de agosto de 2009
  6. ^ ISO (2006) ISO/IEC 14496-3:2005 – Tecnología de la información — Codificación de objetos audiovisuales — Parte 3: Audio Archivado el 13 de abril de 2016 en Wayback Machine , consultado el 6 de agosto de 2009
  7. ^ "La familia de codificación de audio AAC para televisión por cable y de transmisión" (PDF) . 2013. p. 6. Archivado desde el original (PDF) el 28 de septiembre de 2023. Consultado el 29 de enero de 2024 .
  8. ^ "Formatos de archivos de audio para Spotify". Spotify . Consultado el 20 de septiembre de 2021 .
  9. ^ Ahmed, Nasir (enero de 1991). "Cómo se me ocurrió la transformada discreta del coseno". Procesamiento de señales digitales . 1 (1): 4–5. Bibcode :1991DSP.....1....4A. doi :10.1016/1051-2004(91)90086-Z.
  10. ^ Ahmed, Nasir ; Natarajan, T.; Rao, KR (enero de 1974), "Transformada discreta del coseno", IEEE Transactions on Computers , C-23 (1): 90–93, doi :10.1109/TC.1974.223784, S2CID  149806273
  11. ^ Rao, KR ; Yip, P. (1990), Transformada discreta del coseno: algoritmos, ventajas, aplicaciones , Boston: Academic Press, ISBN 978-0-12-580203-1
  12. ^ JP Princen, AW Johnson y AB Bradley: Codificación de subbanda/transformación utilizando diseños de bancos de filtros basados ​​en la cancelación de aliasing en el dominio del tiempo , IEEE Proc. Conferencia internacional sobre acústica, habla y procesamiento de señales (ICASSP), 2161–2164, 1987
  13. ^ John P. Princen, Alan B. Bradley: Diseño de un banco de filtros de análisis/síntesis basado en la cancelación de aliasing en el dominio del tiempo , IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986
  14. ^ Guckert, John (primavera de 2012). "El uso de FFT y MDCT en la compresión de audio MP3" (PDF) . Universidad de Utah . Consultado el 14 de julio de 2019 .
  15. ^ Borland, John (18 de marzo de 2004). "El sonido de la ciencia". CNET . Consultado el 21 de abril de 2023 .
  16. ^ ab "Licenciantes de AAC". Vía Corp. Recuperado el 15 de enero de 2020 .
  17. ^ ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio (PDF) (Informe técnico). ISO / IEC . 1 de septiembre de 2009. Archivado (PDF) desde el original el 14 de junio de 2011 . Consultado el 7 de octubre de 2009 .
  18. ^ ab "AAC". MPEG.ORG . Archivado desde el original el 3 de octubre de 2009 . Consultado el 28 de octubre de 2009 .
  19. ^ "ISO/IEC 13818-7, Cuarta edición, Parte 7 - Codificación de audio avanzada (AAC)" (PDF) . ISO . 15 de enero de 2006. Archivado (PDF) desde el original el 6 de marzo de 2009 . Consultado el 28 de octubre de 2009 .
  20. ^ Bouvigne, Gabriel (2003). «MPEG-2/MPEG-4 - AAC». MP3'Tech. Archivado desde el original el 5 de enero de 2010. Consultado el 28 de octubre de 2009 .
  21. ^ "Preguntas frecuentes sobre audio MPEG versión 9: MPEG-1 y MPEG-2 BC". ISO . Octubre de 1998. Archivado desde el original el 18 de febrero de 2010 . Consultado el 28 de octubre de 2009 .
  22. ^ "Nota de prensa de Florencia". ISO . Marzo de 1996. Archivado desde el original el 8 de abril de 2010 . Consultado el 28 de octubre de 2009 .
  23. ^ Johnston, JD y Ferreira, AJ, "Codificación de transformada estéreo suma-diferencia", ICASSP '92, marzo de 1992, págs. II-569-572.
  24. ^ Sinha, D. y Johnston, JD, "Compresión de audio a bajas velocidades de bits utilizando un banco de filtros conmutados adaptativos de señal", IEEE ASSP, 1996, págs. 1053-1057.
  25. ^ Johnston, JD, Sinha, D., Dorward, S. y Quackenbush, S., "Codificador de audio perceptivo (PAC) de AT&T" en Documentos recopilados sobre reducción de velocidad de bits de audio digital, Gilchrist, N. y Grewin, C. (Ed.), Audio Engineering Society, 1996.
  26. ^ Herre, J. y Johnston, JD, "Mejora del rendimiento de los codificadores de audio perceptuales mediante el uso de modelado de ruido temporal", AES 101st Convention, n.º preimpresión 4384, 1996
  27. ^ abc Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko. "Codificación de audio natural MPEG-4: perfiles y niveles de audio". chiariglione.org . Archivado desde el original el 17 de julio de 2010. Consultado el 6 de octubre de 2009 .
  28. ^ "ISO/IEC FCD 14496-3 Subparte 1 - Borrador - N2203" (PDF) . ISO / IEC JTC 1/SC 29/WG 11. 15 de mayo de 1998 . Consultado el 7 de octubre de 2009 .
  29. ^ abc Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko (1999). "Codificación de audio natural MPEG-4 - Codificación de audio general (basada en AAC)". chiariglione.org . Archivado desde el original el 19 de febrero de 2010 . Consultado el 6 de octubre de 2009 .
  30. ^ "ISO/IEC 14496-3:1999/Amd 1:2000 - Extensiones de audio". ISO . 2000. Archivado desde el original el 2011-06-06 . Consultado el 2009-10-07 .
  31. ^ "ISO/IEC 14496-3:/Amd.1 - Borrador final del comité - MPEG-4 Audio versión 2" (PDF) . ISO / IEC JTC 1/SC 29/WG 11. Julio de 1999. Archivado desde el original (PDF) el 2012-08-01 . Consultado el 2009-10-07 .
  32. ^ Purnhagen, Heiko (19 de febrero de 2000). "Taller de audio MPEG-4 versión 2: HILN - Codificación de audio paramétrica" ​​(PDF) . París. 108.ª Convención de la AES: ¿De qué se trata el audio MPEG-4 versión 2? . Consultado el 7 de octubre de 2009 .
  33. ^ Pereira, Fernando (octubre de 2001). "Niveles para perfiles de audio". Foro de la industria MPEG. Archivado desde el original el 8 de enero de 2010. Consultado el 15 de octubre de 2009 .
  34. ^ "ISO/IEC 14496-3:2001/Amd 1:2003 - Extensión del ancho de banda". ISO . 2003. Archivado desde el original el 2011-06-06 . Consultado el 2009-10-07 .
  35. ^ ab "Texto de ISO/IEC 14496-3:2001/FPDAM 4, Audio Lossless Coding (ALS), nuevos perfiles de audio y extensiones BSAC". ISO / IEC JTC1/SC29/WG11/N7016. 11 de enero de 2005. Archivado desde el original (DOC) el 12 de mayo de 2014. Consultado el 9 de octubre de 2009 .
  36. ^ "Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC, ISO/IEC 14496-3:2005/Amd 2:2006". ISO . 2006. Archivado desde el original el 4 de enero de 2012 . Consultado el 13 de octubre de 2009 .
  37. ^ Mody, Mihir (6 de junio de 2005). «La compresión de audio mejora y se vuelve más compleja». Embedded.com . Archivado desde el original el 8 de febrero de 2016. Consultado el 13 de octubre de 2009 .
  38. ^ ab "MPEG-4 aacPlus - Codificación de audio para el mundo de los medios digitales de hoy" (PDF) . Archivado desde el original (PDF) el 26 de octubre de 2006 . Consultado el 29 de enero de 2007 .
  39. ^ "Codificación paramétrica para audio de alta calidad, ISO/IEC 14496-3:2001/Amd 2:2004". ISO . 2004. Archivado desde el original el 4 de enero de 2012 . Consultado el 13 de octubre de 2009 .
  40. ^ "3GPP TS 26.401 V6.0.0 (2004-09), Funciones de procesamiento de audio del códec de audio general; Códec de audio general aacPlus mejorado; Descripción general (versión 6)" (DOC) . 3GPP. 30 de septiembre de 2004. Archivado desde el original el 19 de agosto de 2006. Consultado el 13 de octubre de 2009 .
  41. ^ "ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". ISO . 2009. Archivado desde el original el 2011-06-06 . Consultado el 2009-10-07 .
  42. ^ "AAC". Hydrogenaudio. Archivado desde el original el 6 de julio de 2014. Consultado el 24 de enero de 2011 .
  43. ^ Solicitud de patente de EE. UU. 20070297624 Codificación de audio digital
  44. ^ "ISO/IEC 13818-7, Tercera edición, Parte 7 - Codificación de audio avanzada (AAC)" (PDF) . ISO . 15 de octubre de 2004. p. 32. Archivado desde el original (PDF) el 13 de julio de 2011 . Consultado el 19 de octubre de 2009 .
  45. ^ Grill, Bernhard; Geyersberger, Stefan; Hilpert, Johannes; Teichmann, Bodo (julio de 2004). Implementation of MPEG-4 Audio Components on various Platforms (PDF) (Implementación de componentes de audio MPEG-4 en varias plataformas) (PDF) . 109.ª Convención AES de 2000, 22-25 de septiembre de 2000, Los Ángeles. Fraunhofer Gesellschaft. Archivado desde el original (PDF) el 2007-06-10 . Consultado el 2009-10-09 .
  46. ^ "ISO/IEC 14496-3:2009/Amd 3:2012 - Transporte de codificación unificada de voz y audio (USAC)". ISO . Archivado desde el original el 8 de marzo de 2016 . Consultado el 3 de agosto de 2016 .
  47. ^ "ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". ISO . Archivado desde el original el 2016-05-20 . Consultado el 2016-08-02 .
  48. ^ "ISO/IEC 14496-3:2009/Amd 3:2012 - Transporte de codificación unificada de voz y audio (USAC)". ISO . Archivado desde el original el 19 de agosto de 2016 . Consultado el 2 de agosto de 2016 .
  49. ^ "La familia AAC-ELD para servicios de comunicación de alta calidad | MPEG". mpeg.chiariglione.org . Archivado desde el original el 20 de agosto de 2016 . Consultado el 2 de agosto de 2016 .
  50. ^ Perfil IMS para el servicio de videoconferencia de alta definición (HDVC) (PDF) . GSMA. 24 de mayo de 2016. pág. 10. Archivado (PDF) del original el 18 de agosto de 2016.
  51. ^ "Preguntas frecuentes sobre licencias de AAC, pregunta 5". Vía Licencias . Consultado el 15 de enero de 2020 .
  52. ^ "Tarifas de licencias de AAC". Vía Licencias . Consultado el 15 de enero de 2020 .
  53. ^ Vía Licensing Corporation (5 de junio de 2018). "ACUERDO DE LICENCIA DE PATENTE AAC". www.sec.gov . Consultado el 21 de abril de 2023 .
  54. ^ "Licencia de FFmpeg y consideraciones legales". ffmpeg.org .
  55. ^ "Confirmación - rpms/fdk-aac-free - b27d53fbad872ea0ec103653fddaec83238132d9 - src.fedoraproject.org". src.fedoraproject.org .
  56. ^ "Confirmación - rpms/ffmpeg - 45f894ec0e43a37775393c159021a4ac60170a55 - src.fedoraproject.org". src.fedoraproject.org .
  57. ^ "Lista de patentes relacionadas con AAC". hydrogenaud.io .
  58. ^ Thom, D.; Purnhagen, H. (octubre de 1998). "Preguntas frecuentes sobre audio MPEG versión 9 - MPEG-4". chiariglione.org . Subgrupo de audio MPEG. Archivado desde el original el 14 de febrero de 2010 . Consultado el 6 de octubre de 2009 .
  59. ^ "El programa de marca registrada xHE-AAC". Instituto Fraunhofer de Circuitos Integrados IIS . Consultado el 11 de febrero de 2021 .
  60. ^ "El software de códec de audio xHE-AAC de Fraunhofer amplía la compatibilidad nativa con AAC en Android P para lograr una mejor calidad a bajas tasas de bits". Instituto Fraunhofer de Circuitos Integrados IIS . Consultado el 11 de julio de 2020 .
  61. ^ "ISO/IEC 14496-3:2019". ISO . Consultado el 19 de febrero de 2022 .
  62. ^ abcd Wolters, Martin; Kjorling, Kristofer; Homm, Daniel; Purnhagen, Heiko. Una mirada más cercana al formato MPEG-4 High Efficiency AAC (PDF) . p. 3. Archivado desde el original (PDF) el 2003-12-19 . Consultado el 2008-07-31 .Presentado en la 115ª Convención de la Audio Engineering Society, del 10 al 13 de octubre de 2003.
  63. ^ "Codificación avanzada de audio (MPEG-2), formato de intercambio de datos de audio". Biblioteca del Congreso / Programa Nacional de Preservación e Infraestructura de Información Digital. 7 de marzo de 2007. Archivado desde el original el 30 de julio de 2008. Consultado el 31 de julio de 2008 .
  64. ^ ETSI TS 101 154 v1.5.1: Especificación para el uso de codificación de video y audio en aplicaciones de transmisión basadas en el flujo de transporte MPEG
  65. ^ Cohen, Peter (27 de mayo de 2010). «iTunes Store ya no utiliza DRM». Macworld . Mac Publishing. Archivado desde el original el 18 de febrero de 2009 . Consultado el 10 de febrero de 2009 .
  66. ^ "Apple AAC". Hydrogenaudio . Archivado desde el original el 2021-11-23 . Consultado el 2021-11-22 .
  67. ^ "Gingerbread - Desarrolladores de Android". Desarrolladores de Android . Archivado desde el original el 29 de diciembre de 2017. Consultado el 8 de mayo de 2018 .
  68. ^ "Formatos multimedia admitidos - Desarrolladores de Android". Desarrolladores de Android . Archivado desde el original el 11 de marzo de 2012. Consultado el 8 de mayo de 2018 .
  69. ^ "Palm Pre Phone / Características, detalles". Palm USA . Archivado desde el original el 24 de mayo de 2011.
  70. ^ "Nintendo - Atención al cliente - Wii - Canal Fotos". nintendo.com . Archivado desde el original el 5 de mayo de 2017 . Consultado el 8 de mayo de 2018 .
  71. ^ "Medios compatibles con Google Cast". Archivado desde el original el 23 de septiembre de 2015. Consultado el 22 de septiembre de 2015 .| Medios compatibles con Google Cast
  72. ^ "Estadísticas - Tiempos de ejecución de Adobe Flash". www.adobe.com . Archivado desde el original el 2 de octubre de 2011. Consultado el 8 de mayo de 2018 .
  73. ^ "Adobe presenta Flash Player 9 con compatibilidad con vídeo H.264". Nota de prensa de Adobe . 2007-12-04. Archivado desde el original el 2014-08-21 . Consultado el 2014-08-20 .
  74. ^ "Xbox.com | Uso del sistema: Cómo utilizar un iPod de Apple con Xbox 360". Archivado desde el original el 8 de abril de 2007.
  75. ^ "Nero Platinum 2018 Suite: un galardonado todoterreno". Nero AG . Archivado desde el original el 14 de diciembre de 2012. Consultado el 8 de mayo de 2018 .
  76. ^ "FAAC". AudioCoding.com . Archivado desde el original el 2009-12-11 . Consultado el 2009-11-03 .
  77. ^ "FAAD2". AudioCoding.com . Archivado desde el original el 2009-12-11 . Consultado el 2009-11-03 .
  78. ^ "5 de diciembre de 2015, ¡El codificador nativo de AAC FFmpeg ahora es estable!". ffmpeg.org . Archivado desde el original el 16 de julio de 2016. Consultado el 26 de junio de 2016 .
  79. ^ ab "Guía de codificación AAC de FFmpeg". Archivado desde el original el 17 de abril de 2016. Consultado el 11 de abril de 2016. ¿Qué codificador ofrece la mejor calidad? ... la respuesta probable es: libfdk_aac
  80. ^ "Libav Wiki - Codificación de AAC". Archivado desde el original el 20 de abril de 2016. Consultado el 11 de abril de 2016 .

Enlaces externos