stringtranslate.com

Codificación de audio avanzada

La codificación de audio avanzada ( AAC ) es un estándar de codificación de audio para la compresión de audio digital con pérdida . Fue diseñado para ser el sucesor del formato MP3 y generalmente logra una calidad de sonido mayor que el MP3 con la misma velocidad de bits . [4]

AAC ha sido estandarizado por ISO e IEC como parte de las especificaciones MPEG-2 y MPEG-4 . [5] [6] Parte de AAC, HE-AAC ("AAC+"), es parte de MPEG-4 Audio y se adopta en los estándares de radio digital DAB+ y Digital Radio Mondiale , y en los estándares de televisión móvil DVB-H y ATSC-M. /H .

AAC admite la inclusión de 48 canales de audio de ancho de banda completo (hasta 96 kHz) en una secuencia más 16 canales de efectos de baja frecuencia ( LFE , limitados a 120 Hz), hasta 16 canales de "acoplamiento" o diálogo y hasta 16 secuencias de datos. . La calidad en estéreo es satisfactoria para requisitos modestos a 96 kbit/s en modo estéreo conjunto ; sin embargo, la transparencia de alta fidelidad exige velocidades de datos de al menos 128 kbit/s ( VBR ). Pruebas [ ¿cuáles? ] de audio MPEG-4 han demostrado que AAC cumple con los requisitos denominados "transparentes" por la UIT a 128 kbit/s para estéreo y 384 kbit/s para audio 5.1 . [7] AAC utiliza sólo un algoritmo de transformación de coseno discreto modificado (MDCT), lo que le otorga una mayor eficiencia de compresión que MP3, que utiliza un algoritmo de codificación híbrido que es en parte MDCT y en parte FFT . [4]

AAC es el formato de audio predeterminado o estándar para iPhone , iPod , iPad , Nintendo DSi , Nintendo 3DS , Apple Music , [a] iTunes , DivX Plus Web Player , PlayStation 4 y varios teléfonos Nokia Serie 40 . Es compatible con una amplia gama de dispositivos y software como PlayStation Vita , Wii , reproductores de audio digital como Sony Walkman o SanDisk Clip , dispositivos Android y BlackBerry , varios sistemas de audio para automóviles integrados en el tablero, [ ¿cuándo? ] [ vago ] y también es uno de los formatos de audio utilizados en el reproductor web de Spotify . [8]

Historia

Fondo

La transformada de coseno discreta (DCT), un tipo de codificación de transformada para compresión con pérdidas , fue propuesta por Nasir Ahmed en 1972 y desarrollada por Ahmed con T. Natarajan y KR Rao en 1973, publicando sus resultados en 1974. [9] [10 ] [11] Esto llevó al desarrollo de la transformada de coseno discreta modificada (MDCT), propuesta por JP Princen, AW Johnson y AB Bradley en 1987, [12] siguiendo trabajos anteriores de Princen y Bradley en 1986. [13] El MP3 El estándar de codificación de audio introducido en 1994 utilizaba un algoritmo de codificación híbrido que es en parte MDCT y en parte FFT . [14] AAC utiliza un algoritmo puramente MDCT, lo que le otorga una mayor eficiencia de compresión que MP3. [4] El desarrollo avanzó aún más cuando Lars Liljeryd introdujo un método que redujo radicalmente la cantidad de información necesaria para almacenar la forma digitalizada de una canción o un discurso. [15]

AAC se desarrolló con la cooperación y contribuciones de empresas como Bell Labs , Fraunhofer IIS , Dolby Laboratories , LG Electronics , NEC , Panasonic , Sony Corporation , [1] ETRI , JVC Kenwood , Philips , Microsoft y NTT . [16] Fue declarado oficialmente estándar internacional por el Grupo de Expertos en Imágenes en Movimiento en abril de 1997. Se especifica como Parte 7 del estándar MPEG-2 y Subparte 4 en la Parte 3 del estándar MPEG-4 . [17]

Estandarización

En 1997, AAC se introdujo por primera vez como MPEG-2 Parte 7 , conocido formalmente como ISO / IEC 13818-7:1997 . Esta parte de MPEG-2 era una parte nueva, ya que MPEG-2 ya incluía MPEG-2 Parte 3 , formalmente conocido como ISO/IEC 13818-3: MPEG-2 BC (compatible con versiones anteriores). [18] [19] Por lo tanto, MPEG-2 Parte 7 también se conoce como MPEG-2 NBC (No compatible con versiones anteriores), porque no es compatible con los formatos de audio MPEG-1 ( MP1 , MP2 y MP3 ). [18] [20] [21] [22]

MPEG-2 Parte 7 definió tres perfiles: perfil de baja complejidad (AAC-LC / LC-AAC), perfil principal (AAC Main) y perfil de frecuencia de muestreo escalable (AAC-SSR). El perfil AAC-LC consta de un formato base muy parecido al formato de codificación Perceptual Audio Coding (PAC) de AT&T, [23] [24] [25] con la adición de modelado de ruido temporal (TNS), [26] la ventana Kaiser (descrita a continuación), un cuantificador no uniforme y una reelaboración del formato de flujo de bits para manejar hasta 16 canales estéreo, 16 canales mono, 16 canales de efectos de baja frecuencia (LFE) y 16 canales de comentarios en un flujo de bits. El perfil Principal agrega un conjunto de predictores recursivos que se calculan en cada toque del banco de filtros. El SSR utiliza un banco de filtros PQMF de 4 bandas, seguido de cuatro bancos de filtros más cortos, para permitir velocidades de muestreo escalables.

En 1999, MPEG-2 Parte 7 se actualizó y se incluyó en la familia de estándares MPEG-4 y pasó a ser conocido como MPEG-4 Parte 3 , MPEG-4 Audio o ISO/IEC 14496-3:1999 . Esta actualización incluyó varias mejoras. Una de estas mejoras fue la adición de tipos de objetos de audio que se utilizan para permitir la interoperabilidad con una amplia gama de otros formatos de audio como TwinVQ , CELP , HVXC , interfaz de texto a voz y audio estructurado MPEG-4 . Otra adición notable en esta versión del estándar AAC es la sustitución de ruido perceptual (PNS). En ese sentido, los perfiles AAC (perfiles AAC-LC, AAC Main y AAC-SSR) se combinan con la sustitución de ruido perceptivo y se definen en el estándar de audio MPEG-4 como tipos de objetos de audio. [27] Los tipos de objetos de audio MPEG-4 se combinan en cuatro perfiles de audio MPEG-4: Principal (que incluye la mayoría de los tipos de objetos de audio MPEG-4), Escalable (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, Síntesis de tabla de ondas , TTSI), Habla (CELP, HVXC, TTSI) y Síntesis de Baja Velocidad (Wavetable Synthesis, TTSI). [27] [28]

El software de referencia para MPEG-4 Parte 3 se especifica en MPEG-4 Parte 5 y los flujos de bits de conformidad se especifican en MPEG-4 Parte 4. MPEG-4 Audio sigue siendo compatible con versiones anteriores de MPEG-2 Parte 7. [29]

La versión 2 de audio MPEG-4 (ISO/IEC 14496-3:1999/Amd 1:2000) definió nuevos tipos de objetos de audio: el tipo de objeto AAC ( AAC-LD ) de retardo bajo, el tipo de objeto de codificación aritmética por corte de bits (BSAC) , codificación de audio paramétrica que utiliza versiones armónicas y de línea individual más versiones resistentes al ruido y errores (ER) de tipos de objetos. [30] [31] [32] También definió cuatro nuevos perfiles de audio: perfil de audio de alta calidad, perfil de audio de bajo retardo, perfil de audio natural y perfil de interconexión de audio móvil. [33]

El perfil HE-AAC (AAC LC con SBR ) y el perfil AAC (AAC LC) se estandarizaron por primera vez en ISO/IEC 14496-3:2001/Amd 1:2003. [34] El perfil HE-AAC v2 (AAC LC con SBR y estéreo paramétrico) se especificó por primera vez en ISO/IEC 14496-3:2005/Amd 2:2006. [35] [36] [37] El tipo de objeto de audio estéreo paramétrico utilizado en HE-AAC v2 se definió por primera vez en ISO/IEC 14496-3:2001/Amd 2:2004. [38] [39] [40]

La versión actual del estándar AAC se define en ISO/IEC 14496-3:2009. [41]

AAC+ v2 también está estandarizado por ETSI ( Instituto Europeo de Normas de Telecomunicaciones ) como TS 102005. [38]

El estándar MPEG-4 Parte 3 también contiene otras formas de comprimir sonido. Estos incluyen formatos de compresión sin pérdidas, audio sintético y formatos de compresión de baja velocidad de bits que se utilizan generalmente para la voz.

Mejoras de AAC sobre MP3

Advanced Audio Coding está diseñado para ser el sucesor del formato MPEG-1 Audio Layer 3 , conocido como formato MP3, que fue especificado por ISO / IEC en 11172-3 ( MPEG-1 Audio) y 13818-3 ( MPEG-2 Audio). .

Las pruebas ciegas realizadas a finales de la década de 1990 demostraron que AAC demostraba una mayor calidad de sonido y transparencia que MP3 para archivos codificados con la misma velocidad de bits. [4]

Las mejoras incluyen:

En general, el formato AAC permite a los desarrolladores más flexibilidad para diseñar códecs que MP3 y corrige muchas de las elecciones de diseño realizadas en la especificación de audio MPEG-1 original. Esta mayor flexibilidad a menudo conduce a estrategias de codificación más concurrentes y, como resultado, a una compresión más eficiente. Esto es especialmente cierto a velocidades de bits muy bajas, donde la codificación estéreo superior, la MDCT pura y los mejores tamaños de ventana de transformación dejan al MP3 incapaz de competir.

Si bien el formato MP3 tiene soporte de hardware y software casi universal, principalmente porque MP3 fue el formato elegido durante los primeros años cruciales de intercambio y distribución generalizados de archivos de música a través de Internet, AAC es un fuerte contendiente debido al apoyo inquebrantable de la industria. . [42]

Funcionalidad

AAC es un algoritmo de codificación de audio de banda ancha que aprovecha dos estrategias de codificación principales para reducir drásticamente la cantidad de datos necesarios para representar audio digital de alta calidad:

El proceso de codificación real consta de los siguientes pasos:

El estándar de audio MPEG-4 no define un conjunto único o pequeño de esquemas de compresión altamente eficientes, sino más bien una compleja caja de herramientas para realizar una amplia gama de operaciones, desde codificación de voz de baja velocidad de bits hasta codificación de audio y síntesis de música de alta calidad.

Los codificadores AAC pueden cambiar dinámicamente entre un único bloque MDCT de 1024 puntos de longitud u 8 bloques de 128 puntos (o entre 960 puntos y 120 puntos, respectivamente).

Codificación modular

AAC adopta un enfoque modular para la codificación. Dependiendo de la complejidad del flujo de bits a codificar, el rendimiento deseado y el resultado aceptable, los implementadores pueden crear perfiles para definir cuál de un conjunto específico de herramientas desean utilizar para una aplicación en particular.

El estándar MPEG-2 Parte 7 (Codificación de audio avanzada) se publicó por primera vez en 1997 y ofrece tres perfiles predeterminados: [2] [44]

El estándar MPEG-4 Parte 3 (MPEG-4 Audio) definió varias herramientas de compresión nuevas (también conocidas como tipos de objetos de audio ) y su uso en perfiles completamente nuevos. AAC no se utiliza en algunos de los perfiles de audio MPEG-4. El perfil MPEG-2 Parte 7 AAC LC, el perfil AAC Main y el perfil AAC SSR se combinan con la sustitución de ruido perceptual y se definen en el estándar de audio MPEG-4 como tipos de objetos de audio (bajo el nombre AAC LC, AAC Main y AAC SSR). Estos se combinan con otros tipos de objetos en los perfiles de audio MPEG-4. [27] Aquí hay una lista de algunos perfiles de audio definidos en el estándar MPEG-4: [35] [45]

Una de las muchas mejoras en el audio MPEG-4 es un tipo de objeto llamado predicción a largo plazo (LTP), que es una mejora del perfil principal que utiliza un predictor directo con menor complejidad computacional. [29]

Kit de herramientas de protección contra errores AAC

La aplicación de protección contra errores permite la corrección de errores hasta cierto punto. Los códigos de corrección de errores generalmente se aplican por igual a toda la carga útil. Sin embargo, dado que diferentes partes de una carga útil AAC muestran diferente sensibilidad a los errores de transmisión, este no sería un enfoque muy eficiente.

La carga útil de AAC se puede subdividir en partes con diferentes sensibilidades a errores.

AAC resistente a errores (ER)

Se pueden utilizar técnicas de resistencia a errores (ER) para hacer que el esquema de codificación sea más robusto contra errores.

Para AAC, se desarrollaron y definieron tres métodos personalizados en audio MPEG-4

Retardo bajo AAC

Los estándares de codificación de audio MPEG-4 Low Delay ( AAC-LD ), Enhanced Low Delay (AAC-ELD) y Enhanced Low Delay v2 (AAC-ELDv2) tal como se definen en ISO/IEC 14496-3:2009 e ISO/IEC 14496. -3:2009/Amd 3 están diseñados para combinar las ventajas de la codificación de audio perceptivo con el bajo retardo necesario para la comunicación bidireccional. Se derivan estrechamente del formato MPEG-2 Advanced Audio Coding (AAC). [47] [48] [49] GSMA recomienda AAC-ELD como códec de voz de banda súper ancha en el perfil IMS para el servicio de videoconferencia de alta definición (HDVC). [50]

Licencias y patentes

No se requieren licencias ni pagos para que un usuario transmita o distribuya audio en formato AAC. [51] Esta razón por sí sola podría haber hecho de AAC un formato más atractivo para distribuir audio que su predecesor MP3, particularmente para transmisión de audio (como radio por Internet) dependiendo del caso de uso.

Sin embargo, se requiere una licencia de patente para todos los fabricantes o desarrolladores de códecs de "usuario final" AAC . [52] Los términos (tal como se revelaron a la SEC) utilizan precios por unidad. En el caso del software, cada computadora que ejecuta el software debe considerarse una "unidad" separada. [53]

Solía ​​ser común que las implementaciones de software gratuitas y de código abierto, como FFmpeg y FAAC, se distribuyeran únicamente en forma de código fuente para no "suministrar" un códec AAC. Sin embargo, desde entonces FFmpeg se ha vuelto más indulgente en materia de patentes: las compilaciones "gyan.dev" recomendadas por el sitio oficial ahora contienen su códec AAC, y la página legal de FFmpeg indica que la conformidad con la ley de patentes es responsabilidad del usuario. [54] (Consulte a continuación la sección Productos que admiten AAC, software). Afortunadamente, el Proyecto Fedora , una comunidad respaldada por Red Hat , ha importado la "Versión modificada por terceros de la biblioteca de códecs AAC Fraunhofer FDK para Android" a sus repositorios. el 25 de septiembre de 2018, [55] y habilitó el codificador y decodificador AAC nativo de FFmpeg para su paquete sin ffmpeg el 31 de enero de 2023. [56]

Los titulares de patentes de AAC incluyen Bell Labs , Dolby , ETRI , Fraunhofer , JVC Kenwood , LG Electronics , Microsoft , NEC , NTT (y su filial NTT Docomo ), Panasonic , Philips y Sony Corporation . [16] [1] Según la lista de patentes de los términos de la SEC, la última patente básica de AAC vence en 2028, y la última patente para todas las extensiones de AAC mencionadas vence en 2031. [57]

Ampliaciones y mejoras

Se han agregado algunas extensiones al primer estándar AAC (definido en MPEG-2 Parte 7 en 1997):

Formatos de contenedor

Además de MP4 , 3GP y otros formatos contenedores basados ​​en el formato de archivo multimedia base ISO para el almacenamiento de archivos, los datos de audio AAC se empaquetaron por primera vez en un archivo para el estándar MPEG-2 utilizando el formato de intercambio de datos de audio (ADIF), [60] que consiste de un único encabezado seguido de los bloques de datos de audio AAC sin procesar. [61] Sin embargo, si los datos se van a transmitir dentro de un flujo de transporte MPEG-2, se utiliza un formato de sincronización automática llamado flujo de transporte de datos de audio ( ADTS ), que consta de una serie de cuadros, cada cuadro tiene un encabezado seguido. por los datos de audio AAC. [60] Este archivo y el formato basado en transmisión se definen en MPEG-2 Parte 7 , pero MPEG-4 solo los considera informativos, por lo que un decodificador MPEG-4 no necesita admitir ninguno de los formatos. [60] Estos contenedores, así como un flujo AAC sin formato, pueden tener la extensión de archivo .aac. MPEG-4 Parte 3 también define su propio formato de sincronización automática llamado Low Overhead Audio Stream (LOAS) que encapsula no solo AAC, sino también cualquier esquema de compresión de audio MPEG-4 como TwinVQ y ALS . Este formato es el que se definió para su uso en flujos de transporte DVB cuando los codificadores usan extensiones SBR o AAC estéreo paramétricas . Sin embargo, está restringido a un solo flujo AAC no multiplexado. Este formato también se conoce como Low Overhead Audio Transport Multiplex (LATM), que es simplemente una versión de transmisión múltiple entrelazada de un LOAS. [60]

Productos compatibles con CAA

Estándares de televisión de alta definición

ISDB-T japonés

En diciembre de 2003, Japón comenzó a transmitir el estándar DTV ISDB-T terrestre que implementa vídeo MPEG-2 y audio MPEG-2 AAC. En abril de 2006 Japón inició la transmisión del subprograma móvil ISDB-T, denominado 1seg, que fue la primera implementación de video H.264/AVC con audio HE-AAC en el servicio de transmisión HDTV Terrestre en el planeta.

ISDB-Tb internacional

En diciembre de 2007, Brasil comenzó a transmitir el estándar DTV terrestre denominado ISDB-Tb Internacional que implementa codificación de video H.264/AVC con audio AAC-LC en el programa principal (simple o múltiple) y video H.264/AVC con audio HE-AACv2 en el subprograma móvil 1seg.

DVB

El ETSI , el organismo rector de estándares para la suite DVB , admite codificación de audio AAC, HE-AAC y HE-AAC v2 en aplicaciones DVB desde al menos 2004. [62] Las transmisiones DVB que utilizan la compresión H.264 para video normalmente usan HE -AAC para audio. [ cita necesaria ]

Hardware

iTunes y iPod

En abril de 2003, Apple atrajo la atención generalizada hacia AAC al anunciar que sus productos iTunes e iPod admitirían canciones en formato MPEG-4 AAC (mediante una actualización de firmware para iPods más antiguos). Los clientes podían descargar música en una forma restringida de gestión de derechos digitales (DRM) de código cerrado de 128 kbit/s AAC (ver FairPlay ) a través de iTunes Store o crear archivos sin DRM desde sus propios CD usando iTunes. En años posteriores, Apple comenzó a ofrecer vídeos musicales y películas, que también utilizan AAC para la codificación de audio.

El 29 de mayo de 2007, Apple comenzó a vender canciones y vídeos musicales de los sellos discográficos participantes a una tasa de bits más alta (256 kbit/s cVBR) y sin DRM, un formato denominado "iTunes Plus". Estos archivos en su mayoría cumplen con el estándar AAC y se pueden reproducir en muchos productos que no son de Apple, pero incluyen información personalizada de iTunes, como carátulas del álbum y un recibo de compra, para identificar al cliente en caso de que el archivo se filtre en redes peer-to. -redes de pares . Sin embargo, es posible eliminar estas etiquetas personalizadas para restaurar la interoperabilidad con reproductores que cumplen estrictamente con la especificación AAC. A partir del 6 de enero de 2009, casi toda la música en iTunes Store de la región de EE. UU. quedó libre de DRM, y el resto quedó libre de DRM a finales de marzo de 2009. [63]

iTunes ofrece una opción de codificación de "Velocidad de bits variable" que codifica pistas AAC en el esquema de velocidad de bits variable restringida (una variante menos estricta de la codificación ABR); Sin embargo, la API QuickTime subyacente ofrece un perfil de codificación VBR real. [64]

A partir de septiembre de 2009, Apple agregó soporte para HE-AAC (que es completamente parte del estándar MP4) solo para transmisiones de radio, no para reproducción de archivos, e iTunes aún carece de soporte para la codificación VBR verdadera.

Otros reproductores portátiles

Teléfonos móviles

Desde hace varios años, muchos teléfonos móviles de fabricantes como Nokia , Motorola , Samsung , Sony Ericsson , BenQ-Siemens y Philips admiten la reproducción AAC. El primer teléfono de este tipo fue el Nokia 5510 lanzado en 2002, que también reproduce MP3. Sin embargo, este teléfono fue un fracaso comercial [ cita necesaria ] y estos teléfonos con reproductores de música integrados no ganaron popularidad hasta 2005, cuando continuó la tendencia de tener compatibilidad con AAC y MP3. La mayoría de los teléfonos inteligentes y teléfonos con temas musicales nuevos admiten la reproducción de estos formatos.

Otros dispositivos

Software

Casi todos los reproductores multimedia informáticos actuales incluyen decodificadores integrados para AAC o pueden utilizar una biblioteca para decodificarlo. En Microsoft Windows , DirectShow se puede utilizar de esta manera con los filtros correspondientes para habilitar la reproducción AAC en cualquier reproductor basado en DirectShow . Mac OS X admite AAC a través de las bibliotecas QuickTime .

Adobe Flash Player , desde la versión 9, actualización 3, también puede reproducir transmisiones AAC. [70] [71] Dado que Flash Player también es un complemento del navegador, también puede reproducir archivos AAC a través de un navegador.

El firmware de código abierto de Rockbox (disponible para varios reproductores portátiles) también ofrece compatibilidad con AAC en distintos grados, según el modelo de reproductor y el perfil de AAC.

La compatibilidad opcional con iPod (reproducción de archivos AAC no protegidos) para Xbox 360 está disponible como descarga gratuita desde Xbox Live . [72]

La siguiente es una lista no exhaustiva de otras aplicaciones de reproducción de software:

Algunos de estos reproductores (por ejemplo, foobar2000, Winamp y VLC) también admiten la decodificación de ADTS (Audio Data Transport Stream) utilizando el protocolo SHOUTcast . Los complementos para Winamp y foobar2000 permiten la creación de dichos flujos.

Audio Digital Nero

En mayo de 2006, Nero AG lanzó una herramienta de codificación AAC gratuita, Nero Digital Audio (la parte del códec AAC se ha convertido en Nero AAC Codec ), [73] que es capaz de codificar LC-AAC, HE-AAC y HE-AAC v2. corrientes. La herramienta es únicamente una herramienta de interfaz de línea de comandos. También se incluye una utilidad separada para decodificar a PCM WAV .

Varias herramientas, incluido el reproductor de audio foobar2000 y MediaCoder, pueden proporcionar una GUI para este codificador.

FAAC y FAAD2

FAAC y FAAD2 significan Freeware Advanced Audio Coder y Decoder 2 respectivamente. FAAC admite los tipos de objetos de audio LC, Main y LTP. [74] FAAD2 admite los tipos de objetos de audio LC, Main, LTP, SBR y PS. [75] Aunque FAAD2 es software libre , FAAC no es software libre.

Fraunhofer FDK AAC

Un codificador/decodificador de código abierto escrito por Fraunhofer incluido en Android ha sido portado a otras plataformas. El codificador AAC nativo de FFmpeg no es compatible con HE-AAC y HE-AACv2, pero GPL 2.0+ de ffmpeg no es compatible con FDK AAC, por lo tanto, ffmpeg con libfdk-aac no es redistribuible. El codificador QAAC que utiliza Core Media Audio de Apple sigue siendo de mayor calidad que FDK.

FFmpeg y Libav

El codificador AAC nativo creado en libavcodec de FFmpeg y bifurcado con Libav se consideró experimental y deficiente. Se realizó una cantidad significativa de trabajo para la versión 3.0 de FFmpeg (febrero de 2016) para que su versión fuera utilizable y competitiva con el resto de codificadores AAC. [76] Libav no ha fusionado este trabajo y continúa usando la versión anterior del codificador AAC. Estos codificadores son de código abierto con licencia LGPL y se pueden crear para cualquier plataforma en la que se puedan crear los marcos FFmpeg o Libav.

Tanto FFmpeg como Libav pueden usar la biblioteca Fraunhofer FDK AAC a través de libfdk-aac, y aunque el codificador nativo de FFmpeg se ha vuelto estable y lo suficientemente bueno para uso común, FDK todavía se considera el codificador de mayor calidad disponible para usar con FFmpeg. [77] Libav también recomienda utilizar FDK AAC si está disponible. [78] FFmpeg 4.4 y superiores también pueden usar el codificador Apple audiotoolbox. [77]

Aunque el codificador AAC nativo solo produce AAC-LC, el decodificador nativo de ffmpeg puede manejar una amplia gama de formatos de entrada.

Ver también

Notas

  1. ^ solo se usa en el reproductor web, Google Home , Amazon Alexa y la aplicación Microsoft Windows .

Referencias

  1. ^ abc "Via Licensing anuncia licencia de patente conjunta AAC actualizada". Cable comercial . 5 de enero de 2009 . Consultado el 18 de junio de 2019 .
  2. ^ ab ISO (1997). "ISO/IEC 13818-7:1997, Tecnología de la información. Codificación genérica de imágenes en movimiento e información de audio asociada. Parte 7: Codificación de audio avanzada (AAC)". Archivado desde el original el 25 de septiembre de 2012 . Consultado el 18 de julio de 2010 .
  3. ^ Codificación de audio avanzada (MPEG-4) (borrador completo). Sostenibilidad de los Formatos Digitales. Washington, DC: Biblioteca del Congreso. 22 de junio de 2010 . Consultado el 1 de diciembre de 2021 .
  4. ^ abcd Brandeburgo, Karlheinz (1999). "Explicación de MP3 y AAC" (PDF) . Archivado desde el original (PDF) el 13 de febrero de 2017.
  5. ^ ISO (2006) ISO/IEC 13818-7:2006 - Tecnología de la información - Codificación genérica de imágenes en movimiento e información de audio asociada - Parte 7: Codificación de audio avanzada (AAC) Archivado el 3 de marzo de 2016 en Wayback Machine , obtenido en 2009 -08-06
  6. ^ ISO (2006) ISO/IEC 14496-3:2005 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio Archivado el 13 de abril de 2016 en Wayback Machine , obtenido el 6 de agosto de 2009
  7. ^ "La familia de codificación de audio AAC para radiodifusión y televisión por cable" (PDF) . 2013. pág. 6. Archivado desde el original (PDF) el 28 de septiembre de 2023 . Consultado el 29 de enero de 2024 .
  8. ^ "Formatos de archivos de audio para Spotify". Spotify . Consultado el 20 de septiembre de 2021 .
  9. ^ Ahmed, Nasir (enero de 1991). "Cómo se me ocurrió la transformada del coseno discreto". Procesamiento de señales digitales . 1 (1): 4–5. doi :10.1016/1051-2004(91)90086-Z.
  10. ^ Ahmed, Nasir ; Natarajan, T.; Rao, KR (enero de 1974), "Transformada de coseno discreta", IEEE Transactions on Computers , C-23 (1): 90–93, doi :10.1109/TC.1974.223784, S2CID  149806273
  11. ^ Rao, KR ; Yip, P. (1990), Transformada de coseno discreta: algoritmos, ventajas, aplicaciones , Boston: Academic Press, ISBN 978-0-12-580203-1
  12. ^ JP Princen, AW Johnson y AB Bradley: codificación de subbanda/transformación utilizando diseños de bancos de filtros basados ​​en la cancelación de alias en el dominio del tiempo , IEEE Proc. Internacional Conferencia sobre acústica, habla y procesamiento de señales (ICASSP), 2161–2164, 1987
  13. ^ John P. Princen, Alan B. Bradley: Diseño de banco de filtros de análisis/síntesis basado en la cancelación de alias en el dominio del tiempo , IEEE Trans. Acústico. Procesamiento de señales de voz, ASSP-34 (5), 1153–1161, 1986
  14. ^ Guckert, John (primavera de 2012). "El uso de FFT y MDCT en la compresión de audio MP3" (PDF) . Universidad de Utah . Consultado el 14 de julio de 2019 .
  15. ^ Borland, John (18 de marzo de 2004). "El sonido de la ciencia". CNET . Consultado el 21 de abril de 2023 .
  16. ^ ab "Licenciantes de AAC". Vía Corp. Consultado el 15 de enero de 2020 .
  17. ^ ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio (PDF) (Informe técnico). ISO / IEC . 1 de septiembre de 2009. Archivado (PDF) desde el original el 14 de junio de 2011 . Consultado el 7 de octubre de 2009 .
  18. ^ ab "CAA". MPEG.ORG . Archivado desde el original el 3 de octubre de 2009 . Consultado el 28 de octubre de 2009 .
  19. ^ "ISO/IEC 13818-7, cuarta edición, parte 7 - Codificación de audio avanzada (AAC)" (PDF) . YO ASI . 15 de enero de 2006. Archivado (PDF) desde el original el 6 de marzo de 2009 . Consultado el 28 de octubre de 2009 .
  20. ^ Bouvigné, Gabriel (2003). "MPEG-2/MPEG-4 - AAC". MP3'Tecnología. Archivado desde el original el 5 de enero de 2010 . Consultado el 28 de octubre de 2009 .
  21. ^ "Preguntas frecuentes sobre audio MPEG versión 9: MPEG-1 y MPEG-2 BC". YO ASI . Octubre de 1998. Archivado desde el original el 18 de febrero de 2010 . Consultado el 28 de octubre de 2009 .
  22. ^ "Comunicado de prensa de Florencia". YO ASI . Marzo de 1996. Archivado desde el original el 8 de abril de 2010 . Consultado el 28 de octubre de 2009 .
  23. ^ Johnston, JD y Ferreira, AJ, "Codificación de transformación estéreo de suma-diferencia", ICASSP '92, marzo de 1992, págs. II-569-572.
  24. ^ Sinha, D. y Johnston, JD, "Compresión de audio a velocidades de bits bajas utilizando un banco de filtros conmutados adaptativos de señal", IEEE ASSP, 1996, págs.
  25. ^ Johnston, JD, Sinha, D., Dorward, S. y Quackenbush, S., "Codificador de audio perceptual (PAC) de AT&T" en artículos recopilados sobre reducción de la tasa de bits de audio digital, Gilchrist, N. y Grewin, C. ( Ed.), Sociedad de Ingeniería de Audio, 1996.
  26. ^ Herre, J. y Johnston, JD, "Mejora del rendimiento de los codificadores de audio perceptivo mediante el uso de modelado de ruido temporal", AES 101st Convention, no. preimpresión 4384, 1996
  27. ^ abc Brandeburgo, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko. "Codificación de audio natural MPEG-4: niveles y perfiles de audio". chiariglione.org . Archivado desde el original el 17 de julio de 2010 . Consultado el 6 de octubre de 2009 .
  28. ^ "ISO/IEC FCD 14496-3 Subparte 1 - Borrador - N2203" (PDF) . ISO / IEC JTC 1/SC 29/WG 11. 15 de mayo de 1998 . Consultado el 7 de octubre de 2009 .
  29. ^ abc Brandeburgo, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko (1999). "Codificación de audio natural MPEG-4: codificación de audio general (basada en AAC)". chiariglione.org . Archivado desde el original el 19 de febrero de 2010 . Consultado el 6 de octubre de 2009 .
  30. ^ "ISO/IEC 14496-3:1999/Amd 1:2000 - Extensiones de audio". YO ASI . 2000. Archivado desde el original el 6 de junio de 2011 . Consultado el 7 de octubre de 2009 .
  31. ^ "ISO/IEC 14496-3:/Amd.1 - Borrador final del comité - Audio MPEG-4 versión 2" (PDF) . ISO / IEC JTC 1/SC 29/WG 11. Julio de 1999. Archivado desde el original (PDF) el 1 de agosto de 2012 . Consultado el 7 de octubre de 2009 .
  32. ^ Purnhagen, Heiko (19 de febrero de 2000). "Taller de audio MPEG-4 versión 2: HILN - Codificación de audio paramétrica" ​​(PDF) . París. AES 108a Convención: MPEG-4 Versión 2 Audio ¿De qué se trata? . Consultado el 7 de octubre de 2009 .
  33. ^ Pereira, Fernando (octubre de 2001). "Niveles para perfiles de audio". Foro de la industria MPEG. Archivado desde el original el 8 de enero de 2010 . Consultado el 15 de octubre de 2009 .
  34. ^ "ISO/IEC 14496-3:2001/Amd 1:2003 - Extensión del ancho de banda". YO ASI . 2003. Archivado desde el original el 6 de junio de 2011 . Consultado el 7 de octubre de 2009 .
  35. ^ ab "Texto de ISO/IEC 14496-3:2001/FPDAM 4, codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC". ISO / IEC JTC1/SC29/WG11/N7016. 11 de enero de 2005. Archivado desde el original (DOC) el 12 de mayo de 2014 . Consultado el 9 de octubre de 2009 .
  36. ^ "Audio Lossless Coding (ALS), nuevos perfiles de audio y extensiones BSAC, ISO/IEC 14496-3:2005/Amd 2:2006". YO ASI . 2006. Archivado desde el original el 4 de enero de 2012 . Consultado el 13 de octubre de 2009 .
  37. ^ Mody, Mihir (6 de junio de 2005). "La compresión de audio se vuelve mejor y más compleja". Embedded.com . Archivado desde el original el 8 de febrero de 2016 . Consultado el 13 de octubre de 2009 .
  38. ^ ab "MPEG-4 aacPlus: codificación de audio para el mundo de los medios digitales actual" (PDF) . Archivado desde el original (PDF) el 26 de octubre de 2006 . Consultado el 29 de enero de 2007 .
  39. ^ "Codificación paramétrica para audio de alta calidad, ISO/IEC 14496-3:2001/Amd 2:2004". YO ASI . 2004. Archivado desde el original el 4 de enero de 2012 . Consultado el 13 de octubre de 2009 .
  40. ^ "3GPP TS 26.401 V6.0.0 (2004-09), funciones de procesamiento de audio del códec de audio general; códec de audio general aacPlus mejorado; descripción general (versión 6)" (DOC) . 3GPP. 30 de septiembre de 2004. Archivado desde el original el 19 de agosto de 2006 . Consultado el 13 de octubre de 2009 .
  41. ^ "ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". YO ASI . 2009. Archivado desde el original el 6 de junio de 2011 . Consultado el 7 de octubre de 2009 .
  42. ^ "CAA". Hidrógenoaudio. Archivado desde el original el 6 de julio de 2014 . Consultado el 24 de enero de 2011 .
  43. ^ Solicitud de patente estadounidense 20070297624 Codificación de audio digital
  44. ^ "ISO/IEC 13818-7, tercera edición, parte 7: codificación de audio avanzada (AAC)" (PDF) . YO ASI . 15 de octubre de 2004. p. 32. Archivado desde el original (PDF) el 13 de julio de 2011 . Consultado el 19 de octubre de 2009 .
  45. ^ Parrilla, Bernhard; Geyersberger, Stefan; Hilpert, Johannes; Teichmann, Bodo (julio de 2004). Implementación de Componentes de Audio MPEG-4 en varias Plataformas (PDF) . 109ª Convención AES 2000 22 al 25 de septiembre Los Ángeles. Fraunhofer Gesellschaft. Archivado desde el original (PDF) el 10 de junio de 2007 . Consultado el 9 de octubre de 2009 .
  46. ^ "ISO/IEC 14496-3:2009/Amd 3:2012 - Transporte de codificación unificada de voz y audio (USAC)". YO ASI . Archivado desde el original el 8 de marzo de 2016 . Consultado el 3 de agosto de 2016 .
  47. ^ "ISO/IEC 14496-3:2009 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio". YO ASI . Archivado desde el original el 20 de mayo de 2016 . Consultado el 2 de agosto de 2016 .
  48. ^ "ISO/IEC 14496-3:2009/Amd 3:2012 - Transporte de codificación unificada de voz y audio (USAC)". YO ASI . Archivado desde el original el 19 de agosto de 2016 . Consultado el 2 de agosto de 2016 .
  49. ^ "La familia AAC-ELD para servicios de comunicación de alta calidad | MPEG". mpeg.chiariglione.org . Archivado desde el original el 20 de agosto de 2016 . Consultado el 2 de agosto de 2016 .
  50. ^ Perfil IMS para el servicio de videoconferencia de alta definición (HDVC) (PDF) . GSMA. 24 de mayo de 2016. pág. 10. Archivado (PDF) desde el original el 18 de agosto de 2016.
  51. ^ "Preguntas frecuentes sobre licencias AAC Q5". A través de Licencias . Consultado el 15 de enero de 2020 .
  52. ^ "Tarifas de licencia AAC". A través de Licencias . Consultado el 15 de enero de 2020 .
  53. ^ Vía Licensing Corporation (5 de junio de 2018). "ACUERDO DE LICENCIA DE PATENTE DE AAC". www.sec.gov . Consultado el 21 de abril de 2023 .
  54. ^ "Licencia FFmpeg y consideraciones legales". ffmpeg.org .
  55. ^ "Confirmar - rpms/fdk-aac-free - b27d53fbad872ea0ec103653fddaec83238132d9 - src.fedoraproject.org". src.fedoraproject.org .
  56. ^ "Confirmar - rpms/ffmpeg - 45f894ec0e43a37775393c159021a4ac60170a55 - src.fedoraproject.org". src.fedoraproject.org .
  57. ^ "Lista de patentes relacionadas con AAC". hidrogenoaud.io .
  58. ^ Thom, D.; Purnhagen, H. (octubre de 1998). "Preguntas frecuentes sobre audio MPEG versión 9 - MPEG-4". chiariglione.org . Subgrupo de audio MPEG. Archivado desde el original el 14 de febrero de 2010 . Consultado el 6 de octubre de 2009 .
  59. ^ "ISO/IEC 14496-3:2019". YO ASI . Consultado el 19 de febrero de 2022 .
  60. ^ abcd Wolters, Martín; Kjorling, Kristofer; Homm, Daniel; Purnhagen, Heiko. Una mirada más cercana a MPEG-4 AAC de alta eficiencia (PDF) . pag. 3. Archivado desde el original (PDF) el 19 de diciembre de 2003 . Consultado el 31 de julio de 2008 .Presentado en la 115ª Convención de la Audio Engineering Society, del 10 al 13 de octubre de 2003.
  61. ^ "Codificación de audio avanzada (MPEG-2), formato de intercambio de datos de audio". Biblioteca del Congreso / Programa Nacional de Preservación e Infraestructura de Información Digital. 7 de marzo de 2007. Archivado desde el original el 30 de julio de 2008 . Consultado el 31 de julio de 2008 .
  62. ^ ETSI TS 101154 v1.5.1: Especificación para el uso de codificación de audio y vídeo en aplicaciones de radiodifusión basadas en el flujo de transporte MPEG
  63. ^ Cohen, Peter (27 de mayo de 2010). "iTunes Store pasa a estar libre de DRM". Macmundo . Publicación Mac. Archivado desde el original el 18 de febrero de 2009 . Consultado el 10 de febrero de 2009 .
  64. ^ "Apple AAC". Hidrógenoaudio . Archivado desde el original el 23 de noviembre de 2021 . Consultado el 22 de noviembre de 2021 .
  65. ^ "Gingerbread: desarrolladores de Android". Desarrolladores de Android . Archivado desde el original el 29 de diciembre de 2017 . Consultado el 8 de mayo de 2018 .
  66. ^ "Formatos multimedia admitidos: desarrolladores de Android". Desarrolladores de Android . Archivado desde el original el 11 de marzo de 2012 . Consultado el 8 de mayo de 2018 .
  67. ^ "Palm Pre Phone / Funciones, Detalles". Palma Estados Unidos . Archivado desde el original el 24 de mayo de 2011.
  68. ^ "Nintendo - Atención al cliente - Wii - Canal de fotos". nintendo.com . Archivado desde el original el 5 de mayo de 2017 . Consultado el 8 de mayo de 2018 .
  69. ^ "Medios compatibles con Google Cast". Archivado desde el original el 23 de septiembre de 2015 . Consultado el 22 de septiembre de 2015 .| Medios compatibles con Google Cast
  70. ^ "Estadísticas: tiempos de ejecución de Adobe Flash". www.adobe.com . Archivado desde el original el 2 de octubre de 2011 . Consultado el 8 de mayo de 2018 .
  71. ^ "Adobe ofrece Flash Player 9 con compatibilidad con vídeo H.264". Comunicado de prensa de Adobe . 2007-12-04. Archivado desde el original el 21 de agosto de 2014 . Consultado el 20 de agosto de 2014 .
  72. ^ "Xbox.com | Uso del sistema: utilice un iPod de Apple con Xbox 360". Archivado desde el original el 8 de abril de 2007.
  73. ^ "Nero Platinum 2018 Suite: todoterreno galardonado". Nerón AG . Archivado desde el original el 14 de diciembre de 2012 . Consultado el 8 de mayo de 2018 .
  74. ^ "FAAC". AudioCoding.com . Archivado desde el original el 11 de diciembre de 2009 . Consultado el 3 de noviembre de 2009 .
  75. ^ "FAAD2". AudioCoding.com . Archivado desde el original el 11 de diciembre de 2009 . Consultado el 3 de noviembre de 2009 .
  76. ^ "5 de diciembre de 2015, ¡el codificador nativo FFmpeg AAC ahora es estable!". ffmpeg.org . Archivado desde el original el 16 de julio de 2016 . Consultado el 26 de junio de 2016 .
  77. ^ ab "Guía de codificación FFmpeg AAC". Archivado desde el original el 17 de abril de 2016 . Consultado el 11 de abril de 2016 . ¿Qué codificador proporciona la mejor calidad? ... la respuesta probable es: libfdk_aac
  78. ^ "Libav Wiki: codificación de AAC". Archivado desde el original el 20 de abril de 2016 . Consultado el 11 de abril de 2016 .

enlaces externos