stringtranslate.com

MP3

MP3 (formalmente MPEG-1 Audio Layer III o MPEG-2 Audio Layer III ) [4] es un formato de codificación para audio digital desarrollado en gran parte por la Sociedad Fraunhofer en Alemania bajo la dirección de Karlheinz Brandenburg , [11] [12] con soporte de otros científicos digitales de otros países. Originalmente definido como el tercer formato de audio del estándar MPEG-1 , se mantuvo y se amplió aún más, definiendo velocidades de bits adicionales y soporte para más canales de audio , como el tercer formato de audio del estándar MPEG-2 posterior . Una tercera versión, conocida como MPEG-2.5, ampliada para admitir velocidades de bits más bajas , se implementa comúnmente, pero no es un estándar reconocido.

MP3 (o mp3 ) como formato de archivo comúnmente designa archivos que contienen un flujo elemental de datos codificados en audio MPEG-1 o audio MPEG-2, sin otras complejidades del estándar MP3.

En cuanto a la compresión de audio (el aspecto del estándar más evidente para los usuarios finales y por el que es más conocido), MP3 utiliza compresión de datos con pérdida para codificar datos utilizando aproximaciones inexactas y el descarte parcial de datos. Esto permite una gran reducción en el tamaño de los archivos en comparación con el audio sin comprimir. La combinación de tamaño pequeño y fidelidad aceptable condujo a un auge en la distribución de música a través de Internet a mediados y finales de la década de 1990, con el MP3 sirviendo como tecnología habilitadora en un momento en que el ancho de banda y el almacenamiento todavía eran escaso. El formato MP3 pronto se asoció con controversias en torno a la infracción de derechos de autor , la piratería musical y los servicios de extracción e intercambio de archivos MP3.com y Napster , entre otros. Con la llegada de los reproductores multimedia portátiles , una categoría de producto que también incluye los teléfonos inteligentes , la compatibilidad con MP3 sigue siendo casi universal.

La compresión MP3 funciona reduciendo (o aproximando) la precisión de ciertos componentes del sonido que se consideran (mediante análisis psicoacústicos) que están más allá de las capacidades auditivas de la mayoría de los humanos. Este método se conoce comúnmente como codificación perceptiva o modelado psicoacústico . [13] La información de audio restante luego se graba de manera eficiente en el espacio, utilizando algoritmos MDCT y FFT . En comparación con el audio digital con calidad de CD , la compresión MP3 normalmente puede lograr una reducción de tamaño del 75 al 95%. Por ejemplo, un MP3 codificado a una velocidad de bits constante de 128 kbit/s daría como resultado un archivo de aproximadamente el 9% del tamaño del CD de audio original. [14] A principios de la década de 2000, los reproductores de discos compactos adoptaron cada vez más soporte para la reproducción de archivos MP3 en CD de datos.

El Moving Picture Experts Group (MPEG) diseñó MP3 como parte de sus estándares MPEG-1 y, posteriormente , MPEG-2 . MPEG-1 Audio (MPEG-1 Parte 3), que incluía MPEG-1 Audio Layer I, II y III, fue aprobado como borrador del comité para un estándar ISO / IEC en 1991, [15] [16] finalizado en 1992, [17] y publicado en 1993 como ISO/IEC 11172-3:1993. [7] En 1995 se publicó una extensión de audio MPEG-2 (MPEG-2 Parte 3) con velocidades de muestreo y de bits más bajas como ISO/IEC 13818-3:1995. [8] [18] Requiere sólo modificaciones mínimas a los decodificadores MPEG-1 existentes (reconocimiento del bit MPEG-2 en el encabezado y adición de nuevas velocidades de muestreo y bits más bajas).

Historia

Fondo

El algoritmo de compresión de datos de audio con pérdida de MP3 aprovecha una limitación perceptiva del oído humano llamada enmascaramiento auditivo . En 1894, el físico estadounidense Alfred M. Mayer informó que un tono podía volverse inaudible mediante otro tono de frecuencia más baja. [19] En 1959, Richard Ehmer describió un conjunto completo de curvas auditivas relacionadas con este fenómeno. [20] Entre 1967 y 1974, Eberhard Zwicker trabajó en las áreas de sintonización y enmascaramiento de bandas de frecuencia críticas, [21] [22] que a su vez se basó en la investigación fundamental en el área de Harvey Fletcher y sus colaboradores en Bell . Laboratorios . [23]

La codificación perceptiva se utilizó por primera vez para la compresión de codificación de voz con codificación predictiva lineal (LPC), [24] que tiene su origen en el trabajo de Fumitada Itakura ( Universidad de Nagoya ) y Shuzo Saito ( Nippon Telegraph and Telephone ) en 1966. [25] En 1978 , Bishnu S. Atal y Manfred R. Schroeder de Bell Labs propusieron un códec de voz LPC , llamado codificación predictiva adaptativa , que utilizaba un algoritmo de codificación psicoacústica que explotaba las propiedades de enmascaramiento del oído humano. [24] [26] Posteriormente, en un artículo de 1979 se informó sobre una mayor optimización realizada por Schroeder y Atal con JL Hall. [27] Ese mismo año, MA Krasner, [28] también propuso un códec de enmascaramiento psicoacústico, quien publicó y produjo hardware para el habla (no utilizable como compresión de bits de música), pero la publicación de sus resultados en un Laboratorio Lincoln relativamente oscuro El Informe Técnico [29] no influyó inmediatamente en la corriente principal del desarrollo de códecs psicoacústicos.

La transformada de coseno discreta (DCT), un tipo de codificación de transformada para compresión con pérdida , propuesta por Nasir Ahmed en 1972, fue desarrollada por Ahmed con T. Natarajan y KR Rao en 1973; publicaron sus resultados en 1974. [30] [31] [32] Esto llevó al desarrollo de la transformada de coseno discreta modificada (MDCT), propuesta por JP Princen, AW Johnson y AB Bradley en 1987, [33] siguiendo trabajos anteriores por Princen y Bradley en 1986. [34] La MDCT se convirtió más tarde en una parte central del algoritmo MP3. [35]

Ernst Terhardt y otros colaboradores construyeron un algoritmo que describe el enmascaramiento auditivo con alta precisión en 1982. [36] Este trabajo se sumó a una variedad de informes de autores que se remontan a Fletcher y al trabajo que inicialmente determinó las proporciones críticas y los anchos de banda críticos.

En 1985, Atal y Schroeder presentaron la predicción lineal excitada por código (CELP), un algoritmo de codificación perceptual del habla basado en LPC con enmascaramiento auditivo que logró una relación de compresión de datos significativa para su época. [24] El Journal on Selected Areas in Communications del IEEE informó sobre una amplia variedad de algoritmos de compresión de audio (en su mayoría perceptivos) en 1988. [37] La ​​edición "Voice Coding for Communications" publicada en febrero de 1988 informó sobre una amplia gama de tecnologías de compresión de bits de audio establecidas y funcionales, [37] algunas de ellas utilizan enmascaramiento auditivo como parte de su diseño fundamental, y varias muestran implementaciones de hardware en tiempo real.

Desarrollo

La génesis de la tecnología MP3 se describe detalladamente en un artículo del profesor Hans Musmann, [38] que presidió el grupo ISO MPEG Audio durante varios años. En diciembre de 1988, MPEG solicitó un estándar de codificación de audio. En junio de 1989, se presentaron 14 algoritmos de codificación de audio. Debido a ciertas similitudes entre estas propuestas de codificación, se agruparon en cuatro grupos de desarrollo. El primer grupo fue ASPEC, formado por Fraunhofer Gesellschaft , AT&T , France Telecom , Deutsche y Thomson-Brandt . El segundo grupo fue MUSICAM , de Matsushita , CCETT , ITT y Philips . El tercer grupo fue ATAC (ATRAC Coding), de Fujitsu , JVC , NEC y Sony . Y el cuarto grupo fue SB-ADPCM , de NTT y BTRL. [38]

Los predecesores inmediatos del MP3 fueron la "codificación óptima en el dominio de frecuencia" (OCF), [39] y la codificación de transformación perceptual (PXFM). [40] Estos dos códecs, junto con las contribuciones de Thomson-Brandt en materia de conmutación de bloques, se fusionaron en un códec llamado ASPEC, que se presentó a MPEG y que ganó el concurso de calidad, pero que fue rechazado erróneamente por ser demasiado complejo de implementar. La primera implementación práctica de un codificador de percepción de audio (OCF) en hardware (el hardware de Krasner era demasiado engorroso y lento para un uso práctico), fue una implementación de un codificador de transformación psicoacústica basado en chips DSP 56000 de Motorola .

Otro predecesor del formato y la tecnología MP3 se encuentra en el códec perceptivo MUSICAM, basado en un banco de filtros de aritmética entera de 32 subbandas, impulsado por un modelo psicoacústico. Fue diseñado principalmente para radiodifusión de audio digital (radio digital) y televisión digital, y sus principios básicos fueron divulgados a la comunidad científica por CCETT (Francia) e IRT (Alemania) en Atlanta durante una conferencia IEEE- ICASSP en 1991, [41] después de haber trabajado en MUSICAM con Matsushita y Philips desde 1989. [38]

Este códec incorporado a un sistema de radiodifusión que utiliza modulación COFDM fue demostrado en el aire y en el campo [42] con Radio Canada y CRC Canada durante el show NAB (Las Vegas) en 1991. La implementación de la parte de audio de este sistema de radiodifusión se basó en un codificador de dos chips (uno para la transformada de subbanda, otro para el modelo psicoacústico diseñado por el equipo de G. Stoll (IRT Alemania), más tarde conocido como modelo psicoacústico I) y un decodificador en tiempo real que utiliza un chip DSP Motorola 56001 ejecutando un software de aritmética de números enteros diseñado por el equipo de YF Dehery (CCETT, Francia). La sencillez del correspondiente decodificador junto con la alta calidad de audio de este códec que utiliza por primera vez una frecuencia de muestreo de 48 kHz , un formato de entrada de 20 bits/muestra (el estándar de muestreo más alto disponible en 1991, compatible con el sistema digital profesional AES/EBU estándar de estudio de entrada) fueron las principales razones para adoptar posteriormente las características de MUSICAM como características básicas para un códec de compresión de música digital avanzado.

Durante el desarrollo del software de codificación MUSICAM, el equipo de Stoll y Dehery hizo un uso exhaustivo de un conjunto de material de evaluación de audio de alta calidad [43] seleccionado por un grupo de profesionales del audio de la Unión Europea de Radiodifusión, y posteriormente utilizado como referencia para el Evaluación de códecs de compresión musical. La técnica de codificación de subbanda resultó ser eficaz, no sólo para la codificación perceptiva de materiales sonoros de alta calidad, sino especialmente para la codificación de materiales sonoros de percusión críticos (batería, triángulo ,...), debido al efecto de enmascaramiento temporal específico de el banco de filtros de subbanda MUSICAM (siendo esta ventaja una característica específica de las técnicas de codificación por transformada corta).

Como estudiante de doctorado en la Universidad de Erlangen-Nuremberg , Alemania , Karlheinz Brandenburg comenzó a trabajar en la compresión de música digital a principios de los años 1980, centrándose en cómo la gente percibe la música. Completó su trabajo doctoral en 1989. [44] MP3 desciende directamente de OCF y PXFM, lo que representa el resultado de la colaboración de Brandenburg, trabajando como investigador postdoctoral en AT&T-Bell Labs con James D. Johnston ("JJ") de AT&T-Bell Labs - con el Instituto Fraunhofer de Circuitos Integrados , Erlangen (donde trabajó con Bernhard Grill y otros cuatro investigadores - "The Original Six" [45] ), con contribuciones relativamente menores de la rama MP2 de codificadores de subbanda psicoacústica . En 1990, Brandenburg se convirtió en profesor asistente en Erlangen-Nuremberg. Mientras estuvo allí, continuó trabajando en compresión musical con científicos del Instituto Heinrich Herz de la Sociedad Fraunhofer . En 1993 se incorporó al personal de Fraunhofer HHI. [44] La canción " Tom's Diner " de Suzanne Vega fue la primera canción utilizada por Karlheinz Brandenburg para desarrollar el formato MP3. Brandenburg adoptó la canción con fines de prueba, escuchándola una y otra vez cada vez que refinaba el esquema, asegurándose de que no afectara negativamente la sutileza de la voz de Vega. [46] En consecuencia, apodó a Vega la "Madre del MP3". [47]

Estandarización

En 1991 , se evaluaron dos propuestas disponibles para un estándar de audio MPEG: MUSICAM ( Codificación y multiplexación integrada de subbanda universal adaptada al patrón de creación ) y ASPEC ( Codificación de entropía perceptual espectral adaptativa ) . Se eligió la técnica MUSICAM, propuesta por Philips (Países Bajos), CCETT (Francia), el Institute for Broadcast Technology (Alemania) y Matsushita (Japón), [48] debido a su simplicidad y robustez al error, así como por su alta nivel de eficiencia computacional. [49] El formato MUSICAM, basado en la codificación de subbandas , se convirtió en la base del formato de compresión de Audio MPEG, incorporando, por ejemplo, su estructura de cuadros, formato de cabecera, frecuencias de muestreo, etc.

Si bien gran parte de la tecnología y las ideas de MUSICAM se incorporaron en la definición de MPEG Audio Layer I y Layer II, solo el banco de filtros y la estructura de datos basada en 1152 muestras de encuadre (formato de archivo y flujo orientado a bytes) de MUSICAM permanecieron en la Capa III. (MP3), como parte del banco de filtros híbridos computacionalmente ineficiente . Bajo la presidencia del profesor Musmann de la Universidad Leibniz de Hannover , la edición del estándar fue delegada a Leon van de Kerkhof (Países Bajos), Gerhard Stoll (Alemania) e Yves-François Dehery (Francia), quienes trabajaron en Layer I y Layer II. ASPEC fue la propuesta conjunta de AT&T Bell Laboratories, Thomson Consumer Electronics, Fraunhofer Society y CNET . [50] Proporcionó la mayor eficiencia de codificación.

Un grupo de trabajo formado por van de Kerkhof, Stoll, Leonardo Chiariglione ( vicepresidente de medios de CSELT ), Yves-François Dehery, Karlheinz Brandenburg (Alemania) y James D. Johnston (Estados Unidos) tomó ideas de ASPEC e integró el banco de filtros de Layer. II, añadió algunas de sus ideas, como la codificación estéreo conjunta de MUSICAM y creó el formato MP3, que fue diseñado para alcanzar la misma calidad a 128  kbit/s que el MP2 a 192 kbit/s.

Los algoritmos para MPEG-1 Audio Layer I, II y III fueron aprobados en 1991 [15] [16] y finalizados en 1992 [17] como parte de MPEG-1 , el primer conjunto de estándares de MPEG , que resultó en el estándar internacional ISO / IEC 11172-3 (también conocido como MPEG-1 Audio o MPEG-1 Parte 3 ), publicado en 1993. [7] Los archivos o flujos de datos que cumplan con este estándar deben manejar frecuencias de muestreo de 48k, 44100 y 32k y continuar siendo soportados por los reproductores y decodificadores MP3 actuales . Así, la primera generación de MP3 definió 14 × 3 = 42 interpretaciones de estructuras de datos de cuadros MP3 y diseños de tamaño.

La eficiencia de compresión de los codificadores generalmente se define por la velocidad de bits porque la relación de compresión depende de la profundidad de bits y la frecuencia de muestreo de la señal de entrada. Sin embargo, a menudo se publican las relaciones de compresión. Pueden utilizar como referencia los parámetros del disco compacto (CD) (44,1 kHz , 2 canales a 16 bits por canal o 2×16 bit), o en ocasiones los parámetros SP de la cinta de audio digital (DAT) (48 kHz, 2×16 bit). . Las relaciones de compresión con esta última referencia son más altas, lo que demuestra el problema con el uso del término relación de compresión para codificadores con pérdida.

Karlheinz Brandenburg utilizó una grabación en CD de la canción " Tom's Diner " de Suzanne Vega para evaluar y perfeccionar el algoritmo de compresión MP3 . [51] Esta canción fue elegida debido a su naturaleza casi monofónica y su amplio contenido espectral, lo que facilita escuchar las imperfecciones en el formato de compresión durante las reproducciones. Esta pista en particular tiene una propiedad interesante en el sentido de que los dos canales son casi, pero no completamente, iguales, lo que lleva a un caso en el que la depresión del nivel de enmascaramiento binaural causa el desenmascaramiento espacial de los artefactos de ruido a menos que el codificador reconozca adecuadamente la situación y aplique correcciones similares a aquellas. detallado en el modelo psicoacústico MPEG-2 AAC. Algunos extractos de audio más críticos ( glockenspiel , triángulo, acordeón , etc.) se tomaron del disco compacto de referencia EBU V3/SQAM y han sido utilizados por ingenieros de sonido profesionales para evaluar la calidad subjetiva de los formatos de audio MPEG. [ cita necesaria ]

Hacerlo público

Los miembros del comité de audio MPEG de ISO desarrollaron (en 1991-1996) una implementación de software de simulación de referencia, escrita en lenguaje C y más tarde conocida como ISO 11172-5 , para producir archivos de audio MPEG compatibles con bits (Capa 1, Capa 2, capa 3). Fue aprobado como borrador del comité del informe técnico ISO/IEC en marzo de 1994 y se imprimió como documento CD 11172-5 en abril de 1994. [52] Fue aprobado como borrador del informe técnico (DTR/DIS) en noviembre de 1994, [ 53] finalizado en 1996 y publicado como estándar internacional ISO/IEC TR 11172-5:1998 en 1998. [54] El software de referencia en lenguaje C se publicó posteriormente como un estándar ISO disponible gratuitamente. [55] Trabajando en tiempo no real en varios sistemas operativos, pudo demostrar la primera decodificación de hardware en tiempo real (basada en DSP) de audio comprimido. Algunas otras implementaciones en tiempo real de codificadores y decodificadores de audio MPEG [56] estaban disponibles para la transmisión digital (radio DAB , televisión DVB ) hacia receptores de consumo y decodificadores.

El 7 de julio de 1994, la Sociedad Fraunhofer lanzó el primer codificador de MP3 por software, llamado l3enc . [57] La ​​extensión del nombre de archivo .mp3 fue elegida por el equipo de Fraunhofer el 14 de julio de 1995 (anteriormente, los archivos se llamaban .bit ). [1] Con el primer reproductor MP3 de software en tiempo real, WinPlay3 (lanzado el 9 de septiembre de 1995), muchas personas pudieron codificar y reproducir archivos MP3 en sus PC. Debido a los discos duros relativamente pequeños de la época (≈500–1000 MB ), la compresión con pérdida era esencial para almacenar varios álbumes de música en una computadora doméstica como grabaciones completas (a diferencia de la notación MIDI o archivos de seguimiento que combinaban notación con grabaciones breves de instrumentos que tocan notas sueltas).

Implementación de ejemplo de Fraunhofer

Un hacker llamado SoloH descubrió el código fuente de la implementación de referencia MPEG "dist10" poco después de su lanzamiento en los servidores de la Universidad de Erlangen . Desarrolló una versión de mayor calidad y la difundió en Internet. Este código inició la extracción generalizada de CD y la distribución de música digital como MP3 a través de Internet. [58] [59] [60] [61]

Otras versiones

En 1994 se finalizaron trabajos adicionales sobre audio MPEG [62] como parte del segundo conjunto de estándares MPEG, MPEG-2 , más formalmente conocido como estándar internacional ISO/IEC 13818-3 (también conocido como MPEG-2 Parte 3 o MPEG- 2 compatible con versiones anteriores ). 2 Audio o MPEG-2 Audio BC [18] ), publicado originalmente en 1995. [8] [63] MPEG-2 Parte 3 (ISO/IEC 13818-3) definió 42 velocidades de bits y frecuencias de muestreo adicionales para audio MPEG-1 Capa I, II y III. Las nuevas velocidades de muestreo son exactamente la mitad que las definidas originalmente en MPEG-1 Audio. Esta reducción en las tasas de muestreo sirve para reducir a la mitad la fidelidad de la frecuencia disponible y al mismo tiempo reducir la tasa de bits en un 50%. MPEG-2 Part 3 también mejoró el audio de MPEG-1 al permitir la codificación de programas de audio con más de dos canales, hasta 5.1 multicanal. [62] Un MP3 codificado con MPEG-2 produce la mitad del ancho de banda de reproducción de MPEG-1 apropiado para piano y canto.

Una tercera generación de flujos de datos (archivos) de estilo "MP3" amplió las ideas y la implementación de MPEG-2 , pero se denominó audio MPEG-2.5 ya que MPEG-3 ya tenía un significado diferente. Esta extensión fue desarrollada en Fraunhofer IIS, el titular de la patente registrada de MP3, reduciendo el campo de sincronización de cuadros en el encabezado MP3 de 12 a 11 bits. Al igual que en la transición de MPEG-1 a MPEG-2, MPEG-2.5 agrega frecuencias de muestreo adicionales exactamente la mitad de las disponibles con MPEG-2. Por lo tanto, amplía el alcance del MP3 para incluir el habla humana y otras aplicaciones, pero requiere sólo el 25% del ancho de banda (reproducción de frecuencia) posible utilizando velocidades de muestreo MPEG-1. Si bien no es un estándar reconocido por ISO, MPEG-2.5 es ampliamente compatible con reproductores de audio digitales chinos y de marca de bajo costo, así como con codificadores de MP3 basados ​​en software ( LAME ), decodificadores (FFmpeg) y reproductores (MPC) que agregan 3 × 8 = 24 tipos de fotogramas MP3 adicionales. Por lo tanto, cada generación de MP3 admite 3 frecuencias de muestreo exactamente la mitad que la generación anterior para un total de 9 variedades de archivos de formato MP3. La tabla de comparación de frecuencia de muestreo entre MPEG-1, 2 y 2.5 se proporciona más adelante en el artículo. [64] [65] MPEG-2.5 es compatible con LAME (desde 2000), Media Player Classic (MPC), iTunes y FFmpeg.

MPEG-2.5 no fue desarrollado por MPEG (ver arriba) y nunca fue aprobado como estándar internacional. MPEG-2.5 es, por tanto, una extensión no oficial o patentada del formato MP3. No obstante, es ubicuo y especialmente ventajoso para aplicaciones de voz humana de baja velocidad de bits.

* El estándar ISO ISO/IEC 11172-3 (también conocido como MPEG-1 Audio) definió tres formatos: MPEG-1 Audio Layer I, Layer II y Layer III. El estándar ISO ISO/IEC 13818-3 (también conocido como MPEG-2 Audio) definió una versión extendida de MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II y Layer III. El audio MPEG-2 (MPEG-2 Parte 3) no debe confundirse con MPEG-2 AAC (MPEG-2 Parte 7 – ISO/IEC 13818-7). [18]

LAME es el codificador de MP3 más avanzado. [ cita necesaria ] LAME incluye una codificación de velocidad de bits variable (VBR) que utiliza un parámetro de calidad en lugar de un objetivo de velocidad de bits. Las versiones posteriores (2008+) admiten un objetivo de calidad n.nnn que selecciona automáticamente frecuencias de muestreo MPEG-2 o MPEG-2.5 según sea apropiado para grabaciones de voz humana que solo necesitan una resolución de ancho de banda de 5512 Hz.

distribución de internet

En la segunda mitad de la década de 1990, los archivos MP3 comenzaron a difundirse en Internet , a menudo a través de redes clandestinas de canciones pirateadas. El primer experimento conocido en distribución por Internet fue organizado a principios de los años 1990 por Internet Underground Music Archive , más conocido por el acrónimo IUMA. Después de algunos experimentos [67] usando archivos de audio sin comprimir, este archivo comenzó a entregar en la Internet nativa mundial de baja velocidad algunos archivos de audio MPEG comprimidos usando el formato MP2 (Capa II) y más tarde archivos MP3 usados ​​cuando el estándar se completó por completo. La popularidad de los MP3 comenzó a aumentar rápidamente con la llegada del reproductor de audio Winamp de Nullsoft , lanzado en 1997, que todavía contaba en 2023 con una comunidad de 80 millones de usuarios activos. [68] En 1998, se lanzó el primer reproductor de audio digital portátil de estado sólido MPMan , desarrollado por SaeHan Information Systems, con sede en Seúl , Corea del Sur , y el Rio PMP300 se vendió posteriormente en 1998, a pesar de los esfuerzos de supresión legal por parte de la RIAA . [69]

En noviembre de 1997, el sitio web mp3.com ofrecía gratuitamente miles de MP3 creados por artistas independientes. [69] El pequeño tamaño de los archivos MP3 permitió el intercambio generalizado de archivos de igual a igual de música extraída de CD, lo que antes habría sido casi imposible. La primera gran red de intercambio de archivos entre pares , Napster , se lanzó en 1999. La facilidad para crear y compartir archivos MP3 resultó en una infracción generalizada de los derechos de autor . Las principales compañías discográficas argumentaron que este libre intercambio de música reducía las ventas y lo llamaron " piratería musical ". Reaccionaron entablando demandas contra Napster , que finalmente fue cerrada y luego vendida, y contra usuarios individuales que compartían archivos. [70]

El intercambio no autorizado de archivos MP3 continúa en las redes peer-to-peer de próxima generación . Algunos servicios autorizados, como Beatport , Bleep , Juno Records , eMusic , Zune Marketplace , Walmart.com , Rhapsody , la reencarnación de Napster aprobada por la industria discográfica y Amazon.com venden música sin restricciones en formato MP3.

Diseño

Estructura de archivos

Diagrama de la estructura de un archivo MP3.
Diagrama de la estructura de un archivo MP3 (MPEG versión 2.5, no descrita aquí, cambia el último bit de la palabra de sincronización a "0" como indicación, moviendo efectivamente un bit al campo de versión [ 65] ).

Un archivo MP3 se compone de fotogramas MP3, que constan de un encabezado y un bloque de datos. Esta secuencia de fotogramas se denomina flujo elemental . Debido al "depósito de bits", los fotogramas no son elementos independientes y, por lo general, no se pueden extraer en límites de fotogramas arbitrarios. Los bloques de datos MP3 contienen la información de audio (comprimida) en términos de frecuencias y amplitudes. El diagrama muestra que el encabezado MP3 consta de una palabra de sincronización , que se utiliza para identificar el comienzo de un fotograma válido. A esto le sigue un bit que indica que este es el estándar MPEG y dos bits que indican que se utiliza la capa 3; de ahí MPEG-1 Audio Layer 3 o MP3. Después de esto, los valores variarán dependiendo del archivo MP3. ISO / IEC 11172-3 define el rango de valores para cada sección del encabezado junto con la especificación del encabezado. La mayoría de los archivos MP3 actuales contienen metadatos ID3 , que preceden o siguen a los fotogramas MP3, como se indica en el diagrama. El flujo de datos puede contener una suma de comprobación opcional .

El estéreo conjunto se realiza únicamente fotograma a fotograma. [71]

Codificación y decodificación

El algoritmo de codificación de MP3 generalmente se divide en cuatro partes. La parte 1 divide la señal de audio en partes más pequeñas, llamadas cuadros, y luego se realiza un filtro MDCT en la salida. La parte 2 pasa la muestra a una transformada rápida de Fourier (FFT) de 1024 puntos , luego se aplica el modelo psicoacústico y se realiza otro filtro MDCT en la salida. La parte 3 cuantifica y codifica cada muestra, lo que se conoce como asignación de ruido, que se ajusta para cumplir con los requisitos de velocidad de bits y enmascaramiento de sonido . La parte 4 formatea el flujo de bits , llamado cuadro de audio, que se compone de 4 partes, el encabezado , la verificación de errores , los datos de audio y los datos auxiliares. [35]

El estándar MPEG-1 no incluye una especificación precisa para un codificador MP3, pero proporciona ejemplos de modelos psicoacústicos, bucles de velocidad y similares en la parte no normativa del estándar original. [72] MPEG-2 duplica el número de frecuencias de muestreo admitidas y MPEG-2.5 agrega 3 más. Cuando se escribió esto, las implementaciones sugeridas estaban bastante anticuadas. Se suponía que los implementadores del estándar idearían algoritmos adecuados para eliminar partes de la información de la entrada de audio. Como resultado, estuvieron disponibles muchos codificadores MP3 diferentes, cada uno de los cuales producía archivos de diferente calidad. Las comparaciones estaban ampliamente disponibles, por lo que era fácil para un posible usuario de un codificador buscar la mejor opción. Algunos codificadores que eran competentes en la codificación a velocidades de bits más altas (como LAME ) no eran necesariamente tan buenos a velocidades de bits más bajas. Con el tiempo, LAME evolucionó en el sitio web de SourceForge hasta convertirse en el codificador MP3 CBR de facto. Posteriormente se agregó un modo ABR. El trabajo avanzó sobre la velocidad de bits variable real utilizando un objetivo de calidad entre 0 y 10. Con el tiempo, los números (como -V 9.600) pudieron generar codificación de voz de baja velocidad de bits de excelente calidad a sólo 41 kbit/s utilizando las extensiones MPEG-2.5.

MP3 utiliza una estructura MDCT superpuesta. Cada cuadro MPEG-1 MP3 tiene 1152 muestras, divididas en dos gránulos de 576 muestras. Estas muestras, inicialmente en el dominio del tiempo, se transforman en un bloque en 576 muestras en el dominio de la frecuencia mediante MDCT. [73] MP3 también permite el uso de bloques más cortos en un gránulo, hasta un tamaño de 192 muestras; Esta característica se utiliza cuando se detecta un transitorio . Al hacerlo, se limita la propagación temporal del ruido de cuantificación que acompaña al transitorio (ver psicoacústica ). La resolución de frecuencia está limitada por el tamaño pequeño de la ventana del bloque largo, lo que disminuye la eficiencia de la codificación. [71] La resolución de tiempo puede ser demasiado baja para señales altamente transitorias y puede causar manchas en los sonidos de percusión. [71]

Debido a la estructura de árbol del banco de filtros, los problemas de preeco empeoran, ya que la respuesta de impulso combinada de los dos bancos de filtros no proporciona ni puede proporcionar una solución óptima en la resolución de tiempo/frecuencia. [71] Además, la combinación de las salidas de los dos bancos de filtros crea problemas de aliasing que deben ser manejados parcialmente por la etapa de "compensación de aliasing"; sin embargo, eso crea un exceso de energía para codificar en el dominio de la frecuencia, disminuyendo así la eficiencia de la codificación. [74]

La decodificación, por otra parte, está cuidadosamente definida en la norma. La mayoría de los decodificadores son " compatibles con flujo de bits ", lo que significa que la salida descomprimida que producen a partir de un archivo MP3 determinado será la misma, dentro de un grado específico de tolerancia de redondeo , que la salida especificada matemáticamente en el documento de alto estándar ISO/IEC (ISO /CEI 11172-3). Por lo tanto, la comparación de decodificadores generalmente se basa en su eficiencia computacional (es decir, cuánta memoria o tiempo de CPU utilizan en el proceso de decodificación). Con el tiempo, esta preocupación se ha vuelto menos problemática a medida que las velocidades de reloj de la CPU pasaron de MHz a GHz. El retardo general del codificador/decodificador no está definido, lo que significa que no existe una disposición oficial para la reproducción sin interrupciones . Sin embargo, algunos codificadores como LAME pueden adjuntar metadatos adicionales que permitirán a los reproductores que puedan manejarlos ofrecer una reproducción perfecta.

Calidad

Al realizar una codificación de audio con pérdida, como al crear un flujo de datos MP3, existe un equilibrio entre la cantidad de datos generados y la calidad del sonido de los resultados. La persona que genera un MP3 selecciona una velocidad de bits, que especifica cuántos kilobits por segundo de audio se desea. Cuanto mayor sea la velocidad de bits, mayor será el flujo de datos MP3 y, en general, más parecido sonará a la grabación original. Con una velocidad de bits demasiado baja, los artefactos de compresión (es decir, sonidos que no estaban presentes en la grabación original) pueden ser audibles en la reproducción. Parte del audio es difícil de comprimir debido a su aleatoriedad y ataques bruscos. Cuando se comprime este tipo de audio, normalmente se escuchan artefactos como timbres o preecos . Una muestra de aplausos o un instrumento triangular con una velocidad de bits relativamente baja proporciona buenos ejemplos de artefactos de compresión. La mayoría de las pruebas subjetivas de códecs de percepción tienden a evitar el uso de este tipo de materiales sonoros; sin embargo, los artefactos generados por los sonidos de percusión son apenas perceptibles debido a la característica de enmascaramiento temporal específica del banco de filtros de 32 subbandas de la Capa II en el que se basa el formato. .

Además de la velocidad de bits de una pieza de audio codificada, la calidad del sonido codificado en MP3 también depende de la calidad del algoritmo del codificador, así como de la complejidad de la señal que se codifica. Como el estándar MP3 permite bastante libertad con los algoritmos de codificación, diferentes codificadores presentan una calidad bastante diferente, incluso con velocidades de bits idénticas. A modo de ejemplo, en una prueba de escucha pública con dos de los primeros codificadores de MP3 configurados a aproximadamente 128 kbit/s, [75] uno obtuvo una puntuación de 3,66 en una escala de 1 a 5, mientras que el otro obtuvo sólo 2,22. La calidad depende de la elección del codificador y de los parámetros de codificación. [76]

Esta observación provocó una revolución en la codificación de audio. Al principio, la tasa de bits era la principal y única consideración. En aquella época, los archivos MP3 eran del tipo más simple: utilizaban la misma velocidad de bits para todo el archivo: este proceso se conoce como codificación de velocidad de bits constante (CBR). El uso de una velocidad de bits constante hace que la codificación sea más sencilla y consuma menos CPU. Sin embargo, también es posible optimizar el tamaño del archivo creando archivos donde la velocidad de bits cambia a lo largo del archivo. Estos se conocen como velocidad de bits variable. El depósito de bits y la codificación VBR formaban parte del estándar MPEG-1 original. El concepto detrás de ellos es que, en cualquier pieza de audio, algunas secciones son más fáciles de comprimir, como el silencio o la música que contiene sólo unos pocos tonos, mientras que otras serán más difíciles de comprimir. Por lo tanto, la calidad general del archivo se puede aumentar utilizando una velocidad de bits más baja para los pasajes menos complejos y una más alta para las partes más complejas. Con algunos codificadores MP3 avanzados, es posible especificar una calidad determinada y el codificador ajustará la velocidad de bits en consecuencia. Los usuarios que deseen una "configuración de calidad" particular que sea transparente para sus oídos pueden usar este valor al codificar toda su música y, en general, no necesitan preocuparse por realizar pruebas de escucha personales en cada pieza musical para determinar la velocidad de bits correcta.

La calidad percibida puede verse influenciada por el entorno de escucha (ruido ambiental), la atención del oyente, su entrenamiento y, en la mayoría de los casos, por el equipo de audio del oyente (como tarjetas de sonido, parlantes y auriculares). Además, se puede lograr una calidad suficiente mediante una configuración de calidad menor para conferencias y aplicaciones de habla humana y se reduce el tiempo y la complejidad de codificación. Una prueba realizada a nuevos estudiantes por el profesor de música de la Universidad de Stanford, Jonathan Berger, mostró que la preferencia de los estudiantes por la música con calidad MP3 ha aumentado cada año. Berger dijo que los estudiantes parecen preferir los sonidos chisporroteantes que los MP3 aportan a la música. [77]

Un estudio en profundidad de la calidad de audio MP3, el proyecto del artista sonoro y compositor Ryan Maguire "The Ghost in the MP3" aísla los sonidos perdidos durante la compresión de MP3. En 2015, lanzó la pista "moDernisT" (un anagrama de "Tom's Diner"), compuesta exclusivamente a partir de los sonidos eliminados durante la compresión MP3 de la canción "Tom's Diner", [78] [79] [80] la pista utilizada originalmente. en la formulación del estándar MP3. En las Actas de la Conferencia Internacional de Música por Computadora de 2014 se publicó una descripción detallada de las técnicas utilizadas para aislar los sonidos eliminados durante la compresión de MP3, junto con la motivación conceptual del proyecto. [81]

tasa de bits

La velocidad de bits es el producto de la frecuencia de muestreo y el número de bits por muestra utilizados para codificar la música. El audio del CD es de 44100 muestras por segundo. La cantidad de bits por muestra también depende de la cantidad de canales de audio. El CD es estéreo y 16 bits por canal. Entonces, multiplicar 44100 por 32 da 1411200: la velocidad de bits del audio digital de CD sin comprimir. MP3 fue diseñado para codificar estos datos de 1411 kbit/s a 320 kbit/s o menos. A medida que los algoritmos MP3 detectan pasajes menos complejos, se pueden emplear velocidades de bits más bajas. Cuando se utiliza MPEG-2 en lugar de MPEG-1, MP3 solo admite velocidades de muestreo más bajas (16.000, 22.050 o 24.000 muestras por segundo) y ofrece opciones de velocidades de bits tan bajas como 8 kbit/s pero no superiores a 160 kbit/s. Al reducir la frecuencia de muestreo, MPEG-2 capa III elimina todas las frecuencias por encima de la mitad de la nueva frecuencia de muestreo que pudo haber estado presente en el audio fuente.

Como se muestra en estas dos tablas, se permiten 14 velocidades de bits seleccionadas en el estándar MPEG-1 Audio Layer III: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 y 320 kbit. /s, junto con las 3 frecuencias de muestreo más altas disponibles de 32, 44,1 y 48  kHz . [65] MPEG-2 Audio Layer III también permite 14 velocidades de bits algo diferentes (y en su mayoría más bajas) de 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 kbit. /s con velocidades de muestreo de 16, 22,05 y 24  kHz , que son exactamente la mitad que MPEG-1. [65] Los cuadros MPEG-2.5 Audio Layer III están limitados a solo 8 velocidades de bits de 8, 16, 24, 32, 40, 48, 56 y 64 kbit/s con 3 velocidades de muestreo aún más bajas de 8, 11,025 y 12 kHz. . [ cita necesaria ] En sistemas anteriores que solo admiten el estándar MPEG-1 Audio Layer III, los archivos MP3 con una velocidad de bits inferior a 32 kbit/s pueden reproducirse acelerados y con tono elevado.

Los sistemas anteriores también carecen de controles de reproducción de avance y rebobinado rápidos en MP3. [83] [84]

Los fotogramas MPEG-1 contienen la mayor cantidad de detalles en el modo de 320 kbit/s, la configuración de velocidad de bits más alta permitida, [85] y el silencio y los tonos simples aún requieren 32 kbit/s. Los fotogramas MPEG-2 pueden capturar reproducciones de sonido de hasta 12 kHz y necesitan hasta 160 kbit/s. Los archivos MP3 creados con MPEG-2 no tienen un ancho de banda de 20 kHz debido al teorema de muestreo de Nyquist-Shannon . La reproducción de frecuencia es siempre estrictamente inferior a la mitad de la frecuencia de muestreo, y los filtros imperfectos requieren un mayor margen de error (nivel de ruido versus nitidez del filtro), por lo que una frecuencia de muestreo de 8 kHz limita la frecuencia máxima a 4 kHz, mientras que un muestreo de 48 kHz La velocidad limita un MP3 a una reproducción de sonido máxima de 24 kHz. MPEG-2 utiliza la mitad y MPEG-2.5 sólo una cuarta parte de las frecuencias de muestreo de MPEG-1.

Para el campo general de la reproducción del habla humana, un ancho de banda de 5.512 Hz es suficiente para producir excelentes resultados (para voz) utilizando una frecuencia de muestreo de 11.025 y codificación VBR de 44.100 archivos WAV (estándar). Los angloparlantes promedian 41–42 kbit/s con la configuración -V 9.6, pero esto puede variar según la cantidad de silencio grabado o la velocidad de entrega (ppm). El remuestreo a 12.000 (ancho de banda de 6K) se selecciona mediante el parámetro LAME -V 9.4. Asimismo, -V 9.2 selecciona una frecuencia de muestreo de 16.000 y un filtrado de paso bajo de 8K resultante. Las versiones anteriores de LAME y FFmpeg solo admiten argumentos enteros para el parámetro de selección de calidad de velocidad de bits variable. El parámetro de calidad n.nnn (-V) está documentado en lame.sourceforge.net, pero solo se admite en LAME con el nuevo selector de calidad de velocidad de bits variable VBR, no con la velocidad de bits promedio (ABR).

Una frecuencia de muestreo de 44,1 kHz se utiliza habitualmente para la reproducción de música porque también se utiliza para el audio de CD , la fuente principal utilizada para crear archivos MP3. En Internet se utiliza una gran variedad de velocidades de bits. Comúnmente se utiliza una velocidad de bits de 128 kbit/s, [86] con una relación de compresión de 11:1, lo que ofrece una calidad de audio adecuada en un espacio relativamente pequeño. A medida que la disponibilidad de ancho de banda de Internet y el tamaño de los discos duros han aumentado, se han generalizado velocidades de bits más altas, de hasta 320 kbit/s. El audio sin comprimir almacenado en un CD de audio tiene una velocidad de bits de 1.411,2 kbit/s (16 bits/muestra × 44.100 muestras/segundo × 2 canales / 1.000 bits/kilobit), por lo que las velocidades de bits son 128, 160 y 192 kbit. /s representan relaciones de compresión de aproximadamente 11:1, 9:1 y 7:1 respectivamente.

Se pueden lograr velocidades de bits no estándar de hasta 640 kbit/s con el codificador LAME y la opción de formato libre, aunque pocos reproductores MP3 pueden reproducir esos archivos. Según el estándar ISO, los decodificadores sólo deben poder decodificar flujos de hasta 320 kbit/s. [87] [88] [89] Los primeros codificadores MPEG Layer III usaban lo que ahora se llama velocidad de bits constante (CBR). El software sólo pudo utilizar una velocidad de bits uniforme en todos los fotogramas de un archivo MP3. Posteriormente, codificadores de MP3 más sofisticados pudieron utilizar el depósito de bits para alcanzar una velocidad de bits promedio seleccionando la velocidad de codificación para cada cuadro en función de la complejidad del sonido en esa parte de la grabación.

Un codificador de MP3 más sofisticado puede producir audio con velocidad de bits variable. El audio MPEG puede utilizar conmutación de velocidad de bits por cuadro, pero solo los decodificadores de capa III deben admitirlo. [65] [90] [91] [92] VBR se utiliza cuando el objetivo es lograr un nivel fijo de calidad. El tamaño de archivo final de una codificación VBR es menos predecible que con una velocidad de bits constante. La velocidad de bits promedio es un tipo de VBR implementado como un compromiso entre los dos: se permite que la velocidad de bits varíe para lograr una calidad más consistente, pero se controla para que permanezca cerca de un valor promedio elegido por el usuario, para tamaños de archivos predecibles. Aunque un decodificador de MP3 debe admitir VBR para cumplir con los estándares, históricamente algunos decodificadores han tenido errores con la decodificación VBR, particularmente antes de que los codificadores VBR se generalizaran. El codificador MP3 LAME más evolucionado admite la generación de formatos VBR, ABR e incluso los formatos MP3 CBR más antiguos.

El audio de capa III también puede utilizar un "depósito de bits", la capacidad de un fotograma parcialmente completo para contener parte de los datos de audio del siguiente fotograma, lo que permite cambios temporales en la velocidad de bits efectiva, incluso en un flujo de velocidad de bits constante. [65] [90] El manejo interno del depósito de bits aumenta el retraso de codificación. [ cita necesaria ] No existe una banda de factor de escala 21 (sfb21) para frecuencias superiores a aproximadamente 16  kHz , lo que obliga al codificador a elegir entre una representación menos precisa en la banda 21 o un almacenamiento menos eficiente en todas las bandas por debajo de la banda 21, lo que resulta en un desperdicio de bits. tasa en codificación VBR. [93]

Datos auxiliares

El campo de datos auxiliares se puede utilizar para almacenar datos definidos por el usuario. Los datos auxiliares son opcionales y el número de bits disponibles no se proporciona explícitamente. Los datos auxiliares se encuentran después de los bits del código Huffman y van hasta donde apunta main_data_begin del siguiente cuadro. El codificador mp3PRO utilizó datos auxiliares para codificar información adicional que podría mejorar la calidad del audio cuando se decodifica con su algoritmo.

Metadatos

Una "etiqueta" en un archivo de audio es una sección del archivo que contiene metadatos como el título, artista, álbum, número de pista u otra información sobre el contenido del archivo. Los estándares MP3 no definen formatos de etiquetas para archivos MP3, ni existe un formato contenedor estándar que admita metadatos y elimine la necesidad de etiquetas. Sin embargo, existen varios estándares de facto para formatos de etiquetas. A partir de 2010, los más extendidos son ID3v1 e ID3v2 , y el más recientemente introducido APEv2 . Estas etiquetas normalmente están incrustadas al principio o al final de los archivos MP3, separadas de los datos del cuadro MP3 real. Los decodificadores de MP3 extraen información de las etiquetas o simplemente las tratan como datos basura ignorables que no son MP3.

El software de reproducción y edición a menudo contiene funciones de edición de etiquetas, pero también existen aplicaciones de edición de etiquetas dedicadas a este propósito. Además de los metadatos sobre el contenido de audio, también se pueden utilizar etiquetas para DRM . [94] ReplayGain es un estándar para medir y almacenar el volumen de un archivo MP3 ( normalización de audio ) en su etiqueta de metadatos, lo que permite a un reproductor compatible con ReplayGain ajustar automáticamente el volumen de reproducción general de cada archivo. MP3Gain se puede utilizar para modificar archivos de forma reversible según las mediciones de ReplayGain, de modo que se pueda lograr una reproducción ajustada en reproductores sin capacidad ReplayGain.

Licencias, propiedad y legislación

La tecnología básica de codificación y decodificación de MP3 no tiene patentes en la Unión Europea; todas las patentes expiraron a más tardar en 2012. En los Estados Unidos, la tecnología quedó prácticamente libre de patentes el 16 de abril de 2017 (ver más abajo). Las patentes de MP3 expiraron en EE. UU. entre 2007 y 2017. En el pasado, muchas organizaciones han reclamado la propiedad de patentes relacionadas con la decodificación o codificación de MP3. Estos reclamos dieron lugar a varias amenazas y acciones legales de diversas fuentes. Como resultado, en los países que permiten patentes de software , la incertidumbre sobre qué patentes deben haber sido licenciadas para crear productos MP3 sin cometer infracción de patentes fue común en las primeras etapas de la adopción de la tecnología.

El estándar inicial MPEG-1 casi completo (partes 1, 2 y 3) estuvo disponible públicamente el 6 de diciembre de 1991 como ISO CD 11172. [95] [96] En la mayoría de los países, las patentes no se pueden presentar una vez que se ha creado el estado de la técnica. públicas, y las patentes caducan 20 años después de la fecha de presentación inicial, que puede ser hasta 12 meses después para presentaciones en otros países. Como resultado, las patentes necesarias para implementar MP3 expiraron en la mayoría de los países en diciembre de 2012, 21 años después de la publicación de ISO CD 11172.

Una excepción son los Estados Unidos, donde las patentes vigentes pero presentadas antes del 8 de junio de 1995 expiran después de 17 años desde la fecha de emisión o 20 años desde la fecha de prioridad, lo que ocurra más tarde. Un largo proceso de tramitación de patentes puede dar lugar a que una patente se emita mucho más tarde de lo esperado normalmente (ver patentes submarinas ). Las diversas patentes relacionadas con MP3 expiraron en fechas que van desde 2007 hasta 2017 en los Estados Unidos. [97] Las patentes para cualquier cosa descrita en ISO CD 11172 presentadas un año o más después de su publicación son cuestionables. Si solo se consideran las patentes conocidas de MP3 presentadas en diciembre de 1992, entonces la decodificación de MP3 ha estado libre de patentes en los EE. UU. desde el 22 de septiembre de 2015, cuando expiró la patente estadounidense 5.812.672 , que tenía una solicitud PCT en octubre de 1992. [98] [99] [100] Si se toma como medida la patente de mayor duración mencionada en las referencias antes mencionadas, entonces la tecnología MP3 quedó libre de patente en los Estados Unidos el 16 de abril de 2017, cuando la patente estadounidense 6,009,399 , tenía [ 101] y administrado por Technicolor , [102] expiró. Como resultado, muchos proyectos de software gratuitos y de código abierto , como el sistema operativo Fedora , han decidido comenzar a ofrecer soporte para MP3 de forma predeterminada, y los usuarios ya no tendrán que recurrir a la instalación de paquetes no oficiales mantenidos por repositorios de software de terceros para MP3. reproducción o codificación. [103]

Technicolor (anteriormente llamado Thomson Consumer Electronics) afirmó controlar las licencias MP3 de las patentes de Capa 3 en muchos países, incluidos Estados Unidos, Japón, Canadá y países de la UE. [104] Technicolor había estado haciendo cumplir activamente estas patentes. [105] Los ingresos por licencias de MP3 de la administración de Technicolor generaron alrededor de 100 millones de euros para la Sociedad Fraunhofer en 2005. [106] En septiembre de 1998, el Instituto Fraunhofer envió una carta a varios desarrolladores de software MP3 afirmando que se necesitaba una licencia para "distribuir y /o vender decodificadores y/o codificadores". La carta afirmaba que los productos sin licencia "infringen los derechos de patente de Fraunhofer y Thomson. Para fabricar, vender o distribuir productos utilizando el estándar [MPEG Layer-3] y, por tanto, nuestras patentes, es necesario obtener de nuestra parte una licencia bajo estas patentes". [107] Esto llevó a una situación en la que el proyecto del codificador MP3 LAME no podía ofrecer a sus usuarios archivos binarios oficiales que pudieran ejecutarse en sus computadoras. La posición del proyecto era que, como código fuente, LAME era simplemente una descripción de cómo se podía implementar un codificador MP3. Extraoficialmente, los binarios compilados estaban disponibles en otras fuentes.

Sisvel SpA, una empresa con sede en Luxemburgo, administra licencias de patentes aplicables a MPEG Audio. [108] Ellos, junto con su filial estadounidense Audio MPEG, Inc., demandaron previamente a Thomson por infracción de patente sobre tecnología MP3, [109] pero esas disputas se resolvieron en noviembre de 2005 cuando Sisvel otorgó a Thomson una licencia para sus patentes. Motorola siguió poco después y firmó con Sisvel para otorgar licencias de patentes relacionadas con MP3 en diciembre de 2005. [110] Excepto tres patentes, las patentes estadounidenses administradas por Sisvel [111] habían expirado todas en 2015. Las tres excepciones son: patente estadounidense 5.878.080 , expiró en febrero de 2017; patente estadounidense 5.850.456 , vencida en febrero de 2017; y la patente estadounidense 5.960.037 , que expiró el 9 de abril de 2017. Aproximadamente en el primer trimestre de 2023, el programa de licencias de Sisvel se ha convertido en un legado. [112]

En septiembre de 2006, funcionarios alemanes confiscaron reproductores MP3 del stand de SanDisk en la feria IFA de Berlín después de que una empresa de patentes italiana ganara una orden judicial en nombre de Sisvel contra SanDisk en una disputa sobre derechos de licencia. La orden judicial fue posteriormente revocada por un juez de Berlín, [113] pero esa revocación fue a su vez bloqueada el mismo día por otro juez del mismo tribunal, "trayendo el Salvaje Oeste de Patentes a Alemania" en palabras de un comentarista. [114] En febrero de 2007, Texas MP3 Technologies demandó a Apple, Samsung Electronics y Sandisk en un tribunal federal del este de Texas , alegando infracción de una patente de reproductor MP3 portátil que Texas MP3 dijo que le había sido asignada. Apple, Samsung y Sandisk resolvieron las demandas en su contra en enero de 2009. [115] [116]

Alcatel-Lucent ha hecho valer varias patentes de codificación y compresión de MP3, supuestamente heredadas de AT&T-Bell Labs, en su propio litigio. En noviembre de 2006, antes de la fusión de las empresas, Alcatel demandó a Microsoft por presunta infracción de siete patentes. El 23 de febrero de 2007, un jurado de San Diego concedió a Alcatel-Lucent 1.520 millones de dólares en concepto de daños y perjuicios por la infracción de dos de ellos. [117] Sin embargo, posteriormente el tribunal revocó el laudo al considerar que una patente no había sido infringida y que la otra no era propiedad de Alcatel-Lucent; era copropiedad de AT&T y Fraunhofer, quien había otorgado la licencia a Microsoft , dictaminó el juez. [118] Esa sentencia de la defensa fue confirmada en apelación en 2008. [119]

Tecnologías alternativas

Existen otros formatos con pérdida. Entre ellos, la codificación de audio avanzada (AAC) es la más utilizada y fue diseñada para ser la sucesora del MP3. También existen otros formatos con pérdida como mp3PRO y MP2 . Son miembros de la misma familia tecnológica que el MP3 y dependen de modelos psicoacústicos y algoritmos MDCT más o menos similares. Mientras que MP3 utiliza un enfoque de codificación híbrido que es en parte MDCT y en parte FFT , AAC es puramente MDCT, lo que mejora significativamente la eficiencia de la compresión. [120] Muchas de las patentes básicas que subyacen a estos formatos pertenecen a Fraunhofer Society, Alcatel-Lucent, Thomson Consumer Electronics , [120] Bell , Dolby , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , [121] ETRI , JVC Kenwood , Philips , Microsoft y NTT . [122]

Cuando el mercado de reproductores de audio digitales estaba despegando, el MP3 fue ampliamente adoptado como estándar, de ahí el nombre popular de "reproductor MP3". Sony fue una excepción y utilizó su propio códec ATRAC tomado de su formato MiniDisc , que según Sony era mejor. [123] Tras las críticas y las ventas de Walkman inferiores a las esperadas , en 2004 Sony introdujo por primera vez compatibilidad nativa con MP3 en sus reproductores Walkman. [124]

También hay formatos de compresión abiertos como Opus y Vorbis que están disponibles de forma gratuita y sin restricciones de patentes conocidas. Algunos de los formatos de compresión de audio más nuevos, como AAC, WMA Pro, Vorbis y Opus, no tienen algunas limitaciones inherentes al formato MP3 que ningún codificador MP3 puede superar. [97] [125]

Además de los métodos de compresión con pérdida, los formatos sin pérdida son una alternativa importante al MP3 porque proporcionan contenido de audio inalterado, aunque con un tamaño de archivo mayor en comparación con la compresión con pérdida. Los formatos sin pérdida incluyen FLAC (Free Lossless Audio Codec), Apple Lossless y muchos otros.

Ver también

Referencias

  1. ^ ab "¡Feliz cumpleaños MP3!". Fraunhofer IIS. 12 de julio de 2005 . Consultado el 18 de julio de 2010 .
  2. ^ Nilsson, M. (noviembre de 2000). "El tipo de medio audio/mpeg: RFC 3003". IETF. doi : 10.17487/RFC3003 . Consultado el 7 de diciembre de 2009 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  3. ^ Casner, S.; Hoschka, P. (julio de 2003). "Registro de tipo MIME de formatos de carga útil RTP - RFC 3555". IETF. doi : 10.17487/RFC3555 . Consultado el 7 de diciembre de 2009 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  4. ^ ab Finlayson, R. (febrero de 2008). "Un formato de carga útil RTP más tolerante a las pérdidas para audio MP3: RFC 5219". IETF. doi : 10.17487/RFC5219 . Consultado el 4 de diciembre de 2014 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  5. ^ "El equipo mp3". Fraunhofer IIS . Consultado el 12 de junio de 2020 .
  6. ^ Patel K, Smith BC, Rowe LA (1 de septiembre de 1993). "Rendimiento de un software decodificador de vídeo MPEG". Actas de la primera conferencia internacional ACM sobre Multimedia - MULTIMEDIA '93 . ACM Multimedia. Ciudad de Nueva York: Asociación de Maquinaria de Computación. págs. 75–82. doi :10.1145/166266.166274. ISBN 978-0-89791-596-0. S2CID  3773268.La referencia 3 en el documento es el Borrador del Comité de la Norma ISO/IEC 11172, 6 de diciembre de 1991.
  7. ^ abcd "ISO/IEC 11172-3:1993 - Tecnología de la información - Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital de hasta aproximadamente 1,5 Mbit/s - Parte 3: Audio". YO ASI. 1993 . Consultado el 14 de julio de 2010 .
  8. ^ abcd "ISO/IEC 13818-3:1995 - Tecnología de la información - Codificación genérica de imágenes en movimiento e información de audio asociada - Parte 3: Audio". YO ASI. 1995 . Consultado el 14 de julio de 2010 .
  9. ^ "Tecnología MP3 en Fraunhofer IIS". Fraunhofer IIS . Archivado desde el original el 15 de agosto de 2021 . Consultado el 12 de junio de 2020 .
  10. ^ MP3 (codificación de audio MPEG Layer III) (borrador completo). Sostenibilidad de los Formatos Digitales. Washington, DC: Biblioteca del Congreso. 3 de mayo de 2017 . Consultado el 1 de diciembre de 2021 .
  11. ^ "73. "Padre" del MP3, Karlheinz Brandenburg" - a través de www.youtube.com.
  12. ^ "En el vigésimo cumpleaños del MP3, una entrevista con el" padre "del MP3, Karlheinz Brandenburg".
  13. ^ Jayant, Nikil ; Johnston, James; Safranek, Robert (octubre de 1993). "Compresión de señales basada en modelos de percepción humana". Actas del IEEE . 81 (10): 1385-1422. doi :10.1109/5.241504.
  14. ^ "MP3 (codificación de audio MPEG capa III)". La Biblioteca del Congreso. 27 de julio de 2017 . Consultado el 9 de noviembre de 2017 .
  15. ^ ab ISO (noviembre de 1991). "Comunicado de prensa MPEG, Kurihama, noviembre de 1991". YO ASI. Archivado desde el original el 3 de mayo de 2011 . Consultado el 17 de julio de 2010 .
  16. ^ abcde ISO (noviembre de 1991). "CD 11172-3 - CODIFICACIÓN DE IMÁGENES EN MOVIMIENTO Y AUDIO ASOCIADO PARA MEDIOS DE ALMACENAMIENTO DIGITAL HASTA APROXIMADAMENTE 1,5 MBIT/s Parte 3 AUDIO" (PDF) . Archivado desde el original (PDF) el 30 de diciembre de 2013 . Consultado el 17 de julio de 2010 .
  17. ^ ab ISO (6 de noviembre de 1992). "Comunicado de prensa MPEG, Londres, 6 de noviembre de 1992". Chiariglione. Archivado desde el original el 12 de agosto de 2010 . Consultado el 17 de julio de 2010 .
  18. ^ abc ISO (octubre de 1998). "Preguntas frecuentes sobre MPEG Audio versión 9: MPEG-1 y MPEG-2 BC". YO ASI . Consultado el 28 de octubre de 2009 .
  19. ^ Mayer, Alfred Marshall (1894). "Investigaciones en Acústica". Revista Filosófica de Londres, Edimburgo y Dublín . 37 (226): 259–288. doi :10.1080/14786449408620544.
  20. ^ Ehmer, Richard H. (1959). "Enmascaramiento por tonos frente a bandas de ruido". La Revista de la Sociedad de Acústica de América . 31 (9): 1253. Código bibliográfico : 1959ASAJ...31.1253E. doi :10.1121/1.1907853.
  21. ^ Zwicker, Eberhard (1974). "Sobre un equivalente psicoacústico de curvas de afinación". Hechos y modelos en audiencia. Comunicación y Cibernética. vol. 8. págs. 132-141. doi :10.1007/978-3-642-65902-7_19. ISBN 978-3-642-65904-1.
  22. ^ Zwicker, Eberhard; Feldtkeller, Richard (1999) [1967]. Das Ohr als Nachrichtenempfänger [ El oído como receptor de comunicación ]. Trans. de Hannes Müsch, Søren Buus y Mary Florentine. Archivado desde el original el 14 de septiembre de 2000 . Consultado el 29 de junio de 2008 .
  23. ^ Fletcher, Harvey (1995). Habla y audición en la comunicación . Sociedad de Acústica de América. ISBN 978-1-56396-393-3.
  24. ^ abc Schroeder, Manfred R. (2014). "Laboratorios Bell". Acústica, información y comunicación: volumen conmemorativo en honor a Manfred R. Schroeder . Saltador. pag. 388.ISBN _ 978-3-319-05660-9.
  25. ^ Gris, Robert M. (2010). "Una historia del habla digital en tiempo real en redes de paquetes: parte II de la codificación predictiva lineal y el protocolo de Internet" (PDF) . Encontró. Proceso de señales de tendencias . 3 (4): 203–303. doi : 10.1561/2000000036 . ISSN  1932-8346.
  26. ^ Atal, B.; Schroeder, M. (1978). "Codificación predictiva de señales de voz y criterios de error subjetivos". ICASSP '78. Conferencia internacional IEEE sobre acústica, voz y procesamiento de señales . vol. 3. págs. 573–576. doi :10.1109/ICASSP.1978.1170564.
  27. ^ Schroeder, señor ; Atal, BS ; Hall, JL (diciembre de 1979). "Optimización de codificadores de voz digitales aprovechando las propiedades de enmascaramiento del oído humano". La Revista de la Sociedad de Acústica de América . 66 (6): 1647. Código bibliográfico : 1979ASAJ...66.1647S. doi : 10.1121/1.383662.
  28. ^ Krasner, MA (18 de junio de 1979). Codificación digital de señales de voz y audio basada en los requisitos de percepción del sistema auditivo (Tesis). Instituto de Tecnología de Massachusetts. hdl :1721.1/16011.
  29. ^ Krasner, MA (18 de junio de 1979). "Codificación digital del habla basada en el requisito perceptual del sistema auditivo (Informe técnico 535)" (PDF) . Archivado (PDF) desde el original el 3 de septiembre de 2017.
  30. ^ Ahmed, Nasir (enero de 1991). "Cómo se me ocurrió la transformada del coseno discreto". Procesamiento de señales digitales . 1 (1): 4–5. doi :10.1016/1051-2004(91)90086-Z.
  31. ^ Ahmed, Nasir ; Natarajan, T.; Rao, KR (enero de 1974), "Transformada de coseno discreta", IEEE Transactions on Computers , C-23 (1): 90–93, doi :10.1109/TC.1974.223784, S2CID  149806273
  32. ^ Rao, KR ; Yip, P. (1990), Transformada de coseno discreta: algoritmos, ventajas, aplicaciones , Boston: Academic Press, ISBN 978-0-12-580203-1
  33. ^ JP Princen, AW Johnson y AB Bradley: codificación de subbanda/transformación utilizando diseños de bancos de filtros basados ​​en la cancelación de alias en el dominio del tiempo , IEEE Proc. Internacional Conferencia sobre acústica, habla y procesamiento de señales (ICASSP), 2161–2164, 1987
  34. ^ John P. Princen, Alan B. Bradley: Diseño de banco de filtros de análisis/síntesis basado en la cancelación de alias en el dominio del tiempo , IEEE Trans. Acústico. Procesamiento de señales de voz, ASSP-34 (5), 1153–1161, 1986
  35. ^ ab Guckert, John (primavera de 2012). "El uso de FFT y MDCT en la compresión de audio MP3" (PDF) . Universidad de Utah . Consultado el 14 de julio de 2019 .
  36. ^ Terhardt, E.; Stoll, G.; Seewann, M. (marzo de 1982). "Algoritmo para la extracción del tono y la prominencia del tono a partir de señales tonales complejas". La Revista de la Sociedad de Acústica de América . 71 (3): 679. Código bibliográfico : 1982ASAJ...71..679T. doi : 10.1121/1.387544.
  37. ^ ab "Codificación de voz para comunicaciones". Revista IEEE sobre áreas seleccionadas de las comunicaciones . 6 (2). Febrero de 1988.
  38. ^ abc Génesis del estándar de codificación de audio MP3 en IEEE Transactions on Consumer Electronics, IEEE, vol. 52, núm. 3, págs. 1043-1049, agosto de 2006
  39. ^ Brandeburgo, Karlheinz; Seitzer, Dieter (3 a 6 de noviembre de 1988). OCF: Codificación de audio de alta calidad con velocidades de datos de 64 kbit/s. 85ª Convención de la Sociedad de Ingeniería de Audio.
  40. ^ Johnston, James D. (febrero de 1988). "Transformar la codificación de señales de audio utilizando criterios de ruido perceptual". Revista IEEE sobre áreas seleccionadas de las comunicaciones . 6 (2): 314–323. doi :10.1109/49.608.
  41. ^ YF Dehery, et al. (1991) Un códec fuente MUSICAM para transmisión y almacenamiento de audio digital. Actas IEEE-ICASSP 91 páginas 3605–3608, mayo de 1991.
  42. ^ "Un comentario de DAB de Alan Box, comunicación de EZ y presidente del grupo de trabajo NAB DAB" (PDF) .
  43. ^ EBU SQAM CD Evaluación de la calidad del sonido Grabaciones de material para pruebas subjetivas. 7 de octubre de 2008.
  44. ^ ab Ewing, Jack (5 de marzo de 2007). "Cómo nació el MP3". Semana empresarial de Bloomberg . Consultado el 24 de julio de 2007 .
  45. ^ Witt, Stephen (2016). Cómo la música se volvió gratuita: el fin de una industria, el cambio de siglo y el paciente cero de la piratería . Estados Unidos de América: Penguin Books. pag. 13.ISBN _ 978-0-14-310934-1. A Brandenburg y Grill se unieron otros cuatro investigadores de Fraunhofer. Heinz Gerhauser supervisó el grupo de investigación de audio del instituto; Harald Popp era especialista en hardware; Ernst Eberlein era un experto en procesamiento de señales; Jurgen Herre fue otro estudiante de posgrado cuya destreza matemática rivalizaba con la del propio Brandeburgo. En años posteriores, este grupo se referiría a sí mismo como "los seis originales".
  46. ^ Jonathan Sterne (17 de julio de 2012). MP3: el significado de un formato. Prensa de la Universidad de Duke. pag. 178.ISBN _ 978-0-8223-5287-7.
  47. ^ "Suzanne Vega | Biografía". La Comunidad Oficial de Suzanne Vega . Consultado el 17 de enero de 2022 .
  48. ^ Tecnología de transmisión de audio y video digital: una guía práctica de ingeniería (tecnología de señales y comunicación) ISBN 3-540-76357-0 p. 144: "En el año 1988, el método MASCAM se desarrolló en el Institut für Rundfunktechnik (IRT) de Múnich como preparación para el sistema de radiodifusión de audio digital (DAB). De MASCAM surgió el MUSICAM (codificación y multiplexación integrada de subbanda universal de patrón de enmascaramiento) El método fue desarrollado en 1989 en cooperación con CCETT, Philips y Matsushita." 
  49. ^ "Informe de estado de ISO MPEG" (Presione soltar). Organización Internacional de Normalización . Septiembre de 1990. Archivado desde el original el 14 de febrero de 2010.
  50. ^ "Codificación de entropía espectral adaptativa de aspectos de señales musicales de alta calidad". Biblioteca electrónica AES . 1991 . Consultado el 24 de agosto de 2010 .
  51. ^ "El MP3: una historia de innovación y traición". NPR . 23 de marzo de 2011 . Consultado el 3 de agosto de 2023 .
  52. ^ MPEG (25 de marzo de 1994). "Aprobado en la 26ª reunión (París)". Archivado desde el original el 26 de julio de 2010 . Consultado el 5 de agosto de 2010 .
  53. ^ MPEG (11 de noviembre de 1994). "Aprobado en la 29ª reunión". Archivado desde el original el 8 de agosto de 2010 . Consultado el 5 de agosto de 2010 .
  54. ^ ISO. "ISO/IEC TR 11172-5:1998 - Tecnología de la información - Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital de hasta aproximadamente 1,5 Mbit/s - Parte 5: Simulación de software" . Consultado el 5 de agosto de 2010 .
  55. ^ "ISO/IEC TR 11172-5:1998 - Tecnología de la información - Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital de hasta aproximadamente 1,5 Mbit/s - Parte 5: Simulación de software (software de referencia)" (ZIP) . Consultado el 5 de agosto de 2010 .
  56. ^ Dehery, Yves-François (1994). Un estándar de codificación de sonido de alta calidad para sistemas de radiodifusión, telecomunicaciones y multimedia . Países Bajos: Elsevier Science BV. págs. 53–64. ISBN 978-0-444-81580-4. Este artículo se refiere a una estación de trabajo de audio digital comprimido Musicam (MPEG Audio Layer II) implementada en un microordenador que se utiliza no sólo como estación de edición profesional sino también como servidor en Ethernet para una biblioteca de audio digital comprimido, anticipando así el futuro MP3 en Internet.
  57. ^ "MP3, la tecnología actual". Mucha información informativa sobre música . 2005. Archivado desde el original el 4 de julio de 2008 . Consultado el 15 de septiembre de 2016 .
  58. ^ La máquina de discos celestial en The Atlantic "Para mostrar a las industrias cómo usar el códec, MPEG creó un programa de muestra gratuito que convertía música en archivos MP3. El software de demostración creó un sonido de mala calidad y Fraunhofer no tenía la intención de usarlo. El "código fuente" del software (sus instrucciones subyacentes) se almacenó en una computadora de fácil acceso en la Universidad de Erlangen, desde donde fue descargado por un tal SoloH, un hacker de los Países Bajos (y, se supone, un fanático de Star Wars). SoloH renovó el código fuente para producir software que convertía pistas de discos compactos en archivos de música de calidad aceptable". (2000)
  59. ^ Ídolos del pop y piratas: mecanismos de consumo y circulación global... por el Dr. Charles Fairchild
  60. ^ ¿ Tecnologías de piratería? - Explorando la interacción entre comercialismo e idealismo en el desarrollo de MP3 y DivX por HENDRIK STORSTEIN SPILKER, SVEIN HÖIER, página 2072
  61. ^ www.euronet.nl/~soloh/mpegEnc/ ( Archive.org )
  62. ^ ab "Aprobado en la 22ª reunión del GT11" (Comunicado de prensa). Organización Internacional de Normalización . 2 de abril de 1993. Archivado desde el original el 6 de agosto de 2010 . Consultado el 18 de julio de 2010 .
  63. ^ Brandeburgo, Karlheinz; Bosi, Marina (febrero de 1997). "Descripción general de audio MPEG: estándares actuales y futuros para codificación de audio de baja velocidad de bits". Revista de la Sociedad de Ingeniería de Audio . 45 (1/2): 4–21 . Consultado el 30 de junio de 2008 .
  64. ^ abcd "Detalles técnicos de MP3 (MPEG-2 y MPEG-2.5)". Fraunhofer IIS . Septiembre de 2007. Archivado desde el original el 24 de enero de 2008."MPEG-2.5" es el nombre de una extensión patentada desarrollada por Fraunhofer IIS. Permite que MP3 funcione satisfactoriamente a velocidades de bits muy bajas e introduce frecuencias de muestreo adicionales de 8 kHz, 11,025 kHz y 12 kHz.
  65. ^ abcdefghi Supurovic, Predrag (22 de diciembre de 1999). "Encabezado de cuadro de audio MPEG" . Consultado el 29 de mayo de 2009 .
  66. ^ abc "ISO/IEC 13818-3:1994(E) - Tecnología de la información - Codificación genérica de imágenes en movimiento y audio asociado: audio" (ZIP) . 11 de noviembre de 1994 . Consultado el 4 de agosto de 2010 .
  67. ^ "Acerca del archivo de música clandestina de Internet".
  68. ^ Vainilavičius, Justinas (15 de noviembre de 2023). "Winamp ha vuelto después de una renovación; la nostalgia parece intacta". cibernoticias . Consultado el 8 de diciembre de 2023 .
  69. ^ ab Schubert, Ruth (10 de febrero de 1999). "Los expertos en tecnología obtienen música para una canción; la industria está frustrada porque Internet simplifica la música gratis". Seattle Post-Intelligencer . Consultado el 22 de noviembre de 2008 .[ enlace muerto permanente ]
  70. ^ Giesler, Markus (2008). "Conflicto y compromiso: drama en la evolución del mercado". Revista de investigación del consumidor . 34 (6): 739–753. CiteSeerX 10.1.1.564.7146 . doi :10.1086/522098. S2CID  145796529. 
  71. ^ abcd Bouvigne, Gabriel (2003). "Tecnología MP3: limitaciones". Archivado desde el original el 7 de enero de 2011.
  72. ^ "ISO/IEC 11172-3:1993/Cor 1:1996". Organización Internacional de Normalización . 2006 . Consultado el 27 de agosto de 2009 .
  73. ^ Taylor, Mark (junio de 2000). "Preguntas frecuentes técnicas de LAME" . Consultado el 9 de diciembre de 2023 .
  74. ^ Liberman, Serbia. DSP: la tecnología detrás de la multimedia .
  75. ^ Amorim, Roberto (3 de agosto de 2003). "Resultados de la prueba de escucha pública de extensión de 128 kbit/s" . Consultado el 17 de marzo de 2007 .
  76. ^ Mares, Sebastián (diciembre de 2005). «Resultados de la prueba de escucha pública multiformato @ 128 kbps» . Consultado el 17 de marzo de 2007 .
  77. ^ Dougherty, Dale (1 de marzo de 2009). "El sonido chisporroteante de la música". Radar O'Reilly .
  78. ^ "Conozca al clarividente musical que encuentra fantasmas en sus MP3". RUIDOSO . 18 de marzo de 2015.
  79. ^ "Los fantasmas en el mp3". 15 de marzo de 2015. Archivado desde el original el 14 de junio de 2017 . Consultado el 25 de abril de 2015 .
  80. ^ "Objetos perdidos y encontrados: estudiante de posgrado de la U.Va. descubre fantasmas en el MP3". UVA Hoy . 23 de febrero de 2015.
  81. ^ El fantasma en el MP3
  82. ^ "Guía de opciones de línea de comandos (en CVS)" . Consultado el 4 de agosto de 2010 .
  83. ^ "Manual de funcionamiento de JVC RC-EX30" (PDF) (en varios idiomas). 2004. pág. 14. Archivado desde el original (PDF) el 20 de agosto de 2020. Buscar: localizar la posición deseada en el disco (solo CD de audio)( equipo estéreo de 2004 )
  84. ^ "Manual de funcionamiento DV-RW250H GB" (PDF) . 2004. pág. 33. • La reproducción de avance rápido y revisión no funciona con un CD MP3/WMA/JPEG.
  85. ^ "Comparación de la calidad de sonido de audio de alta resolución, CD y MP3". www.sony.com . Sony . Consultado el 11 de agosto de 2020 .
  86. ^ Woon-Seng Gan; Sen-Maw Kuo (2007). Procesamiento de señal integrado con Micro Signal Architecture. Prensa Wiley-IEEE . pag. 382.ISBN _ 978-0-471-73841-1.
  87. ^ Bouvigne, Gabriel (28 de noviembre de 2006). "formato libre a 640 kbit/s y foobar2000, ¿posibilidades?" . Consultado el 15 de septiembre de 2016 .
  88. ^ "lame(1): crear archivos de audio mp3 - página de manual de Linux". linux.die.net . Consultado el 22 de agosto de 2020 .
  89. ^ "Páginas de manual de Linux en línea: páginas de manual de man.cx". hombre.cx . Consultado el 22 de agosto de 2020 .
  90. ^ ab "GPSYCHO - Velocidad de bits variable". Codificador MP3 LAME . Consultado el 11 de julio de 2009 .
  91. ^ "TwoLAME: MPEG Audio Layer II VBR" . Consultado el 11 de julio de 2009 .
  92. ^ Subgrupo de audio ISO MPEG. "Preguntas frecuentes sobre MPEG Audio versión 9: MPEG-1 y MPEG-2 BC" . Consultado el 11 de julio de 2009 .
  93. ^ "Interruptor LAME Y". Base de conocimientos de Hydrogenaudio . Consultado el 23 de marzo de 2015 .
  94. ^ Rae, Casey. "Los metadatos y tú". Coalición por el futuro de la música . Archivado desde el original el 29 de junio de 2017 . Consultado el 12 de diciembre de 2014 .
  95. ^ Patel, Ketan; Smith, Brian C.; Rowe, Lawrence A. Rendimiento de un decodificador de vídeo MPEG por software (PDF) . Conferencia ACM Multimedia 1993.
  96. ^ "Preguntas frecuentes sobre MPEG, versión 3.1". 14 de mayo de 1994. Archivado desde el original el 23 de julio de 2009.
  97. ^ ab "Una gran lista de patentes de MP3 (y supuestas fechas de vencimiento)". búsqueda de melodías . 26 de febrero de 2007.
  98. ^ Cogliati, Josh (20 de julio de 2008). "Estado de la patente de MPEG-1, H.261 y MPEG-2". Kuro5hin .Este trabajo no tuvo en cuenta las divisiones y continuaciones de patentes.
  99. ^ Patente estadounidense nº 5812672
  100. ^ "Expiración de la patente estadounidense para MP3, MPEG-2, H.264". OSNews.com.
  101. ^ "Método y aparato para codificar señales digitales que emplean asignación de bits utilizando combinaciones de diferentes modelos de umbral para lograr las velocidades de bits deseadas".
  102. ^ "mp3licensing.com - Patentes". mp3licensing.com .
  103. ^ "Próximamente compatibilidad total con MP3 en Fedora". 5 de mayo de 2017.
  104. ^ "Compresión de datos acústicos: patente básica de MP3". Fundación para una Infraestructura de Información Libre . 15 de enero de 2005. Archivado desde el original el 15 de julio de 2007 . Consultado el 24 de julio de 2007 .
  105. ^ "Propiedad intelectual y licencias". Tecnicolor . Archivado desde el original el 4 de mayo de 2011.
  106. ^ Kistenfeger, Muzinée (julio de 2007). "La Sociedad Fraunhofer (Fraunhofer-Gesellschaft, FhG)". Consulado General Británico en Munich. Archivado desde el original el 18 de agosto de 2002 . Consultado el 24 de julio de 2007 .
  107. ^ "Aplicación temprana de patentes de MP3". Cámara de compensación de efectos escalofriantes . 1 de septiembre de 1998. Archivado desde el original el 19 de agosto de 2014 . Consultado el 24 de julio de 2007 .
  108. ^ "Programa de licencias de audio MPEG de SISVEL".
  109. ^ "Audio MPEG y Sisvel: Thomson demandado por infracción de patente en Europa y Estados Unidos: reproductores MP3 detenidos en la aduana". ZDNet India . 6 de octubre de 2005. Archivado desde el original el 11 de octubre de 2007 . Consultado el 24 de julio de 2007 .
  110. ^ "otorga a Motorola una licencia de patente de audio MP3 y MPEG 2". SISVEL. 21 de diciembre de 2005. Archivado desde el original el 21 de enero de 2014 . Consultado el 18 de enero de 2014 .
  111. ^ "Patentes de audio MPEG de EE. UU." (PDF) . Sivel. Archivado desde el original (PDF) el 27 de octubre de 2016 . Consultado el 7 de abril de 2017 .
  112. ^ "Programas de licencias: programas heredados". www.sisvel.com . Archivado desde el original el 19 de febrero de 2023 . Consultado el 15 de septiembre de 2023 .
  113. ^ Ogg, Erica (7 de septiembre de 2006). "Se anula la orden de incautación de MP3 de SanDisk". Noticias CNET . Archivado desde el original el 4 de noviembre de 2012 . Consultado el 24 de julio de 2007 .
  114. ^ "Sisvel trae Patent Wild West a Alemania". Blog IPEG . 7 de septiembre de 2006 . Consultado el 24 de julio de 2007 .
  115. ^ "Apple y SanDisk resuelven disputa sobre patentes de MP3 en Texas". Ley de propiedad intelectual360 . 26 de enero de 2009 . Consultado el 16 de agosto de 2010 .
  116. ^ "Profesionales de Baker Botts LLP: Lisa Catherine Kelly - Compromisos representativos". Baker Botts LLP . Archivado desde el original el 10 de diciembre de 2014 . Consultado el 15 de septiembre de 2016 .
  117. ^ "Microsoft se enfrenta a un pago de MP3 de 1.500 millones de dólares". Noticias de la BBC . 22 de febrero de 2007 . Consultado el 30 de junio de 2008 .
  118. ^ "Microsoft gana la revocación de la decisión sobre la patente de MP3". CNET . 6 de agosto de 2007 . Consultado el 17 de agosto de 2010 .
  119. ^ "Tribunal de Apelaciones de Decisión del Circuito Federal" (PDF) . 25 de septiembre de 2008. Archivado desde el original (PDF) el 29 de octubre de 2008.
  120. ^ ab Brandeburgo, Karlheinz (1999). "Explicación de MP3 y AAC". Archivado desde el original (PDF) el 19 de octubre de 2014.
  121. ^ "Via Licensing anuncia la licencia de patente conjunta AAC actualizada". Cable comercial . 5 de enero de 2009 . Consultado el 18 de junio de 2019 .
  122. ^ "Licenciantes AAC". Vía Corp. Archivado desde el original el 28 de junio de 2019 . Consultado el 6 de julio de 2019 .
  123. ^ Marriott, Michel (30 de septiembre de 1999). "MIRAR NOTICIAS; el nuevo reproductor de Sony dará un guiño al MP3". Los New York Times .
  124. ^ "Walkman de red Sony NW-E105".
  125. ^ Jean-Marc Valin; Gregorio Maxwell; Timothy B. Terriberry; Koen Vos (octubre de 2013). Codificación de música de alta calidad y bajo retardo en el códec Opus . 135ª Convención AES. arXiv : 1602.04845 . Su CBR produce paquetes con exactamente el tamaño solicitado por el codificador, sin un depósito de bits que imponga retrasos de almacenamiento en búfer adicionales, como se encuentra en códecs como MP3 o AAC-LD. [...] [ruido tonal] se nota más en MP3 de baja tasa de bits.

Otras lecturas

enlaces externos