MPEG-1 Audio Layer II o MPEG-2 Audio Layer II ( MP2 , a veces llamado incorrectamente Musicam o MUSICAM ) [7] es un formato de compresión de audio con pérdida definido por la norma ISO/IEC 11172-3 junto con MPEG-1 Audio Layer I y MPEG-1 Audio Layer III (MP3). Si bien el MP3 es mucho más popular para aplicaciones de PC e Internet , el MP2 sigue siendo un estándar dominante para la transmisión de audio. [8]
La codificación MPEG-1 Audio Layer 2 se derivó del códec de audio MUSICAM ( codificación y multiplexación integradas de subbanda universal adaptadas a patrones de enmascaramiento ), desarrollado por el Centro común de estudios de televisión y comunicaciones (CCETT), Philips y el Institut für Rundfunktechnik (IRT) en 1989 como parte de la iniciativa intergubernamental paneuropea de investigación y desarrollo EUREKA 147 para el desarrollo de un sistema de transmisión de audio y datos a receptores fijos, portátiles o móviles (establecido en 1987).
Comenzó como el proyecto Digital Audio Broadcast (DAB) dirigido por Egon Meier-Engelen de Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt (más tarde llamado Deutsches Zentrum für Luft- und Raumfahrt, Centro Aeroespacial Alemán) en Alemania. La Comunidad Europea financió este proyecto, comúnmente conocido como EU-147, de 1987 a 1994 como parte del programa de investigación EUREKA .
El sistema Eureka 147 comprendía tres elementos principales: codificación de audio MUSICAM ( codificación y multiplexación integradas de subbanda universal con patrón de enmascaramiento ), codificación y multiplexación de transmisión y modulación COFDM. [9]
MUSICAM fue uno de los pocos códecs capaces de lograr una alta calidad de audio a velocidades de bits en el rango de 64 a 192 kbit/s por canal monofónico. Fue diseñado para cumplir con los requisitos técnicos de la mayoría de las aplicaciones (en el campo de la radiodifusión, las telecomunicaciones y la grabación en medios de almacenamiento digital): bajo retardo, baja complejidad, robustez ante errores, unidades de acceso cortas, etc. [10] [11]
Como predecesor del formato y la tecnología MP3, el códec perceptual MUSICAM se basa en una transformación de 32 subbandas aritmética de números enteros, impulsada por un modelo psicoacústico. Fue diseñado principalmente para la transmisión de audio digital y la televisión digital, y presentado por CCETT (Francia) e IRT (Alemania) en Atlanta durante una conferencia IEEE-ICASSP. [12] Este códec incorporado en un sistema de radiodifusión que utiliza modulación COFDM se demostró en el aire y en el campo [13] junto con Radio Canadá y CRC Canadá durante el show NAB (Las Vegas) en 1991. La implementación de la parte de audio de este sistema de radiodifusión se basó en un codificador de dos chips (uno para la transformada de subbanda, uno para el modelo psicoacústico diseñado por el equipo de G. Stoll (IRT Alemania), más tarde conocido como modelo psicoacústico I en el estándar de audio ISO MPEG) y un decodificador en tiempo real que utiliza un chip DSP Motorola 56001 que ejecuta un software de aritmética de números enteros diseñado por el equipo de YF Dehery ( CCETT , Francia). La sencillez del decodificador correspondiente junto con la alta calidad de audio de este codec utilizando por primera vez una frecuencia de muestreo de 48 kHz, un formato de entrada de 20 bits/muestra (el estándar de muestreo más alto disponible en 1991, compatible con el estándar de estudio de entrada digital profesional AES/EBU) fueron las principales razones para adoptar posteriormente las características de MUSICAM como las características básicas para un codec de compresión de música digital avanzado como MP3.
El algoritmo de codificación de audio utilizado por el sistema de transmisión de audio digital (DAB) Eureka 147 ha estado sujeto al proceso de estandarización dentro del ISO/Moving Pictures Expert Group (MPEG) en 1989-94. [14] [15] La codificación de audio MUSICAM se utilizó como base para algunos esquemas de codificación de audio MPEG-1 y MPEG-2. [16] La mayoría de las características clave de audio MPEG-1 se heredaron directamente de MUSICAM, incluido el banco de filtros, el procesamiento del dominio del tiempo, los tamaños de los cuadros de audio, etc. Sin embargo, se realizaron mejoras y el algoritmo MUSICAM real no se utilizó en el estándar final MPEG-1 Audio Layer II.
Desde la finalización de MPEG-1 Audio y MPEG-2 Audio (en 1992 y 1994), el algoritmo original MUSICAM ya no se utiliza. [7] [17] El nombre MUSICAM se utiliza a menudo por error cuando se hace referencia a MPEG-1 Audio Layer II. Esto puede dar lugar a cierta confusión, porque el nombre MUSICAM es una marca registrada de diferentes empresas en diferentes regiones del mundo. [7] [17] [18] (Musicam es el nombre utilizado para MP2 en algunas especificaciones de Astra Digital Radio, así como en los documentos DAB de la BBC).
El Proyecto Eureka 147 dio como resultado la publicación de la Norma Europea ETS 300 401 en 1995 para DAB, que ahora tiene aceptación mundial. La norma DAB utiliza la capa de audio MPEG-1 II (ISO/IEC 11172-3) para una frecuencia de muestreo de 48 kHz y la capa de audio MPEG-2 II (ISO/IEC 13818-3) para una frecuencia de muestreo de 24 kHz. [19]
A finales de los años 1980, el Grupo de Expertos en Imágenes en Movimiento (MPEG) de la ISO inició un esfuerzo para estandarizar la codificación de audio y vídeo digital, que se esperaba que tuviera una amplia gama de aplicaciones en la radiodifusión digital y televisiva (posteriormente DAB , DMB , DVB ) y su uso en CD-ROM (posteriormente Video CD ). [20] La codificación de audio MUSICAM fue una de las 14 propuestas para el estándar de audio MPEG-1 que se presentaron a la ISO en 1989. [11] [16]
El estándar de audio MPEG-1 se basó en los formatos de audio existentes MUSICAM y ASPEC. [21] El estándar de audio MPEG-1 incluía las tres "capas" de audio (técnicas de codificación) ahora conocidas como Capa I (MP1), Capa II (MP2) y Capa III (MP3). Todos los algoritmos para MPEG-1 Audio Layer I, II y III fueron aprobados en 1991 como borrador del comité de ISO-11172 [22] [23] [24] y finalizados en 1992 [25] como parte de MPEG-1 , el primer conjunto de estándares de MPEG , que resultó en el estándar internacional ISO / IEC 11172-3 (también conocido como MPEG-1 Audio o MPEG-1 Parte 3 ), publicado en 1993. [4] El trabajo adicional sobre audio MPEG [26] se finalizó en 1994 como parte del segundo conjunto de estándares MPEG, MPEG-2 , más formalmente conocido como estándar internacional ISO/IEC 13818-3 (también conocido como MPEG-2 Parte 3 o MPEG-2 Audio compatible con versiones anteriores o MPEG-2 Audio BC [27] ), publicado originalmente en 1995. [5] [28] MPEG-2 Parte 3 (ISO/IEC 13818-3) definió velocidades de bits y frecuencias de muestreo adicionales para las capas de audio I, II y III de MPEG-1. Las nuevas frecuencias de muestreo son exactamente la mitad de las definidas originalmente para el audio de MPEG-1. La Parte 3 de MPEG-2 también mejoró el audio de MPEG-1 al permitir la codificación de programas de audio con más de dos canales, hasta multicanal 5.1. [26]
El componente Layer III ( MP3 ) utiliza un algoritmo de compresión con pérdida que fue diseñado para reducir en gran medida la cantidad de datos necesarios para representar una grabación de audio y sonar como una reproducción decente del audio original sin comprimir para la mayoría de los oyentes.
CCETT (Francia), IRT (Alemania) y Philips (Países Bajos) ganaron un premio Emmy en Ingeniería 2000 por el desarrollo de un sistema de compresión de audio digital de dos canales conocido como Musicam o MPEG Audio Layer II. [29] [30]
La capa de audio MPEG-1 II se define en ISO/IEC 11172-3 (MPEG-1 Parte 3)
Se ha proporcionado una extensión en MPEG-2 Audio Layer II y está definida en ISO/IEC 13818-3 (MPEG-2 Parte 3) [31] [32]
El formato se basa en fotogramas digitales sucesivos de 1152 intervalos de muestreo con cuatro formatos posibles:
El audio MPEG puede tener una tasa de bits variable (VBR), pero no se admite ampliamente. La capa II puede utilizar un método llamado conmutación de tasa de bits. Cada cuadro se puede crear con una tasa de bits diferente. [32] [33] Según ISO/IEC 11172-3:1993, Sección 2.4.2.3: Para proporcionar el menor retraso y complejidad posibles, no se requiere que el decodificador (de audio MPEG) admita una tasa de bits continuamente variable cuando se encuentra en la capa I o II. [34]
Parte de los estándares de radio digital DAB y televisión digital DVB .
El formato MPEG-1 Audio Layer II se utiliza habitualmente en la industria de la radiodifusión para distribuir audio en directo a través de conexiones de red por satélite, ISDN e IP, así como para el almacenamiento de audio en sistemas de reproducción digital. Un ejemplo es el sistema de distribución de programación PRSS Content Depot de NPR . Content Depot distribuye audio MPEG-1 L2 en un contenedor Broadcast Wave File. MPEG2 con encabezados RIFF (utilizado en ) se especifica en los estándares RIFF/WAV. Como resultado, Windows Media Player reproducirá directamente los archivos Content Depot, sin embargo, los reproductores menos inteligentes a menudo no lo hacen. Como el proceso de codificación y decodificación habría sido un drenaje significativo de los recursos de la CPU en las primeras generaciones de sistemas de reproducción de radiodifusión, los sistemas de reproducción de radiodifusión profesionales normalmente implementan el códec en hardware, por ejemplo delegando la tarea de codificación y decodificación a una tarjeta de sonido compatible en lugar de a la CPU del sistema..wav
.wav
MPEG-1 Audio Layer II es el formato de audio utilizado en Digital Audio Broadcast (DAB), un estándar de radio digital para la transmisión de servicios de radio de audio digital en muchos países de todo el mundo.
El departamento de Investigación y Desarrollo de la BBC afirma que se necesitan al menos 192 kbit/s para una transmisión estéreo de alta fidelidad:
Se ha determinado que un valor de 256 kbit/s proporciona una señal de transmisión estéreo de alta calidad. Sin embargo, una pequeña reducción, a 224 kbit/s, suele ser adecuada y, en algunos casos, puede ser posible aceptar una reducción adicional a 192 kbit/s, especialmente si se aprovecha la redundancia en la señal estéreo mediante un proceso de codificación "estéreo conjunta" (es decir, no es necesario enviar dos veces algunos sonidos que aparecen en el centro de la imagen estéreo). A 192 kbit/s, es relativamente fácil escuchar imperfecciones en material de audio crítico.
— Libro blanco sobre I+D de la BBC WHP 061, junio de 2003 [35]
Todos los reproductores de DVD-Video en los países PAL contienen decodificadores MP2 estéreo, lo que convierte al formato MP2 en un posible competidor de Dolby Digital en estos mercados. Los reproductores de DVD-Video en los países NTSC no están obligados a decodificar audio MP2, aunque la mayoría lo hace. Si bien algunas grabadoras de DVD almacenan audio en MP2 y muchos DVD creados por consumidores utilizan el formato, los DVD comerciales con bandas sonoras MP2 son poco comunes.
MPEG-1 Audio Layer II es el formato de audio estándar utilizado en los formatos Video CD y Super Video CD (VCD y SVCD también admiten velocidad de bits variable y MPEG Multichannel agregado por MPEG-2).
MPEG-1 Audio Layer II es el formato de audio estándar utilizado en el estándar MHP para decodificadores.
MPEG-1 Audio Layer II es el formato de audio utilizado en las videocámaras HDV .
Los archivos MP2 son compatibles con algunos reproductores de audio portátiles .
El término MP2 y la extensión del nombre de archivo .mp2
generalmente se refieren a datos MPEG-1 Audio Layer II, pero también pueden referirse a MPEG-2 Audio Layer II , una extensión compatible con versiones anteriores que agrega soporte para audio multicanal , codificación de velocidad de bits variable y frecuencias de muestreo adicionales, definidas en ISO/IEC 13818-3. La abreviatura MP2 también se aplica a veces erróneamente al video MPEG-2 o al audio MPEG-2 AAC .