Formato de compresión de audio con pérdida
MPEG-1 Audio Layer II o MPEG-2 Audio Layer II ( MP2 , a veces llamado incorrectamente Musicam o MUSICAM ) [7] es un formato de compresión de audio con pérdida definido por ISO/IEC 11172-3 junto con MPEG-1 Audio Layer I y MPEG- 1 Capa de Audio III (MP3). Si bien MP3 es mucho más popular para aplicaciones de PC e Internet , MP2 sigue siendo un estándar dominante para la transmisión de audio. [8]
Historia del desarrollo de MP2 a MP3.
MÚSICA
La codificación MPEG-1 Audio Layer 2 se derivó del códec de audio MUSICAM ( Codificación y multiplexación integrada de subbanda universal adaptada al patrón de enmascaramiento ), desarrollado por el Centre commun d'études de télévision et télécommunications (CCETT), Philips y el Institut für Rundfunktechnik (IRT). ) en 1989 como parte de la iniciativa intergubernamental paneuropea de investigación y desarrollo EUREKA 147 para el desarrollo de un sistema para la transmisión de audio y datos a receptores fijos, portátiles o móviles (establecida en 1987).
Comenzó como el proyecto Digital Audio Broadcast (DAB) dirigido por Egon Meier-Engelen de Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt (más tarde llamado Deutsches Zentrum für Luft- und Raumfahrt, Centro Aeroespacial Alemán) en Alemania. La Comunidad Europea financió este proyecto, comúnmente conocido como EU-147, de 1987 a 1994 como parte del programa de investigación EUREKA .
El sistema Eureka 147 constaba de tres elementos principales: codificación de audio MUSICAM ( codificación y multiplexación integrada de subbanda universal de patrón de enmascaramiento ), codificación y multiplexación de transmisión y modulación COFDM. [9]
MUSICAM fue uno de los pocos códecs capaces de lograr una alta calidad de audio a velocidades de bits en el rango de 64 a 192 kbit/s por canal monofónico. Ha sido diseñado para cumplir con los requisitos técnicos de la mayoría de las aplicaciones (en el campo de la radiodifusión, las telecomunicaciones y la grabación en medios de almacenamiento digital): bajo retardo, baja complejidad, resistencia a errores, unidades de acceso cortas, etc. [10] [11]
Como predecesor del formato y la tecnología MP3, el códec perceptivo MUSICAM se basa en la aritmética de enteros transformadas de 32 subbandas, impulsada por un modelo psicoacústico. Fue diseñado principalmente para radiodifusión de audio digital y televisión digital, y divulgado por CCETT (Francia) e IRT (Alemania) en Atlanta durante una conferencia IEEE-ICASSP. [12] Este códec incorporado a un sistema de radiodifusión que utiliza modulación COFDM se demostró en el aire y en el campo [13] junto con Radio Canada y CRC Canada durante el show NAB (Las Vegas) en 1991. La implementación de la parte de audio de este El sistema de transmisión estaba basado en un codificador de dos chips (uno para la transformada de subbanda, otro para el modelo psicoacústico diseñado por el equipo de G. Stoll (IRT Alemania), más tarde conocido como Modelo Psicoacústico I en el estándar de audio ISO MPEG) y un codificador real. Decodificador de tiempo que utiliza un chip DSP Motorola 56001 que ejecuta un software de aritmética de números enteros diseñado por el equipo de YF Dehery ( CCETT , Francia). La simplicidad del decodificador correspondiente junto con la alta calidad de audio de este códec que utiliza por primera vez una frecuencia de muestreo de 48 kHz, un formato de entrada de 20 bits/muestra (el estándar de muestreo más alto disponible en 1991, compatible con el sistema digital profesional AES/EBU estándar de estudio de entrada) fueron las principales razones para adoptar posteriormente las características de MUSICAM como características básicas para un códec de compresión de música digital avanzado como MP3.
El algoritmo de codificación de audio utilizado por el sistema Eureka 147 Digital Audio Broadcasting (DAB) ha estado sujeto al proceso de estandarización dentro del ISO/Moving Pictures Expert Group (MPEG) en 1989-94. [14] [15] La codificación de audio MUSICAM se utilizó como base para algunos esquemas de codificación de audio MPEG-1 y MPEG-2. [16] La mayoría de las características clave de MPEG-1 Audio se heredaron directamente de MUSICAM, incluido el banco de filtros, el procesamiento en el dominio del tiempo, los tamaños de fotogramas de audio, etc. Sin embargo, se realizaron mejoras y el algoritmo MUSICAM real no se utilizó en la versión final. Estándar MPEG-1 Audio Layer II.
Desde la finalización de MPEG-1 Audio y MPEG-2 Audio (en 1992 y 1994), el algoritmo MUSICAM original ya no se utiliza. [7] [17] El nombre MUSICAM se utiliza a menudo erróneamente cuando se refiere a MPEG-1 Audio Layer II. Esto puede generar cierta confusión, porque el nombre MUSICAM es una marca registrada de diferentes empresas en diferentes regiones del mundo. [7] [17] [18] (Musicam es el nombre utilizado para MP2 en algunas especificaciones de Astra Digital Radio, así como en los documentos DAB de la BBC).
El Proyecto Eureka 147 dio como resultado la publicación de la norma europea ETS 300 401 en 1995 para DAB, que ahora tiene aceptación mundial. El estándar DAB utiliza MPEG-1 Audio Layer II (ISO/IEC 11172-3) para una frecuencia de muestreo de 48 kHz y MPEG-2 Audio Layer II (ISO/IEC 13818-3) para una frecuencia de muestreo de 24 kHz. [19]
Audio MPEG
A fines de la década de 1980, el Grupo de Expertos en Imágenes en Movimiento (MPEG) de ISO inició un esfuerzo para estandarizar la codificación de audio y video digital, que se esperaba que tuviera una amplia gama de aplicaciones en la transmisión de radio y televisión digital (más tarde DAB , DMB , DVB ), y uso en CD-ROM (más tarde Video CD ). [20] La codificación de audio MUSICAM fue una de las 14 propuestas para el estándar de audio MPEG-1 que se presentaron a ISO en 1989. [11] [16]
El estándar de audio MPEG-1 se basó en los formatos de audio MUSICAM y ASPEC existentes. [21]
El estándar de audio MPEG-1 incluía las tres "capas" de audio (técnicas de codificación) ahora conocidas como Capa I (MP1), Capa II (MP2) y Capa III (MP3). Todos los algoritmos para MPEG-1 Audio Layer I, II y III fueron aprobados en 1991 como borrador del comité de ISO-11172 [22] [23] [24] y finalizados en 1992 [25] como parte de MPEG-1 , el primer conjunto de estándares de MPEG , que dio como resultado el estándar internacional ISO / IEC 11172-3 (también conocido como MPEG-1 Audio o MPEG-1 Parte 3 ), publicado en 1993. [4] El trabajo adicional sobre audio MPEG [26] se finalizó en 1994 como parte del segundo conjunto de estándares MPEG, MPEG-2 , más formalmente conocido como estándar internacional ISO/IEC 13818-3 (también conocido como MPEG-2 Parte 3 o MPEG-2 Audio o MPEG-2 Audio BC [27] compatible con versiones anteriores ) , publicado originalmente en 1995. [5] [28] MPEG-2 Parte 3 (ISO/IEC 13818-3) definió velocidades de bits y frecuencias de muestreo adicionales para MPEG-1 Audio Layer I, II y III. Las nuevas velocidades de muestreo son exactamente la mitad que las definidas originalmente para MPEG-1 Audio. MPEG-2 Part 3 también mejoró el audio de MPEG-1 al permitir la codificación de programas de audio con más de dos canales, hasta 5.1 multicanal. [26]
El componente Layer III ( MP3 ) utiliza un algoritmo de compresión con pérdida que fue diseñado para reducir en gran medida la cantidad de datos necesarios para representar una grabación de audio y que suene como una reproducción decente del audio original sin comprimir para la mayoría de los oyentes.
Premio Emmy en Ingeniería
CCETT (Francia), IRT (Alemania) y Philips (Países Bajos) ganaron un premio Emmy en Ingeniería 2000 por el desarrollo de un sistema de compresión de audio digital de dos canales conocido como Musicam o MPEG Audio Layer II. [29] [30]
Especificaciones técnicas
MPEG-1 Audio Layer II se define en ISO/IEC 11172-3 (MPEG-1 Parte 3)
- Frecuencias de muestreo : 32, 44,1 y 48 kHz
- Velocidades de bits : 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 y 384 kbit/s
Se ha proporcionado una extensión en MPEG-2 Audio Layer II y se define en ISO/IEC 13818-3 (MPEG-2 Parte 3) [31]
- Frecuencias de muestreo adicionales: 16, 22,05 y 24 kHz
- Velocidades de bits adicionales: 8, 16, 24, 40 y 144 kbit/s
- Soporte multicanal : hasta 5 canales de audio de rango completo y un canal LFE (canal de mejora de baja frecuencia)
El formato se basa en sucesivos fotogramas digitales de 1152 intervalos de muestreo con cuatro formatos posibles:
- formato mono
- formato estéreo
- formato estéreo conjunto codificado de intensidad (irrelevancia estéreo)
- formato de doble canal (no correlacionado)
Velocidad de bits variable
El audio MPEG puede tener una velocidad de bits variable (VBR), pero no es ampliamente compatible. La capa II puede utilizar un método llamado conmutación de velocidad de bits. Cada cuadro se puede crear con una velocidad de bits diferente. [33]
Según ISO/IEC 11172-3:1993, Sección 2.4.2.3: Para proporcionar el menor retraso y complejidad posibles, no es necesario que el decodificador (audio MPEG) soporte una velocidad de bits continuamente variable cuando está en capa. Yo o II. [34]
Cómo funciona el formato MP2
- MP2 es un codificador de audio de subbanda , lo que significa que la compresión se realiza en el dominio del tiempo con un banco de filtros de bajo retardo que produce 32 componentes en el dominio de la frecuencia. En comparación, MP3 es un codificador de audio transformado con un banco de filtros híbrido, lo que significa que la compresión tiene lugar en el dominio de la frecuencia después de una transformación híbrida (doble) desde el dominio del tiempo.
- MPEG Audio Layer II es el algoritmo central de los estándares MP3. Todas las características psicoacústicas y estructuras de formato de fotograma del formato MP3 se derivan del algoritmo y formato básico de MP2.
- El codificador MP2 puede aprovechar las redundancias entre canales utilizando una codificación de intensidad "estéreo conjunta" opcional .
- Al igual que MP3, MP2 es un formato de codificación perceptual, lo que significa que elimina información que el sistema auditivo humano no podrá percibir fácilmente. Para elegir qué información eliminar, la señal de audio se analiza según un modelo psicoacústico que tiene en cuenta los parámetros del sistema auditivo humano. Las investigaciones en psicoacústica han demostrado que si hay una señal fuerte en una determinada frecuencia, el sistema auditivo humano no puede percibir señales más débiles en frecuencias cercanas a la frecuencia de la señal fuerte. Esto se llama enmascaramiento de frecuencia. Los códecs de audio perceptual aprovechan este enmascaramiento de frecuencia al ignorar información en frecuencias que se consideran imperceptibles, lo que permite asignar más datos a la reproducción de frecuencias perceptibles.
- MP2 divide la señal de audio de entrada en 32 subbandas y, si el audio de una subbanda se considera imperceptible, esa subbanda no se transmite. MP3, por otro lado, transforma la señal de audio de entrada al dominio de la frecuencia en 576 componentes de frecuencia. Por lo tanto, MP3 tiene una resolución de frecuencia más alta que MP2, lo que permite aplicar el modelo psicoacústico de manera más selectiva que MP2. Por tanto, el MP3 tiene un mayor margen para reducir la tasa de bits.
- El uso de una herramienta de codificación de entropía adicional y una mayor precisión de frecuencia (debido al mayor número de subbandas de frecuencia utilizadas por MP3) explican por qué MP3 no necesita una velocidad de bits tan alta como MP2 para obtener una calidad de audio aceptable. Por el contrario, MP2 muestra un mejor comportamiento que MP3 en el dominio del tiempo, debido a su menor resolución de frecuencia. Esto implica menos retardo de tiempo del códec, lo que puede simplificar la edición de audio, así como "robustez" y resistencia a los errores que pueden ocurrir durante el proceso de grabación digital o durante los errores de transmisión.
- El banco de filtros de subbanda MP2 también proporciona una característica inherente de " ocultación de transitorios ", debido al efecto de enmascaramiento temporal específico de su filtro principal. Esta característica única de la familia MPEG-1 Audio implica una muy buena calidad de sonido en señales de audio con cambios rápidos de energía, como los sonidos de percusión. Debido a que tanto el formato MP2 como el MP3 utilizan el mismo banco de filtros de subbanda básico, ambos se benefician de esta característica.
Aplicaciones de MP2
Parte de los estándares de radio digital DAB y televisión digital DVB .
La capa II se utiliza comúnmente en la industria de la radiodifusión para distribuir audio en vivo a través de conexiones de red satelital, RDSI y IP, así como para el almacenamiento de audio en sistemas de reproducción digital. Un ejemplo es el sistema de distribución de programación PRSS Content Depot de NPR . Content Depot distribuye audio MPEG-1 L2 en un contenedor Broadcast Wave File. MPEG2 con encabezados RIFF (utilizado en ) se especifica en los estándares RIFF/WAV. Como resultado, Windows Media Player reproducirá directamente los archivos de Content Depot; sin embargo, los reproductores menos inteligentes a menudo no lo hacen. Como el proceso de codificación y decodificación habría supuesto una pérdida importante de recursos de la CPU en las primeras generaciones de sistemas de reproducción de retransmisiones, los sistemas de reproducción de retransmisiones profesionales suelen implementar el códec en hardware, por ejemplo, delegando la tarea de codificar y decodificar a una tarjeta de sonido compatible en lugar de que la CPU del sistema..wav
.wav
Todos los reproductores de DVD-Video en los países PAL contienen decodificadores MP2 estéreo, lo que convierte al MP2 en un posible competidor de Dolby Digital en estos mercados. Los reproductores de DVD-Video en los países NTSC no están obligados a decodificar audio MP2, aunque la mayoría sí lo hacen. Si bien algunas grabadoras de DVD almacenan audio en MP2 y muchos DVD creados por consumidores utilizan este formato, los DVD comerciales con bandas sonoras MP2 son raros.
MPEG-1 Audio Layer II es el formato de audio estándar utilizado en los formatos Video CD y Super Video CD (VCD y SVCD también admiten velocidad de bits variable y MPEG multicanal agregado por MPEG-2).
MPEG-1 Audio Layer II es el formato de audio estándar utilizado en el estándar MHP para decodificadores.
MPEG-1 Audio Layer II es el formato de audio utilizado en las videocámaras HDV .
Los archivos MP2 son compatibles con algunos reproductores de audio portátiles .
Nombres y extensiones
El término MP2 y la extensión de nombre de archivo .mp2
generalmente se refieren a datos MPEG-1 Audio Layer II, pero también pueden referirse a MPEG-2 Audio Layer II , una extensión en su mayoría compatible con versiones anteriores que agrega soporte para audio multicanal , codificación de velocidad de bits variable y velocidades de muestreo adicionales. definido en ISO/IEC 13818-3. La abreviatura MP2 también se aplica a veces erróneamente al vídeo MPEG-2 o al audio MPEG-2 AAC .
Ver también
Notas
- ^ Nilsson, Martín (noviembre de 2000). "El tipo de medio audio/mpeg: RFC 3003". IETF . Consultado el 7 de diciembre de 2009 .
- ^ Hoschka, Philipp; Casner, Stephen L. (julio de 2003). "Registro de tipo MIME de formatos de carga útil RTP - RFC 3555". IETF . Consultado el 7 de diciembre de 2009 .
- ^ Patel K, Smith BC, Rowe LA (1 de septiembre de 1993). "Rendimiento de un software decodificador de vídeo MPEG". Actas de la primera conferencia internacional ACM sobre Multimedia - MULTIMEDIA '93 . ACM Multimedia. Ciudad de Nueva York: Asociación de Maquinaria de Computación. págs. 75–82. doi :10.1145/166266.166274. ISBN 978-0-89791-596-0. S2CID 3773268.La referencia 3 en el documento es el Borrador del Comité de la Norma ISO/IEC 11172, 6 de diciembre de 1991.
- ^ ab "ISO/IEC 11172-3:1993 - Tecnología de la información - Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital de hasta aproximadamente 1,5 Mbit/s - Parte 3: Audio". YO ASI. 1993 . Consultado el 14 de julio de 2010 .
- ^ ab "ISO/IEC 13818-3:1995 - Tecnología de la información - Codificación genérica de imágenes en movimiento e información de audio asociada - Parte 3: Audio". YO ASI. 1995 . Consultado el 14 de julio de 2010 .
- ^ Codificación de audio MPEG-1 y MPEG-2 Layer II (borrador parcial). Sostenibilidad de los Formatos Digitales. Washington, DC: Biblioteca del Congreso. 17 de mayo de 2012 . Consultado el 1 de diciembre de 2021 .
- ^ abc "Preguntas frecuentes sobre audio MPEG versión 9". 1998 . Consultado el 22 de agosto de 2010 .
- ^ Techopedia (16 de febrero de 2015). "Capa de audio MPEG-1 II (MP2)". techopedia.com . Consultado el 17 de marzo de 2022 .
- ^ AJ Bower (1998). "Radio digital: el sistema DAB Eureka 147". Reino Unido: BBC . Consultado el 22 de agosto de 2010 .
- ^ Dehery, YF; Palanca, M.; Urcún, P. (1991). "Un códec fuente MUSICAM para transmisión y almacenamiento de audio digital". [Actas] ICASSP 91: Conferencia internacional de 1991 sobre acústica, habla y procesamiento de señales . págs. 3605–3608 vol.5. doi :10.1109/ICASSP.1991.151054. ISBN 0-7803-0003-3. S2CID 62615197.
- ^ ab "Biblioteca electrónica AES: codificación fuente de Musicam". 1991 . Consultado el 22 de agosto de 2010 .
- ^ Dehery, YF; Palanca, M.; Urcún, P. (mayo de 1991). Un códec fuente MUSICAM para transmisión y almacenamiento de audio digital . [Actas] ICASSP 91: Conferencia internacional de 1991 sobre acústica, habla y procesamiento de señales . págs. 3605–3608. doi :10.1109/ICASSP.1991.151054. ISBN 0-7803-0003-3.
- ^ Caja, Alan (15 de abril de 1991). "Un comentario de DAB de Alan Box, comunicación de EZ y presidente del grupo de trabajo NAB DAB" (PDF) . Radiodifusión . vol. 150, núm. 15. pág. 26.
- ^ Transmisión de audio digital (DAB); DAB a receptores móviles, portátiles y fijos - Detalles del elemento de trabajo 'DE/JTC-DAB' - ETS 300401, 1995-02-15 , consultado el 23 de agosto de 2010
- ^ DAB: planificación de servicios para radiodifusión de audio digital terrestre (PDF) , 1992, archivado desde el original (PDF) el 4 de mayo de 2005 , consultado el 22 de agosto de 2010
- ^ ab "Informe de estado de ISO MPEG - septiembre de 1990". 1990. Archivado desde el original el 14 de febrero de 2010 . Consultado el 22 de agosto de 2010 .
- ^ ab Sistemas Telos. "Datos sobre la compresión MPEG". Archivado desde el original el 8 de mayo de 2001 . Consultado el 22 de agosto de 2010 .
- ^ MÚSICAM EE.UU.. "Preguntas frecuentes de MUSICAM USA: ¿MUSICAM no es simplemente su implementación de ISO/MPEG Layer 2?" . Consultado el 23 de agosto de 2010 .
- ^ Sistemas de radiodifusión; Transmisión de audio digital (DAB) a receptores móviles, portátiles y fijos - Detalles del elemento de trabajo 'REN/JTC-DAB-36' - EN 300401, 2006-06-15 , consultado el 23 de agosto de 2010
- ^ Chiariglione, Leonardo (octubre de 1989). "Comunicado de prensa MPEG". Kurihama: Grupo de expertos en imágenes en movimiento . Archivado desde el original el 5 de agosto de 2010..
- ^ Tecnología de transmisión de audio y video digital: una guía práctica de ingeniería (tecnología de señales y comunicación) ISBN 3-540-76357-0 p. 144: "En el año 1988, el método MASCAM se desarrolló en el Institut für Rundfunktechnik (IRT) de Múnich como preparación para el sistema de radiodifusión de audio digital (DAB). De MASCAM surgió el MUSICAM (codificación y multiplexación integrada de subbanda universal de patrón de enmascaramiento) El método fue desarrollado en 1989 en cooperación con CCETT, Philips y Matsushita."
- ^ Chiariglione, Leonardo (noviembre de 1991). "Comunicado de prensa MPEG". Kurihama: Grupo de expertos en imágenes en movimiento . Archivado desde el original el 3 de mayo de 2011 . Consultado el 17 de julio de 2010 .
- ^ ISO (noviembre de 1991). "CD 11172-3 - Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital de hasta aproximadamente 1,5 MBit/s, parte 3 de audio". neuron2.net. Archivado desde el original (DOC) el 11 de junio de 2010 . Consultado el 17 de julio de 2010 .
- ^ Patel, Ketan; Smith, Brian C.; Rowe, Lawrence A. Rendimiento de un decodificador de vídeo MPEG por software (PDF) . Conferencia ACM Multimedia 1993.La referencia 3 del artículo es: 'ISO/IEC JTC/SC29, "Representación codificada de imágenes, audio e información multimedia/hipermedia", borrador del comité de la norma ISO/IEC 11172 , 6 de diciembre de 1991'.
- ^ ISO (6 de noviembre de 1992). "Comunicado de prensa MPEG, Londres, 6 de noviembre de 1992". Chiariglione.org . Archivado desde el original el 12 de agosto de 2010 . Consultado el 17 de julio de 2010 .
- ^ ab "Comunicado de prensa - Adoptado en la 22ª reunión del GT11" (Comunicado de prensa). Organización Internacional de Normalización . 1993-04-02. Archivado desde el original el 6 de agosto de 2010 . Consultado el 18 de julio de 2010 .
- ^ ISO (octubre de 1998). "Preguntas frecuentes sobre MPEG Audio versión 9: MPEG-1 y MPEG-2 BC". YO ASI . Consultado el 28 de octubre de 2009 .
- ^ Brandeburgo, Karlheinz; Bosi, Marina (febrero de 1997). "Descripción general de audio MPEG: estándares actuales y futuros para codificación de audio de baja velocidad de bits". Revista de la Sociedad de Ingeniería de Audio . 45 (1/2): 4–21 . Consultado el 30 de junio de 2008 .
- ^ Academia Nacional de Artes y Ciencias de la Televisión, Premios al logro destacado en desarrollo técnico/de ingeniería (PDF) , archivado desde el original (PDF) el 14 de abril de 2010 , consultado el 1 de agosto de 2010
- ^ "CCETT - DAB: transmisión de audio digital (sitio web archivado)". 2001-02-11. Archivado desde el original el 11 de febrero de 2001 . Consultado el 1 de agosto de 2010 .
- ^ Werner Oomen, León van de Kerkhof. "Capa de audio MPEG-2 I/II". chiariglione.org . Consultado el 29 de diciembre de 2009 .
- ^ Subgrupo de audio ISO MPEG, Preguntas frecuentes sobre audio MPEG versión 9, MPEG-1 y MPEG-2 BC, consultado el 11 de julio de 2009.
- ^ TwoLAME: MPEG Audio Layer II VBR, consultado el 11 de julio de 2009.
Referencias
- Génesis del estándar de codificación de audio MP3 por Hans Georg Musmann en IEEE Transactions on Consumer Electronics, vol. 52, núm. 3, págs. 1043-1049, agosto de 2006
- MUSICAM Source Coding por Yves-François Dehery, Décima Conferencia Internacional de AES: Kensington, Londres, Inglaterra, (7 a 9 de septiembre de 1991), págs.
enlaces externos
- La historia del MP3 del Fraunhofer IIS
- Recursos y software de audio MPEG
- TooLAME: un codificador MP2
- TwoLAME: una bifurcación del código tooLAME
- RFC 3003: el documento que define el tipo MIME para MPEG-1 Audio Layer II
- Un decodificador MPEG Audio Layer II en 4k: código fuente para un pequeño decodificador de código abierto.
- Sitio web oficial de MPEG
- Estado de las patentes de MPEG-1, H.261 y MPEG-2: información sobre patentes