Windows Media Audio ( WMA ) es una serie de códecs de audio y sus correspondientes formatos de codificación de audio desarrollados por Microsoft . Es una tecnología propietaria que forma parte del marco de Windows Media . WMA consta de cuatro códecs distintos. El códec WMA original, conocido simplemente como WMA , fue concebido como un competidor de los populares códecs MP3 y RealAudio . [2] [3] WMA Pro , un códec más nuevo y avanzado, admite audio multicanal y de alta resolución . [4] Un códec sin pérdida , WMA Lossless , comprime los datos de audio sin pérdida de fidelidad de audio (el formato WMA normal tiene pérdida ). [4] WMA Voice , dirigido al contenido de voz, aplica compresión utilizando un rango de tasas de bits bajas . [4] Microsoft también ha desarrollado un formato de contenedor digital llamado Advanced Systems Format para almacenar audio codificado por WMA.
El primer códec WMA se basó en un trabajo anterior de Henrique Malvar y su equipo, que fue transferido al equipo de Windows Media en Microsoft. [5] Malvar era un investigador senior y gerente del Grupo de Procesamiento de Señales en Microsoft Research , [6] cuyo equipo trabajó en el proyecto MSAudio . [7] El primer códec finalizado se denominó inicialmente MSAudio 4.0 . [8] [9] Más tarde se lanzó oficialmente como Windows Media Audio , [1] como parte de Windows Media Technologies 4.0. Microsoft afirmó que WMA podía producir archivos que tenían la mitad del tamaño de los archivos MP3 de calidad equivalente; [10] Microsoft también afirmó que WMA ofrecía audio "casi con calidad de CD" a 64 kbit/s. [10] Sin embargo, la primera afirmación fue rechazada por algunos audiófilos [11] y ambas afirmaciones han sido refutadas a través de pruebas de escucha de códecs disponibles públicamente . RealNetworks también cuestionó las afirmaciones de Microsoft sobre la calidad de audio superior de WMA en comparación con RealAudio. [3]
Versiones más nuevas de WMA estuvieron disponibles: Windows Media Audio 2 en 1999, [12] Windows Media Audio 7 en 2000, [13] Windows Media Audio 8 en 2001, [14] y Windows Media Audio 9 en 2003. [4] Microsoft anunció por primera vez sus planes de licenciar la tecnología WMA a terceros en 1999. [15] Antes de Windows XP , los archivos WMA se transmitían principalmente mediante el filtro de origen de Windows Media ( códec DirectShow ), que luego se eliminó en Windows Vista con la adición de Media Foundation. [16] Aunque las versiones anteriores de Windows Media Player reproducían archivos WMA, la compatibilidad con la creación de archivos WMA no se agregó hasta la séptima versión. [17] En 2003, Microsoft lanzó nuevos códecs de audio que no eran compatibles con el códec WMA original. Estos códecs fueron Windows Media Audio 9 Professional , [4] Windows Media Audio 9 Lossless , [4] y Windows Media Audio 9 Voice . [4]
Todas las versiones de WMA publicadas desde la versión 9.0 (es decir, 9.1, 9.2 y 10) han sido compatibles con el decodificador v9 original y, por lo tanto, no se consideran códecs independientes. La única excepción a esto es el códec WMA 10 Professional, cuyo modo de baja tasa de bits (LBR) solo es compatible con los decodificadores WMA Professional más antiguos a la mitad de la frecuencia de muestreo (de forma similar a cómo HE-AAC es compatible con AAC-LC). La decodificación de fidelidad total de secuencias de bits LBR de WMA 10 Professional requiere un decodificador WMA versión 10 o posterior.
En la mayoría de los casos, un archivo WMA se encuentra contenido en el formato Advanced Systems Format (ASF), un formato contenedor propietario de Microsoft para audio o vídeo digital . [18] El formato contenedor ASF especifica cómo se deben codificar los metadatos del archivo, de forma similar a las etiquetas ID3 que utilizan los archivos MP3. Los metadatos pueden incluir el nombre de la canción, el número de pista, el nombre del artista y también los valores de normalización de audio . Este contenedor puede admitir opcionalmente la gestión de derechos digitales (DRM) mediante una combinación de intercambio de claves de criptografía de curva elíptica , cifrado de bloque DES , un cifrado de bloque personalizado, cifrado de flujo RC4 y la función hash SHA-1 . Consulte Windows Media DRM para obtener más información.
Desde 2008, Microsoft también utiliza WMA Professional en su formato de archivo interoperable protegido (PIFF) basado en el formato de archivo multimedia base ISO y que se utiliza con mayor frecuencia para Smooth Streaming, una forma de transmisión de velocidad de bits adaptable a través de HTTP. Los estándares de la industria relacionados, como DECE UltraViolet y MPEG-DASH, no han estandarizado WMA como códec de audio compatible, y se han decantado por los códecs de audio MPEG y Dolby, más habituales en la industria.
Cada archivo WMA contiene una única pista de audio en uno de los cuatro subformatos: WMA, WMA Pro, WMA Lossless o WMA Voice. Estos formatos se implementan de forma diferente entre sí, de modo que son técnicamente distintos y mutuamente incompatibles; es decir, un dispositivo o software compatible con un subformato no es automáticamente compatible con ninguno de los otros códecs. A continuación se explica cada códec con más detalle.
Windows Media Audio (WMA) es el códec más común de los cuatro códecs WMA. El uso coloquial del término WMA , especialmente en materiales de marketing y especificaciones de dispositivos, generalmente se refiere solo a este códec. La primera versión del códec lanzada en 1999 se considera WMA 1. En el mismo año, la sintaxis del flujo de bits , o algoritmo de compresión , se modificó de manera menor y se convirtió en WMA 2. [12] Desde entonces, se han lanzado versiones más nuevas del códec, pero el proceso de decodificación sigue siendo el mismo, lo que garantiza la compatibilidad entre las versiones del códec. [12] WMA es un códec de audio con pérdida basado en el estudio de la psicoacústica . Las señales de audio que se consideran imperceptibles para el oído humano se codifican con una resolución reducida durante el proceso de compresión.
WMA puede codificar señales de audio muestreadas a una frecuencia de hasta 48 kHz con hasta dos canales discretos ( estéreo ). WMA 9 introdujo técnicas de codificación de tasa de bits variable (VBR) y tasa de bits promedio (ABR) en el codificador MS, aunque ambas eran técnicamente compatibles con el formato original. [12] WMA 9.1 también agregó compatibilidad con audio de bajo retardo, [19] lo que reduce la latencia para la codificación y decodificación.
Básicamente, WMA es un codificador de transformada basado en la transformada de coseno discreta modificada (MDCT), algo similar a AAC , Cook y Vorbis . El flujo de bits de WMA se compone de supertramas, cada una de las cuales contiene 1 o más tramas de 2048 muestras. Si no se utiliza el reservorio de bits, una trama es igual a una supertrama. Cada trama contiene varios bloques, que son 128, 256, 512, 1024 o 2048 muestras mucho después de ser transformadas al dominio de frecuencia a través de la MDCT. En el dominio de frecuencia, se determina el enmascaramiento de las muestras transformadas y luego se utiliza para recuantificar las muestras. Finalmente, las muestras de punto flotante se descomponen en partes de coeficiente y exponente y se codifican de forma independiente mediante Huffman . La información estéreo normalmente se codifica en medio/lado . A bajas velocidades de bits, también se pueden utilizar pares espectrales de línea (normalmente menos de 17 kbit/s) y una forma de codificación de ruido (normalmente menos de 33 kbit/s) para mejorar la calidad.
Al igual que AAC y Ogg Vorbis, WMA fue pensado para abordar deficiencias percibidas en el estándar MP3. Dados sus objetivos de diseño comunes, los tres formatos terminaron tomando decisiones de diseño similares. Los tres son códecs de transformación pura. Además, la implementación MDCT utilizada en WMA es esencialmente un superconjunto de las utilizadas en Ogg y AAC, de modo que las rutinas de ventanas y iMDCT de WMA se pueden utilizar para decodificar AAC y Ogg Vorbis casi sin modificaciones. Sin embargo, la cuantificación y la codificación estéreo se manejan de manera diferente en cada códec. El rasgo distintivo principal del formato estándar WMA es su uso exclusivo de 5 tamaños de bloque diferentes, en comparación con MP3, AAC y Ogg Vorbis, que restringen los archivos a solo dos tamaños. WMA Pro amplía esto al agregar un sexto tamaño de bloque utilizado a una frecuencia de muestreo de 88,2/96 kHz.
Los dispositivos certificados PlaysForSure , así como una gran cantidad de dispositivos no certificados, que van desde reproductores de música portátiles hasta reproductores de DVD , admiten la reproducción de archivos WMA. La mayoría de las tiendas en línea certificadas por PlaysForSure distribuyen contenido utilizando solo este códec. En 2005, Nokia anunció sus planes de admitir la reproducción de WMA en futuros teléfonos Nokia. [20] En el mismo año, se puso a disposición una actualización para PlayStation Portable (versión 2.60) que permitió reproducir archivos WMA en el dispositivo por primera vez. [21]
Windows Media Audio Professional (WMA Pro) es un códec con pérdida mejorado estrechamente relacionado con los estándares WMA. Conserva la mayoría de las mismas características de codificación general, pero también presenta estrategias de cuantificación y codificación de entropía mejoradas, así como una codificación estéreo más eficiente. Cabe destacar que se han eliminado muchas de las características de baja tasa de bits del estándar WMA, ya que el códec principal está diseñado para una codificación eficiente en la mayoría de las tasas de bits. Sus principales competidores incluyen AAC , HE-AAC , Vorbis , Dolby Digital y DTS. Admite una profundidad de bits de muestra de 16 y 24 bits, frecuencias de muestreo de hasta 96 kHz y hasta ocho canales discretos ( sonido envolvente de 7.1 canales ). [22] WMA Pro también admite la compresión de rango dinámico , que reduce la diferencia de volumen entre los sonidos más fuertes y más suaves en la pista de audio. Según Amir Majidimehr de Microsoft, WMA Pro podría ir teóricamente más allá del sonido envolvente 7.1 y admitir "un número ilimitado de canales"; Sin embargo, Microsoft decidió limitar su capacidad actual a ocho (7,1 canales discretos). [23]
La sintaxis de flujo de bits del códec se congeló en la primera versión, WMA 9 Pro. [24] Las versiones posteriores de WMA Pro introdujeron codificación de baja tasa de bits, audio de bajo retardo, [25] modo de interpolación de frecuencia, [26] y una gama expandida de opciones de codificación de frecuencia de muestreo y profundidad de bits . Un archivo WMA 10 Pro comprimido con modo de interpolación de frecuencia comprende una pista WMA 9 Pro codificada a la mitad de la tasa de muestreo original, que luego se restaura utilizando un nuevo algoritmo de compresión. [27] En esta situación, los reproductores WMA 9 Pro que no se han actualizado al códec WMA 10 Pro solo pueden decodificar el flujo WMA 9 Pro de menor calidad. A partir de WMA 10 Pro, la codificación de ocho canales comienza a 128 kbit/s, y las pistas se pueden codificar a la resolución nativa de CD de audio (44,1 kHz, 16 bits), anteriormente el dominio del estándar WMA.
A pesar de un creciente número de dispositivos compatibles y su superioridad sobre WMA, WMA Pro aún tiene poco soporte de hardware y software. Algunas excepciones notables a esto son Microsoft Zune (limitado a estéreo), [28] Xbox 360 , [29] dispositivos con Windows Mobile con Windows Media Player 10 Mobile, [30] dispositivos más nuevos de Toshiba Gigabeat y Motorola , [31] [32] y dispositivos que ejecutan versiones recientes del firmware alternativo de Rockbox . [33] Además, WMA Pro es un requisito para el programa de certificación WMV HD . [34] En el lado del software, Verizon utiliza WMA 10 Pro para su servicio de música V CAST, [35] y Windows Media Player 11 ha promovido el códec como una alternativa a WMA para copiar pistas de CD de audio. [36] WMA Pro es compatible con Silverlight a partir de la versión 2 (aunque solo en modo estéreo). En ausencia del hardware de audio adecuado, WMA Pro puede mezclar automáticamente audio multicanal a estéreo o mono , y una resolución de 24 bits a 16 bits durante la reproducción.
Un ejemplo notable del uso de WMA Pro en lugar de WMA Standard es el sitio web de NBC Olympics, que utiliza WMA 10 Pro en su modo de baja tasa de bits a 48 kbit/s. [ cita requerida ]
Windows Media Audio 9 Lossless es una versión sin pérdida de Windows Media Audio, un códec de audio de Microsoft , lanzado a principios de 2003. Comprime un CD de audio a un rango de 206 a 411 MB, a velocidades de bits de 470 a 940 kbit/s. El resultado es un duplicado bit a bit del archivo de audio original; en otras palabras, la calidad de audio en el CD será la misma que la del archivo cuando se reproduzca. WMA Lossless utiliza la misma extensión de archivo .WMA que otros formatos de Windows Media Audio. Admite 6 canales discretos y hasta 24 bits/96 kHz de audio sin pérdida. El formato nunca ha sido documentado públicamente, aunque los proyectos libav y ffmpeg han realizado ingeniería inversa de un decodificador de código abierto para plataformas que no son de Microsoft .
Windows Media Audio Lossless (WMA Lossless) es un códec de audio sin pérdida que compite con ATRAC Advanced Lossless, Dolby TrueHD , DTS-HD Master Audio , Shorten , Monkey's Audio , FLAC , Apple Lossless y WavPack (desde finales de 2011, [37] [38] [39] los últimos tres tienen la ventaja de ser software de código abierto y están disponibles para casi cualquier sistema operativo ). Diseñado para fines de archivo, [40] comprime señales de audio sin pérdida de calidad del original utilizando VBR. Cuando se descomprime, la señal de audio es una réplica exacta del original. La primera versión del códec, WMA 9 Lossless, y sus revisiones admiten hasta 96 kHz, audio de 24 bits para hasta 6 canales discretos ( envolvente de 5.1 canales ) con control de compresión de rango dinámico. La relación de compresión típica para música varía entre 1.7:1 y 3:1. [40] [41] [42]
El soporte de hardware para el códec está disponible en Cowon A3, [43] Cowon S9, Bang & Olufsen Serenata [44] Sony Walkman NWZ-A y NWZ-S series, Zune 4, 8 , 80 30 , Zune 120 (con versión de firmware 2.2 o posterior) y Zune HD , Xbox 360 , [29] dispositivos con Windows Mobile con Windows Media Player 10 Mobile, [30] Windows Phone (versión 8 y posterior), modelos Toshiba Gigabeat S y V, Toshiba T-400, Meizu M3 y reproductores de música Insignia NS-DV, Pilot y Sport de Best Buy . El Logitech Squeezebox Touch ahora admite el formato de forma nativa a pesar de que anteriormente solo lo admitía mediante transcodificación. Al igual que WMA Standard, WMA Lossless está siendo utilizado por algunas tiendas en línea para distribuir música en línea. [45] [46] De manera similar a WMA Pro, el decodificador WMA Lossless puede realizar downmix cuando no hay un hardware de audio capaz. [ cita requerida ] A partir de 2012, los proyectos ffmpeg y libav tienen decodificadores WMA Lossless de código abierto basados en ingeniería inversa del decodificador oficial. A partir del 20 de junio de 2012, ffmpeg solo puede decodificar con éxito archivos WMA de 16 bits.
Windows Media Audio Voice (WMA Voice) es un códec de audio con pérdida que compite con Speex (usado en el servicio en línea Xbox Live de Microsoft [47] ), ACELP y otros códecs. Diseñado para aplicaciones de reproducción de voz de bajo ancho de banda, [48] emplea filtrado de paso bajo y paso alto de sonido fuera del rango de frecuencia del habla humana para lograr una mayor eficiencia de compresión que WMA. Puede detectar automáticamente secciones de una pista de audio que contengan voz y música y usar el algoritmo de compresión estándar de WMA en su lugar. [24] WMA Voice admite hasta 22,05 kHz solo para un solo canal (mono). [48] La codificación está limitada a una tasa de bits constante (CBR) y hasta 20 kbit/s. La primera y única versión del códec es WMA 9 Voice.
Los dispositivos con Windows Mobile y Windows Media Player 10 Mobile tienen compatibilidad nativa con la reproducción de voz WMA 9. [30] Además, BBC World Service ha empleado WMA Voice para su servicio de transmisión de radio por Internet . [49]
Microsoft afirma que el audio codificado con WMA suena mejor que el MP3 a la misma velocidad de bits; Microsoft también afirma que el audio codificado con WMA a velocidades de bits más bajas suena mejor que el MP3 a velocidades de bits más altas. [50] Las pruebas de escucha a doble ciego con otros códecs de audio con pérdida han mostrado resultados variados, desde el fracaso en respaldar las afirmaciones de Microsoft sobre su calidad superior hasta la supremacía sobre otros códecs. Una prueba independiente realizada en mayo de 2004 a 128 kbit/s mostró que WMA era aproximadamente equivalente a LAME MP3; inferior a AAC y Vorbis; y superior a ATRAC3 (versión de software). [51]
Algunos estudios concluyeron:
Las afirmaciones de Microsoft sobre la calidad de sonido de WMA han generado quejas con frecuencia. "Algunos audiófilos cuestionan las afirmaciones de Microsoft sobre la calidad de WMA", según un artículo publicado en EDN. [11] Otro artículo de MP3 Developments escribió que la afirmación de Microsoft sobre el audio con calidad de CD a 64 kbit/s con WMA estaba "muy lejos de la verdad". [52] En las primeras etapas del desarrollo de WMA, un representante de RealNetworks afirmó que WMA era un "esfuerzo claro e inútil de Microsoft para ponerse a la altura de RealAudio 8". [53]
Microsoft ha afirmado en ocasiones que la calidad de sonido de WMA a 64 kbit/s es igual o superior a la de MP3 a 128 kbit/s (la mayoría de los oyentes consideran que tanto WMA como MP3 son casi transparentes a 192 kbit/s). En un estudio de 1999 financiado por Microsoft, National Software Testing Laboratories (NSTL) descubrió que los oyentes preferían WMA a 64 kbit/s a MP3 a 128 kbit/s (codificado por MusicMatch Jukebox ). [54]
Los codificadores MP3 y WMA han experimentado un desarrollo y una mejora activos durante muchos años, por lo que su calidad relativa puede cambiar con el tiempo.
Aparte de Windows Media Player, la mayoría de los formatos de compresión WMA se pueden reproducir utilizando ALLPlayer , VLC media player , [55] Media Player Classic , [56] MPlayer , RealPlayer , Winamp , Zune Software (con ciertas limitaciones: la compatibilidad con el complemento DSP y la salida DirectSound está deshabilitada utilizando el complemento WMA predeterminado), [ cita requerida ] y muchos otros reproductores multimedia de software. El software de gestión de medios Microsoft Zune admite la mayoría de los códecs WMA, pero utiliza una variación de Windows Media DRM que utiliza PlaysForSure.
El proyecto FFmpeg ha realizado ingeniería inversa y reimplementado los códecs WMA para permitir su uso en sistemas operativos compatibles con POSIX como Linux . El proyecto Rockbox amplió aún más este códec para que sea adecuado para núcleos integrados, lo que permite la reproducción en reproductores de MP3 portátiles y teléfonos móviles que ejecuten software de código abierto. RealNetworks ha anunciado planes para admitir la reproducción de archivos WMA sin DRM en RealPlayer para Linux. [57] En la plataforma Macintosh , Microsoft lanzó una versión PowerPC de Windows Media Player para Mac OS X en 2003, [58] pero el desarrollo posterior del software ha cesado. Microsoft actualmente respalda el Flip4Mac WMA de terceros , un componente QuickTime que permite a los usuarios de Macintosh reproducir archivos WMA en cualquier reproductor que use el marco QuickTime. [59] Sin embargo, Flip4Mac actualmente no admite el códec Windows Media Audio Voice. [60]
La plataforma principal de Android no es compatible con WMA, pero existe software WMA de terceros para dispositivos Android. [61]
El formato WMA se puede reproducir en casi todos los dispositivos Windows Mobile y posteriores Windows Phone.
Hay muchos paquetes de software propietarios y de código abierto que pueden exportar audio en formato WMA, incluidos, entre muchos otros, Windows Media Player, Windows Movie Maker , Microsoft Expression Encoder , Sony Sound Forge , GOM Player , RealPlayer , [62] Adobe Premiere Pro , [63] Adobe Audition , [64] Adobe Soundbooth y VLC media player . [65] Microsoft Office OneNote admite la codificación en todos los códecs WMA, [66] y Windows Media Encoder también admite todas las opciones de resolución y velocidad de bits disponibles.
Los códecs WMA se utilizan con mayor frecuencia con el formato contenedor ASF, que tiene una función DRM opcional. Windows Media DRM, que se puede utilizar junto con WMA, admite servicios de suscripción de música con límite de tiempo, como los que ofrecen los servicios de descarga ilimitada, incluidos URGE de MTV , Napster , Rhapsody , Yahoo! Music Unlimited y Virgin Digital . Windows Media DRM, un componente de PlaysForSure y Windows Media Connect , es compatible con muchos dispositivos de audio portátiles modernos y clientes de transmisión de medios como Roku , SoundBridge , Xbox 360 y Wii . Los reproductores que admiten el formato WMA pero no Windows Media DRM no pueden reproducir archivos protegidos con DRM.
audiófilos cuestionan las afirmaciones de Microsoft sobre la calidad de WMA