Formato de compresión de audio optimizado para codificación de voz
El códec de audio de velocidad múltiple adaptativa ( AMR , AMR-NB o GSM-AMR ) es un formato de compresión de audio optimizado para la codificación de voz . AMR es un códec de voz de banda estrecha de velocidad múltiple que codifica señales de banda estrecha (200–3400 Hz) a velocidades de bits variables que van desde 4,75 a 12,2 kbit/s con voz de calidad de llamada [3] a partir de 7,4 kbit/s. [4]
AMR fue adoptado como el códec de voz estándar por 3GPP en octubre de 1999 y ahora se utiliza ampliamente en GSM [5] y UMTS . Utiliza la adaptación de enlace para seleccionar una de ocho velocidades de bits diferentes según las condiciones del enlace.
AMR también es un formato de archivo para almacenar audio hablado utilizando el códec AMR. Muchos teléfonos móviles modernos pueden almacenar grabaciones de audio cortas en formato AMR, y existen programas tanto gratuitos como propietarios (consulte Soporte de software) para convertir entre este y otros formatos, aunque AMR es un formato de voz y es poco probable que dé resultados ideales para otro tipo de audio. La extensión de nombre de archivo común es .amr
. También existe otro formato de almacenamiento para AMR que es adecuado para aplicaciones con demandas más avanzadas en el formato de almacenamiento, como acceso aleatorio o sincronización con video. Este formato es el formato contenedor 3GP especificado por 3GPP basado en el formato de archivo multimedia base ISO. [6]
Uso
Los cuadros contienen 160 muestras y tienen una duración de 20 milisegundos. [1] AMR utiliza varias técnicas, como ACELP , DTX , VAD y CNG . El uso de AMR requiere una adaptación optimizada del enlace que selecciona el mejor modo de códec para cumplir con los requisitos de capacidad y canal de radio local. Si las condiciones de radio son malas, se reduce la codificación de la fuente y se aumenta la codificación del canal . Esto mejora la calidad y la robustez de la conexión de red al tiempo que sacrifica algo de claridad de voz. En el caso particular de AMR, esta mejora está en algún lugar alrededor de S/N = 4–6 dB para una comunicación utilizable. El nuevo sistema inteligente permite al operador de red priorizar la capacidad o la calidad por estación base.
Hay un total de 14 modos del códec AMR, ocho están disponibles en un canal de velocidad completa (FR) y seis en un canal de velocidad media (HR) .
Características
- Frecuencia de muestreo 8 kHz/13 bits (160 muestras para cuadros de 20 ms), filtrada a 200–3400 Hz.
- El códec AMR utiliza ocho códecs fuente con velocidades de bits de 12,2, 10,2, 7,95, 7,40, 6,70, 5,90, 5,15 y 4,75 kbit/s.
- Genera longitudes de trama de 95, 103, 118, 134, 148, 159, 204 o 244 bits para velocidades de bits AMR FR de 4,75, 5,15, 5,90, 6,70, 7,40, 7,95, 10,2 o 12,2 kbit/s, respectivamente. Las longitudes de trama AMR HR son diferentes.
- AMR utiliza transmisión discontinua (DTX), con detección de actividad de voz (VAD) y generación de ruido de confort (CNG) para reducir el uso del ancho de banda durante los períodos de silencio.
- El retardo algorítmico es de 20 ms por cuadro. Para velocidades de bits de 12,2, no hay retardo de anticipación "algoritmo". Para otras velocidades, el retardo de anticipación es de 5 ms. Tenga en cuenta que hay un retardo de anticipación "ficticio" de 5 ms, para permitir un cambio de modo sin problemas por cuadro con el resto de velocidades.
- AMR es un codificador de voz híbrido y, como tal, transmite tanto parámetros de voz como una señal de forma de onda.
- La complejidad del algoritmo se califica en 5, utilizando una escala relativa donde G.711 es 1 y G.729a es 15.
- Las pruebas PSQM en condiciones ideales arrojan puntuaciones de opinión medias de 4,14 para AMR (12,2 kbit/s), en comparación con 4,45 para G.711 (μ-law) [ cita requerida ]
- Las pruebas PSQM bajo estrés de red arrojan puntuaciones de opinión medias de 3,79 para AMR (12,2 kbit/s), en comparación con 4,13 para G.711 (μ-law)
Cuestiones de licencias y patentes
Los códecs AMR incorporan varias patentes de Nokia , Ericsson , NTT y VoiceAge, [7] [8] siendo esta última el Administrador de Licencias para los consorcios de patentes AMR . VoiceAge también acepta la presentación de patentes para la determinación de su posible esencialidad para estos estándares. [9] [10]
La tarifa inicial para las herramientas de creación de contenido profesional y los productos de "canal en tiempo real" es de 6.500 dólares estadounidenses. [ ¿Cuándo? ] La regalía anual mínima es de 10.000 dólares, que, en el primer año, excluye la tarifa inicial. Las tarifas de licencia por canal bajan de 0,99 a 0,50 dólares según el volumen, hasta un máximo de 2 millones de dólares anuales. [7] [8]
En la categoría de productos informáticos personales, por ejemplo, los reproductores multimedia, el decodificador AMR se licencia de forma gratuita. La tarifa de licencia para un codificador vendido se reduce de 0,40 a 0,30 dólares en función del volumen, hasta un máximo de 300.000 dólares anuales. La regalía anual mínima no se aplica a los productos con licencia que entran en la categoría de productos informáticos personales y utilizan únicamente el decodificador gratuito. [7] [8]
Más información:
- Información sobre licencias de VoiceAge, incluidos los precios para obtener licencias de los códecs AMR
- Cuestiones jurídicas del 3GPP
- La Plataforma de Patentes 3G y su política de licencias
- Códecs AMR como bibliotecas compartidas: avisos legales para el uso de las bibliotecas amrnb y amrwb basadas en la implementación de referencia
Soporte de software
- 3GPP TS 26.073 – Códec de voz AMR (código fuente C) – implementación de referencia [11]
- Audacity (versión beta 1.3) a través de las bibliotecas de integración FFmpeg [12] (formato de entrada y salida)
- FFmpeg con bibliotecas OpenCORE AMR [13]
- Android [14] Se utiliza para grabadora de voz.
- Códecs AMR como bibliotecas compartidas: sitio de desarrollo de bibliotecas amrnb y amrwb. Estas bibliotecas se basan en la implementación de referencia y se crearon para evitar la incorporación de código fuente posiblemente patentado en muchos proyectos de código abierto.
- Software de código abierto para convertir el formato .amr: RetroCode, Amr2Wav, ambos están en una etapa temprana de desarrollo
- AMR Player es un software gratuito para reproducir archivos de audio AMR y puede convertir AMR desde/hacia el formato de audio MP3/WAV.
- Nokia Multimedia Converter 2.0 puede convertir (crear) muestras. Se puede utilizar la herramienta de conversión de Nokia para crear archivos .amr y .awb. También funciona en Windows 7 si la instalación se ejecuta en modo de compatibilidad con XP.
- MPlayer ( SMPlayer , KMPlayer [15] )
- Parole Media Player 0.8.1 (en Ubuntu 16.04)
- QuickTime Player y el marco multimedia
- RealPlayer versión 11 y posteriores
- Reproductor multimedia VLC versión 1.1.0 y posteriores (solo formato de entrada, no formato de salida)
- espectáculo ffd
- Apple iPhone (puede reproducir archivos AMR)
- iOS y macOS (iMessage)
- Teléfonos inteligentes BlackBerry (se utilizan para el formato de archivo de grabadora de voz, mientras que BlackBerry 10 no puede reproducir el formato AMR)
- Paquete de códecs K-Lite
- Reproductor multimedia Classic Home Cinema, en torno a 1.7.1
- foobar2000 con el componente foo_input_amr
Véase también
Referencias
- ^ ab "3GPP TS 26.090 - Funciones de procesamiento de voz obligatorias del códec de voz; códec de voz de velocidad múltiple adaptativa (AMR); funciones de transcodificación". 3GPP . Consultado el 21 de julio de 2010 .
- ^ "3GPP TS 26.071 - Funciones de procesamiento de voz obligatorias del CODEC de voz; Códec de voz AMR; Descripción general". 3GPP . Consultado el 21 de julio de 2010 .
- ^ "¿Qué es la voz con calidad de llamada?". ITworld . 13 de diciembre de 2000 . Consultado el 26 de julio de 2019 .
- ^ RFC 4867 - Formato de carga útil RTP y formato de almacenamiento de archivos para los códecs de audio de velocidad múltiple adaptativa (AMR) y de banda ancha de velocidad múltiple adaptativa (AMR-WB) Página 35
- ^ "Cómo clasificar los códecs GSM: un tutorial". 11 de julio de 2003.
- ^ RFC 4867 - Formato de carga útil RTP y formato de almacenamiento de archivos para los códecs de audio de velocidad múltiple adaptativa (AMR) y de banda ancha de velocidad múltiple adaptativa (AMR-WB) Página 35
- ^ abc VoiceAge Corporation (14 de octubre de 2007). «Condiciones de licencia de AMR». VoiceAge Corporation. Archivado desde el original el 14 de octubre de 2007. Consultado el 12 de septiembre de 2009 .
- ^ abc VoiceAge Corporation (junio de 2007). «AMR Licensing Terms» (Condiciones de licencia de AMR). VoiceAge Corporation. Archivado desde el original el 14 de octubre de 2007. Consultado el 12 de septiembre de 2009 .
- ^ VoiceAge Corporation. «Licencias: demandas de patentes». VoiceAge Corporation. Archivado desde el original el 14 de octubre de 2007. Consultado el 12 de septiembre de 2009 .
- ^ VoiceAge Corporation (14 de octubre de 2007). «Licencias: solicitudes de patentes». Archivado desde el original el 14 de octubre de 2007. Consultado el 12 de septiembre de 2009 .
- ^ 3GPP (11-12-2008) 3GPP TS 26.073 - Códec de voz AMR, consultado el 8-9-2009
- ^ Recuperado el 28 de febrero de 2010
- ^ Documentación general de FFmpeg - Biblioteca externa AMR, consultado el 8 de julio de 2009
- ^ Códecs AMR de Android, consultado el 8 de julio de 2009. Archivado el 18 de febrero de 2009 en Wayback Machine .
- ^ Preferencias del decodificador de audio interno de KMPlayer Archivado el 22 de octubre de 2014 en Wayback Machine , consultado el 22 de octubre de 2014
Enlaces externos
- 3GPP TS 26.090 – Funciones de procesamiento de voz obligatorias del códec de voz; códec de voz de velocidad múltiple adaptativa (AMR); funciones de transcodificación
- 3GPP TS 26.071 – Funciones de procesamiento de voz obligatorias del códec de voz; códec de voz AMR; descripción general
- Especificaciones de los códecs 3GPP; 3G y posteriores / GSM, serie 26
- RFC 4867 – Formato de carga útil RTP y formato de almacenamiento de archivos para los códecs de audio de velocidad múltiple adaptativa (AMR) y de banda ancha de velocidad múltiple adaptativa (AMR-WB)
- RFC 4281 – El parámetro de códecs para los tipos de medios "Bucket"