stringtranslate.com

Predicción lineal de excitación mixta.

La predicción lineal de excitación mixta ( MELP ) es un estándar de codificación de voz del Departamento de Defensa de los Estados Unidos que se utiliza principalmente en aplicaciones militares y comunicaciones por satélite , voz segura y dispositivos de radio seguros. Su estandarización y posterior desarrollo fue liderado y apoyado por la NSA y la OTAN. La versión "mejorada" actual se conoce como MELPe .

Historia

El MELP inicial fue inventado por Alan McCree alrededor de 1995 [1] mientras era estudiante de posgrado en el Centro de Procesamiento de Señales e Imágenes (CSIP) de Georgia Tech, y las patentes originales relacionadas con MELP ya han expirado. Ese codificador de voz inicial se estandarizó en 1997 y se conoció como MIL-STD-3005. [2] Superó a otros codificadores de voz candidatos en la competencia del Departamento de Defensa de EE. UU., incluidos: (a) Codificador armónico selectivo de frecuencia (FSHC), (b) Excitación multibanda avanzada (AMBE), (c) Excitación multibanda mejorada (EMBE), ( d) Codificador de transformada sinusoide (STC), y (e) Codificador LPC de subbanda (SBC). [3] Debido a su menor complejidad que el codificador Waveform Interpolative (WI), el vocoder MELP ganó la competencia del Departamento de Defensa y fue seleccionado para MIL-STD -3005. [4]

MIL-STD-3005

Entre 1998 y 2001, se creó un nuevo vocoder basado en MELP a la mitad de velocidad (es decir, 1200 bit/s), y SignalCom (posteriormente adquirido por Microsoft ), Compandent y AT&T agregaron mejoras sustanciales al MIL-STD-3005. Corporation , que incluía (a) un nuevo codificador de voz adicional a la mitad de la velocidad (es decir, 1200 bit/s), (b) codificación (análisis) sustancialmente mejorada, (c) decodificación (síntesis) sustancialmente mejorada, (d) preprocesamiento de ruido para eliminar ruido de fondo, (e) transcodificación entre los flujos de bits de 2400 bit/s y 1200 bit/s, y (f) nuevo posfiltro. Este desarrollo bastante significativo tenía como objetivo crear un nuevo codificador a la mitad de velocidad y hacerlo interoperable con el antiguo estándar MELP. Este MELP mejorado (también conocido como MELPe) se adoptó como el nuevo MIL-STD-3005 en 2001 en forma de anexos y suplementos del MIL-STD-3005 original, lo que permite la misma calidad que los antiguos MELP de 2400 bit/s. a la mitad del precio. Una de las mayores ventajas del nuevo MELPe de 2400 bit/s es que comparte el mismo formato de bits que MELP y, por lo tanto, puede interoperar con sistemas MELP heredados, pero ofrecería mejor calidad en ambos extremos. MELPe proporciona una calidad mucho mejor que todos los estándares militares más antiguos, especialmente en entornos ruidosos como campos de batalla, vehículos y aviones.

STANAG-4591 (OTAN)

En 2002, después de una extensa competencia y pruebas, el DoD MELPe de 2400 y 1200 bit/s de EE. UU. también se adoptó como estándar de la OTAN , conocido como STANAG -4591. [5] Las mediciones de rendimiento de las pruebas de la OTAN incluyeron inteligibilidad de la voz, calidad de la voz, reconocimiento del hablante, dependencia del idioma, dependencia del hablante, 10 entornos de ruido acústico, canal de transmisión por debajo del 1% de BER, tándem usando codificador de voz CVSD de 16 kbit/s, voz susurrada y voz real. -tiempo de implementación. Los datos de las pruebas incluyeron más de 36.000 archivos, o 500 horas de conversación en diversas condiciones e idiomas. Como parte de las pruebas de la OTAN para el nuevo estándar de la OTAN, MELPe se probó con otros candidatos como el HSX (eXcitación estocástica armónica) de Francia y el SB-LPC (codificación predictiva lineal de banda dividida) de Turquía , así como con el antiguo sistema de voz seguro. estándares como FS1015 LPC-10e (2,4 kbit/s), FS1016 CELP (4,8 kbit/s) y CVSD (16 kbit/s). Posteriormente, MELPe también ganó el concurso de la OTAN, superando en calidad a todos los demás candidatos, así como en calidad a todos los antiguos estándares de voz seguros (CVSD, CELP y LPC-10e ). La competencia de la OTAN concluyó que MELPe mejoraba sustancialmente el rendimiento (en términos de calidad de voz, inteligibilidad e inmunidad al ruido), al tiempo que reducía los requisitos de rendimiento. Las pruebas de la OTAN también incluyeron pruebas de interoperabilidad, utilizaron más de 200 horas de datos de voz y fueron realizadas por tres laboratorios de pruebas en todo el mundo. Compandent Inc, como parte de los proyectos basados ​​en MELPe realizados para la NSA y la OTAN , proporcionó a la NSA y la OTAN una plataforma de banco de pruebas especial conocida como dispositivo MELCODER que proporcionó la referencia de oro para la implementación en tiempo real de MELPe. El equipo terminal de datos (DTE) FLEXI-232 de bajo costo fabricado por Compandent, que se basa en la referencia dorada MELCODER, es muy popular y ampliamente utilizado para evaluar y probar MELPe en tiempo real, varios canales y redes, y condiciones de campo. .

En 2005, Thales Group ( Francia ) añadió una nueva variación MELPe de velocidad de 600 bit/s (sin competencia ni pruebas extensas como las realizadas para el MELPe de 2400/1200 bit/s) al estándar STANAG-4591 de la OTAN. [6]

MELP de 300 bits/s

En 2010, MIT Lincoln Labs, Compandent, BBN y General Dynamics también desarrollaron para DARPA un dispositivo MELP de 300 bit/s. [7] Su calidad era mejor que la del MELPe de 600 bit/s, pero su retraso algorítmico era mayor.

Implementaciones

MELPe se ha implementado en muchas aplicaciones, incluidos dispositivos de radio seguros, comunicaciones por satélite, VoIP y aplicaciones de telefonía móvil. En tales aplicaciones, se requiere experiencia adicional para combatir errores de canal, pérdida de paquetes y pérdida de sincronización. Esta experiencia requiere la comprensión de la sensibilidad de los bits de MELPe a los errores. Los MELPe de 2400 bit/s y 1200 bit/s incluyen un bit de sincronización, que es útil en comunicaciones serie.

Nivel de compresión

MELPe está destinado a la compresión del habla. Dada una entrada de audio muestreada a 8 kHz, el códec MELPe produce las siguientes relaciones de compresión en un flujo de datos μ-Law G.711 de 64 kbit/s, descontando los efectos de la sobrecarga del protocolo:

Generalmente, la codificación de voz implica una compensación de diferentes aspectos que incluyen la velocidad de bits, la calidad de la voz, el retraso (tamaño de fotograma y anticipación), la complejidad computacional, la robustez para diferentes hablantes e idiomas, la robustez para diferentes ruidos de fondo, la robustez ante errores de canal y también recuperación del estado del códec ante la pérdida de paquetes. Dado que las velocidades más bajas del MELPe (600 y 1200 bit/s) son superconjuntos de la velocidad de 2400 bit/s, la complejidad del algoritmo (por ejemplo, en MIPS) es aproximadamente la misma para todas las velocidades. Las velocidades más bajas utilizan fotogramas y anticipación mayores, así como el tamaño del libro de códigos, por lo que requieren más memoria.

Derechos de propiedad intelectual

MELPe (y/o sus derivados) está sujeto a licencias de propiedad intelectual de las siguientes empresas: Texas Instruments (algoritmo/código fuente MELP de 2400 bit/s), Microsoft (transcodificador de 1200 bit/s), Thales Group (velocidad de 600 bit/s) , Compandent y AT&T (NPP de preprocesador de ruido).

Ver también

Referencias

  1. ^ Un modelo de codificador de voz LPC de excitación mixta para codificación de voz de baja velocidad de bits, Alan V. McCree, Thomas P. Barnweell, 1995 en IEEE Trans. Procesamiento de voz y audio (MELP original)
  2. ^ Conversión de voz de analógico a digital mediante predicción lineal de excitación mixta (MELP) de 2400 bits/segundo, Departamento de Defensa de EE. UU. (MIL_STD-3005, MELP original)
  3. ^ MR Bielefeld, LM Supplee, "Desarrollo de un programa de prueba para el proceso de selección de vocoder de 2400 bps del DoD", Acoustics Speech and Signal Processing 1996. ICASSP-96. Actas de la conferencia. 1996 Conferencia internacional IEEE sobre, vol. 2, págs. 1141-1144 vol. 2, 1996.
  4. ^ LM Supplee, RP Cohn, JS Collura, AV McCree, "MELP: el nuevo estándar federal a 2400 bps", Acoustics Speech and Signal Processing 1997. ICASSP-97. 1997 Conferencia internacional IEEE sobre, vol. 2, págs. 1591-1594 vol.2, 1997.
  5. ^ EL CODIFICADOR DE VOZ DE BANDA ESTRECHA INTEROPERABLE DE LA OTAN DE 1200 Y 2400 BIT / S, STANAG-4591, OTAN
  6. ^ VARIACIÓN MELPe PARA CODIFICADOR DE VOZ DE BANDA ESTRECHA OTAN DE 600 BIT / S, STANAG-4591, OTAN
  7. ^ Alan McCree, "Un marco de codificador de voz fonético escalable que utiliza la cuantificación vectorial predictiva conjunta de parámetros MELP", en Proc. IEEE Internacional. Conf. Acoust., Habla, procesamiento de señales, 2006, págs. I 705–708, Toulouse, Francia