stringtranslate.com

Voz segura

Sistema de radio seguro Gretacoder 210.
Sistema de voz seguro CVX-396, Crypto AG

Voz segura (alternativamente voz segura o cifonía ) es un término en criptografía para el cifrado de comunicaciones de voz a través de una variedad de tipos de comunicación como radio, teléfono o IP .

Historia

La implementación del cifrado de voz se remonta a la Segunda Guerra Mundial , cuando la comunicación segura era primordial para las fuerzas armadas de EE. UU. Durante ese tiempo, simplemente se agregaba ruido a una señal de voz para evitar que los enemigos escucharan las conversaciones. El ruido se agregaba reproduciendo un registro de ruido en sincronización con la señal de voz y cuando la señal de voz llegaba al receptor, la señal de ruido se restaba, dejando la señal de voz original. Para poder restar el ruido, el receptor necesitaba tener exactamente la misma señal de ruido y los registros de ruido sólo se hacían en pares; uno para el transmisor y otro para el receptor. Tener sólo dos copias de los registros hacía imposible que el receptor equivocado descifrara la señal. Para implementar el sistema, el ejército contrató a Bell Laboratories y desarrollaron un sistema llamado SIGSALY . Con SIGSALY, se utilizaron diez canales para muestrear el espectro de frecuencias de voz de 250 Hz a 3 kHz y se asignaron dos canales para muestrear el tono de voz y el silbido de fondo. En la época de SIGSALY, el transistor no había sido desarrollado y el muestreo digital se realizaba mediante circuitos utilizando el tubo de vacío Thyratron modelo 2051. Cada terminal SIGSALY utilizó 40 racks de equipos que pesaban 55 toneladas y ocuparon una gran sala. Este equipo incluía transmisores y receptores de radio y grandes tocadiscos de fonógrafo. La voz estaba codificada en dos discos fonográficos de vinilo de 410 milímetros (16 pulgadas) que contenían un tono de audio de modulación por desplazamiento de frecuencia (FSK). Los discos se reproducían en grandes y precisos tocadiscos en sincronía con la transmisión de voz.

Desde la introducción del cifrado de voz hasta la actualidad, las técnicas de cifrado han evolucionado drásticamente. La tecnología digital ha reemplazado efectivamente a los antiguos métodos analógicos de cifrado de voz y, mediante el uso de algoritmos complejos, el cifrado de voz se ha vuelto mucho más seguro y eficiente. Un método de cifrado de voz relativamente moderno es la codificación de subbanda . Con la codificación de subbanda, la señal de voz se divide en múltiples bandas de frecuencia, utilizando múltiples filtros de paso de banda que cubren rangos de frecuencia específicos de interés. Las señales de salida de los filtros de paso de banda luego se traducen en paso bajo para reducir el ancho de banda, lo que reduce la frecuencia de muestreo. Luego, las señales de paso bajo se cuantifican y codifican utilizando técnicas especiales como la modulación de código de pulso (PCM). Después de la etapa de codificación, las señales se multiplexan y envían a lo largo de la red de comunicación. Cuando la señal llega al receptor, se aplican las operaciones inversas a la señal para devolverla a su estado original. [1] Subhash Kak y Nikil Jayant desarrollaron un sistema de codificación del habla en los Laboratorios Bell en la década de 1970 . [2] En este sistema se utilizaron matrices de permutación para codificar representaciones codificadas (como modulación de código de pulso y variantes) de los datos de voz. Motorola desarrolló un sistema de cifrado de voz llamado Digital Voice Protection (DVP) como parte de su primera generación de técnicas de cifrado de voz. DVP utiliza una técnica de cifrado de sincronización automática conocida como retroalimentación de cifrado (CFB). El número extremadamente elevado de claves posibles asociadas con el primer algoritmo DVP hace que el algoritmo sea muy robusto y proporciona un alto nivel de seguridad. Al igual que con otros sistemas de cifrado con clave simétrica, se requiere la clave de cifrado para descifrar la señal con un algoritmo de descifrado especial.

Digital

Una voz digital segura generalmente incluye dos componentes, un digitalizador para convertir señales de voz y digitales y un sistema de cifrado para brindar confidencialidad. En la práctica, es difícil enviar la señal cifrada a través de los mismos circuitos de comunicación de banda vocal utilizados para transmitir voz no cifrada, por ejemplo, líneas telefónicas analógicas o radios móviles , debido a la expansión del ancho de banda.

Esto ha llevado al uso de codificadores de voz ( vocoders ) para lograr una compresión ajustada del ancho de banda de las señales de voz. STU-III , KY-57 y SCIP de la NSA son ejemplos de sistemas que operan sobre circuitos de voz existentes . El sistema STE , por el contrario, requiere líneas RDSI con un ancho de banda amplio para su funcionamiento normal. Para cifrar GSM y VoIP , que son nativamente digitales, se podría utilizar el protocolo estándar ZRTP como tecnología de cifrado de extremo a extremo .

La solidez de la voz segura se beneficia enormemente al tener los datos de voz comprimidos a velocidades de bits muy bajas mediante un componente especial llamado codificación de voz , compresión de voz o codificador de voz (también conocido como vocoder ). Los antiguos estándares de compresión de voz segura incluyen ( CVSD , CELP , LPC-10e y MELP , donde el último estándar es el algoritmo MELPe de última generación.

Métodos digitales que utilizan compresión de voz: MELP o MELPe

MELPe o MELP mejorado (predicción lineal de excitación mixta) es un estándar de codificación de voz del Departamento de Defensa de los Estados Unidos que se utiliza principalmente en aplicaciones militares y comunicaciones por satélite, voz segura y dispositivos de radio seguros. Su desarrollo fue liderado y apoyado por la NSA y la OTAN. El estándar de voz segura MELPe del gobierno de EE. UU. también se conoce como MIL-STD-3005, y el estándar de voz segura MELPe de la OTAN también se conoce como STANAG -4591.

El MELP inicial fue inventado por Alan McCree alrededor de 1995. [3] Ese codificador de voz inicial se estandarizó en 1997 y se conoció como MIL-STD-3005. [4] Superó a otros codificadores de voz candidatos en la competencia del Departamento de Defensa de EE. UU., incluidos: (a) Codificador armónico selectivo de frecuencia (FSHC), (b) Excitación multibanda avanzada (AMBE), (c) Excitación multibanda mejorada (EMBE), ( d) Codificador de transformada sinusoide (STC), y (e) Codificador LPC de subbanda (SBC). Debido a su menor complejidad [ cita necesaria ] que el codificador Waveform Interpolative (WI), el vocoder MELP ganó la competencia del Departamento de Defensa y fue seleccionado para MIL-STD -3005.

Entre 1998 y 2001, se creó un nuevo vocoder basado en MELP a la mitad de velocidad (es decir, 1200 bit/s) y SignalCom (posteriormente adquirido por Microsoft ), AT&T Corporation y Compandent agregaron mejoras sustanciales al MIL-STD-3005. que incluía (a) un nuevo codificador de voz adicional a la mitad de la velocidad (es decir, 1200 bit/s), (b) codificación (análisis) sustancialmente mejorada, (c) decodificación (síntesis) sustancialmente mejorada, (d) preprocesamiento de ruido para eliminar el ruido de fondo , (e) transcodificación entre los flujos de bits de 2400 bit/s y 1200 bit/s, y (f) nuevo posfiltro. Este desarrollo bastante significativo tenía como objetivo crear un nuevo codificador a la mitad de velocidad y hacerlo interoperable con el antiguo estándar MELP. Este MELP mejorado (también conocido como MELPe) se adoptó como el nuevo MIL-STD-3005 en 2001 en forma de anexos y suplementos del MIL-STD-3005 original, lo que permite la misma calidad que los antiguos MELP de 2400 bit/s. a la mitad del precio. Una de las mayores ventajas del nuevo MELPe de 2400 bit/s es que comparte el mismo formato de bits que MELP y, por lo tanto, puede interoperar con sistemas MELP heredados, pero ofrecería mejor calidad en ambos extremos. MELPe proporciona una calidad mucho mejor que todos los estándares militares más antiguos, especialmente en entornos ruidosos como campos de batalla, vehículos y aviones.

En 2002, después de una extensa competencia y pruebas, el DoD MELPe de 2400 y 1200 bit/s de EE. UU. también se adoptó como estándar de la OTAN , conocido como STANAG -4591. [5] Como parte de las pruebas de la OTAN para el nuevo estándar de la OTAN, MELPe se probó contra otros candidatos como el HSX (eXcitación estocástica armónica) de Francia y el SB-LPC (codificación predictiva lineal de banda dividida) de Turquía , así como el antiguos estándares de voz seguros como FS1015 LPC-10e (2,4 kbit/s), FS1016 CELP (4,8 kbit/s) y CVSD (16 kbit/s). Posteriormente, MELPe también ganó el concurso de la OTAN, superando en calidad a todos los demás candidatos, así como en calidad a todos los antiguos estándares de voz seguros (CVSD, CELP y LPC-10e ). La competencia de la OTAN concluyó que MELPe mejoraba sustancialmente el rendimiento (en términos de calidad de voz, inteligibilidad e inmunidad al ruido), al tiempo que reducía los requisitos de rendimiento. Las pruebas de la OTAN también incluyeron pruebas de interoperabilidad, utilizaron más de 200 horas de datos de voz y fueron realizadas por tres laboratorios de pruebas en todo el mundo. Compandent Inc, como parte de los proyectos basados ​​en MELPe realizados para la NSA y la OTAN , proporcionó a la NSA y la OTAN una plataforma de banco de pruebas especial conocida como dispositivo MELCODER que proporcionó la referencia de oro para la implementación en tiempo real de MELPe. El equipo terminal de datos (DTE) FLEXI-232 de bajo costo fabricado por Compandent, que se basa en la referencia dorada MELCODER, es muy popular y ampliamente utilizado para evaluar y probar MELPe en tiempo real, varios canales y redes, y condiciones de campo. .

La competencia de la OTAN concluyó que MELPe mejoraba sustancialmente el rendimiento (en términos de calidad de voz, inteligibilidad e inmunidad al ruido), al tiempo que reducía los requisitos de rendimiento. Las pruebas de la OTAN también incluyeron pruebas de interoperabilidad, utilizaron más de 200 horas de datos de voz y fueron realizadas por tres laboratorios de pruebas en todo el mundo.

En 2005, Thales Group ( Francia ) añadió una nueva variación MELPe de velocidad de 600 bit/s (sin competencia ni pruebas extensas como las realizadas para el MELPe de 2400/1200 bit/s) [6] al estándar STANAG-4591 de la OTAN, y Hay esfuerzos más avanzados para reducir las velocidades de bits a 300 bit/s e incluso 150 bit/s. [7]

En 2010, Lincoln Labs., Compandent, BBN y General Dynamics también desarrollaron para DARPA un dispositivo MELP de 300 bit/s. [8] Su calidad era mejor que la del MELPe de 600 bit/s, pero su retraso era mayor.

Ver también

Referencias

  1. ^ Owens, FJ (1993). Procesamiento de señales del habla . Molinos de perros: MacMillan Press. ISBN 0-333-51922-1.
  2. ^ Kak, S. y Jayant, NS, Cifrado de voz mediante codificación de formas de onda. Revista técnica de Bell System, vol. 56, págs. 781–808, mayo-junio de 1977.
  3. ^ Un modelo de codificador de voz LPC de excitación mixta para codificación de voz de baja velocidad de bits, Alan V. McCree, Thomas P. Barnweell, 1995 en IEEE Trans. Procesamiento de voz y audio (MELP original)
  4. ^ Conversión de voz de analógico a digital mediante predicción lineal de excitación mixta (MELP) de 2400 bits/segundo, Departamento de Defensa de EE. UU. (MIL_STD-3005, MELP original)
  5. ^ EL CODIFICADOR DE VOZ DE BANDA ESTRECHA INTEROPERABLE DE LA OTAN DE 1200 Y 2400 BIT / S, STANAG-4591, OTAN
  6. ^ VARIACIÓN MELPe PARA CODIFICADOR DE VOZ DE BANDA ESTRECHA OTAN DE 600 BIT / S, STANAG-4591, OTAN
  7. ^ Nichols, Randall K. y Lekkas, Panos C. (2002). "Criptología del habla". Seguridad inalámbrica: modelos, amenazas y soluciones . Nueva York: McGraw-Hill. ISBN 0-07-138038-8.
  8. ^ Alan McCree, "Un marco de codificador de voz fonético escalable que utiliza la cuantificación vectorial predictiva conjunta de parámetros MELP", en Proc. IEEE Internacional. Conf. Acoust., Habla, procesamiento de señales, 2006, págs. I 705–708, Toulouse, Francia