codificador de voz

Un vocodificador ( / ˈ v oʊ k oʊ d ər / , un acrónimo de voz y codificador ) es una categoría de codificación de voz que analiza y sintetiza la señal de voz humana para la compresión , multiplexación , cifrado de voz o transformación de datos de audio .

El vocoder fue inventado en 1938 por Homer Dudley en los Laboratorios Bell como medio para sintetizar el habla humana. ^[1] Este trabajo se desarrolló en el codificador de voz de canal que se utilizó como códec de voz para telecomunicaciones para la codificación de voz para conservar el ancho de banda en la transmisión.

Cifrando las señales de control se puede proteger la transmisión de voz contra interceptaciones . Su uso principal de esta manera es la comunicación por radio segura. La ventaja de este método de cifrado es que no se envía nada de la señal original, sólo envolventes de los filtros de paso de banda. La unidad receptora debe configurarse en la misma configuración de filtro para resintetizar una versión del espectro de la señal original.

El vocoder también se ha utilizado ampliamente como instrumento musical electrónico . La parte decodificadora del vocodificador, llamada voder , se puede utilizar de forma independiente para la síntesis de voz.

Teoría

La voz humana está formada por sonidos generados por la apertura y cierre de la glotis por las cuerdas vocales , lo que produce una forma de onda periódica con muchos armónicos . Luego, este sonido básico es filtrado por la nariz y la garganta (un complicado sistema de tuberías resonantes ) para producir diferencias en el contenido armónico ( formantes ) de forma controlada, creando la amplia variedad de sonidos utilizados en el habla. Hay otro conjunto de sonidos, conocidos como sonidos sordos y explosivos , que la boca crea o modifica de diferentes maneras.

El vocoder examina el habla midiendo cómo cambian sus características espectrales con el tiempo. Esto da como resultado una serie de señales que representan estas frecuencias en cualquier momento particular mientras el usuario habla. En términos simples, la señal se divide en varias bandas de frecuencia (cuanto mayor sea este número, más preciso será el análisis) y el nivel de señal presente en cada banda de frecuencia proporciona la representación instantánea del contenido de energía espectral. Para recrear el habla, el vocoder simplemente invierte el proceso, procesando una fuente de ruido de banda ancha pasándola por una etapa que filtra el contenido de frecuencia en función de la serie de números grabada originalmente.

Específicamente, en el codificador, la entrada pasa a través de un filtro multibanda , luego la salida de cada banda se mide usando un seguidor de envolvente y las señales de los seguidores de envolvente se transmiten al decodificador. El decodificador las aplica como señales de control a los amplificadores correspondientes de los canales de filtro de salida.

Se descarta la información sobre la frecuencia instantánea de la señal de voz original (a diferencia de su característica espectral); No era importante conservar esto para el uso original del vocoder como ayuda de cifrado. Es este aspecto deshumanizante del proceso de codificación de voz lo que lo ha hecho útil para crear efectos de voz especiales en la música popular y el entretenimiento de audio.

En lugar de una recreación punto por punto de la forma de onda, el proceso del vocoder envía sólo los parámetros del modelo vocal a través del enlace de comunicación. Dado que los parámetros cambian lentamente en comparación con la forma de onda de voz original, se puede reducir el ancho de banda necesario para transmitir voz. Esto permite que más canales de voz utilicen un canal de comunicación determinado , como un canal de radio o un cable submarino .

Los codificadores de voz analógicos suelen analizar una señal entrante dividiendo la señal en múltiples bandas o rangos de frecuencia sintonizados. Para reconstruir la señal, se envía una señal portadora a través de una serie de estos filtros de paso de banda sintonizados . En el ejemplo de una voz de robot típica, la portadora es ruido o una forma de onda en diente de sierra . Suele haber entre 8 y 20 bandas.

La amplitud del modulador para cada una de las bandas de análisis individuales genera un voltaje que se utiliza para controlar los amplificadores para cada una de las bandas portadoras correspondientes. El resultado es que los componentes de frecuencia de la señal moduladora se asignan a la señal portadora como cambios de amplitud discretos en cada una de las bandas de frecuencia.

A menudo hay una banda sorda o un canal de sibilancia . Esto es para frecuencias que están fuera de las bandas de análisis del habla típica pero que aún son importantes en el habla. Algunos ejemplos son palabras que comienzan con las letras s , f , ch o cualquier otro sonido sibilante. El uso de esta banda produce un habla reconocible, aunque suena algo mecánico. Los vocoders suelen incluir un segundo sistema para generar sonidos sordos, utilizando un generador de ruido en lugar de la frecuencia fundamental . Esto se mezcla con la salida del portador para aumentar la claridad.

En el algoritmo del vocoder de canal, entre los dos componentes de una señal analítica , considerar solo el componente de amplitud y simplemente ignorar el componente de fase tiende a dar como resultado una voz poco clara; Para conocer los métodos para rectificar esto, consulte el vocoder de fase .

Historia

El desarrollo de un codificador de voz fue iniciado en 1928 por el ingeniero de los Laboratorios Bell , Homer Dudley , ^[5] a quien se le concedieron patentes el 21 de marzo de 1939, ^[6] y el 16 de noviembre de 1937. ^[7]

Para demostrar la capacidad de síntesis de voz de su sección decodificadora, el voder (demostración de funcionamiento por voz) ^[8] se presentó al público en el edificio de AT&T en la Feria Mundial de Nueva York de 1939-1940. ^[9] El voder constaba de un oscilador electrónico (una fuente de sonido de tono agudo ) y un generador de ruido para el silbido , un filtro resonador de 10 bandas con amplificadores de ganancia variable a modo de tracto vocal y controladores manuales que incluían un conjunto de reguladores de presión. teclas sensibles para el control del filtro y un pedal para el control del tono. ^[10] Los filtros controlados por teclas convierten el tono y el silbido en vocales , consonantes e inflexiones . Se trataba de una máquina compleja de manejar, pero un operador experto podía producir un habla reconocible. ^[9]^{[medios 1]}

El codificador de voz de Dudley se utilizó en el sistema SIGSALY , que fue construido por ingenieros de Bell Labs en 1943. SIGSALY se utilizó para comunicaciones de voz cifradas durante la Segunda Guerra Mundial . El codificador de voz KO-6 se lanzó al mercado en 1949 en cantidades limitadas; era una aproximación cercana al SIGSALY a 1200 bit/s. En 1953, el codificador de voz KY-9 THESEUS ^{[11] de} 1650 bit/s utilizó lógica de estado sólido para reducir el peso a 565 libras (256 kg) de las 55 toneladas cortas (50 000 kg) de SIGSALY, y en 1961 el codificador de voz HY-2 El codificador, un sistema de 16 canales de 2400 bit/s, pesaba 100 libras (45 kg) y fue la última implementación de un codificador de voz de canal en un sistema de voz seguro. ^[12]

Desde entonces, trabajos posteriores en este campo han utilizado codificación de voz digital . La técnica de codificación de voz más utilizada es la codificación predictiva lineal (LPC). ^[13] Otra técnica de codificación de voz, la modulación diferencial adaptativa de código de pulso (ADPCM), fue desarrollada por P. Cummiskey, Nikil S. Jayant y James L. Flanagan en Bell Labs en 1973. ^[14]

Aplicaciones

Equipos terminales para sistemas basados en radio móvil digital (DMR).
Codificación y cifrado de voz digital
Implantes cocleares : se utiliza codificación de voz de ruido y tono para simular los efectos de los implantes cocleares. ^{[ cita necesaria ]}
Efectos musicales y otros efectos artísticos ^[15]

Implementaciones modernas

Incluso con la necesidad de grabar varias frecuencias y sonidos sordos adicionales, la compresión de los sistemas de vocoder es impresionante. Los sistemas de grabación de voz estándar capturan frecuencias de aproximadamente 500 a 3400 Hz, donde se encuentran la mayoría de las frecuencias utilizadas en el habla, normalmente utilizando una frecuencia de muestreo de 8 kHz (ligeramente mayor que la frecuencia de Nyquist ). La resolución de muestreo suele ser de 8 o más bits por resolución de muestra, para una velocidad de datos en el rango de 64 kbit/s, pero un buen vocodificador puede proporcionar una simulación de voz razonablemente buena con tan solo 5 kbit/s de datos.

En muchas redes telefónicas se utilizan codificadores de voz de calidad de pago , como ITU G.729 . G.729 en particular tiene una velocidad de datos final de 8 kbit/s con una calidad de voz excelente. G.723 logra una calidad ligeramente peor a velocidades de datos de 5,3 y 6,4 kbit/s. Muchos sistemas de vocodificadores de voz utilizan velocidades de datos más bajas, pero por debajo de 5 kbit/s la calidad de la voz comienza a caer rápidamente. ^{[ cita necesaria ]}

En los sistemas de cifrado de la NSA se utilizan varios sistemas de vocoder :

LPC-10, FIPS Pub 137, 2400 bit/s, que utiliza codificación predictiva lineal
Predicción lineal excitada por código (CELP), 2400 y 4800 bit/s, estándar federal 1016, utilizado en STU-III
Modulación delta de pendiente continuamente variable (CVSD), 16 kbit/s, utilizada en codificadores de banda ancha como el KY-57.
Predicción lineal de excitación mixta (MELP), MIL STD 3005, 2400 bit/s, utilizada en el Future Narrowband Digital Terminal FNBDT , el teléfono seguro del siglo XXI de la NSA .
Modulación de código de impulsos diferencial adaptativo (ADPCM), antiguo ITU-T G.721, 32 kbit/s utilizado en el teléfono seguro STE ^[a]

Los codificadores de voz modernos que se utilizan hoy en día en equipos de comunicación y dispositivos de almacenamiento de voz se basan en los siguientes algoritmos:

Predicción lineal excitada por código algebraico (ACELP 4,7–24 kbit/s) ^[16]
Predicción lineal de excitación mixta (MELPe 2400, 1200 y 600 bit/s) ^[17]
Excitación multibanda (AMBE 2000 bit/s – 9600 bit/s) ^[18]
Representación pulsada sinusoidal (SPR 600 bit/s – 4800 bit/s) ^[19]
Interpolación de formas de onda robusta, avanzada y de baja complejidad (RALCWI 2050, 2400 y 2750 bit/s) ^[20]
Predicción lineal excitada de tres ondas (TWELP 300–9600 bit/s) ^[21]
Vocodificador robusto de ruido (NRV 300 y 800 bit/s) ^[22]

Los vocoders también se utilizan actualmente en psicofísica , lingüística , neurociencia computacional e investigación de implantes cocleares .

Basado en predicción lineal

Desde finales de la década de 1970, la mayoría de los vocodificadores no musicales se han implementado mediante predicción lineal , mediante la cual la envolvente espectral (formante) de la señal objetivo se estima mediante un filtro IIR de todos los polos . En la codificación de predicción lineal, el filtro omnipolar reemplaza el banco de filtros de paso de banda de su predecesor y se usa en el codificador para blanquear la señal (es decir, aplanar el espectro) y nuevamente en el decodificador para volver a aplicar la forma espectral del objetivo. señal de voz.

Una ventaja de este tipo de filtrado es que la ubicación de los picos espectrales del predictor lineal está completamente determinada por la señal objetivo y puede ser tan precisa como lo permita el período de tiempo que se va a filtrar. Esto contrasta con los vocoders realizados con bancos de filtros de ancho fijo, donde la ubicación de los picos espectrales está limitada por las bandas de frecuencia fija disponibles. El filtrado LP también tiene desventajas en el sentido de que las señales con un gran número de frecuencias constituyentes pueden exceder el número de frecuencias que pueden representarse mediante el filtro de predicción lineal. Esta restricción es la razón principal por la que la codificación LP casi siempre se utiliza junto con otros métodos en codificadores de voz de alta compresión.

Interpolación de forma de onda

El vocoder de interpolación de forma de onda (WI) fue desarrollado en AT&T Bell Laboratories alrededor de 1995 por WB Kleijn y, posteriormente, AT&T desarrolló una versión de baja complejidad para la competencia de vocoder seguro del Departamento de Defensa. En la Universidad de California, Santa Bárbara , se realizaron mejoras notables al codificador WI . AT&T posee las patentes principales relacionadas con WI y otros institutos poseen patentes adicionales. ^[23]^[24]^[25]

Efectos artísticos

Usos en la música

Configuración de vocoder de canal como aplicación musical; los subtítulos en holandés son "Filtros de paso de banda" y "Medidores de nivel".

Para aplicaciones musicales , se utiliza una fuente de sonidos musicales como portadora, en lugar de extraer la frecuencia fundamental. Por ejemplo, se podría utilizar el sonido de un sintetizador como entrada al banco de filtros, una técnica que se hizo popular en los años 1970.

Historia

Werner Meyer-Eppler , un científico alemán con especial interés en la síntesis electrónica de voz, publicó una tesis en 1948 sobre la música electrónica y la síntesis del habla desde el punto de vista de la síntesis del sonido . ^[26] Posteriormente contribuyó decisivamente a la fundación del Estudio de Música Electrónica de WDR en Colonia, en 1951. ^[27]

Uno de los primeros intentos de utilizar un vocoder en la creación de música fue el sintetizador Siemens en el Estudio Siemens de Música Electrónica, desarrollado entre 1956 y 1959. ^[28]^[29]^{[media 2]}

En 1968, Robert Moog desarrolló uno de los primeros vocoders musicales de estado sólido para el estudio de música electrónica de la Universidad de Buffalo . ^[30]

En 1968, Bruce Haack construyó un prototipo de vocoder, llamado Farad en honor a Michael Faraday . ^[31] Apareció por primera vez en "The Electronic Record For Children", lanzado en 1969 y luego en su álbum de rock The Electric Lucifer , lanzado en 1970. ^[32]^{[medios 3]}

En 1970, Wendy Carlos y Robert Moog construyeron otro vocoder musical, un dispositivo de diez bandas inspirado en los diseños de vocoder de Homer Dudley . Originalmente se llamó codificador-decodificador de espectro y luego se le denominó simplemente vocodificador. La señal portadora provino de un sintetizador modular Moog y el modulador de una entrada de micrófono . La salida del codificador de voz de diez bandas era bastante inteligible pero dependía de un habla especialmente articulada.

En 1972, el primer álbum de música electrónica de Isao Tomita , Electric Samurai: Switched on Rock, fue un primer intento de aplicar la técnica de síntesis de voz a través de un vocoder ^[^{cita requerida}^]^[^{aclaración necesaria}^] al rock electrónico . El álbum incluía interpretaciones electrónicas de canciones pop y rock contemporáneo , mientras utilizaba voces sintetizadas en lugar de voces humanas. En 1974, utilizó voces sintetizadas en su popular álbum de música clásica Snowflakes are Dancing , que se convirtió en un éxito mundial y ayudó a popularizar la música electrónica.

En 1973, la banda británica Emerson, Lake and Palmer utilizó un vocoder en su álbum Brain Salad Surgery , para la canción " Karn Evil 9: 3rd Impression ".

La canción de 1975 " The Raven " del álbum Tales of Mystery and Imagination de The Alan Parsons Project presenta a Alan Parsons interpretando la voz a través de un codificador de voz EMI. Según las notas del álbum, "The Raven" fue la primera canción de rock que contó con un vocoder digital.

Pink Floyd utilizó un vocoder en tres de sus álbumes, primero en Animals de 1977 para las canciones " Ovejas " y " Pigs (Three Different Ones) ", luego en 1987 en A Momentary Lapse of Reason en " A New Machine Part 1 " y "A New Machine Part 2", y finalmente en The Division Bell de 1994 , en " Keep Talking ".

La Electric Light Orchestra estuvo entre las primeras en utilizar el vocoder en un contexto comercial, con su álbum de 1977 Out of the Blue . La banda lo utiliza ampliamente en el álbum, incluidos los éxitos " Sweet Talkin' Woman " y " Mr. Blue Sky ". ^[33] En los álbumes siguientes, la banda hizo un uso esporádico de él, en particular en sus éxitos " The Diary of Horace Wimp " y " Confusion " de su álbum Discovery de 1979 , los temas "Prologue", "Yours Truly, 2095" y "Epilogue" de su álbum Time de 1981 , ^[34] y " Calling America " de su álbum de 1986 Balance of Power .

A finales de la década de 1970, el dúo francés Space Art utilizó un vocoder durante la grabación de su segundo álbum, Trip in the Centre Head . ^[35]

Phil Collins utilizó un codificador de voz para proporcionar un efecto vocal para su exitoso sencillo internacional de 1981 " In the Air Tonight ". ^[36]

Los vocoders han aparecido en grabaciones pop de vez en cuando, la mayoría de las veces simplemente como un efecto especial más que como un aspecto destacado del trabajo. Sin embargo, muchos artistas electrónicos experimentales del género musical new age suelen utilizar el vocoder de una manera más completa en obras específicas, como Jean-Michel Jarre (en Zoolook , 1984) y Mike Oldfield (en QE2 , 1980 y Five Miles Out , 1982).

El módulo de vocoder y su uso por parte de Mike Oldfield se pueden ver claramente en su DVD Live At Montreux 1981 (pista " Sheba ").

También hay algunos artistas que han hecho de los vocoders una parte esencial de su música, en general o durante una fase prolongada. Los ejemplos incluyen el grupo alemán de synthpop Kraftwerk , el grupo japonés de nueva ola Polysics , Stevie Wonder (" Send One Your Love ", " A Seed's a Star ") y el teclista de jazz/fusión Herbie Hancock durante su período de finales de los años 1970. En 1982, Neil Young utilizó un Sennheiser Vocoder VSM201 en seis de las nueve pistas de Trans . ^[37] El coro y el puente de " PYT (Pretty Young Thing) " de Michael Jackson . incluye un codificador de voz ("Pretty young thing/You make me sing"), cortesía del músico de sesión Michael Boddicker .

Coldplay ha utilizado un vocoder en algunas de sus canciones. Por ejemplo, en " Major Minus " y " Hurts Like Heaven ", ambos del álbum Mylo Xyloto (2011), la voz de Chris Martin está mayoritariamente procesada mediante vocoder. " Midnight ", de Ghost Stories (2014), también presenta a Martin cantando a través de un vocoder. ^[38] La pista oculta "X Marks the Spot" de A Head Full of Dreams también se grabó a través de un vocoder.

La banda de noisecore Atari Teenage Riot ha utilizado codificadores de voz en una variedad de sus canciones y presentaciones en vivo, como Live at the Brixton Academy (2002), junto con otras tecnologías de audio digital, tanto antiguas como nuevas.

La canción de Red Hot Chili Peppers " By the Way " utiliza un efecto de vocoder en la voz de Anthony Kiedis .

Entre los usuarios más consistentes del vocoder a la hora de emular la voz humana se encuentran Daft Punk , que han utilizado este instrumento desde su primer álbum Homework (1997) hasta su último trabajo Random Access Memories (2013) y consideran la convergencia de la voz tecnológica y humana". la identidad de su proyecto musical". ^[39] Por ejemplo, la letra de " Around the World " (1997) está íntegramente procesada con vocoder, " Get Lucky " (2013) presenta una mezcla de voces humanas naturales y procesadas, y " Instant Crush " (2013) presenta a Julian. Casablancas cantando en un vocoder.

Ye (Kanye West) utilizó un vocoder en la salida de su canción " Runaway " (2010). ^[40]

El productor Zedd , la cantante de country estadounidense Maren Morris y el dúo musical estadounidense Gray hicieron una canción titulada " The Middle " que contó con un vocoder y alcanzó el top diez de las listas en 2018. ^[41]

Efectos de voz en otras artes.

Las voces de robots se convirtieron en un elemento recurrente en la música popular durante el siglo XX. Además de los vocoders, varios otros métodos para producir variaciones de este efecto incluyen: Sonovox , Talk box , Auto-Tune , ^{[media 4]} vocoders de predicción lineal, síntesis de voz , ^{[media 5]}^{[media 6]} modulación en anillo y filtro de peine .

Ejemplo de codificador de voz

Demostración del efecto de "voz robótica" que se encuentra en el cine y la televisión.

¿Problemas al reproducir este archivo? Ver ayuda para los medios .

Los codificadores de voz se utilizan en la producción de televisión , cine y juegos, generalmente para robots o computadoras parlantes. Las voces robóticas de los Cylons en Battlestar Galactica fueron creadas con un EMS Vocoder 2000. ^[37] La versión de 1980 del tema de Doctor Who , arreglada y grabada por Peter Howell , tiene una sección de la melodía principal generada por un Roland SVC- 350 codificador de voz. Se utilizó un vocoder Roland VP-330 similar para crear la voz de Soundwave , un personaje de la serie Transformers .

Ver también

Notas

^ ADPCM no es un codificador de voz adecuado sino más bien un códec de forma de onda. La UIT ha reunido G.721 junto con algunos otros códecs ADPCM en G.726.

Referencias

^ US 135416A, "Sistema para la producción artificial de sonidos vocales u otros", emitido el 7 de abril de 1937
^ Dudley, Homer (octubre de 1940). "La naturaleza portadora del habla". Revista técnica del sistema Bell . XIX (4).
^ "HY-2". Cryptomuseum.com . Consultado el 31 de julio de 2019 .
^ "Vocodificador HY-2". Máquinas criptográficas.
^ Molinos, Mara (2012). "Medios y prótesis: el vocoder, la laringe artificial y la historia del procesamiento de señales". Qui Parle . 21 (1): 107–149. doi :10.5250/quiparle.21.1.0107. S2CID 143012886.
^ Solicitud estadounidense 2151091, Dudley, Homer W., "Signal Transmission", publicada el 21 de mayo de 1939, asignada a Bell Telephone Laboratories , Inc. (presentada el 30 de octubre de 1935)
^ Solicitud estadounidense 2098956, Dudley, Homer W., "Signaling system", publicada el 16 de noviembre de 1937, asignada a Bell Telephone Laboratories , Inc.
^ Solicitud de EE. UU. 2121142, Dudley, Homer, "Signal Transmission", publicada el 21 de junio de 1938, asignada a Bell Telephone Laboratories , Inc.
^ ab "El 'Voder' y el 'Vocoder' Homer Dudley, EE. UU., 1940". 120 Años de Música Electrónica (120years.net) . 2013-09-21. El Vocoder (grabadora operada por voz) y el Voder (demostración de operación por voz) desarrollados por el físico investigador Homer Dudley,... El Voder se presentó por primera vez en 1939 en la Feria Mundial de Nueva York (donde se demostró a intervalos de una hora) y más tarde en 1940 en San Francisco. Había veinte operadores capacitados conocidos como las 'niñas' que manejaban la máquina como si fuera un instrumento musical como un piano o un órgano... Esto se hacía manipulando catorce teclas con los dedos, una barra con la muñeca izquierda y una pedal con el pie derecho.
^ "El Voder (1939)". Cabezas parlantes: simulacros . Laboratorios Haskins .Basado en James L. Flanagan (1965). "Síntesis del habla". Análisis, Síntesis y Percepción del Habla . Springer-Verlag. págs. 172-173.(Ver diagrama esquemático del sintetizador Voder).
^ "KY-9". Cryptomuseum.com . Consultado el 31 de julio de 2019 .
^ "Campbell.qxd" (PDF) . Consultado el 31 de julio de 2019 .
^ Gupta, Shipra (mayo de 2016). "Aplicación de MFCC en el reconocimiento de locutores independientes de texto" (PDF) . Revista Internacional de Investigación Avanzada en Ciencias de la Computación e Ingeniería de Software . 6 (5): 805–810 (806). ISSN 2277-128X. S2CID 212485331. Archivado desde el original (PDF) el 18 de octubre de 2019 . Consultado el 18 de octubre de 2019 . Los métodos LPC son los más utilizados en la codificación de voz.
^ Cummiskey, P.; Jayant, Nikil S .; Flanagan, James L. (1973). "Cuantización adaptativa en codificación PCM diferencial de voz". La revista técnica de Bell System . 52 (7): 1105-1118. doi :10.1002/j.1538-7305.1973.tb02007.x.
^ Ernst Rothauser . Tesis y patentes sobre tecnología de vocoder.
^ "Voice Age" (licencia) . Corporación VoiceAge.
^ "MELPe - Preguntas frecuentes". Compandente Inc.
^ "IMBE y AMBE". Digital Voice Systems, Inc. Archivado desde el original el 7 de julio de 2017 . Consultado el 8 de noviembre de 2008 .
^ "Vocodificadores SPR". DSP Innovations Inc. Archivado desde el original el 9 de abril de 2016 . Consultado el 8 de noviembre de 2008 .
^ "CI de codificador de voz RALCWI". Microcircuitos CML . CML Microsystems Plc. Archivado desde el original el 15 de marzo de 2018 . Consultado el 17 de mayo de 2013 .
^ "Vocodificador DOCE". DSP Innovaciones Inc.
^ "Vocodificadores de ruido Rubust". Tecnologías Raytheon BBN. Archivado desde el original el 2 de abril de 2014.
^ Kleijn, WB; Haagen, J. (1995). "Un codificador de voz basado en la descomposición de formas de onda características". 1995 Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales . vol. 1. (AT&T Bell Labs., Murray Hill, Nueva Jersey). págs. 508–511. doi :10.1109/ICASSP.1995.479640. ISBN 978-0-7803-2431-2. S2CID 9105323.
^ Kleijn, WB; Shoham, Y.; Enviar.; Hagen, R. (1996). "Un codificador de interpolación de formas de onda de baja complejidad". Actas de la conferencia de la Conferencia Internacional IEEE sobre Acústica, Habla y Procesamiento de Señales de 1996 . vol. 1. (AT&T Bell Labs., Murray Hill, Nueva Jersey). págs. 212-215. doi :10.1109/ICASSP.1996.540328. ISBN 978-0-7803-3192-1. S2CID 44346744. {{cite book}}: |periodical=ignorado ( ayuda )
^ Gottesman, O.; Gersho, A. (2001). "Codificación interpolativa de formas de onda mejorada a baja velocidad de bits". Transacciones IEEE sobre procesamiento de voz y audio . 9 (noviembre de 2001). (Departamento de Ingeniería Eléctrica y Computación, Universidad de California, Santa Bárbara, CA): 786–798. doi : 10.1109/89.966082. S2CID 17949435.
^ Meyer-Eppler, Werner (1949), Elektronische Klangerzeugung: Elektronische Musik und synthetische Sprache , Bonn: Ferdinand Dümmlers
^ Diesterhöft, Sonja (2003), "Meyer-Eppler und der Vocoder", Seminars Klanganalyse und -synthese (en alemán), Fachgebiet Kommunikationswissenschaft, Institut für Sprache und Kommunikation, Technische Universität Berlin, archivado desde el original el 5 de marzo de 2008
^ "Das Siemens-Studio für elektronische Musik von Alexander Schaaf und Helmut Klein" (en alemán). Museo Alemán. Archivado desde el original el 30 de septiembre de 2013.
^ Holmes, Thom (2012). "Primeros sintetizadores y experimentadores". Música electrónica y experimental: tecnología, música y cultura (4ª ed.). Rutledge. págs. 190-192. ISBN 978-1-136-46895-7.(Véase también el extracto de las págs. 157 a 160 de la tercera edición de 2008 ( ISBN 978-0-415-95781-6 ))
^ Bode, Harald (octubre de 1984). "Historia de la modificación electrónica del sonido" (PDF) . Revista de la Sociedad de Ingeniería de Audio . 32 (10): 730–739.
^ BRUCE HAACK - FARAD: LA VOZ ELÉCTRICA (Notas de prensa). Bruce Haack. Piedras lanzan registros LLC. 2010.{{cite AV media notes}}: CS1 maint: others in cite AV media (notes) (link)
^ "Biografía de Bruce Haack 1965-1974". Editorial Bruce Haack.
^ De la nada (folleto). Orquesta de Luz Eléctrica. Épico, legado. 2007.{{cite AV media notes}}: CS1 maint: others in cite AV media (notes) (link)
^ "En 1981, Electric Light Orchestra nos llevó al futuro". Revista Nacional . 2021-08-08 . Consultado el 19 de octubre de 2021 .
^ Richard, Philippe (29 de noviembre de 2016). "Musique. Space Art, pioneros del electro à la française" [Música. Space Art, pioneros del electro francés]. Oeste de Francia (en francés) . Consultado el 28 de abril de 2021 .
^ Flanes, Robyn (5 de enero de 2005). "Pistas clásicas: Phil Collins" In the Air Tonight"". Mezclar en línea . Consultado el 25 de febrero de 2015 .
^ ab Tompkins, Dave (2010-2011). Cómo destrozar una bonita playa: el vocoder de la Segunda Guerra Mundial al hip-hop, The Machine Speaks . Casa Melville. ISBN 978-1-61219-093-8.
^ "¡Midnight es increíble! Pero parece que la voz de Chris tiene autoajuste en algunas partes. ¿Pensé que Coldplay no usa autoajuste?". Coldplay "Oráculo". 5 de marzo de 2014. Archivado desde el original el 2 de mayo de 2014 . Consultado el 25 de marzo de 2014 .
^ "Daft Punk:" La musique actuelle manque d'ambition"" (entrevista) . El Fígaro . 3 de mayo de 2013.
^ Estelle Caswell (1 de septiembre de 2016). "Kanye deconstruido: la voz humana como instrumento definitivo" . Consultado el 26 de septiembre de 2023 .
^ "Zedd y Griff lanzan Bubbly Future Pop Jam" de adentro hacia afuera"". EDM.com . Jason Heffler. 23 de octubre de 2020 . Consultado el 23 de octubre de 2021 .

Referencias multimedia

^ Una de las primeras máquinas de vocoder [sic] (imagen en movimiento). do. 1939.Una demostración del voder (no del vocoder).
^ Siemens Electronic Music Studio en Deutsches Museum (varias partes) (Video). Detalles del Siemens Electronic Music Studio, expuesto en el Deutsches Museum .
^ Bruce Haack (1970). Electric to Me Turn - de "The Electric Lucifer" (Fonógrafo). Registros de Columbia. Una muestra del Vocoder anterior.
^ T-Pain (2005). Estoy Sprung (CD Single/Descargar). Registros Jive. (Una muestra del efecto Auto-Tune (también conocido como efecto T-Pain ).)
^ Síntesis de voz por computadora anterior (audio). Laboratorios Bell de AT&T. do. 1961.(Una muestra de síntesis de voz y síntesis de canciones anteriores basadas en computadora , realizadas por John Larry Kelly, Jr. y Louis Gerstman en Bell Labs , usando una computadora IBM 704. La canción de demostración " Daisy Bell ", musical acompañada por Max Mathews , impresionó a Arthur C. Clarke y más tarde lo utilizó en la escena culminante del guión de su novela 2001: Odisea en el espacio .)
^ TI Speak & Spell (vídeo). Instrumentos de Texas. do. 1980. (Una muestra de síntesis de voz .

Enlaces externos

Wikimedia Commons tiene medios relacionados con los codificadores de voz .

"Cómo funcionan los codificadores de voz". PAÍA. Archivado desde el original el 7 de septiembre de 2011.
Descripción, fotografías y diagrama del vocoder en 120years.net
Artículo de O'Reilly sobre codificadores de voz
Objeto de interés: The Vocoder Mini documental de The New Yorker Magazine