Codificación de voz

[cita requerida] Las técnicas empleadas en la codificación del habla son similares a las utilizadas en la compresión de datos de audio y la codificación de audio, donde el conocimiento en psicoacústica se utiliza para transmitir solo datos que son relevantes para el sistema auditivo humano.

En la codificación del habla, el criterio más importante es la preservación de la inteligibilidad y la "simpatía" del habla, con una cantidad limitada de datos transmitidos.

En 2008, el códec G.711.1, que tiene una estructura escalable, fue estandarizado por el UIT-T.

[[cita requerida]] Los algoritmos de codificación de voz más utilizados se basan en la codificación predictiva lineal (LPC).

En CELP, los coeficientes de predicción lineal (LPC) se calculan y cuantifican, generalmente como pares espectrales de línea (LSP).

[2]​ Desde entonces, MDCT ha sido ampliamente adoptado en aplicaciones de voz sobre IP (VoIP), como el códec de audio de banda ancha G.729.1 introducido en 2006,[3]​ Apple 's Facetime (usando AAC-LD) introducido en 2010,[4]​ y el códec CELT introducido en 2011.

[7]​[8]​[9]​ La consola de videojuegos PlayStation 4 también utiliza el códec CELT / Opus para el chat de fiesta del sistema PlayStation Network .

Comparación de AAC-LD, AAC-LC y MP3