Mejora del habla

La mejora del habla tiene como objetivo mejorar la calidad del habla mediante el uso de diversos algoritmos. El objetivo de la mejora es mejorar la inteligibilidad y/o la calidad perceptiva general de la señal de habla degradada mediante técnicas de procesamiento de señales de audio .

La mejora del habla degradada por el ruido, o reducción de ruido, es el campo más importante de la mejora del habla y se utiliza para muchas aplicaciones, como teléfonos móviles , VoIP , sistemas de teleconferencia , reconocimiento de voz , diarización de hablantes y audífonos . ^[1]^[2]

Algoritmos

Los algoritmos de mejora del habla para la reducción de ruido se pueden clasificar en tres clases fundamentales: técnicas de filtrado, restauración espectral y métodos basados en modelos. ^[3]

Técnicas de filtrado

Método de sustracción espectral
Filtrado de Viena
Aproximación al subespacio de señales (SSA)

Restauración espectral

Estimador de amplitud espectral de tiempo corto con error cuadrático medio mínimo (MMSE-STSA)

Basado en modelos de habla

Véase también

Referencias

^ J. Benesty, S. Makino, J. Chen (ed.). Mejora del habla . págs.1-8. Springer, 2005. ISBN 978-3-540-24039-6 .
^ Sahidullah, Maryland; Patiño, José; Cornell, Samuele; Yin, Ruiking; Sivasankaran, Sunit; Bredin, Hervé; Korshunov, Pavel; Brutti, Alessio; Serizel, Romain; Vicente, Emmanuel; Evans, Nicolás; Marcel, Sebastián; Squartini, Stefano; Barras, Claude (6 de noviembre de 2019). "La presentación rápida a DIHARD II: contribuciones y lecciones aprendidas". arXiv : 1911.02388 [eess.AS].
^ J. Benesty, MM Sondhi, Y. Huang (ed). Springer Handbook of Speech Processing . págs. 843-869. Springer, 2007. ISBN 978-3-540-49125-5 .

J. Benesty, MM Sondhi, Y. Huang (ed). Springer Handbook of Speech Processing . Springer, 2007. ISBN 978-3-540-49125-5 .
J. Benesty, S. Makino, J. Chen (ed.). Mejora del habla . Springer, 2005. ISBN 978-3-540-24039-6 .
PC Loizou. Mejora del habla: teoría y práctica . CRC Press, 2013. ISBN 978-1-466-50421-9 .