La mejora del habla tiene como objetivo mejorar la calidad del habla mediante el uso de diversos algoritmos. El objetivo de la mejora es mejorar la inteligibilidad y/o la calidad perceptiva general de la señal de habla degradada mediante técnicas de procesamiento de señales de audio .
La mejora del habla degradada por el ruido, o reducción de ruido, es el campo más importante de la mejora del habla y se utiliza para muchas aplicaciones, como teléfonos móviles , VoIP , sistemas de teleconferencia , reconocimiento de voz , diarización de hablantes y audífonos . [1] [2]
Algoritmos
Los algoritmos de mejora del habla para la reducción de ruido se pueden clasificar en tres clases fundamentales: técnicas de filtrado, restauración espectral y métodos basados en modelos. [3]
- Estimador de amplitud espectral de tiempo corto con error cuadrático medio mínimo (MMSE-STSA)
- Basado en modelos de habla
Véase también
Referencias
- ^ J. Benesty, S. Makino, J. Chen (ed.). Mejora del habla . págs.1-8. Springer, 2005. ISBN 978-3-540-24039-6 .
- ^ Sahidullah, Maryland; Patiño, José; Cornell, Samuele; Yin, Ruiking; Sivasankaran, Sunit; Bredin, Hervé; Korshunov, Pavel; Brutti, Alessio; Serizel, Romain; Vicente, Emmanuel; Evans, Nicolás; Marcel, Sebastián; Squartini, Stefano; Barras, Claude (6 de noviembre de 2019). "La presentación rápida a DIHARD II: contribuciones y lecciones aprendidas". arXiv : 1911.02388 [eess.AS].
- ^ J. Benesty, MM Sondhi, Y. Huang (ed). Springer Handbook of Speech Processing . págs. 843-869. Springer, 2007. ISBN 978-3-540-49125-5 .