Kaldi (software)

Kaldi es un kit de herramientas de reconocimiento de voz de código abierto escrito en C++ para reconocimiento de voz y procesamiento de señales , disponible gratuitamente bajo la licencia Apache v2.0.

Kaldi tiene como objetivo proporcionar un software que sea flexible y extensible, ^[2] y esté destinado a ser utilizado por investigadores de reconocimiento automático de voz (ASR) para construir un sistema de reconocimiento.

Admite transformaciones lineales, MMI , entrenamiento discriminativo MMI y MCE mejorado , entrenamiento discriminativo de espacio de características y redes neuronales profundas . ^[3]

Kaldi es capaz de generar características como mfcc , fbank , fMLLR , etc. Por lo tanto, en investigaciones recientes sobre redes neuronales profundas, un uso popular de Kaldi es preprocesar formas de onda sin procesar en características acústicas para modelos neuronales de extremo a extremo.

Kaldi se ha incorporado como parte del desafío de reconocimiento y separación de voz de CHiME en varios eventos sucesivos. ^[4]^[5]^[6] El software se desarrolló inicialmente como parte de un taller de 2009 en la Universidad Johns Hopkins . ^[7]

Kaldi debe su nombre al legendario pastor de cabras etíope Kaldi, de quien se dice que descubrió la planta del café . ^[8]

Véase también

Referencias

^ "Kaldi: cuestiones legales". kaldi-asr.org .
^ "Kaldi: Acerca del proyecto Kaldi". kaldi-asr.org .
^ "Kaldi: redes neuronales profundas en Kaldi". kaldi-asr.org .
^ "El 4º desafío de reconocimiento y separación de voz de CHiME". Archivado desde el original el 16 de febrero de 2017 . Consultado el 15 de febrero de 2017 .
^ "El tercer desafío de reconocimiento y separación de voz de CHiME" . Consultado el 15 de febrero de 2017 .
^ Emmanuel Vincent, Jon Barker, Shinji Watanabe, Jonathan Le Roux, Francesco Nesta, et al. El segundo desafío de separación y reconocimiento de voz 'CHiME': conjuntos de datos, tareas y líneas base. ICASSP - 38.ª Conferencia internacional sobre acústica, voz y procesamiento de señales - 2013, mayo de 2013, Vancouver, Canadá. pp.126-130, 2013.
^ "Historia del proyecto Kaldi" . Consultado el 26 de julio de 2017 .
^ "Kaldi: Acerca del proyecto Kaldi".

Enlaces externos

Sitio web oficial
Kaldi – El proyecto oficial de GitHub
Documento de Kaldi: El kit de herramientas de reconocimiento de voz de Kaldi
VOSK: modelos comerciales y de código abierto de Alpha Cephei sobre las bases de Kaldi