Pionero en la aplicación de redes neuronales recurrentes al reconocimiento de voz
Tony Robinson es un investigador en la aplicación de redes neuronales recurrentes al reconocimiento de voz , [1] [2] [3] siendo uno de los primeros en descubrir las capacidades prácticas de las redes neuronales profundas y su aplicación al reconocimiento de voz. [4]
Educación y carrera temprana
Robinson estudió ciencias naturales en la Universidad de Cambridge entre 1981 y 1984, donde se especializó en física. En 1985 completó un máster en procesamiento de lenguaje y voz por ordenador y en 1989 realizó un doctorado en la misma área, ambos en Cambridge. Publicó por primera vez sobre el tema del reconocimiento de voz durante su doctorado [5] y ha publicado más de cien artículos de investigación ampliamente citados sobre el reconocimiento automático de voz (ASR) en los años posteriores. [6]
Carrera emprendedora
En 1995, Robinson fundó SoftSound Ltd, una empresa de tecnología de voz que fue adquirida por Autonomy con el objetivo de utilizar la tecnología para facilitar la búsqueda de datos de voz y vídeo no estructurados. Robinson ayudó a construir el sistema de reconocimiento de voz de vocabulario amplio más rápido disponible en ese momento, que funcionaba en más idiomas que cualquier otro modelo, basado en redes neuronales recurrentes. [7]
De 2008 a 2010, Robinson fue director del Advanced Speech Group en SpinVox , un proveedor de servicios de conversión de voz a texto para los mercados de operadores, incluidos los de telefonía inalámbrica, VoIP y cable. Su sistema de reconocimiento automático de voz (ASR) se utilizó durante un tiempo más de un millón de veces al día y, posteriormente, SpinVox fue adquirido por la empresa global de tecnología de voz Nuance . [8]
Robinson también fue fundador de Speechmatics , que lanzó sus servicios de reconocimiento de voz basados en la nube en 2012. Speechmatics posteriormente anunció una nueva tecnología en modelado acelerado de nuevos idiomas a fines de 2017. [9] Robinson continúa publicando artículos en tecnología de reconocimiento de voz, especialmente en el área de modelado estadístico del lenguaje. [10]
Referencias
- ^ Robinson, Tony; Fallside, Frank (julio de 1991). "Un sistema de reconocimiento de voz en red de propagación de errores recurrentes". Lenguaje y habla por computadora . 5 (3): 259–274. doi :10.1016/0885-2308(91)90010-N.
- ^ Robinson, Tony (1996). "El uso de redes neuronales recurrentes en el reconocimiento continuo del habla". Reconocimiento automático del habla y del hablante . The Kluwer International Series in Engineering and Computer Science. Vol. 355. págs. 233–258. CiteSeerX 10.1.1.364.7237 . doi :10.1007/978-1-4613-1367-0_10. ISBN . 978-1-4612-8590-8.
- ^ Wakefield, Jane (14 de marzo de 2008). «El reconocimiento de voz se traslada al texto». BBC News . Consultado el 24 de agosto de 2020 .
- ^ Robinson, Tony (septiembre de 1993). "Un sistema de reconocimiento de voz continuo, de vocabulario amplio, independiente del hablante y basado en redes neuronales: el proyecto WERNICKE". Tercera Conferencia Europea sobre Comunicación y Tecnología del Habla . 1 : 1941–1944 . Consultado el 17 de mayo de 2018 .
- ^ Robinson, Anthony John (junio de 1989). "Redes de propagación de errores dinámicos". Tesis doctoral . Consultado el 17 de mayo de 2018 .
- ^ Robinson, Tony. «Tony Robinson - Perfil». ResearchGate . Consultado el 17 de mayo de 2018 .
- ^ Robinson, Tony; Hochberg, Mike; Renals, Steve (1996). "El uso de redes neuronales recurrentes en el reconocimiento continuo del habla". Reconocimiento automático del habla y del hablante . La serie internacional Kluwer en ingeniería y ciencias de la computación. Vol. 355. págs. 233–258. CiteSeerX 10.1.1.364.7237 . doi :10.1007/978-1-4613-1367-0_10. ISBN . 978-1-4612-8590-8.
- ^ "Nuance adquiere SpinVox". Innovación en el cuidado de la salud . 24 de junio de 2011. Consultado el 9 de septiembre de 2023 .
- ^ Orlowski, Andrew. "El pionero británico de las redes neuronales acaba de revolucionar el reconocimiento de voz de nuevo". The Register . Situation Publishing . Consultado el 17 de mayo de 2018 .
- ^ Chelba, Ciprian; Mikolov, Tomas; Schuster, Mike (2013). Punto de referencia de mil millones de palabras para medir el progreso en el modelado estadístico del lenguaje (informe). Biblioteca de la Universidad de Cornell. arXiv : 1312.3005 .