stringtranslate.com

Alex Waibel

Alexander Waibel (nacido el 2 de mayo de 1956 en Heidelberg , Alemania) es profesor de Ciencias de la Computación en la Universidad Carnegie Mellon [1] y el Instituto de Tecnología de Karlsruhe (KIT). [2] La investigación de Waibel se centra en el reconocimiento automático de voz , la traducción y la interacción hombre-máquina . Su trabajo ha introducido sistemas de comunicación interlingüística, como sistemas de interpretación consecutiva y simultánea en una variedad de plataformas. [3] En la investigación fundamental sobre aprendizaje automático, es conocido por la Red Neuronal de Retardo de Tiempo (TDNN), [4] la primera Red Neuronal Convolucional (CNN) entrenada por descenso de gradiente , utilizando retropropagación . Alex Waibel introdujo la TDNN en 1987 en ATR [5] en Japón. [6]

Vida temprana y educación

Alex Waibel pasó parte de su educación en Barcelona, ​​antes de ingresar en el Humanistisches Gymnasium de Ludwigshafen. De 1976 a 1979, estudió Ingeniería Eléctrica y Ciencias de la Computación en el Instituto Tecnológico de Massachusetts . En 1979, recibió el Premio Guillamin a la mejor tesis de licenciatura. Ese mismo año, ingresó en la Universidad Carnegie Mellon , donde recibió un título de maestría en 1980 y un doctorado en ciencias de la computación y ciencias cognitivas en 1986 .

Carrera académica e investigación

Waibel es el director de interACT, [7] el Centro Internacional para Tecnologías Avanzadas de Comunicación en el Instituto de Tecnología de Karlsruhe. Fue uno de los fundadores de C-STAR, [8] un consorcio internacional para la investigación de la traducción del habla, y se desempeñó como su presidente de 1998 a 2000. En 2003, C-STAR se convirtió en IWSLT, la Conferencia Internacional sobre Traducción de Lenguas Habladas. Waibel ha sido presidente de su Comité Directivo desde su inicio [1]. Dirigió y coordinó varios programas de investigación multisitio en Europa y los EE. UU., incluido el programa CHIL [9] (Proyecto Integrado FP-6 sobre multimodalidad) en Europa y el proyecto NSF-ITR STR-DUST (el primer proyecto de traducción del habla independiente del dominio) en los EE. UU. Fue coordinador del proyecto IP EU-BRIDGE, [10] financiado por la CE (2012-2014).

En C-STAR, su equipo desarrolló el sistema de traducción de voz JANUS , el primer sistema de traducción de voz estadounidense y europeo, y en 2005, el primer sistema de traducción de voz simultánea en tiempo real para conferencias. Desarrolló con su laboratorio varios sistemas multimodales, entre ellos, seguimiento de rostros, lectura de labios, reconocimiento de emociones a partir del habla, salas de reuniones perceptivas, reconocedores de reuniones, navegadores de reuniones y sistemas de diálogo multimodal para robots humanoides.

Demostró los primeros servicios de interpretación automática en el Parlamento Europeo en 2012. [11]

De 2019 a 2023, dirigió OML (Organic Machine Learning) financiado por el Ministerio Federal de Educación e Investigación (Alemania), un proyecto de investigación fundamental para desarrollar el aprendizaje automático incremental e interactivo, con el objetivo de ayudar a la IA a gestionar mejor la sorpresa en el lenguaje y la robótica.

Emprendimiento

En las áreas de voz, traducción de voz e interfaces multimodales , Waibel posee varias patentes [12] y ha fundado y cofundado empresas comerciales exitosas. Fue el fundador y presidente de Mobile Technologies, LLC, creadora de la aplicación móvil Jibbigo de conversión de voz a voz para traducir el habla en un teléfono.

En 2005, Waibel presentó el primer servicio de traducción simultánea automática del mundo en una conferencia de prensa en la Universidad Carnegie Mellon [13], afirmando que "el traductor de conferencias graba, transcribe y traduce automáticamente el discurso de un conferenciante en tiempo real, y los estudiantes pueden seguir la conferencia en su idioma en su PC o teléfono móvil". [14] Implementado en 2012, [15] sirve a estudiantes extranjeros [16] como el servicio pionero de su tipo.

En 2013, Jibbigo fue adquirida por Facebook Inc. y Waibel se unió a la empresa para iniciar el Language Technology Group, que se convirtió en parte de los esfuerzos más amplios de aprendizaje automático aplicado de Facebook. [17] Fue cofundador y director de MultiModal Technologies, Inc. [18] y M*Modal, especializada en registros médicos, que se fusionó con 3M en 2019. [19]

En 2015, cofundó KITES GmbH para ofrecer servicios de traducción simultánea de voz a universidades y al Parlamento Europeo. KITES fue adquirida por Zoom en 2021[2] y ahora ofrece subtítulos automáticos y traducción simultánea durante las videoconferencias de Zoom. Waibel trabaja como investigador asociado en Zoom y en consejos asesores de empresas relacionadas.

En octubre de 2018, Waibel cerró con éxito un caso legal [20] contra la Fundación Wikimedia [21] citando las leyes alemanas sobre difamación. [22]

Premios y honores

Alex Waibel recibió el premio IEEE Senior Best Paper Award por su trabajo en TDNN (1990). En 1994 recibió el premio Alcatel-SEL "Forschungspreis Technische Kommunikation" por su trabajo en sistemas de traducción de voz por computadora. En 2002, recibió el premio Allen Newell a la excelencia en investigación y el premio Meta en 2011 con Jibbigo Mobile Translators por sus excelentes traductores de voz móviles que llevan la traducción de voz a dispositivos móviles. En 2014, recibió el premio Antonio Zampolli por "contribuciones sobresalientes al avance de los recursos lingüísticos y la evaluación de la tecnología del lenguaje dentro de la tecnología del lenguaje humano", LREC . [23] Con InterACT , recibió un segundo premio Meta por "Contribuciones sobresalientes e innovadoras a las tecnologías de comunicación multilingüe y translingüística" (2016). Recibió el premio Sustained Accomplishment Award de la ACM-ICMI por su trabajo en interfaces multimodales (2019). [24] En 2023, se convirtió en el 21.º homenajeado en recibir el premio IEEE James L. Flanagan Speech and Audio Processing Award por su "trabajo pionero en traducción de voz y tecnologías de apoyo". [25]

Waibel ha sido miembro vitalicio del IEEE , miembro de la International Speech Communication Association (ISCA) y miembro de la Academia Nacional de Ciencias de Alemania, Leopoldina [26] desde 2017. En 2023, Waibel fue incluido como miembro del Explorers Club citando expediciones de aviación y exploración de aguas profundas. [27]

Referencias

  1. ^ "Biografía de Alex Waibel". www.cs.cmu.edu . Consultado el 29 de junio de 2024 .
  2. ^ "KIT". KIT . Consultado el 22 de abril de 2024 .
  3. ^ "Sprachbarrieren durchbrechen: ¿Traum oder Wirklichkeit?" (PDF) . Leopoldina . 2015.
  4. ^ "Reconocimiento de fonemas mediante redes neuronales con retardo temporal". Université de Toronto . Marzo de 1989 . Consultado el 29 de junio de 2024 .
  5. ^ "Reconocimiento de fonemas mediante redes neuronales con retardo temporal" (PDF) . 30 de octubre de 1987. Consultado el 29 de junio de 2024 .
  6. ^ Waibel, Alex (diciembre de 1987). "Reconocimiento de fonemas mediante redes neuronales con retardo temporal SP87" (PDF) . ATR .
  7. ^ "InterACT". interact.kit.edu . 30 de septiembre de 2016 . Consultado el 7 de julio de 2024 .
  8. ^ (inaktiv), Schweizer, Dorothea (28 de agosto de 2012). "EQUIPO - C-STAR". isl.anthropomatik.kit.edu .{{cite web}}: CS1 maint: varios nombres: lista de autores ( enlace )
  9. ^ CHIL - Computadoras en el circuito de interacción humana. doi :10.1007/978-1-84882-054-8_1. ISBN 978-1-84882-054-8. Consultado el 23 de abril de 2024 .
  10. ^ Daroussi, Younes. "EU-BRIDGE". www.eu-bridge.eu .
  11. ^ 2012: Alex Waibel presentando la conferencia Translator en el Parlamento Europeo (inglés) . Consultado el 25 de abril de 2024 en www.youtube.com.
  12. ^ "Invenciones, patentes y solicitudes de patentes de Alex Waibel - Búsqueda de patentes de Justia". patents.justia.com .
  13. ^ "Demostración de avances en comunicación interlingüística y traducción de voz a voz". The Interactive Systems Lab . Marzo de 2021 . Consultado el 27 de junio de 2024 .
  14. ^ Waibel, Alex (2012). "Interpretación simultánea por máquinas - Simultanübersetzung durch Maschinen - el primer servicio de traducción simultánea automática del mundo en una universidad". YouTube . Consultado el 26 de marzo de 2019 .
  15. ^ Patente de Estados Unidos
  16. ^ "Simultanübersetzung durch Maschinen". YouTube . 12 de junio de 2012.
  17. ^ "Facebook adquirirá Mobile Technologies, con sede en Pittsburgh | TribLIVE.com". archive.triblive.com .
  18. ^ "MultiModal Technologies Inc - Perfil de la empresa y noticias". Bloomberg.com . Consultado el 28 de abril de 2024 .
  19. ^ "3M completa la adquisición del negocio tecnológico de M*Modal". Centro de noticias de 3M . Consultado el 28 de abril de 2024 .
  20. ^ "Urteil im Fall Waibel" (PDF) . Fundación Wikimedia . 12 de septiembre de 2018.
  21. ^ "Raue LLP tuvo éxito contra Wikipedia". 31 de octubre de 2018.
  22. ^ "Un tribunal alemán nos obligó a eliminar parte del 'historial' de un artículo de Wikipedia. Esto es lo que eso significa". Wikimedia Foundation . 11 de abril de 2019.
  23. ^ "Y el ganador es..." lrec2014.lrec-conf.org .
  24. ^ "Premios ICMI 2019". icmi.acm.org .
  25. ^ "Ganadores del premio IEEE James L. Flanagan de procesamiento de voz y audio" (PDF) . IEEE .
  26. ^ "Lista de Miembros". www.leopoldina.org .
  27. ^ "Waibel nombrado miembro del Explorers Club". Facultad de Informática Carnegie Mellon . Consultado el 20 de enero de 2024 .