stringtranslate.com

Xuedong Huang

Xuedong David Huang (nacido el 20 de octubre de 1962) es un científico informático y ejecutivo tecnológico chino-estadounidense que ha hecho contribuciones al procesamiento del lenguaje hablado y la inteligencia artificial , incluidos los servicios de inteligencia artificial de Azure. Es el director de tecnología de Zoom después de desempeñarse como miembro técnico de Microsoft y director de tecnología de inteligencia artificial de Azure durante 30 años. Huang es un firme defensor de la inteligencia artificial para la accesibilidad [1] y la inteligencia artificial para el patrimonio cultural [2] .

Educación

Huang recibió su doctorado de la Universidad de Edimburgo en 1989 (patrocinado por la ORS británica y la Beca de la Universidad de Edimburgo), su maestría de la Universidad de Tsinghua en 1984 y su licenciatura de la Universidad de Hunan en 1982.

Carrera

Después de recibir su doctorado en 1989, Huang se unió a la Universidad Carnegie Mellon y trabajó con Raj Reddy y Kai-Fu Lee en reconocimiento de voz . En CMU, dirigió la investigación del sistema de voz Sphinx-II que logró el mejor desempeño en cada categoría de la evaluación comparativa de DARPA de 1992. Microsoft Research lo reclutó para fundar y dirigir las iniciativas de lenguaje hablado de Microsoft en 1993. Su libro coautor Spoken Language Processing [3] y su revisión histórica del reconocimiento de voz [4] resumen sucintamente varias generaciones de investigación del lenguaje hablado. Como Mr. Speech de Microsoft durante tres décadas, Huang ha sido fundamental en la creación de la Interfaz de programación de aplicaciones de voz (SAPI) de Microsoft, el envío de Microsoft Speech Server y la modernización del lenguaje hablado y los servicios de inteligencia artificial integradores [5] [6] a través de Azure AI, [7] que no solo habilita a millones de clientes de terceros, sino que también potencia los servicios Windows , Office , Teams y Azure OpenAI de Microsoft.

Huang ayudó a Microsoft y Azure Cognitive Services a lograr varios de los primeros hitos de paridad humana de la industria en las siguientes tareas de investigación abierta: transcripción del habla conversacional, [8] traducción automática, [9] preguntas y respuestas conversacionales, [10] y subtitulado de imágenes con visión artificial. [11]

Huang ha hecho importantes contribuciones a la industria del software y la IA a través de su liderazgo ejecutivo y sus publicaciones científicas, siendo propietario de más de 170 patentes en EE. UU. e impactando a miles de millones a través de productos y servicios habilitados para Azure AI. En 2016, la revista Wired lo nombró uno de los 25 genios . [12] En 2021, Azure AI fue nombrado ganador del premio Tecnología del año de InfoWorld . [13]

Huang recibió la medalla de excelencia en investigación Allen Newell en 1992 y el premio al mejor artículo sobre procesamiento del habla del IEEE en 1993. Fue reconocido como miembro del IEEE por el Instituto de Ingenieros Eléctricos y Electrónicos en 2000, nombrado miembro de la ACM por la Asociación de Maquinaria Informática en 2017, [14] y miembro de la Academia de Ciencias del Estado de Washington . Huang recibió el Premio al Liderazgo Corporativo Asiático Americano 2022 y el Premio al Líder Industrial Amar Bose del IEEE. En 2023, fue elegido miembro de la Academia Nacional de Ingeniería de EE. UU. (NAE), [15] y miembro de la Academia Estadounidense de Artes y Ciencias . [16]

Referencias

  1. ^ "Azure AI para la accesibilidad". www.linkedin.com . Consultado el 9 de febrero de 2021 .
  2. ^ "Xuedong Huang en LinkedIn: Microsoft presenta el inuktitut en Microsoft Translator - Microsoft". www.linkedin.com . Consultado el 9 de febrero de 2021 .
  3. ^ Procesamiento del lenguaje hablado, Prentice Hall 2001 Xuedong Huang, Alex Acero y Hsiao-Wuen Hon
  4. ^ Una perspectiva histórica del reconocimiento de voz Xuedong Huang, James Baker, Raj Reddy. Communications of the ACM, enero de 2014, vol. 57, n.º 1, páginas 94-103.
  5. ^ Estudio sobre sesgo en la transcripción del habla de Stanford en 2020
  6. ^ XYZ-Code: una representación holística hacia la IA integradora, blog de IA de Microsoft
  7. ^ Servicios cognitivos de Azure AI
  8. ^ Logro histórico: los investigadores de Microsoft alcanzan la paridad humana en el reconocimiento de voz conversacional 18 de octubre de 2016 | Allison Linn
  9. ^ Microsoft alcanza un hito histórico al utilizar inteligencia artificial para igualar el desempeño humano en la traducción de noticias del chino al inglés 14 de marzo de 2018 | Allison Linn
  10. ^ Los sistemas de lectura automática se están volviendo más conversacionales Mayo de 2019
  11. ^ ¿ Qué es eso? El último avance de Microsoft, ahora en Azure AI, describe imágenes tan bien como lo hacen las personas 14 de octubre de 2020 | John Roach
  12. ^ 25 genios que están creando el futuro de los negocios 26.04.2016
  13. ^ Yegulalp, James R. Borck, Martin Heller, Steven Nuñez, Andrew C. Oliver, Ian Pointer, Isaac Sacolick y Serdar (3 de febrero de 2021). «Ganadores del premio Tecnología del año 2021 de InfoWorld». InfoWorld . Consultado el 8 de febrero de 2021 .{{cite web}}: CS1 maint: varios nombres: lista de autores ( enlace )
  14. ^ Gente de ACM - Xuedong Huang 25 de julio de 2017
  15. ^ La Academia Nacional de Ingeniería elige a 106 miembros y 18 miembros internacionales 7 de febrero de 2023
  16. ^ Nuevos miembros elegidos en 2023: Academia Estadounidense de Artes y Ciencias 19 de abril de 2023 Huang se unió a Zoom en junio de 2023 como CTO.