stringtranslate.com

Thomas Huang

Thomas Shi-Tao Huang ( chino tradicional :黃煦濤; chino simplificado :黄煦涛; pinyin : Huáng Xùtāo ; 26 de junio de 1936 - 25 de abril de 2020) fue un informático, ingeniero eléctrico y escritor estadounidense nacido en China. Fue investigador y profesor emérito de la Universidad de Illinois en Urbana-Champaign (UIUC). Huang fue una de las figuras principales en visión artificial , reconocimiento de patrones e interacción hombre-máquina . [1]

Vida temprana y educación

Huang nació el 26 de junio de 1936 en Shanghái , República de China. [2] En 1949, su familia se mudó a Taiwán . Huang estudió electrónica en la Universidad Nacional de Taiwán y recibió su licenciatura en 1956. [3]

Huang viajó a Estados Unidos para estudiar en el Instituto Tecnológico de Massachusetts (MIT). En el MIT trabajó inicialmente con Peter Elias , que estaba interesado en la teoría de la información y la codificación de imágenes, y luego con William F. Schreiber . En ese momento, los equipos de escaneo no estaban disponibles comercialmente, por lo que fue necesario construir un escáner para digitalizar y reproducir imágenes. Los programas de computadora se escribieron en lenguaje ensamblador utilizando un prototipo de computadora Lincoln Lab TX-0 . Las descripciones de las imágenes digitalizadas se almacenaron en cinta de papel con agujeros perforados . [3] Huang fue supervisado por Schreiber tanto para su tesis de maestría, Estadísticas de imágenes y codificación interpolativa lineal (1960), [4] y su tesis de doctorado, Ruido pictórico (1963). [5] Su trabajo de maestría se centró en algoritmos para la codificación de imágenes utilizando técnicas adaptativas para la interpolación con sensibilidad a los bordes. Su doctorado incluyó trabajo sobre los efectos subjetivos del ruido pictórico a lo largo de un espectro. [3]

Carrera

Huang aceptó un puesto en la facultad del Departamento de Ingeniería Eléctrica del MIT, y permaneció allí desde 1963 hasta 1973. [3] Aceptó un puesto como profesor de ingeniería eléctrica y director del Laboratorio de Procesamiento de Información y Señales en la Universidad de Purdue en 1973, permaneciendo allí hasta 1980. [3]

En 1980 Huang aceptó una cátedra de ingeniería eléctrica en la Universidad de Illinois en Urbana-Champaign (UIUC). [3] El 15 de abril de 1996, Huang se convirtió en el primer profesor distinguido William L. Everitt en ingeniería eléctrica e informática en la UIUC. [6] Estuvo involucrado con el Laboratorio de Ciencias Coordinadas (CSL), y se desempeñó como jefe del Grupo de Formación y Procesamiento de Imágenes del Instituto Beckman para la Ciencia y la Tecnología Avanzadas y copresidente del área de investigación del Instituto Beckman sobre Interacción Inteligente Hombre-Computadora. [7] [8] A partir de 2012, fue nombrado presidente de la Cátedra Swanlund, el título más alto dotado en la UIUC. [9] [10] Huang se retiró de la docencia en diciembre de 2014, pero continuó activo como investigador. [11]

Huang fue editor fundador de la Revista Internacional de Visión por Computadora, Gráficos y Procesamiento de Imágenes y de la Serie Springer en Ciencias de la Información de Springer-Verlag . Ayudó a organizar el primer Simposio Internacional de Codificación de Imágenes (1969), el primer Taller Internacional sobre Codificación de Vídeo de Muy Baja Velocidad de Bits (1993) y la primera Conferencia Internacional sobre Reconocimiento Automático de Rostros y Gestos (1995), todos los cuales se convirtieron en eventos repetidos. [7]

Investigación

La investigación de Huang tendió a centrarse en el desarrollo de conceptos generales, metodologías, teorías y algoritmos que tienen una amplia aplicación en el procesamiento de señales multimodales y multimedia. [3] Mientras todavía estaba en el MIT, desarrolló el primer procedimiento algebraico para probar las condiciones de estabilidad de filtros bidimensionales , basado en la transformación bilineal doble y el método de Ansell. [12] También publicó sobre holografía digital . [13] Mientras estaba en Purdue, trabajó en filtros no lineales , particularmente filtros medianos , que se convirtieron en una técnica estándar para la eliminación de ruido en imágenes. [14]

Algunos de sus primeros trabajos se ocuparon de la compresión de imágenes , extendiéndose más tarde a áreas de mejora, restauración y análisis. Desarrolló enfoques para la compresión binaria de documentos que utilizaban información escaneada bidimensional, examinando los cambios de una línea de un escaneo a la siguiente y detectando puntos de transición en los que difiere una línea posterior. Las predicciones estadísticas y los resultados experimentales del rendimiento del modelo se ajustaron bien. [3] En 1969, Huang y Grant Anderson fueron uno de los primeros equipos en proponer un método para la codificación de transformación de bloques , [15] basándose en el trabajo de JJY Huang y Peter M. Schultheiss. [16] [17]

En 1984, Tsai y Huang fueron los primeros en presentar un método multi-cuadro de dominio de frecuencia que relacionaba la transformada de Fourier discreta de imágenes satelitales de baja resolución observadas desde la etapa de adquisición con la transformada de Fourier continua de la imagen de alta resolución, utilizando la transformada de Fourier inversa para obtener una imagen final con mayor resolución. [18] [19] Huang también trabajó en métodos wavelet de codificación y en codificación fractal . La codificación wavelet es particularmente importante para la recuperación de imágenes basada en contenido de bases de datos multimedia que contienen imágenes, video, audio y texto. Permite realizar búsquedas en imágenes codificadas más pequeñas en lugar de imágenes recuperadas de tamaño completo. [3] Otras áreas de investigación de importancia incluyen el uso de retroalimentación de relevancia para adaptar los sistemas de bases de datos a las intenciones del usuario (al navegar o buscar), [20] y construir tablas de contenido e índices semánticos para video usando información multimedia (secuencia de imágenes, audio y subtítulos si están disponibles). [21]

En el área de modelado 3D, Huang trabajó en la identificación del movimiento tridimensional y la estructura de objetos rígidos dadas múltiples imágenes en las que se pueden identificar características correspondientes. [22] Este trabajo fue importante para la compresión de imágenes de televisión, para el desarrollo de estándares de imagen y para la investigación en visión humana y por computadora. [3] Huang también trabajó en el modelado 3D, análisis y síntesis de imágenes del rostro, las manos y el cuerpo humano. La motivación inicial detrás de esta investigación fue dar soporte a la codificación de video basada en modelos 3D de baja tasa de bits para videoconferencias y teleconferencias. La idea era que si un modelo 3D del usuario podía transmitirse y reconstruirse en el extremo receptor, sería suficiente extraer y enviar información de movimiento para controlar el modelo 3D y regenerar la secuencia de video. Las herramientas desarrolladas para este tipo de escenarios también son aplicables a muchos otros problemas, incluidas las conferencias en espacios virtuales con avatares y los juegos electrónicos. [23]

Huang consideró que el procesamiento de imágenes y de voz eran fundamentalmente similares [3] y trabajó con reconocimiento de voz y procesamiento de sonido, además de imágenes. Huang, Mark Hasegawa-Johnson y sus estudiantes crearon una base de datos de voz grabada en automóviles que se puede utilizar como punto de referencia para probar algoritmos de reconocimiento de voz audiovisual [24] . También desarrollaron métodos para detectar elementos de audio que probablemente atraigan la atención humana y los están utilizando para permitir que los humanos revisen de manera más efectiva grandes cantidades de grabaciones de audio para encontrar información importante [25] .

Huang realizó un trabajo importante en la interacción hombre-computadora multimodal y el diseño de interfaces. [26] Fue uno de los primeros investigadores en combinar técnicas basadas en audio y video para la identificación de estados afectivos humanos. [27] Un trabajo más reciente de Huang y otros intenta "desarrollar una serie de algoritmos para extraer información de la multimodalidad de una manera óptima", [28] examinando grandes cantidades de datos de múltiples fuentes y optimizando los tipos y cantidades de datos que se comprimen y transmiten. Esta investigación de detección oportunista tiene aplicaciones tanto en el uso militar como civil. [28] [29]

Huang también esperaba desarrollar formas más naturales y efectivas para que los humanos interactúen con una computadora o un entorno virtual usando el habla y los gestos. [3] Los proyectos de investigación incluyen el seguimiento visual de las manos y el reconocimiento de gestos ; [30] el uso de la lectura visual de los labios para mejorar la precisión del reconocimiento de voz en audio; y la integración del reconocimiento de voz y el análisis visual de gestos en el control de pantallas en entornos virtuales. [23]

También trabajó en el reconocimiento audiovisual de género, grupo de edad y emociones. Su trabajo en la detección de género y emociones recibió atención de los medios cuando su software se utilizó para examinar la Mona Lisa , concluyendo que el retrato era de una mujer (no, como algunos habían teorizado, basado en el propio Da Vinci ) y que su enigmática sonrisa era más feliz que triste. [31] [32]

En 2015, Huang trabajó con Ann Willemsen-Dunlap en un proyecto interdisciplinario para desarrollar un avatar tridimensional generado por computadora, capaz de mostrar emociones apropiadas, para ser utilizado en la comunicación en línea de información médica a los pacientes. [33]

También exploró el uso de computación de alto rendimiento y big data para desarrollar mejores técnicas de aprendizaje profundo . [11] Una de las tareas que se están estudiando, como era de esperar, es el reconocimiento facial. En otro proyecto, su equipo está trabajando con el astrónomo Robert Brunner para entrenar una red neuronal de propagación hacia adelante para identificar imágenes de galaxias . [34]

Trabajo publicado

En 2010, Huang había publicado más de 21 libros y había sido autor de más de 600 artículos. [35] Las publicaciones representativas de Thomas Huang incluyen:

Vida personal

Huang se casó con Margaret, que falleció tres meses antes que él. Se casaron en 1959. [36]

Huang murió pacíficamente en Indiana el 25 de abril de 2020, a la edad de 83 años. [37]

La pareja tuvo cuatro hijos: Caroline, Greg, Tom y Marjorie. [36]

Honores

Huang recibió numerosos honores y premios en su carrera, entre ellos: [38]

Membresías

Premios

Premios nombrados

Huang supervisó a más de 100 estudiantes de posgrado. En 2012, se creó el Fondo Thomas y Margaret Huang para la Investigación de Posgrado en respuesta a las solicitudes de los ex alumnos James J. Kuch y Chang Wen Chen, para celebrar las contribuciones de Huang y su esposa como mentores y profesores, así como sus contribuciones como investigador. El fondo proporcionará becas para apoyar a los estudiantes en Interacción Inteligente Hombre-Computadora en el Instituto Beckman. [50] [51]

Referencias

  1. ^ Bovik, Alan C.; Chen, Chang Wen; Goldgof, Dmitry (2002). Bovik, Alan C.; Chen, Chang Wen; Goldgof, Dmitry (eds.). Avances en el procesamiento y la comprensión de imágenes: un homenaje a Thomas S. Huang . Serie sobre percepción de máquinas e inteligencia artificial. Vol. 52. Singapur: World Scientific. doi :10.1142/5042. ISBN. 978-981-238-091-3.
  2. ^ Informes del Presidente y del Tesorero . Fundación Memorial John Simon Guggenheim. 1971. pág. 56.
  3. ^ abcdefghijkl Goldstein, Andrew (20 de marzo de 1997). "THOMAS HUANG: una entrevista realizada por Andrew Goldstein (Entrevista n.° 331 para el Centro de Historia de la Ingeniería Eléctrica)". Centro de Historia de la Ingeniería Eléctrica . Hoboken, Nueva Jersey: Instituto de Ingenieros Eléctricos y Electrónicos, Inc. . Consultado el 22 de julio de 2015 .
  4. ^ Huang, Thomas Shi-Tao (1960). Estadística de imágenes y codificación interpolativa lineal (edición de tesis de maestría). Cambridge, Massachusetts: Instituto Tecnológico de Massachusetts, Departamento de Ingeniería Eléctrica.
  5. ^ Huang, Thomas Shi-Tao (1963). Ruido pictórico (edición de tesis de doctorado). Cambridge, Massachusetts: Instituto Tecnológico de Massachusetts, Departamento de Ingeniería Eléctrica.
  6. ^ "Cátedra: Profesor William L. Everitt de Ingeniería Eléctrica". ECE Illinois . Universidad de Illinois. 1996 . Consultado el 23 de julio de 2015 .
  7. ^ ab Xiong, Ziyou; Radhakrishnan, Regunathan; Divakaran, Ajay; Rui, Yong; Huang, Thomas S. (2006). "Acerca de los autores". Un marco unificado para el resumen, la exploración y la recuperación de vídeos con aplicaciones para vídeos de consumo y de vigilancia . Ámsterdam: Elsevier/Academic Press. págs. 263–264. ISBN 978-0-12-369387-7.
  8. ^ "Directorio del Instituto Beckman: Thomas S. Huang". Instituto Beckman de Ciencia y Tecnología Avanzada . Consultado el 28 de mayo de 2010 .
  9. ^ "Cinco profesores nombrados titulares de la Cátedra Swanlund". The News-Gazette . 2012-12-05 . Consultado el 23 de julio de 2015 .
  10. ^ "Presidente: Presidente Swanlund". ECE Illinois . Consultado el 23 de julio de 2015 .
  11. ^ ab Valentine, Ashish (5 de diciembre de 2014). "Loui, Huang y Polychronopoulos se retiran de la docencia en ECE Illinois". ECE Illinois . Consultado el 27 de julio de 2015 .
  12. ^ Huang, T. (junio de 1972). "Estabilidad de filtros recursivos bidimensionales". IEEE Transactions on Audio and Electroacoustics . 20 (2): 158–163. doi :10.1109/TAU.1972.1162364.
  13. ^ Huang, TS (1971). "Holografía digital". Actas del IEEE . 59 (9): 1335–1346. doi :10.1109/PROC.1971.8408.
  14. ^ Huang, T.; Yang, G.; Tang, G. (1979). "Un algoritmo rápido de filtrado de mediana bidimensional". IEEE Transactions on Acoustics, Speech, and Signal Processing . 27 (1): 13–18. doi :10.1109/tassp.1979.1163188.
  15. ^ Anderson, Grant; Huang, Thomas S. (1971). "Picture widthwide compression by piecewise Fourier transform" (Compresión del ancho de banda de la imagen mediante la transformación de Fourier por partes). IEEE Transactions on Communications . 19 (2): 133–140. doi :10.1109/tcom.1971.1090630. Una versión anterior de este artículo apareció en las actas del Simposio del Centenario de la Universidad de Purdue sobre Sistemas y Ciencias de la Información, celebrado del 28 al 30 de abril de 1969.
  16. ^ Huang, JJY; Schultheiss, Peter M. (1963). "Cuantización en bloque de variables aleatorias gaussianas correlacionadas". IEEE Transactions on Communications Systems . 11 (3): 289–296. doi :10.1109/tcom.1963.1088759.
  17. ^ Nebeker, Frederik (1998). "Going Digital: The 1960s" (PDF) . Procesamiento de señales: el surgimiento de una disciplina, 1948-1998 . Piscataway, NJ: IEEE Press. pp. 55–87. Archivado desde el original (PDF) el 25 de julio de 2015. Consultado el 24 de julio de 2015 .
  18. ^ Tsai, R.; Huang, T. (1984). "Restauración y registro de imágenes multifotograma". Avances en visión artificial y procesamiento de imágenes . JAI Press Inc., págs. 317–339.
  19. ^ Técnicas avanzadas de mejora de la resolución de imágenes y vídeos, Quang H. Luong
  20. ^ Zhou, Xiang Sean; Huang, Thomas S. (1 de abril de 2003). "Retroalimentación de relevancia en la recuperación de imágenes: una revisión exhaustiva". Multimedia Systems . 8 (6): 536–544. CiteSeerX 10.1.1.89.8025 . doi :10.1007/s00530-002-0070-3. S2CID  9664339. 
  21. ^ Xiong, Ziyou; Radhakrishnan, Regunathan; Divakaran, Ajay; Rui, Yong; Huang, Thomas S. (2006). Un marco unificado para el resumen, la exploración y la recuperación de vídeos con aplicaciones para vídeos de consumo y de vigilancia . Ámsterdam: Elsevier/Academic Press. ISBN 978-0-12-369387-7.
  22. ^ Huang, TS; Netravali, AN (2002). "Movimiento y estructura a partir de correspondencias de características: una revisión". Actas del IEEE . 82 (2): 252–268. doi :10.1109/5.265351.
  23. ^ ab Wen, Zhen; Huang, Thomas S. (2004). Procesamiento de rostros en 3D: modelado, análisis y síntesis. Boston: Kluwer Academic Publishers. ISBN 978-1402080470.
  24. ^ Lee, B.; Hasegawa-Johnson, M.; Goudeseune, C.; Kamdar, S.; Borys, S.; Liu, M.; Huang, TS (2004). AVICAR: corpus de habla audiovisual en un entorno automovilístico. INTERSPEECH: ISCA.
  25. ^ Dickinson, Meg. "Estudios para determinar qué sonidos llaman la atención y cómo localizarlos". ECE Illinois . N.º 17 de febrero de 2014. Consultado el 27 de julio de 2015 .
  26. ^ Sharma, R.; Pavlovic, VI; Huang, TS (mayo de 1998). "Hacia una interfaz hombre-computadora multimodal". Actas del IEEE . 86 (5): 853–869. doi :10.1109/5.664275.
  27. ^ Huang, Thomas S.; Chen, Lawrence S.; Tao, Hai (abril de 1998). "Reconocimiento bimodal de emociones por parte del hombre y la máquina". Actas del taller ATR sobre entornos de comunicación virtual .
  28. ^ ab Kelly, Megan (14 de diciembre de 2009). "Los profesores de ECE reciben una subvención del Departamento de Defensa de 1,5 millones de dólares para estudiar la detección oportunista". ECE Illinois . Consultado el 27 de julio de 2015 .
  29. ^ Dahlquist, April (8 de agosto de 2011). «Matemáticas versus vida salvaje: los investigadores utilizan la visión artificial para identificar la vida salvaje». ECE Illinois . Consultado el 27 de julio de 2015 .
  30. ^ Pavlovic, VI; Sharma, R.; Huang, TS (julio de 1997). "Interpretación visual de gestos manuales para la interacción hombre-ordenador: una revisión". IEEE Transactions on Pattern Analysis and Machine Intelligence . 19 (7): 677–695. CiteSeerX 10.1.1.353.4090 . doi :10.1109/34.598226. S2CID  7185733. 
  31. ^ Kline, Greg (6 de marzo de 2006). «El software demuestra que Mona Lisa no es ni un hombre ni Da Vinci». The News-Gazette . Consultado el 27 de julio de 2015 .
  32. ^ Instituto Beckman de la Universidad de Illinois (2005). "Perfil de investigación: Thomas Huang" (PDF) . Informe anual 2005-06 . Universidad de Illinois en Urbana-Champaign. págs. 18-19.
  33. ^ "Jump ARCHES financia el proyecto de avatar en 3D de Huang". CSL: Coordinated Science Lab, ECE Illinois. 24 de febrero de 2015. Consultado el 23 de julio de 2015 .
  34. ^ Koon, Mike (11 de noviembre de 2014). "Supercomputing Speeds Advances in Deep Neural Networks". Oficina de Comunicaciones de Ingeniería, Illinois . Consultado el 27 de julio de 2015 .
  35. ^ ab "Huang gana el premio al artículo más citado de la década". Beckman Institute . 30 de junio de 2010.
  36. ^ ab "Perdí a mis padres en la era del COVID-19. ¿Cómo puedo reabrir mi propia vida?" - Boston Globe , 14 de mayo de 2020
  37. ^ Comunicaciones, Oficina de Marketing y Ingeniería de Grainger. "Recordando a Thomas Huang, titular de la cátedra emérita Maybelle Leland Swanlund en Ingeniería eléctrica e informática". ece.illinois.edu . Consultado el 14 de junio de 2021 .
  38. ^ "Thomas S. Huang". ECE Illinois, Departamento de Ingeniería Eléctrica y Computacional. Archivado desde el original el 6 de octubre de 2011. Consultado el 28 de mayo de 2010 .
  39. ^ "Thomas S. Huang". Academia Sinica . Consultado el 16 de septiembre de 2023 .
  40. ^ "Directorio de miembros extranjeros de la CAS en 2009 (por apellido)". Academia China de Ciencias . Consultado el 23 de julio de 2015 .
  41. ^ "La Academia Nacional de Ingeniería elige a 74 miembros y ocho asociados extranjeros". Noticias de la Academia Nacional de Ingeniería . 16 de febrero de 2001. Consultado el 23 de julio de 2015 .
  42. ^ "Dr. Thomas S. Huang". Academia Nacional de Ingeniería . Consultado el 23 de julio de 2015 .
  43. ^ "Becarios IEEE 1979 | Sociedad de Comunicaciones IEEE".
  44. ^ Gudeman, Kim (16 de junio de 2009). «Tres investigadores del CSL ganan los premios de investigación de innovación de HP Labs». CSL: Coordinated Science Laboratory . Consultado el 23 de julio de 2015 .
  45. ^ "Huang nombrado científico del año por la EI". Beckman Institute . 3 de febrero de 2006. Consultado el 23 de julio de 2015 .
  46. ^ "El Premio Okawa". Fundación Okawa para la Información y las Telecomunicaciones . Consultado el 23 de julio de 2015 .
  47. ^ "Premios IAPR: El premio King-Sun Fu". Asociación Internacional de Reconocimiento de Patrones (IAPR) . Consultado el 23 de julio de 2015 .
  48. ^ "Ganadores de la Medalla de Procesamiento de Señales Jack S. Kilby del IEEE" (PDF) . IEEE . Archivado desde el original (PDF) el 19 de junio de 2010 . Consultado el 27 de febrero de 2011 .
  49. ^ "Ganadores de la Medalla de Procesamiento de Señales Jack S. Kilby del IEEE – 2001 – Thomas S. Huang y Arun N. Netravali". IEEE . Archivado desde el original el 8 de abril de 2010 . Consultado el 27 de febrero de 2011 .
  50. ^ McGaughey, Steve (8 de enero de 2012). "Huang Fund and Challenge son tributos a un Beckman original". Beckman Institute .
  51. ^ "Fondo Thomas y Margaret Huang para la investigación de posgrado". Beckman Institute . Consultado el 23 de julio de 2015 .