Fumitada Itakura

Fumitada Itakura (板倉文忠, Itakura Fumitada , nacido el 6 de agosto de 1940) es un científico japonés . Realizó trabajos pioneros en el procesamiento estadístico de señales y su aplicación al análisis , síntesis y codificación del habla , incluido el desarrollo de los métodos de codificación predictiva lineal (LPC) y pares espectrales de líneas (LSP).

Biografía

Itakura nació en Toyokawa , Prefectura de Aichi , Japón . Recibió sus títulos de grado y posgrado de la Universidad de Nagoya en 1963 y 1965, respectivamente. ^[1] En 1966, mientras estudiaba su doctorado en Nagoya, desarrolló los primeros conceptos de lo que luego se conocería como codificación predictiva lineal (LPC), junto con Shuzo Saito de Nippon Telegraph and Telephone (NTT). Describieron un enfoque para la discriminación automática de fonemas que involucraba el primer enfoque de máxima verosimilitud para la codificación del habla . ^[2] En 1968, se unió al Laboratorio de Comunicación Eléctrica NTT Musashino en Tokio . ^[1] El mismo año, Itakura y Saito presentaron el algoritmo de distancia Itakura-Saito . ^[3] Al año siguiente, Itakura y Saito introdujeron la correlación parcial (PARCOR) para LPC. ^[2]

Itakura completó su título de D.Eng. en procesamiento de voz en 1972, escribiendo su disertación sobre "Análisis y síntesis de voz basados en un método estadístico". ^[1] De 1973 a 1975, trabajó en el Departamento de Investigación Acústica de Bell Labs , habiendo sido invitado a trabajar allí en problemas fundamentales por James Flanagan , quien había quedado impresionado por uno de los artículos de Itakura sobre codificación de baja tasa de bits. ^[4]

En 1975, Itakura desarrolló el método de pares espectrales de líneas (LSP) para la codificación de voz de alta compresión, mientras estaba en NTT. ^[5]^[6]^[1] De 1975 a 1981, estudió problemas en análisis y síntesis de voz basados en el método LSP. ^[1] En 1980, su equipo desarrolló un chip sintetizador de voz basado en LSP. LSP es una tecnología importante para la síntesis y codificación de voz, y en la década de 1990 fue adoptada por casi todos los estándares internacionales de codificación de voz como un componente esencial, contribuyendo a la mejora de la comunicación de voz digital a través de canales móviles e Internet en todo el mundo. ^[6]

En 1981 fue nombrado jefe de la Sección de Investigación de Habla y Acústica en NTT. Dejó este puesto en 1984 para aceptar una cátedra de teoría de comunicaciones y procesamiento de señales en la Universidad de Nagoya . Actualmente enseña en la Universidad Meijo . ^[7]

El trabajo de Itakura sobre estimación espectral y de formantes sentó las bases para gran parte de los primeros avances en el procesamiento de señales de voz. ^[8] Su trabajo sobre modelado autorregresivo del habla se utiliza en casi todos los sistemas de transmisión de voz de tasa de bits baja a media modernos, y la representación de pares espectrales de líneas que desarrolló ahora se encuentra en casi todos los sistemas de telefonía celular. ^[8]

Premios

Entre sus premios se incluyen el Premio Senior IEEE ASSP 1975, un premio del Ministerio de Ciencia y Tecnología de Japón en 1977, el Premio Morris N. Liebmann IEEE 1986 ^[9] (con BS Atal), el Premio de la Sociedad de Procesamiento de Señales IEEE 1996, la Medalla del Tercer Milenio IEEE, el Premio al Logro y Contribuciones Distinguidas IEICE 2002 y la Medalla Cinta Púrpura 2003 del Gobierno Japonés. En 2005, recibió el Premio Asahi y la Medalla de Procesamiento de Señales Jack S. Kilby IEEE . ^[10]^[11] En 2009, recibió el Premio NEC C&C por su investigación pionera y el desarrollo de tecnología de codificación de voz altamente eficiente con métodos de análisis-síntesis para el habla. Es miembro del IEEE por sus contribuciones pioneras al procesamiento del habla, ^[12] y miembro honorario del Instituto de Ingenieros en Electrónica, Información y Comunicación de Japón.

Referencias

^ abcde "Historia Oral Fumitada Itakura". Red de Historia Global IEEE. 20 de mayo de 2009 . Consultado el 21 de julio de 2009 .
^ ab Gray, Robert M. (2010). "Una historia del habla digital en tiempo real en redes de paquetes: Parte II de la codificación predictiva lineal y el protocolo de Internet" (PDF) . Encontrado. Trends Signal Process . 3 (4): 203–303. doi : 10.1561/2000000036 . ISSN 1932-8346.
^ Itakura, F., y Saito, S. (1968). Análisis de telefonía de síntesis basada en el método de máxima verosimilitud. En Proc. 6.º Congreso Internacional de Acústica (pp. C–17–C–20). Los Alamitos, CA: IEEE.
^ "Historia oral de James L. Flanagan". IEEE Global History Network. 20 de mayo de 2009. Archivado desde el original el 31 de diciembre de 2009. Consultado el 21 de julio de 2009 .
^ Zheng, F.; Song, Z.; Li, L.; Yu, W. (1998). "La medida de distancia para pares de espectros de líneas aplicada al reconocimiento de voz" (PDF) . Actas de la 5.ª Conferencia internacional sobre procesamiento del lenguaje hablado (ICSLP'98) (3): 1123–6.
^ ab "Lista de hitos del IEEE". IEEE . Consultado el 15 de julio de 2019 .
^ "視聴覚情報研究室". Universidad Meijo.
^ ab "Fumitada Itakura". IEEE. Archivado desde el original el 5 de diciembre de 2008 . Consultado el 21 de julio de 2009 .
^ "Ganadores del premio en memoria de Morris N. Liebmann del IEEE". Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) . Archivado desde el original el 6 de junio de 2008. Consultado el 15 de febrero de 2008 .
^ "Ganadores de la Medalla de Procesamiento de Señales Jack S. Kilby del IEEE" (PDF) . IEEE . Archivado desde el original (PDF) el 16 de diciembre de 2021 . Consultado el 27 de febrero de 2011 .
^ "Ganadores de la Medalla de Procesamiento de Señales Jack S. Kilby del IEEE – 2005 – Fumitada Itakura". IEEE . Archivado desde el original el 5 de septiembre de 2012 . Consultado el 27 de febrero de 2011 .
^ "IEEE Fellows 2003 |". IEEE Communications Society . Consultado el 7 de septiembre de 2024 .