Fumitada Itakura

Fumitada Itakura (板倉文忠, Itakura Fumitada , nacida el 6 de agosto de 1940) es una científica japonesa . Realizó un trabajo pionero en el procesamiento estadístico de señales y su aplicación al análisis , síntesis y codificación del habla , incluido el desarrollo de los métodos de codificación predictiva lineal (LPC) y pares de líneas espectrales (LSP).

Biografía

Itakura nació en Toyokawa , Prefectura de Aichi , Japón . Recibió títulos de pregrado y posgrado de la Universidad de Nagoya en 1963 y 1965, respectivamente. ^[1] En 1966, mientras estudiaba su doctorado en Nagoya, desarrolló los primeros conceptos de lo que más tarde se conocería como codificación predictiva lineal (LPC), junto con Shuzo Saito de Nippon Telegraph and Telephone (NTT). Describieron un enfoque para la discriminación automática de fonemas que implicaba el primer enfoque de máxima verosimilitud para la codificación del habla . ^[2] En 1968, se unió al Laboratorio de Comunicaciones Eléctricas NTT Musashino en Tokio . ^[1] El mismo año, Itakura y Saito presentaron el algoritmo de distancia Itakura-Saito . ^[3] Al año siguiente, Itakura y Saito introdujeron la correlación parcial (PARCOR) a LPC. ^[2]

Itakura completó su D.Eng. Licenciado en procesamiento del habla en 1972, escribiendo su tesis sobre "Análisis y síntesis del habla basado en un método estadístico". ^[1] De 1973 a 1975, trabajó en el Departamento de Investigación de Acústica de los Laboratorios Bell , habiendo sido invitado a trabajar allí en problemas fundamentales por James Flanagan , quien había quedado impresionado por uno de los artículos de Itakura sobre codificación de baja velocidad de bits. ^[4]

En 1975, Itakura desarrolló el método de pares espectrales de líneas (LSP) para codificación de voz de alta compresión, mientras estaba en NTT. ^[5]^[6]^[1] De 1975 a 1981, estudió problemas de análisis y síntesis del habla basados en el método LSP. ^[1] En 1980, su equipo desarrolló un chip sintetizador de voz basado en LSP. LSP es una tecnología importante para la síntesis y codificación de voz, y en la década de 1990 fue adoptada por casi todos los estándares internacionales de codificación de voz como un componente esencial, contribuyendo a la mejora de la comunicación de voz digital a través de canales móviles e Internet en todo el mundo. ^[6]

En 1981, fue nombrado Jefe de la Sección de Investigación del Habla y Acústica de NTT. Dejó este puesto en 1984 para ocupar una cátedra de teoría de las comunicaciones y procesamiento de señales en la Universidad de Nagoya . Actualmente enseña en la Universidad Meijo . ^[7]

El trabajo de Itakura sobre estimación espectral y de formantes sentó las bases para gran parte de los primeros avances en el procesamiento de señales de voz. ^[8] Su trabajo sobre el modelado autorregresivo del habla se utiliza en casi todos los sistemas modernos de transmisión de voz de velocidad binaria baja a media, y la representación de pares espectrales de líneas que desarrolló se encuentra ahora en casi todos los sistemas de telefonía celular. ^[8]

Premios

Sus premios incluyen el IEEE ASSP 1975 Senior Award, un premio del Ministerio de Ciencia y Tecnología de Japón en 1977, el IEEE 1986 Morris N. Liebmann Award ^[9] (con BS Atal), el IEEE Signal Processing 1996 Society Award, el IEEE Third Medalla del Milenio, el Premio IEICE a Contribuciones y Logros Distinguidos 2002 y la Medalla Cinta Púrpura del Gobierno Japonés 2003. En 2005, recibió el Premio Asahi y la Medalla de Procesamiento de Señales IEEE Jack S. Kilby . ^[10]^[11] En 2009, recibió el premio NEC C&C por su investigación pionera y el desarrollo de tecnología de codificación de voz altamente eficiente con métodos de análisis y síntesis del habla. Es miembro del IEEE por sus contribuciones pioneras al procesamiento del habla, ^[12] y miembro honorario del Instituto de Ingenieros en Electrónica, Información y Comunicaciones de Japón.

Referencias

^ abcde "Historia Oral Fumitada Itakura". Red de Historia Global IEEE. 20 de mayo de 2009 . Consultado el 21 de julio de 2009 .
^ ab Gray, Robert M. (2010). "Una historia del habla digital en tiempo real en redes de paquetes: parte II de la codificación predictiva lineal y el protocolo de Internet" (PDF) . Encontró. Proceso de señales de tendencias . 3 (4): 203–303. doi : 10.1561/2000000036 . ISSN 1932-8346.
^ Itakura, F. y Saito, S. (1968). Análisis de telefonía de síntesis basado en el método de máxima verosimilitud. En Proc. 6º del Congreso Internacional de Acústica (págs. C–17–C–20). Los Alamitos, CA: IEEE.
^ "Historia oral de James L. Flanagan". Red de Historia Global IEEE. 20 de mayo de 2009. Archivado desde el original el 31 de diciembre de 2009 . Consultado el 21 de julio de 2009 .
^ Zheng, F.; Canción, Z.; Pequeño.; Yu, W. (1998). "La medida de distancia para pares de espectro de líneas aplicada al reconocimiento de voz" (PDF) . Actas de la Quinta Conferencia Internacional sobre Procesamiento del Lenguaje Hablado (ICSLP'98) (3): 1123–6.
^ ab "Lista de hitos del IEEE". IEEE . Consultado el 15 de julio de 2019 .
^ "視聴覚情報研究室". Universidad Meijo.
^ ab "Fumitada Itakura". IEEE . Consultado el 21 de julio de 2009 .
^ "Ganadores del premio IEEE Morris N. Liebmann Memorial". Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) . Consultado el 15 de febrero de 2008 .
^ "Destinatarios de la medalla de procesamiento de señales IEEE Jack S. Kilby" (PDF) . IEEE . Consultado el 27 de febrero de 2011 .
^ "Destinatarios de la medalla de procesamiento de señales IEEE Jack S. Kilby - 2005 - Fumitada Itakura". IEEE . Consultado el 27 de febrero de 2011 .
^ "Becarios IEEE 2003 | Sociedad de Comunicaciones IEEE".