Fumitada Itakura (板倉 文忠, Itakura Fumitada , nacida el 6 de agosto de 1940) es una científica japonesa . Realizó un trabajo pionero en el procesamiento estadístico de señales y su aplicación al análisis , síntesis y codificación del habla , incluido el desarrollo de los métodos de codificación predictiva lineal (LPC) y pares de líneas espectrales (LSP).
Itakura nació en Toyokawa , Prefectura de Aichi , Japón . Recibió títulos de pregrado y posgrado de la Universidad de Nagoya en 1963 y 1965, respectivamente. [1] En 1966, mientras estudiaba su doctorado en Nagoya, desarrolló los primeros conceptos de lo que más tarde se conocería como codificación predictiva lineal (LPC), junto con Shuzo Saito de Nippon Telegraph and Telephone (NTT). Describieron un enfoque para la discriminación automática de fonemas que implicaba el primer enfoque de máxima verosimilitud para la codificación del habla . [2] En 1968, se unió al Laboratorio de Comunicaciones Eléctricas NTT Musashino en Tokio . [1] El mismo año, Itakura y Saito presentaron el algoritmo de distancia Itakura-Saito . [3] Al año siguiente, Itakura y Saito introdujeron la correlación parcial (PARCOR) a LPC. [2]
Itakura completó su D.Eng. Licenciado en procesamiento del habla en 1972, escribiendo su tesis sobre "Análisis y síntesis del habla basado en un método estadístico". [1] De 1973 a 1975, trabajó en el Departamento de Investigación de Acústica de los Laboratorios Bell , habiendo sido invitado a trabajar allí en problemas fundamentales por James Flanagan , quien había quedado impresionado por uno de los artículos de Itakura sobre codificación de baja velocidad de bits. [4]
En 1975, Itakura desarrolló el método de pares espectrales de líneas (LSP) para codificación de voz de alta compresión, mientras estaba en NTT. [5] [6] [1] De 1975 a 1981, estudió problemas de análisis y síntesis del habla basados en el método LSP. [1] En 1980, su equipo desarrolló un chip sintetizador de voz basado en LSP. LSP es una tecnología importante para la síntesis y codificación de voz, y en la década de 1990 fue adoptada por casi todos los estándares internacionales de codificación de voz como un componente esencial, contribuyendo a la mejora de la comunicación de voz digital a través de canales móviles e Internet en todo el mundo. [6]
En 1981, fue nombrado Jefe de la Sección de Investigación del Habla y Acústica de NTT. Dejó este puesto en 1984 para ocupar una cátedra de teoría de las comunicaciones y procesamiento de señales en la Universidad de Nagoya . Actualmente enseña en la Universidad Meijo . [7]
El trabajo de Itakura sobre estimación espectral y de formantes sentó las bases para gran parte de los primeros avances en el procesamiento de señales de voz. [8] Su trabajo sobre el modelado autorregresivo del habla se utiliza en casi todos los sistemas modernos de transmisión de voz de velocidad binaria baja a media, y la representación de pares espectrales de líneas que desarrolló se encuentra ahora en casi todos los sistemas de telefonía celular. [8]
Sus premios incluyen el IEEE ASSP 1975 Senior Award, un premio del Ministerio de Ciencia y Tecnología de Japón en 1977, el IEEE 1986 Morris N. Liebmann Award [9] (con BS Atal), el IEEE Signal Processing 1996 Society Award, el IEEE Third Medalla del Milenio, el Premio IEICE a Contribuciones y Logros Distinguidos 2002 y la Medalla Cinta Púrpura del Gobierno Japonés 2003. En 2005, recibió el Premio Asahi y la Medalla de Procesamiento de Señales IEEE Jack S. Kilby . [10] [11] En 2009, recibió el premio NEC C&C por su investigación pionera y el desarrollo de tecnología de codificación de voz altamente eficiente con métodos de análisis y síntesis del habla. Es miembro del IEEE por sus contribuciones pioneras al procesamiento del habla, [12] y miembro honorario del Instituto de Ingenieros en Electrónica, Información y Comunicaciones de Japón.