Fumitada Itakura (板倉 文忠, Itakura Fumitada , nacido el 6 de agosto de 1940) es un científico japonés . Realizó trabajos pioneros en el procesamiento estadístico de señales y su aplicación al análisis , síntesis y codificación del habla , incluido el desarrollo de los métodos de codificación predictiva lineal (LPC) y pares espectrales de líneas (LSP).
Itakura nació en Toyokawa , Prefectura de Aichi , Japón . Recibió sus títulos de grado y posgrado de la Universidad de Nagoya en 1963 y 1965, respectivamente. [1] En 1966, mientras estudiaba su doctorado en Nagoya, desarrolló los primeros conceptos de lo que luego se conocería como codificación predictiva lineal (LPC), junto con Shuzo Saito de Nippon Telegraph and Telephone (NTT). Describieron un enfoque para la discriminación automática de fonemas que involucraba el primer enfoque de máxima verosimilitud para la codificación del habla . [2] En 1968, se unió al Laboratorio de Comunicación Eléctrica NTT Musashino en Tokio . [1] El mismo año, Itakura y Saito presentaron el algoritmo de distancia Itakura-Saito . [3] Al año siguiente, Itakura y Saito introdujeron la correlación parcial (PARCOR) para LPC. [2]
Itakura completó su título de D.Eng. en procesamiento de voz en 1972, escribiendo su disertación sobre "Análisis y síntesis de voz basados en un método estadístico". [1] De 1973 a 1975, trabajó en el Departamento de Investigación Acústica de Bell Labs , habiendo sido invitado a trabajar allí en problemas fundamentales por James Flanagan , quien había quedado impresionado por uno de los artículos de Itakura sobre codificación de baja tasa de bits. [4]
En 1975, Itakura desarrolló el método de pares espectrales de líneas (LSP) para la codificación de voz de alta compresión, mientras estaba en NTT. [5] [6] [1] De 1975 a 1981, estudió problemas en análisis y síntesis de voz basados en el método LSP. [1] En 1980, su equipo desarrolló un chip sintetizador de voz basado en LSP. LSP es una tecnología importante para la síntesis y codificación de voz, y en la década de 1990 fue adoptada por casi todos los estándares internacionales de codificación de voz como un componente esencial, contribuyendo a la mejora de la comunicación de voz digital a través de canales móviles e Internet en todo el mundo. [6]
En 1981 fue nombrado jefe de la Sección de Investigación de Habla y Acústica en NTT. Dejó este puesto en 1984 para aceptar una cátedra de teoría de comunicaciones y procesamiento de señales en la Universidad de Nagoya . Actualmente enseña en la Universidad Meijo . [7]
El trabajo de Itakura sobre estimación espectral y de formantes sentó las bases para gran parte de los primeros avances en el procesamiento de señales de voz. [8] Su trabajo sobre modelado autorregresivo del habla se utiliza en casi todos los sistemas de transmisión de voz de tasa de bits baja a media modernos, y la representación de pares espectrales de líneas que desarrolló ahora se encuentra en casi todos los sistemas de telefonía celular. [8]
Entre sus premios se incluyen el Premio Senior IEEE ASSP 1975, un premio del Ministerio de Ciencia y Tecnología de Japón en 1977, el Premio Morris N. Liebmann IEEE 1986 [9] (con BS Atal), el Premio de la Sociedad de Procesamiento de Señales IEEE 1996, la Medalla del Tercer Milenio IEEE, el Premio al Logro y Contribuciones Distinguidas IEICE 2002 y la Medalla Cinta Púrpura 2003 del Gobierno Japonés. En 2005, recibió el Premio Asahi y la Medalla de Procesamiento de Señales Jack S. Kilby IEEE . [10] [11] En 2009, recibió el Premio NEC C&C por su investigación pionera y el desarrollo de tecnología de codificación de voz altamente eficiente con métodos de análisis-síntesis para el habla. Es miembro del IEEE por sus contribuciones pioneras al procesamiento del habla, [12] y miembro honorario del Instituto de Ingenieros en Electrónica, Información y Comunicación de Japón.