Léon Bottou (nacido en 1965) es un investigador más conocido por su trabajo en aprendizaje automático y compresión de datos . Su trabajo presenta el descenso de gradiente estocástico como un algoritmo de aprendizaje fundamental. [1] También es uno de los principales creadores de la tecnología de compresión de imágenes DjVu (junto con Yann LeCun y Patrick Haffner), y el mantenedor de DjVuLibre, la implementación de código abierto de DjVu. Es el desarrollador original del lenguaje de programación Lush.
Léon Bottou nació en Francia en 1965. Obtuvo el Diplôme d'Ingénieur de la École Polytechnique en 1987, un Magistère de Mathématiques Fondamentales et Appliquées et d'Informatique de la École Normale Supérieure en 1988 y un doctorado de la Université Paris-Sud en 1991. Luego se unió al Departamento de Investigación de Sistemas Adaptativos en AT&T Bell Laboratories en Holmdel, Nueva Jersey , donde colaboró con Vladimir Vapnik en algoritmos de aprendizaje local. [2] En 1992, regresó a Francia y fundó Neuristique SA, una empresa que produjo herramientas de aprendizaje automático y uno de los primeros paquetes de software de minería de datos. En 1995, regresó a Bell Laboratories, donde desarrolló una serie de nuevos métodos de aprendizaje automático, como Graph Transformer Networks (similar a un campo aleatorio condicional ), y los aplicó al reconocimiento de escritura a mano y OCR. [3] El sistema de reconocimiento de cheques bancarios que ayudó a desarrollar fue ampliamente implementado por NCR y otras empresas, leyendo más del 10% de todos los cheques en los EE. UU. a fines de la década de 1990 y principios de la década de 2000.
En 1996, se unió a AT&T Labs y trabajó principalmente en la tecnología de compresión de imágenes DjVu , [4] que es utilizada por algunos sitios web, en particular Internet Archive , para distribuir documentos escaneados. Entre 2002 y 2010, fue científico investigador en NEC Laboratories en Princeton, Nueva Jersey , donde se centró en la teoría y la práctica del aprendizaje automático con conjuntos de datos a gran escala, [5] aprendizaje en línea y métodos de optimización estocástica. [6] Desarrolló el software de código abierto LaSVM para máquinas de vectores de soporte rápidas a gran escala y software de descenso de gradiente estocástico para entrenar SVM lineal y campos aleatorios condicionales. En 2010 se unió al Microsoft adCenter en Redmond, Washington , y en 2012 se convirtió en investigador principal en Microsoft Research en la ciudad de Nueva York. En marzo de 2015 se unió a Facebook Artificial Intelligence Research, también en la ciudad de Nueva York, como líder de investigación.
Fue presidente del programa de la Conferencia de 2013 sobre sistemas de procesamiento de información neuronal y de la Conferencia internacional de 2009 sobre aprendizaje automático . Es editor asociado de las Transacciones sobre análisis de patrones e inteligencia artificial del IEEE , las Cartas de reconocimiento de patrones de la IAPR y el Journal of Machine Learning Research , publicado de forma independiente . [ cita requerida ] En 2007, recibió uno de los primeros Premios Blavatnik para jóvenes científicos de la Fundación de la familia Blavatnik y la Academia de Ciencias de Nueva York .