Richard S. Sutton FRS FRSC es un informático canadiense . Es profesor de informática en la Universidad de Alberta y científico investigador en Keen Technologies. [1] Sutton es considerado uno de los fundadores del aprendizaje de refuerzo computacional moderno , [2] habiendo realizado varias contribuciones significativas en el campo, incluyendo el aprendizaje de diferencias temporales y los métodos de gradiente de políticas. [3]
Richard Sutton nació en Ohio y creció en Oak Brook, Illinois , un suburbio de Chicago .
Sutton se licenció en psicología en la Universidad de Stanford en 1978 antes de realizar una maestría (1980) y un doctorado (1984) en informática en la Universidad de Massachusetts Amherst bajo la supervisión de Andrew Barto . Su tesis doctoral, Temporal Credit Assignment in Reinforcement Learning , introdujo las arquitecturas actor-crítico y la asignación temporal de créditos . [4] [3]
En la década de 1970, se vio influenciado por el trabajo de Harry Klopf, que proponía que el aprendizaje supervisado no era suficiente para la IA o para explicar el comportamiento inteligente, y que era necesario el aprendizaje por ensayo y error, impulsado por los "aspectos hedónicos del comportamiento". Esto centró su interés en el aprendizaje por refuerzo. [5]
En 1984, Sutton fue investigador postdoctoral en la Universidad de Massachusetts.
De 1985 a 1994, fue miembro principal del personal técnico del Laboratorio de Sistemas Inteligentes y Computacionales del GTE en Waltham, Massachusetts . [3] Después de eso, pasó tres años en la Universidad de Massachusetts Amherst como científico investigador senior. [3]
De 1998 a 2002, Sutton trabajó en el Laboratorio AT&T Shannon en Florham Park, Nueva Jersey, como miembro principal del personal técnico en el departamento de inteligencia artificial. [3]
Desde 2003 es profesor de informática en la Universidad de Alberta . Dirigió el Laboratorio de Aprendizaje por Refuerzo e Inteligencia Artificial de la institución hasta 2018. [6] [3]
Si bien mantuvo su cátedra, Sutton se unió a Deepmind en junio de 2017 como distinguido científico investigador y cofundador de su oficina de Edmonton . [4] [7] [8]
Sutton se convirtió en ciudadano canadiense en 2015 y renunció a su ciudadanía estadounidense [8] en 2017.
En un ensayo de 2019, Sutton criticó el campo de investigación de IA por no "aprender la amarga lección de que incorporar la forma en que pensamos no funciona a largo plazo", argumentando que "70 años de investigación de IA [habían demostrado] que los métodos generales que aprovechan la computación son, en última instancia, los más efectivos, y por un amplio margen", superando los esfuerzos basados en el conocimiento humano sobre campos específicos como la visión por computadora, el reconocimiento de voz, el ajedrez o el Go. [9] [10]
En 2023, él y John Carmack anunciaron una asociación para el desarrollo de AGI . [11]
Sutton es miembro de la Asociación para el Avance de la Inteligencia Artificial (AAAI) desde 2001. [12] En 2003 recibió el Premio del Presidente de la Sociedad Internacional de Redes Neuronales [13] y en 2013, el premio al Logro Destacado en Investigación de la Universidad de Massachusetts Amherst . [14]
La nominación de Sutton como miembro de la AAAI dice: [12]
Por sus importantes contribuciones a muchos temas del aprendizaje automático, incluidos el aprendizaje de refuerzo, las técnicas de diferencia temporal y las redes neuronales.
En 2016, Sutton fue elegido miembro de la Royal Society of Canada. [15] En 2021, fue elegido miembro de la Royal Society. [16]