Richard S. Sutton FRS FRSC es un informático canadiense . Es profesor de ciencias de la computación en la Universidad de Alberta y científico investigador en Keen Technologies. [1] Sutton es considerado uno de los fundadores del aprendizaje por refuerzo computacional moderno , [2] y tiene varias contribuciones importantes al campo, incluido el aprendizaje por diferencias temporales y los métodos de gradiente de políticas. [3]
Richard Sutton nació en Ohio y creció en Oak Brook, Illinois , un suburbio de Chicago .
Sutton recibió su licenciatura en psicología de la Universidad de Stanford en 1978 antes de realizar una maestría (1980) y un doctorado. (1984) en informática de la Universidad de Massachusetts Amherst bajo la supervisión de Andrew Barto . Su tesis doctoral, Asignación de créditos temporales en el aprendizaje por refuerzo , introdujo arquitecturas actor-críticas y la asignación de créditos temporales . [4] [3]
Fue influenciado por el trabajo de Harry Klopf en la década de 1970, que proponía que el aprendizaje supervisado es insuficiente para la IA o para explicar el comportamiento inteligente, y que el aprendizaje por prueba y error, impulsado por "aspectos hedónicos del comportamiento", es necesario. Esto centró su interés en el aprendizaje por refuerzo. [5]
En 1984, Sutton era investigador postdoctoral en la Universidad de Massachusetts.
De 1985 a 1994, fue miembro principal del personal técnico del Laboratorio de Computación y Sistemas Inteligentes de GTE en Waltham, Massachusetts . [3] Después de eso, pasó 3 años en la Universidad de Massachusetts Amherst como científico investigador senior. [3]
De 1998 a 2002, Sutton trabajó en el Laboratorio Shannon de AT&T en Florham Park, Nueva Jersey, como miembro técnico principal del departamento de inteligencia artificial. [3]
Desde 2003 es profesor de ciencias de la computación en la Universidad de Alberta . Lideró el Laboratorio de Aprendizaje por Refuerzo e Inteligencia Artificial de la institución hasta 2018. [6] [3]
Mientras conservaba su cátedra, Sutton se unió a Deepmind en junio de 2017 como un distinguido investigador científico y cofundador de su oficina en Edmonton . [4] [7] [8]
Sutton se convirtió en ciudadano canadiense en 2015 y renunció a su ciudadanía estadounidense [8] en 2017.
En un ensayo de 2019, Sutton criticó el campo de la investigación de la IA por no "aprender la amarga lección de que construir cómo pensamos no funciona a largo plazo", argumentando que "70 años de investigación de la IA [habían demostrado] que Los métodos generales que aprovechan la computación son, en última instancia, los más efectivos, y por un amplio margen", superando los esfuerzos basados en el conocimiento humano sobre campos específicos como la visión por computadora, el reconocimiento de voz, el ajedrez o el Go. [9] [10]
En 2023, él y John Carmack anunciaron una asociación para el desarrollo de AGI . [11]
Sutton es miembro de la Asociación para el Avance de la Inteligencia Artificial (AAAI) desde 2001. [12] En 2003 recibió el Premio del Presidente de la Sociedad Internacional de Redes Neurales [13] y en 2013, el premio al Logro Sobresaliente en Investigación de la Universidad. de Massachusetts Amherst . [14]
La nominación de Sutton como miembro de la AAAI dice: [12]
Por contribuciones importantes a muchos temas del aprendizaje automático, incluido el aprendizaje por refuerzo, técnicas de diferencia temporal y redes neuronales.
En 2016, Sutton fue elegido miembro de la Royal Society of Canada. [15] En 2021, fue elegido miembro de la Royal Society. [dieciséis]