stringtranslate.com

David Silver (informático)

David Silver FRS (nacido en 1976) es un científico investigador principal de Google DeepMind y profesor en el University College de Londres . Ha dirigido investigaciones sobre aprendizaje por refuerzo con AlphaGo y AlphaZero y ha sido codirector de AlphaStar . [1] [2]

Educación

Estudió en el Christ's College de Cambridge , [3] graduándose en 1997 con el premio Addison-Wesley, y habiendo entablado amistad con Demis Hassabis mientras estaba en Cambridge. [4] Silver regresó a la academia en 2004 en la Universidad de Alberta para estudiar un doctorado sobre aprendizaje por refuerzo , [5] donde co-introdujo los algoritmos utilizados en los primeros programas de Go 9×9 de nivel de maestría y se graduó en 2009. [6] [7] Su versión del programa MoGo (en coautoría con Sylvain Gelly) fue uno de los programas de Go más sólidos en 2009. [8]

Carrera e investigación

Después de graduarse de la universidad, Silver cofundó la compañía de videojuegos Elixir Studios , donde fue CTO y programador principal, recibiendo varios premios por tecnología e innovación. [4] [9]

Silver recibió una beca de investigación universitaria de la Royal Society en 2011 y, posteriormente, se convirtió en profesor en el University College de Londres . [10] Sus conferencias sobre aprendizaje por refuerzo están disponibles en YouTube. [11] Silver fue consultor de Google DeepMind desde sus inicios y se incorporó a tiempo completo en 2013.

Su trabajo reciente se ha centrado en combinar el aprendizaje de refuerzo con el aprendizaje profundo , incluido un programa que aprende a jugar a juegos de Atari directamente desde los píxeles. [12] Silver dirigió el proyecto AlphaGo, que culminó con el primer programa en derrotar a un jugador profesional de primer nivel en el juego de tamaño completo de Go. [13] Posteriormente, AlphaGo recibió una Certificación Profesional honoraria de 9 Dan; y ganó el premio Cannes Lion a la innovación. [14] Luego dirigió el desarrollo de AlphaZero , que utilizó la misma IA para aprender a jugar Go desde cero (aprendiendo solo jugando él mismo y no a partir de juegos humanos) antes de aprender a jugar ajedrez y shogi de la misma manera, a niveles más altos que cualquier otro programa de computadora.

Silver es uno de los miembros del personal de Google DeepMind con más publicaciones, con más de 200.000 citas y tiene un índice h de 93 según Google Scholar . [1]

Premios y honores

Silver recibió el Premio ACM en Informática 2019 por sus avances revolucionarios en los juegos de computadora. [15]

En 2021, Silver fue elegido miembro de la Royal Society (FRS) por sus contribuciones a Deep Q-Networks y AlphaGo . [16] Fue elegido miembro de la Asociación para el Avance de la Inteligencia Artificial en 2022. [17]

Referencias

  1. ^ abc Publicaciones de David Silver indexadas por Google Scholar
  2. ^ Oriol Vinyals ; Ígor Babuschkin; Wojciech M. Czarnecki; et al. (30 de octubre de 2019). "Nivel de gran maestro en StarCraft II utilizando el aprendizaje por refuerzo de múltiples agentes". Naturaleza . 575 (7782): 350–354. doi :10.1038/S41586-019-1724-Z. ISSN  1476-4687. PMID  31666705. Wikidata  Q72988805.
  3. ^ Lista de miembros de la Universidad de Cambridge hasta el 31 de julio de 1998
  4. ^ ab Shead, Sam. "David Silver: el héroe anónimo y la potencia intelectual de Google DeepMind". businessinsider.com . Consultado el 26 de septiembre de 2020 .
  5. ^ David Silver en el Proyecto de Genealogía Matemática
  6. ^ Silver, David (2009). Aprendizaje por refuerzo y búsqueda basada en simulación en Go por computadora. ualberta.ca (tesis doctoral). Universidad de Alberta. doi :10.7939/R39D8T. OCLC  575410609.
  7. ^ Sylvain Gelly; David Silver (2008). "Cómo alcanzar el nivel de maestría en el juego de Go 9x9 por computadora" (PDF) . Actas de la vigésimo tercera conferencia de la AAAI sobre inteligencia artificial .
  8. ^ Stuart J. Russell ; Peter Norvig (2009). Inteligencia artificial: un enfoque moderno (3.ª ed.). Prentice Hall .
  9. ^ "Lo que la IA detrás de AlphaGo puede enseñarnos sobre el ser humano". Wired.com . Consultado el 17 de mayo de 2016 .
  10. ^ "CSML | David Silver". ucl.ac.uk . Archivado desde el original el 24 de abril de 2021 . Consultado el 27 de mayo de 2017 .
  11. ^ "Curso de aprendizaje por refuerzo de David Silver - Clase 1: Introducción al aprendizaje por refuerzo". 13 de mayo de 2015 – vía YouTube .
  12. ^ Volodymyr Mnih; Koray Kavukcuoglu; David Silver; et al. (25 de febrero de 2015). "Control a nivel humano mediante aprendizaje de refuerzo profundo". Nature . 518 (7540): 529–533. doi :10.1038/NATURE14236. ISSN  1476-4687. PMID  25719670. Wikidata  Q27907579.
  13. ^ David Silver; Aja Huang ; Chris J. Maddison; et al. (27 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Nature . 529 (7587): 484–489. doi :10.1038/NATURE16961. ISSN  1476-4687. PMID  26819042. Wikidata  Q28005460.
  14. ^ "Google DeepMind AlphaGo en el Reino Unido gana el Gran Premio de Innovación" . Consultado el 27 de mayo de 2017 .
  15. ^ Ormond, Jim. "Premio ACM en Informática otorgado al desarrollador de AlphaGo: David Silver reconocido por avances revolucionarios en juegos de computadora". acm.org . Consultado el 2 de abril de 2020 .
  16. ^ "La Royal Society elige nuevos miembros destacados y miembros extranjeros". royalsociety.org . Consultado el 8 de junio de 2021 .
  17. ^ "Becarios AAAI electos". AAAI . Consultado el 3 de enero de 2024 .