stringtranslate.com

David Silver (informático)

David Silver FRS (nacido en 1976) es un científico investigador principal en Google DeepMind y profesor en el University College London . Ha dirigido investigaciones sobre aprendizaje por refuerzo con AlphaGo , AlphaZero y codirector de AlphaStar . [1] [2]

Educación

Estudió en Christ's College, Cambridge , [3] graduándose en 1997 con el premio Addison-Wesley y trabando amistad con Demis Hassabis mientras estaba en Cambridge. [4] Silver regresó a la academia en 2004 en la Universidad de Alberta para estudiar un doctorado sobre aprendizaje por refuerzo , [5] donde co-introdujo los algoritmos utilizados en los primeros programas Go 9 × 9 de nivel maestro y se graduó en 2009. [6] [7] Su versión del programa MoGo (en coautoría con Sylvain Gelly) fue uno de los programas Go más sólidos en 2009. [8]

Carrera e investigación

Después de graduarse de la universidad, Silver cofundó la empresa de videojuegos Elixir Studios , donde fue CTO y programador principal, recibiendo varios premios por tecnología e innovación. [4] [9]

Silver recibió una beca de investigación de la Royal Society University en 2011 y posteriormente se convirtió en profesora en el University College London . [10] Sus conferencias sobre aprendizaje por refuerzo están disponibles en YouTube. [11] Silver fue consultor de Google DeepMind desde sus inicios y se unió a tiempo completo en 2013.

Su trabajo reciente se ha centrado en combinar el aprendizaje por refuerzo con el aprendizaje profundo , incluido un programa que aprende a jugar juegos de Atari directamente desde píxeles. [12] Silver lideró el proyecto AlphaGo, que culminó con el primer programa para derrotar a un jugador profesional superior en el juego de Go de tamaño completo. [13] AlphaGo recibió posteriormente una certificación profesional honoraria de 9 Dan; y ganó el premio Cannes Lion a la innovación. [14] Luego dirigió el desarrollo de AlphaZero , que utilizó la misma IA para aprender a jugar Go desde cero (aprender solo jugando él mismo y no con juegos humanos) antes de aprender a jugar ajedrez y shogi de la misma manera, a niveles más altos que cualquier otro programa informático.

Silver se encuentra entre los miembros del personal de Google DeepMind con más publicaciones, con más de 170.000 citas y tiene un índice h de 86 según Google Scholar . [1]

Premios y honores

Silver recibió el Premio ACM en Computación 2019 por sus avances revolucionarios en los juegos de computadora. [15]

En 2021, Silver fue elegido miembro de la Royal Society (FRS) por sus contribuciones a Deep Q-Networks y AlphaGo . [16] Fue elegido miembro de la Asociación para el Avance de la Inteligencia Artificial en 2022. [17]

Referencias

  1. ^ Publicaciones de abc David Silver indexadas por Google Scholar
  2. ^ Oriol Vinyals ; Ígor Babuschkin; Wojciech M. Czarnecki; et al. (30 de octubre de 2019). "Nivel de gran maestro en StarCraft II utilizando el aprendizaje por refuerzo de múltiples agentes". Naturaleza . 575 (7782): 350–354. doi :10.1038/S41586-019-1724-Z. ISSN  1476-4687. PMID  31666705. Wikidata  Q72988805.
  3. ^ Lista de miembros de la Universidad de Cambridge hasta el 31 de julio de 1998
  4. ^ ab Shead, Sam. "David Silver: el héroe anónimo y potencia intelectual de Google DeepMind". businessinsider.com . Consultado el 26 de septiembre de 2020 .
  5. ^ David Silver en el Proyecto de genealogía de matemáticas
  6. ^ Plata, David (2009). Aprendizaje por refuerzo y búsqueda basada en simulación en Computer Go. ualberta.ca (tesis doctoral). Universidad de Alberta. doi :10.7939/R39D8T. OCLC  575410609.
  7. ^ Sylvain Gelly; David Plata (2008). "Lograr un nivel de juego maestro en 9 × 9 Computer Go" (PDF) . Actas de la Vigésima Tercera Conferencia AAAI sobre Inteligencia Artificial .
  8. ^ Estuardo J. Russell ; Peter Norvig (2009). Inteligencia artificial: un enfoque moderno (3ª ed.). Prentice Hall .
  9. ^ "Lo que la IA detrás de AlphaGo puede enseñarnos sobre el ser humano". Cableado.com . Consultado el 17 de mayo de 2016 .
  10. ^ "CSML | David Plata". ucl.ac.uk. ​Archivado desde el original el 24 de abril de 2021 . Consultado el 27 de mayo de 2017 .
  11. ^ "Curso RL de David Silver - Conferencia 1: Introducción al aprendizaje por refuerzo". 13 de mayo de 2015 - vía YouTube .
  12. ^ Volodymyr Mnih; Koray Kavukcuoglu; David Plata; et al. (25 de febrero de 2015). "Control a nivel humano mediante aprendizaje por refuerzo profundo". Naturaleza . 518 (7540): 529–533. doi :10.1038/NATURALEZA14236. ISSN  1476-4687. PMID  25719670. Wikidata  Q27907579.
  13. ^ David plata; Aja Huang ; Chris J. Maddison; et al. (27 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Naturaleza . 529 (7587): 484–489. doi :10.1038/NATURALEZA16961. ISSN  1476-4687. PMID  26819042. Wikidata  Q28005460.
  14. ^ "Google DeepMind AlphaGo en el Reino Unido gana el Gran Premio de Innovación" . Consultado el 27 de mayo de 2017 .
  15. ^ Ormond, Jim. "Premio ACM en Computación otorgado al desarrollador de AlphaGo: David Silver reconocido por sus avances revolucionarios en los juegos de computadora". acm.org . Consultado el 2 de abril de 2020 .
  16. ^ "La Royal Society elige nuevos becarios y miembros extranjeros destacados". royalsociety.org . Consultado el 8 de junio de 2021 .
  17. ^ "Becarios AAAI electos". AAAI . Consultado el 3 de enero de 2024 .