David Silver (informático)

David Silver FRS (nacido en 1976) es un científico investigador principal de Google DeepMind y profesor en el University College de Londres . Ha dirigido investigaciones sobre aprendizaje por refuerzo con AlphaGo y AlphaZero y ha sido codirector de AlphaStar . ^[1]^[2]

Educación

Estudió en el Christ's College de Cambridge , ^[3] graduándose en 1997 con el premio Addison-Wesley, y habiendo entablado amistad con Demis Hassabis mientras estaba en Cambridge. ^[4] Silver regresó a la academia en 2004 en la Universidad de Alberta para estudiar un doctorado sobre aprendizaje por refuerzo , ^{[5] donde co-introdujo los algoritmos utilizados en los primeros programas}de Go 9×9 de nivel de maestría y se graduó en 2009. ^[6]^[7] Su versión del programa MoGo (en coautoría con Sylvain Gelly) fue uno de los programas de Go más sólidos en 2009. ^[8]

Carrera e investigación

Después de graduarse de la universidad, Silver cofundó la compañía de videojuegos Elixir Studios , donde fue CTO y programador principal, recibiendo varios premios por tecnología e innovación. ^[4]^[9]

Silver recibió una beca de investigación universitaria de la Royal Society en 2011 y, posteriormente, se convirtió en profesor en el University College de Londres . ^[10] Sus conferencias sobre aprendizaje por refuerzo están disponibles en YouTube. ^[11] Silver fue consultor de Google DeepMind desde sus inicios y se incorporó a tiempo completo en 2013.

Su trabajo reciente se ha centrado en combinar el aprendizaje de refuerzo con el aprendizaje profundo , incluido un programa que aprende a jugar a juegos de Atari directamente desde los píxeles. ^[12] Silver dirigió el proyecto AlphaGo, que culminó con el primer programa en derrotar a un jugador profesional de primer nivel en el juego de tamaño completo de Go. ^{[13] Posteriormente,} AlphaGo recibió una Certificación Profesional honoraria de 9 Dan; y ganó el premio Cannes Lion a la innovación. ^[14] Luego dirigió el desarrollo de AlphaZero , que utilizó la misma IA para aprender a jugar Go desde cero (aprendiendo solo jugando él mismo y no a partir de juegos humanos) antes de aprender a jugar ajedrez y shogi de la misma manera, a niveles más altos que cualquier otro programa de computadora.

Silver es uno de los miembros del personal de Google DeepMind con más publicaciones, con más de 200.000 citas y tiene un índice h de 93 según Google Scholar . ^[1]

Premios y honores

Silver recibió el Premio ACM en Informática 2019 por sus avances revolucionarios en los juegos de computadora. ^[15]

En 2021, Silver fue elegido miembro de la Royal Society (FRS) por sus contribuciones a Deep Q-Networks y AlphaGo . ^[16] Fue elegido miembro de la Asociación para el Avance de la Inteligencia Artificial en 2022. ^[17]

Referencias

^ abc Publicaciones de David Silver indexadas por Google Scholar
^ Oriol Vinyals ; Ígor Babuschkin; Wojciech M. Czarnecki; et al. (30 de octubre de 2019). "Nivel de gran maestro en StarCraft II utilizando el aprendizaje por refuerzo de múltiples agentes". Naturaleza . 575 (7782): 350–354. doi :10.1038/S41586-019-1724-Z. ISSN 1476-4687. PMID 31666705. Wikidata Q72988805.
^ Lista de miembros de la Universidad de Cambridge hasta el 31 de julio de 1998
^ ab Shead, Sam. "David Silver: el héroe anónimo y la potencia intelectual de Google DeepMind". businessinsider.com . Consultado el 26 de septiembre de 2020 .
^ David Silver en el Proyecto de Genealogía Matemática
^ Silver, David (2009). Aprendizaje por refuerzo y búsqueda basada en simulación en Go por computadora. ualberta.ca (tesis doctoral). Universidad de Alberta. doi :10.7939/R39D8T. OCLC 575410609.
^ Sylvain Gelly; David Silver (2008). "Cómo alcanzar el nivel de maestría en el juego de Go 9x9 por computadora" (PDF) . Actas de la vigésimo tercera conferencia de la AAAI sobre inteligencia artificial .
^ Stuart J. Russell ; Peter Norvig (2009). Inteligencia artificial: un enfoque moderno (3.ª ed.). Prentice Hall .
^ "Lo que la IA detrás de AlphaGo puede enseñarnos sobre el ser humano". Wired.com . Consultado el 17 de mayo de 2016 .
^ "CSML | David Silver". ucl.ac.uk . Archivado desde el original el 24 de abril de 2021 . Consultado el 27 de mayo de 2017 .
^ "Curso de aprendizaje por refuerzo de David Silver - Clase 1: Introducción al aprendizaje por refuerzo". 13 de mayo de 2015 – vía YouTube .
^ Volodymyr Mnih; Koray Kavukcuoglu; David Silver; et al. (25 de febrero de 2015). "Control a nivel humano mediante aprendizaje de refuerzo profundo". Nature . 518 (7540): 529–533. doi :10.1038/NATURE14236. ISSN 1476-4687. PMID 25719670. Wikidata Q27907579.
^ David Silver; Aja Huang ; Chris J. Maddison; et al. (27 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Nature . 529 (7587): 484–489. doi :10.1038/NATURE16961. ISSN 1476-4687. PMID 26819042. Wikidata Q28005460.
^ "Google DeepMind AlphaGo en el Reino Unido gana el Gran Premio de Innovación" . Consultado el 27 de mayo de 2017 .
^ Ormond, Jim. "Premio ACM en Informática otorgado al desarrollador de AlphaGo: David Silver reconocido por avances revolucionarios en juegos de computadora". acm.org . Consultado el 2 de abril de 2020 .
^ "La Royal Society elige nuevos miembros destacados y miembros extranjeros". royalsociety.org . Consultado el 8 de junio de 2021 .
^ "Becarios AAAI electos". AAAI . Consultado el 3 de enero de 2024 .