David Silver (informático)

David Silver FRS (nacido en 1976) es un científico investigador principal en Google DeepMind y profesor en el University College London . Ha dirigido investigaciones sobre aprendizaje por refuerzo con AlphaGo , AlphaZero y codirector de AlphaStar . ^[1]^[2]

Educación

Estudió en Christ's College, Cambridge , ^[3] graduándose en 1997 con el premio Addison-Wesley y trabando amistad con Demis Hassabis mientras estaba en Cambridge. ^[4] Silver regresó a la academia en 2004 en la Universidad de Alberta para estudiar un doctorado sobre aprendizaje por refuerzo , ^[5] donde co-introdujo los algoritmos utilizados en los primeros programas Go 9 × 9 de nivel maestro y se graduó en 2009. ^[6]^[7] Su versión del programa MoGo (en coautoría con Sylvain Gelly) fue uno de los programas Go más sólidos en 2009. ^[8]

Carrera e investigación

Después de graduarse de la universidad, Silver cofundó la empresa de videojuegos Elixir Studios , donde fue CTO y programador principal, recibiendo varios premios por tecnología e innovación. ^[4]^[9]

Silver recibió una beca de investigación de la Royal Society University en 2011 y posteriormente se convirtió en profesora en el University College London . ^[10] Sus conferencias sobre aprendizaje por refuerzo están disponibles en YouTube. ^[11] Silver fue consultor de Google DeepMind desde sus inicios y se unió a tiempo completo en 2013.

Su trabajo reciente se ha centrado en combinar el aprendizaje por refuerzo con el aprendizaje profundo , incluido un programa que aprende a jugar juegos de Atari directamente desde píxeles. ^[12] Silver lideró el proyecto AlphaGo, que culminó con el primer programa para derrotar a un jugador profesional superior en el juego de Go de tamaño completo. ^[13] AlphaGo recibió posteriormente una certificación profesional honoraria de 9 Dan; y ganó el premio Cannes Lion a la innovación. ^[14] Luego dirigió el desarrollo de AlphaZero , que utilizó la misma IA para aprender a jugar Go desde cero (aprender solo jugando él mismo y no con juegos humanos) antes de aprender a jugar ajedrez y shogi de la misma manera, a niveles más altos que cualquier otro programa informático.

Silver se encuentra entre los miembros del personal de Google DeepMind con más publicaciones, con más de 170.000 citas y tiene un índice h de 86 según Google Scholar . ^[1]

Premios y honores

Silver recibió el Premio ACM en Computación 2019 por sus avances revolucionarios en los juegos de computadora. ^[15]

En 2021, Silver fue elegido miembro de la Royal Society (FRS) por sus contribuciones a Deep Q-Networks y AlphaGo . ^[16] Fue elegido miembro de la Asociación para el Avance de la Inteligencia Artificial en 2022. ^[17]

Referencias

^ Publicaciones de abc David Silver indexadas por Google Scholar
^ Oriol Vinyals ; Ígor Babuschkin; Wojciech M. Czarnecki; et al. (30 de octubre de 2019). "Nivel de gran maestro en StarCraft II utilizando el aprendizaje por refuerzo de múltiples agentes". Naturaleza . 575 (7782): 350–354. doi :10.1038/S41586-019-1724-Z. ISSN 1476-4687. PMID 31666705. Wikidata Q72988805.
^ Lista de miembros de la Universidad de Cambridge hasta el 31 de julio de 1998
^ ab Shead, Sam. "David Silver: el héroe anónimo y potencia intelectual de Google DeepMind". businessinsider.com . Consultado el 26 de septiembre de 2020 .
^ David Silver en el Proyecto de genealogía de matemáticas
^ Plata, David (2009). Aprendizaje por refuerzo y búsqueda basada en simulación en Computer Go. ualberta.ca (tesis doctoral). Universidad de Alberta. doi :10.7939/R39D8T. OCLC 575410609.
^ Sylvain Gelly; David Plata (2008). "Lograr un nivel de juego maestro en 9 × 9 Computer Go" (PDF) . Actas de la Vigésima Tercera Conferencia AAAI sobre Inteligencia Artificial .
^ Estuardo J. Russell ; Peter Norvig (2009). Inteligencia artificial: un enfoque moderno (3ª ed.). Prentice Hall .
^ "Lo que la IA detrás de AlphaGo puede enseñarnos sobre el ser humano". Cableado.com . Consultado el 17 de mayo de 2016 .
^ "CSML | David Plata". ucl.ac.uk. Archivado desde el original el 24 de abril de 2021 . Consultado el 27 de mayo de 2017 .
^ "Curso RL de David Silver - Conferencia 1: Introducción al aprendizaje por refuerzo". 13 de mayo de 2015 - vía YouTube .
^ Volodymyr Mnih; Koray Kavukcuoglu; David Plata; et al. (25 de febrero de 2015). "Control a nivel humano mediante aprendizaje por refuerzo profundo". Naturaleza . 518 (7540): 529–533. doi :10.1038/NATURALEZA14236. ISSN 1476-4687. PMID 25719670. Wikidata Q27907579.
^ David plata; Aja Huang ; Chris J. Maddison; et al. (27 de enero de 2016). "Dominar el juego de Go con redes neuronales profundas y búsqueda de árboles". Naturaleza . 529 (7587): 484–489. doi :10.1038/NATURALEZA16961. ISSN 1476-4687. PMID 26819042. Wikidata Q28005460.
^ "Google DeepMind AlphaGo en el Reino Unido gana el Gran Premio de Innovación" . Consultado el 27 de mayo de 2017 .
^ Ormond, Jim. "Premio ACM en Computación otorgado al desarrollador de AlphaGo: David Silver reconocido por sus avances revolucionarios en los juegos de computadora". acm.org . Consultado el 2 de abril de 2020 .
^ "La Royal Society elige nuevos becarios y miembros extranjeros destacados". royalsociety.org . Consultado el 8 de junio de 2021 .
^ "Becarios AAAI electos". AAAI . Consultado el 3 de enero de 2024 .