Al principio, la red neuronal no sabía nada sobre Ir más allá de las reglas.
[8] En los primeros tres días, AlphaGo Zero jugó 4,9 millones de juegos contra sí mismo en rápida sucesión.
[9] Pareció desarrollar las habilidades necesarias para vencer a los mejores humanos en tan solo unos días, mientras que el anterior AlphaGo requirió meses de entrenamiento para alcanzar el mismo nivel.
[10] A modo de comparación, los investigadores también entrenaron una versión de AlphaGo Zero utilizando juegos humanos, AlphaGo Master, y descubrieron que aprendía más rápido, pero en realidad tenía un peor rendimiento a largo plazo.
[14] DeepMind declaró en octubre de 2017 que ya había comenzado a trabajar activamente para intentar utilizar la tecnología AlphaGo Zero para el plegamiento de proteínas y afirmó que pronto publicaría nuevos hallazgos.
Oren Etzioni, del Instituto Allen de Inteligencia Artificial, calificó a AlphaGo Zero como "un resultado técnico muy impresionante" tanto en su capacidad para hacerlo como en su capacidad para entrenar el sistema en 40 días, en cuatro TPU.
Por el contrario, DeepMind "confía en que este enfoque sea generalizable a un gran número de dominios".
"Al principio era difícil de entender y casi me sentía como si estuviera jugando contra un extraterrestre.
Sin embargo, después de haber tenido una gran experiencia, me he acostumbrado", dijo Mok.