Roadrunner fue una supercomputadora construida por IBM para el Laboratorio Nacional de Los Álamos en Nuevo México, EE. UU. El Roadrunner, que costó 100 millones de dólares, fue diseñado para un rendimiento máximo de 1,7 petaflops . Alcanzó 1,026 petaflops el 25 de mayo de 2008, convirtiéndose en el primer sistema TOP500 LINPACK del mundo con un rendimiento sostenido de 1,0 petaflops. [2] [3]
En noviembre de 2008, alcanzó un rendimiento máximo de 1,456 petaFLOPS , conservando su primer puesto en la lista TOP500 . [4] También fue la cuarta supercomputadora más eficiente energéticamente del mundo en la lista Supermicro Green500, con una tasa operativa de 444,94 megaflops por vatio de potencia utilizada. El diseño híbrido de Roadrunner se reutilizó luego para varias otras supercomputadoras energéticamente eficientes. [5] Roadrunner fue desmantelada por Los Alamos el 31 de marzo de 2013. [6] En su lugar, Los Alamos puso en servicio una supercomputadora llamada Cielo , que se instaló en 2010.
IBM construyó la computadora para la Administración Nacional de Seguridad Nuclear (NNSA) del Departamento de Energía de los Estados Unidos (DOE). [7] [8] Era un diseño híbrido con 12.960 procesadores IBM PowerXCell 8i [9] y 6.480 procesadores AMD Opteron de doble núcleo [10] en servidores blade especialmente diseñados conectados por InfiniBand . El Roadrunner usaba Red Hat Enterprise Linux junto con Fedora [11] como sistemas operativos, y se administraba con el software de computación distribuida xCAT . También usaba la implementación de la interfaz de paso de mensajes Open MPI . [12]
El Roadrunner ocupaba aproximadamente 296 bastidores de servidores [13] que cubrían 560 metros cuadrados (6000 pies cuadrados) [14] y entró en funcionamiento en 2008. Fue desmantelado el 31 de marzo de 2013. [13] El DOE utilizó la computadora para simular cómo envejecen los materiales nucleares con el fin de predecir si el antiguo arsenal de armas nucleares de los EE. UU. es seguro y confiable. Otros usos del Roadrunner incluyeron las industrias científica, financiera, automotriz y aeroespacial.
Roadrunner se diferenciaba de otras supercomputadoras contemporáneas porque continuaba el enfoque híbrido [13] para el diseño de supercomputadoras introducido por Seymour Cray en 1964 con el CDC 6600 de Control Data Corporation y continuaba con el CDC 7600 , un orden de magnitud más rápido, en 1969. Sin embargo, en esta arquitectura los procesadores periféricos se usaban solo para funciones del sistema operativo y todas las aplicaciones se ejecutaban en el procesador central. La mayoría de las supercomputadoras anteriores solo habían usado una arquitectura de procesador, ya que se pensaba que era más fácil de diseñar y programar. Para aprovechar todo el potencial de Roadrunner, todo el software tuvo que escribirse especialmente para esta arquitectura híbrida. El diseño híbrido consistía en procesadores de servidor Opteron de doble núcleo fabricados por AMD utilizando la arquitectura estándar AMD64 . Adjunto a cada núcleo Opteron hay un procesador PowerXCell 8i diseñado y fabricado por IBM . Como supercomputadora, el Roadrunner fue considerado un clúster Opteron con aceleradores Cell, ya que cada nodo consta de un Cell conectado a un núcleo Opteron y los Opterons entre sí. [15]
Roadrunner estuvo en desarrollo desde 2002 y se puso en línea en 2006. Debido a su novedoso diseño y complejidad, se construyó en tres fases y se volvió completamente operativo en 2008. Su predecesor fue una máquina también desarrollada en Los Alamos llamada Dark Horse. [16] Esta máquina fue uno de los primeros sistemas de arquitectura híbrida originalmente basado en ARM y luego trasladado al procesador Cell. Era un diseño completamente 3D, su diseño integraba memoria 3D, redes, procesadores y una serie de otras tecnologías.
La primera fase del Roadrunner consistió en construir un clúster estándar basado en Opteron, mientras se evaluaba la viabilidad de seguir construyendo y programando la futura versión híbrida. Este Roadrunner de la fase 1 alcanzó los 71 teraflops y estuvo en pleno funcionamiento en el Laboratorio Nacional de Los Álamos en 2006.
La fase 2, conocida como AAIS (sistema inicial de arquitectura avanzada), incluía la construcción de una versión híbrida a pequeña escala del sistema terminado utilizando una versión anterior del procesador Cell. Esta fase se utilizó para crear aplicaciones prototipo para la arquitectura híbrida. Se puso en funcionamiento en enero de 2007.
El objetivo de la Fase 3 era alcanzar un rendimiento sostenido superior a 1 petaflops. Se añadieron al diseño nodos Opteron adicionales y nuevos procesadores PowerXCell. Estos procesadores PowerXCell son cinco veces más potentes que los procesadores Cell utilizados en la Fase 2. Se construyó a escala completa en las instalaciones de IBM en Poughkeepsie, Nueva York , [1] donde rompió la barrera de 1 petaflops durante su cuarto intento el 25 de mayo de 2008. El sistema completo se trasladó a su ubicación permanente en Nuevo México en el verano de 2008. [1]
Roadrunner utilizó dos modelos diferentes de procesadores. El primero es el AMD Opteron 2210 , que funciona a 1,8 GHz. Los opterons se utilizan tanto en los nodos computacionales que alimentan las células con datos útiles como en los nodos de operaciones y comunicación del sistema que pasan datos entre nodos computacionales y ayudan a los operadores que ejecutan el sistema. Roadrunner tiene un total de 6.912 procesadores Opteron, de los cuales 6.480 se utilizan para computación y 432 para operación. Los opterons están conectados entre sí mediante enlaces HyperTransport . Cada Opteron tiene dos núcleos para un total de 13.824 núcleos.
El segundo procesador es el IBM PowerXCell 8i , que funciona a 3,2 GHz. Estos procesadores tienen un núcleo de propósito general (PPE) y ocho núcleos de rendimiento especial (SPE) para operaciones de punto flotante . Roadrunner tiene un total de 12.960 procesadores PowerXCell, con 12.960 núcleos PPE y 103.680 núcleos SPE, para un total de 116.640 núcleos.
Lógicamente, un TriBlade consta de dos Opteron de doble núcleo con 16 GB de RAM y cuatro CPU PowerXCell 8i con 16 GB de RAM Cell. [10]
Físicamente, un TriBlade consta de un blade Opteron LS21 , un blade de expansión y dos blades Cell QS22 . El LS21 tiene dos Opteron de doble núcleo a 1,8 GHz con 16 GB de memoria para todo el blade, lo que proporciona 8 GB para cada CPU. Cada QS22 tiene dos CPU PowerXCell 8i, que funcionan a 3,2 GHz y 8 GB de memoria, lo que hace 4 GB para cada CPU. El blade de expansión conecta los dos QS22 a través de cuatro enlaces PCIe x8 al LS21, dos enlaces para cada QS22. También proporciona conectividad externa a través de un adaptador InfiniBand 4x DDR. Esto hace un ancho total de cuatro ranuras para un solo TriBlade. Tres TriBlades caben en un chasis BladeCenter H. El blade de expansión está conectado al blade Opteron a través de HyperTransport.
Una unidad conectada es un conjunto de 60 BladeCenter H llenos de TriBlades, es decir, 180 TriBlades. Todos los TriBlades están conectados a un conmutador Infiniband Voltaire ISR2012 de 288 puertos. Cada CU también tiene acceso al sistema de archivos Panasas a través de doce servidores System x3755 . [10]
Información del sistema CU: [10]
El clúster final está formado por 18 unidades conectadas, que están conectadas entre sí a través de ocho conmutadores Infiniband ISR2012 adicionales (de segunda etapa). Cada CU está conectada a través de doce enlaces ascendentes para cada conmutador de segunda etapa, lo que hace un total de 96 conexiones de enlace ascendente. [10]
Información general del sistema: [10]
El IBM Roadrunner se cerró el 31 de marzo de 2013. [13] Si bien la supercomputadora era una de las más rápidas del mundo, su eficiencia energética era relativamente baja. Roadrunner entregaba 444 megaflops por vatio, frente a los 886 megaflops por vatio de una supercomputadora comparable. [17] Antes de que se desmantele la supercomputadora, los investigadores pasarán un mes realizando experimentos de memoria y enrutamiento de datos que ayudarán a diseñar futuras supercomputadoras. [13]
Una vez desmantelado el IBM Roadrunner, se destruirán los componentes electrónicos. [18] Los Alamos se encargará de la mayor parte de la destrucción del superordenador, alegando la naturaleza secreta de sus cálculos. Algunas de sus piezas se conservarán con fines históricos. [18]