POWER7 es una familia de microprocesadores multinúcleo superescalares basados en la arquitectura del conjunto de instrucciones Power ISA 2.06 lanzada en 2010 que sucedió a POWER6 y POWER6+ . POWER7 fue desarrollado por IBM en varios sitios, incluidos los laboratorios de IBM en Rochester, Minnesota ; Austin, Texas; Essex Junction, Vermont ; TJ Watson Research Center , Nueva York; Bromont, QC [1] y IBM Deutschland Research & Development GmbH, Böblingen , Alemania. IBM anunció servidores basados en POWER7 el 8 de febrero de 2010. [2] [3]
En noviembre de 2006, IBM obtuvo un contrato de DARPA por 244 millones de dólares para desarrollar una arquitectura de supercomputadora a escala de petabytes antes de finales de 2010 en el marco del proyecto HPCS . El contrato también establece que la arquitectura estará disponible comercialmente. La propuesta de IBM, PERCS (Sistema informático productivo, fácil de usar y fiable), que les permitió obtener el contrato, se basa en el procesador POWER7, el sistema operativo AIX y el sistema de archivos paralelos generales . [4]
Una característica en la que colaboraron IBM y DARPA es la modificación del hardware de direccionamiento y tabla de páginas para admitir espacio de memoria compartida global para clústeres POWER7. Esto permite a los investigadores programar un clúster como si fuera un sistema único, sin utilizar el paso de mensajes. Desde el punto de vista de la productividad, esto es esencial, ya que algunos científicos no están familiarizados con MPI u otras técnicas de programación paralela utilizadas en clústeres. [5]
La arquitectura multinúcleo superescalar POWER7 fue una evolución sustancial del diseño POWER6, centrándose más en la eficiencia energética a través de múltiples núcleos y subprocesamiento simultáneo multihilo (SMT). [6] La arquitectura POWER6 se construyó desde cero para maximizar la frecuencia del procesador a costa de la eficiencia energética. Logró unos notables 5 GHz. Mientras que el POWER6 cuenta con un procesador de doble núcleo , cada uno capaz de realizar subprocesamiento simultáneo multihilo (SMT) bidireccional , el procesador IBM POWER 7 tiene hasta ocho núcleos y cuatro subprocesos por núcleo, para una capacidad total de 32 subprocesos simultáneos. [7]
IBM afirmó en ISCA 29 [8] que el rendimiento máximo se logró con diseños de alta frecuencia con 10–20 retrasos FO4 por etapa de canalización a costa de la eficiencia energética. Sin embargo, la unidad de punto flotante binario POWER6 logra una "canalización de 6 ciclos y 13 FO4 ". [9] [ aclaración necesaria ] Por lo tanto, la canalización para la CPU POWER7 se ha modificado nuevamente, al igual que para los diseños POWER5 y POWER6. En algunos aspectos, esta reelaboración es similar al giro de Intel en 2005 que abandonó la microarquitectura x86 de séptima generación P4.
El POWER7 está disponible con 4, 6 u 8 núcleos físicos por microchip, en un diseño de 1 a 32 vías, con hasta 1024 SMT y una microarquitectura e interfaces ligeramente diferentes para soportar especificaciones extendidas/sub-especificaciones en referencia a Power ISA y/o diferentes arquitecturas de sistema. Por ejemplo, en el sistema de supercomputación (HPC) Power 775 está empaquetado como un módulo de chip cuádruple (QCM) de 32 vías con 256 núcleos físicos y 1024 SMT. [10] También hay un modo TurboCore especial que puede apagar la mitad de los núcleos de un procesador de ocho núcleos, pero esos 4 núcleos tienen acceso a todos los controladores de memoria y caché L3 a velocidades de reloj aumentadas. Esto hace que el rendimiento de cada núcleo sea mayor, lo que es importante para cargas de trabajo que requieren el rendimiento secuencial más rápido a costa de un rendimiento paralelo reducido. El modo TurboCore puede reducir "los costos de software a la mitad para aquellas aplicaciones que tienen licencia por núcleo, al tiempo que aumenta el rendimiento por núcleo de ese software". [11] Los nuevos servidores IBM Power 780 escalables de alta gama cuentan con el nuevo modo de optimización de carga de trabajo TurboCore y ofrecen hasta el doble de rendimiento por núcleo de los sistemas basados en POWER6. [11]
Cada núcleo es capaz de realizar subprocesos múltiples simultáneos de cuatro vías (SMT). El POWER7 tiene aproximadamente 1.200 millones de transistores y tiene un tamaño de 567 mm2 fabricado en un proceso de 45 nm. Una diferencia notable con respecto al POWER6 es que el POWER7 ejecuta las instrucciones fuera de orden en lugar de hacerlo en orden. A pesar de la disminución de la frecuencia máxima en comparación con el POWER6 (4,25 GHz frente a 5,0 GHz), cada núcleo tiene un rendimiento superior al del POWER6, mientras que cada procesador tiene hasta 4 veces más núcleos.
POWER7 tiene estas especificaciones: [12] [13]
La especificación técnica especifica además: [15]
Cada núcleo del procesador POWER7 implementa una ejecución agresiva de instrucciones fuera de orden (OoO) para impulsar una alta eficiencia en el uso de las rutas de ejecución disponibles. El procesador POWER7 tiene una unidad de secuencia de instrucciones que es capaz de enviar hasta seis instrucciones por ciclo a un conjunto de colas. Se pueden enviar hasta ocho instrucciones por ciclo a las unidades de ejecución de instrucciones.
Esto arroja las siguientes cifras teóricas de rendimiento de precisión simple (SP) (basadas en una implementación de 8 núcleos a 4,14 GHz):
4 unidades SIMD de 64 bits por núcleo y una unidad SIMD VMX de 128 bits por núcleo pueden realizar 12 operaciones de multiplicación y suma por ciclo, lo que da 24 operaciones SP FP por ciclo. A 4,14 GHz, esto da 4140 millones * 24 = 99,36 SP GFLOPS y, con 8 núcleos, 794,88 SP GFLOPS.
El rendimiento máximo de doble precisión (DP) es aproximadamente la mitad del rendimiento máximo de SP.
A modo de comparación, las CPU con arquitectura Haswell 2013 de Intel pueden realizar 16 DP FLOP o 32 SP FLOP por ciclo (8/16 DP/SP fusionados multiplicación-suma repartidos en 2 unidades vectoriales FP AVX2 de 256 bits ). [16] A 3,4 GHz (i7-4770), esto se traduce en 108,8 SP GFLOPS por núcleo y 435,2 SP GFLOPS de rendimiento máximo en el chip de 4 núcleos, lo que da niveles aproximadamente similares de rendimiento por núcleo, sin tener en cuenta los efectos o beneficios de la tecnología Turbo Boost de Intel .
Esta comparación teórica del rendimiento máximo también se aplica en la práctica: el POWER7 y el i7-4770 obtienen puntuaciones similares en los puntos de referencia de punto flotante SPEC CPU2006 (un solo subproceso): 71,5 [17] para el POWER7 frente a 74,0 [18] para el i7-4770.
Observe que el chip POWER7 superó significativamente (2x–5x) al i7 en algunos puntos de referencia (bwaves, cactusADM, lbm) y también fue significativamente más lento (2x–3x) en la mayoría de los demás. Esto es indicativo de importantes diferencias arquitectónicas entre los dos chips/placas base/sistemas de memoria, etc.: fueron diseñados con diferentes cargas de trabajo en mente.
Sin embargo, en general, en un sentido muy amplio, se puede decir que el rendimiento de punto flotante del POWER7 es similar al del Haswell i7.
IBM presentó el procesador POWER7+ en la conferencia Hot Chips 24 en agosto de 2012. Se trata de una versión actualizada con mayores velocidades, más caché y aceleradores integrados. Se fabrica con un proceso de fabricación de 32 nm. [19]
Las primeras cajas que se enviaron con los procesadores POWER7+ fueron los servidores IBM Power 770 y 780. Los chips tienen hasta 80 MB de caché L3 (10 MB/núcleo), velocidades de reloj mejoradas (hasta 4,4 GHz) y 20 LPAR por núcleo. [20]
A partir de octubre de 2011 [update], la gama de sistemas basados en POWER7 incluye los modelos IBM Power Systems "Express" (710, 720, 730, 740 y 750), los modelos Enterprise (770, 780 y 795) y los modelos de computación de alto rendimiento (755 y 775). Los modelos Enterprise se diferencian en que cuentan con capacidades de capacidad bajo demanda. Las especificaciones máximas se muestran en la siguiente tabla.
IBM también ofrece 5 BladeCenters basados en POWER7 . [23] Las especificaciones se muestran en la siguiente tabla.
Los siguientes son proyectos de supercomputadoras que utilizan el procesador POWER7: