stringtranslate.com

Sunway SW26010

El SW26010 es un procesador multinúcleo de 260 núcleos diseñado por el Centro de Promoción de la Industria y Tecnología de Circuitos Integrados de Shanghái (ICC para abreviar) ( chino : 上海集成电路技术与产业促进中心 (简称ICC)). Implementa la arquitectura Sunway , una arquitectura de computación de conjunto de instrucciones reducidas (RISC) de 64 bits diseñada en China . [1] El SW26010 tiene cuatro clústeres de 64 elementos de procesamiento de cómputo (CPE) que están dispuestos en una matriz de ocho por ocho. Los CPE admiten instrucciones SIMD y son capaces de realizar ocho operaciones de punto flotante de doble precisión por ciclo. Cada clúster está acompañado por un núcleo de propósito general más convencional llamado Elemento de procesamiento de gestión (MPE) que proporciona funciones de supervisión. [1] Cada clúster tiene su propio controlador SDRAM DDR3 dedicado y un banco de memoria con su propio espacio de direcciones . [2] [3] El procesador funciona a una velocidad de reloj de 1,45 GHz. [4]

Los núcleos CPE cuentan con 64  KB de memoria scratchpad para datos y 16 KB para instrucciones , y se comunican a través de una red en un chip , en lugar de tener una jerarquía de caché tradicional . [5] Los MPE tienen una configuración más tradicional, con 32 KB de cachés de instrucciones y datos L1 y un caché L2 de 256 KB . [1] Finalmente, la red en chip se conecta a una única interfaz de interconexión del sistema que conecta el chip con el mundo exterior.

El SW26010 se utiliza en la supercomputadora Sunway TaihuLight , que entre marzo y junio de 2018, fue la supercomputadora más rápida del mundo según la clasificación del proyecto TOP500 . [6] El sistema utiliza 40.960 SW26010 para obtener 93,01  PFLOPS en el punto de referencia LINPACK .

Sucesor: SW26010P

SW26010P incluye 6 grupos de núcleos (CG), cada uno de los cuales incluye un elemento de procesamiento de gestión (MPE) y un clúster de elementos de procesamiento de computación (CPE) de 8x8. Cada CG tiene su controlador de memoria (MC), que se conecta a 16 GB de memoria DDR4 con un ancho de banda de 51,2 GB/s. El intercambio de datos entre cada dos CPE en el mismo clúster de CPE se logra a través de la interfaz de acceso a memoria remota (RMA) (un reemplazo de la característica de comunicación de registros en la generación anterior). Cada CPE tiene una memoria de datos local (LDM) rápida de 256 KB. Cada procesador SW26010P consta de 390 elementos de procesamiento. [7]

Véase también

Referencias

  1. ^ abc Dongarra, Jack (20 de junio de 2016). "Informe sobre el sistema Sunway TaihuLight" (PDF) . www.netlib.org . Consultado el 20 de junio de 2016 .
  2. ^ Fu, Haohuan; Liao, Junfeng; Yang, Jinzhe; et al. (2016). "La supercomputadora Sunway TaihuLight: sistema y aplicaciones". Ciencia. Inf. China. Ciencia . 59 (7). doi : 10.1007/s11432-016-5588-7 .
  3. ^ Trader, Tiffany (19 de junio de 2016). "China presenta el 'Sunway' de 93 petaflops con procesadores de cosecha propia". HPC Wire . Consultado el 21 de junio de 2016 . Cada núcleo del CPE tiene una única tubería de punto flotante que puede realizar 8 flops por ciclo por núcleo (aritmética de punto flotante de 64 bits) y el MPE tiene una tubería dual, cada una de las cuales puede realizar 8 flops por ciclo por tubería (aritmética de punto flotante de 64 bits).
  4. ^ Hemsoth, Nicole (20 de junio de 2016). "Una mirada al interior de la nueva supercomputadora china que encabeza las listas". The Next Platform . Consultado el 20 de junio de 2016 .
  5. ^ Lendino, Jamie (20 de junio de 2016). "Conoce la nueva supercomputadora más rápida del mundo: la TaihuLight de China". Extremetech . Consultado el 21 de junio de 2016. El informe TOP500 decía que el chip también carece de cualquier caché L1-L2-L3 tradicional y, en su lugar, tiene 12 KB de caché de instrucciones y 64 KB de "borrador local" que funciona como una especie de caché L1.
  6. ^ "Top 500 The List: noviembre de 2016". TOP 500 . 14 de noviembre de 2016 . Consultado el 26 de noviembre de 2016 .
  7. ^ Liu, Yong (Alejandro); Liu, Xin (Lucy); Li, colmillo (Nancy); Fu, Haohuan; Yang, Yuling; Canción, Jiawei; Zhao, Pengpeng; Wang, Zhen; Peng, Dajia; Chen, Huarong; Guo, Chu; Huang, Heliang; Wu, Wenzhao; Chen, Dexun (2021). "Cerrar la brecha de la" supremacía cuántica ". Actas de la Conferencia Internacional sobre Computación, Redes, Almacenamiento y Análisis de Alto Rendimiento . págs. 1–12. doi :10.1145/3458817.3487399. ISBN 9781450384421.S2CID239036985  .​