Chip de investigación de teraflops

Intel Teraflops Research Chip (nombre en código Polaris ) es un procesador multinúcleo de investigación que contiene 80 núcleos , que utiliza una arquitectura de red en chip , desarrollado por el Programa de investigación de computación a escala tera de Intel . ^[1] Se fabricó utilizando un proceso CMOS de 65 nm con ocho capas de interconexión de cobre y contiene 100 millones de transistores en una matriz de 275 mm ² . ^[2]^[3]^[4] Su objetivo de diseño era demostrar una arquitectura modular capaz de un rendimiento sostenido de 1,0 TFLOPS mientras disipa menos de 100 W. ^[3] La investigación del proyecto se incorporó posteriormente a Xeon Phi . El líder técnico del proyecto fue Sriram R. Vangal. ^[4]

El procesador se presentó inicialmente en el Intel Developer Forum el 26 de septiembre de 2006 ^[5] y se anunció oficialmente el 11 de febrero de 2007. ^[6] Se presentó un chip funcional en la Conferencia Internacional de Circuitos de Estado Sólido IEEE de 2007 , junto con especificaciones técnicas. ^[2]

Arquitectura

El chip consta de una red de malla 2D de 10x8 núcleos y funciona nominalmente a 4 GHz. ^{[nb 1]} Cada núcleo, llamado mosaico (3 mm ^{2 ), contiene un motor de procesamiento y un enrutador}conmutado por agujero de gusano de 5 puertos (0,34 mm ² ) con interfaces mesócronas , con un ancho de banda de 80 GB/s y una latencia de 1,25 ns a 4 GHz. ^{[2] El motor de procesamiento de cada mosaico contiene dos unidades independientes}de canalización de 9 etapas , multiplicador acumulador de punto flotante de precisión simple (FPMAC), 3 KB de memoria de instrucciones de ciclo único y 2 KB de memoria de datos. ^[3] Cada unidad FPMAC es capaz de realizar 2 operaciones de punto flotante de precisión simple por ciclo . Por tanto, cada mosaico tiene un rendimiento máximo estimado de 16 GFLOPS en la configuración estándar de 4 GHz. Una palabra de instrucción muy larga (VLIW) de 96 bits codifica hasta ocho operaciones por ciclo. ^[3] El conjunto de instrucciones personalizado incluye instrucciones para enviar y recibir paquetes hacia/desde la red del chip, así como instrucciones para poner en reposo y despertar un mosaico en particular. ^[4] Debajo de cada mosaico, se apiló en 3D un módulo SRAM de 256 KB (nombre en código Freya ) , acercando así la memoria al procesador para aumentar el ancho de banda de memoria general a 1 TB/s, a expensas de un mayor costo, estrés térmico y latencia, y una pequeña capacidad total de 20 MB. ^[7] Se demostró que la red de Polaris tiene un ancho de banda de bisección de 1,6 Tbit/s a 3,16 GHz y 2,92 Tbit/s a 5,67 GHz. ^[8]

Otras características destacadas del chip Teraflops Research incluyen su gestión de energía de grano fino con 21 regiones de suspensión independientes en un mosaico y suspensión de mosaico dinámica, y una eficiencia energética muy alta con un pico teórico de 27 GFLOPS/W a 0,6 V y 19,4 GFLOPS/W reales para plantilla a 0,75 V. ^[4]^[9]

Asuntos

Intel se propuso ayudar al desarrollo de software para la nueva arquitectura exótica creando un nuevo modelo de programación , especialmente para el chip, llamado Ct . El modelo nunca tuvo el apoyo que Intel esperaba y finalmente se incorporó a Intel Array Building Blocks , una biblioteca C++ ahora descontinuada.

Véase también

Notas

^ Aunque posteriormente Intel demostró que el chip podía funcionar a una velocidad de hasta 5,67 GHz.
^ A 1,07 V y 4,27 GHz.
^ Todas las mediciones presentan el rendimiento con los 80 núcleos activos.
^ En 2008 se lograron frecuencias sustancialmente más altas con los mismos voltajes (en comparación con el informe inicial de ISSCC) con el uso de una solución de enfriamiento personalizada.
^ Los valores en cursiva fueron extrapolados por , donde la frecuencia máxima se extrajo manualmente de los gráficos y, por lo tanto, son solo aproximados en su naturaleza. ${\text{FLOPS}}_{pico}=f_{máx}\cdot 80{\text{ mosaicos}}\cdot 2{\tfrac {\text{FPMAC}}{\text{mosaico}}}\cdot 2{\tfrac {\text{FLOPS}}{{\text{FPMAC}}\cdot {\text{ciclo}}}}$
^ Los valores en cursiva se extrajeron manualmente de los gráficos y, por lo tanto, son solo aproximados en su naturaleza.

Referencias

^ Intel Corporation . «Teraflops Research Chip». Archivado desde el original el 22 de julio de 2010.
^ abcdefghijkl Vangal, Sriram; Howard, Jason; Ruhl, Gregory; Dighe, Saurabh; Wilson, Howard; Tschanz, James; Finan, David; Iyer, Priya; Singh, Arvind; Jacob, Tiju; Jain, Shailendra (2007). "Una red en chip de 80 mosaicos y 1,28 TFLOPS en CMOS de 65 nm". Conferencia internacional de circuitos de estado sólido IEEE de 2007. Compendio de artículos técnicos . págs. 98–589. doi :10.1109/ISSCC.2007.373606. ISBN. 978-1-4244-0852-8.S2CID20065641 .
^ abcd Peh, Li-Shiuan; Keckler, Stephen W.; Vangal, Sriram (2009), Keckler, Stephen W.; Olukotun, Kunle; Hofstee, H. Peter (eds.), "Redes en chip para sistemas multinúcleo", Procesadores y sistemas multinúcleo , Springer US, págs. 35–71, Bibcode :2009mps..book...35P, doi :10.1007/978-1-4419-0263-4_2, ISBN 978-1-4419-0262-7, consultado el 14 de mayo de 2020
^ abcdefghijklmnopqrstu Vangal, SR; Howard, J.; Ruhl, G.; Dighe, S.; Wilson, H.; Tschanz, J.; Finán, D.; Singh, A.; Jacob, T.; Jainista, S.; Erraguntla, V. (2008). "Un procesador TeraFLOPS de 80 mosaicos de menos de 100 W en CMOS de 65 nm". Revista IEEE de circuitos de estado sólido . 43 (1): 29–41. Código Bib : 2008IJSSC..43...29V. doi :10.1109/JSSC.2007.910957. ISSN 0018-9200. S2CID 15672087.
^ "Intel desarrolla chips de investigación a escala de terabytes". Comunicado de prensa de Intel . 2006.
^ Intel Corporation (11 de febrero de 2007). "Intel Research Advances 'Era Of Tera'". Sala de prensa de Intel . Archivado desde el original el 13 de abril de 2009.
^ Bautista, Jerry (2008). Computación a escala de tera y desafíos de interconexión: consideraciones sobre apilamiento 3D. Simposio IEEE Hot Chips 2008 (HCS). Stanford, CA, EE. UU.: IEEE. pp. 1–34. doi :10.1109/HOTCHIPS.2008.7476514. ISBN. 978-1-4673-8871-9. Número de identificación S2C: 26400101.
^ Chip de investigación de Teraflops de Intel (PDF) . Intel Corporation . 2007. Archivado desde el original (PDF) el 18 de febrero de 2020.
^ Fossum, Tryggve (2007). MPSOC de gama alta: la supercomputadora personal (PDF) . Conferencia MPSoC 2007. p. 6.