stringtranslate.com

Chip de investigación Teraflops

El chip de investigación Intel Teraflops (nombre en código Polaris ) es un procesador de investigación de muchos núcleos que contiene 80 núcleos , que utiliza una arquitectura de red en chip , desarrollado por el Programa de investigación de computación Tera-Scale de Intel . [1] Fue fabricado utilizando un proceso CMOS de 65 nm con ocho capas de interconexión de cobre y contiene 100 millones de transistores en una matriz de 275 mm 2 . [2] [3] [4] Su objetivo de diseño era demostrar una arquitectura modular capaz de un rendimiento sostenido de 1,0 TFLOPS mientras disipaba menos de 100 W. [3] La investigación del proyecto se incorporó posteriormente a Xeon Phi . El líder técnico del proyecto fue Sriram R. Vangal. [4]

El procesador se presentó inicialmente en el Foro de desarrolladores Intel el 26 de septiembre de 2006 [5] y se anunció oficialmente el 11 de febrero de 2007. [6] Se presentó un chip funcional en la Conferencia Internacional de Circuitos de Estado Sólido IEEE de 2007 , junto con las especificaciones técnicas. [2]

Arquitectura

El chip consta de una red de núcleos de malla 2D de 10x8 y nominalmente funciona a 4 GHz. [nb 1] Cada núcleo, llamado mosaico (3 mm 2 ), contiene un motor de procesamiento y un enrutador conmutado por agujero de gusano de 5 puertos (0,34 mm 2 ) con interfaces mesócronas , con un ancho de banda de 80 GB/s y una latencia de 1,25 ns a 4 GHz. [2] El motor de procesamiento en cada mosaico contiene dos unidades independientes de acumulación múltiple de punto flotante de punto flotante (FPMAC) de 9 etapas independientes , 3 KB de memoria de instrucciones de ciclo único y 2 KB de memoria de datos. [3] Cada unidad FPMAC es capaz de realizar 2 operaciones de punto flotante de precisión simple por ciclo . Por lo tanto, cada mosaico tiene un rendimiento máximo estimado de 16 GFLOPS en la configuración estándar de 4 GHz. Una palabra de instrucción muy larga (VLIW) de 96 bits codifica hasta ocho operaciones por ciclo. [3] El conjunto de instrucciones personalizadas incluye instrucciones para enviar y recibir paquetes hacia/desde la red del chip y también instrucciones para dormir y reactivar un mosaico en particular. [4] Debajo de cada mosaico, se apiló en 3D un módulo SRAM de 256 KB (con nombre en código Freya ) , acercando así la memoria al procesador para aumentar el ancho de banda general de la memoria a 1 TB/s, a expensas de un mayor costo, estrés térmico y latencia. y una pequeña capacidad total de 20 MB. [7] Se demostró que la red de Polaris tiene un ancho de banda de bisección de 1,6 Tbit/s a 3,16 GHz y 2,92 Tbit/s a 5,67 GHz. [8]

Diagrama de mosaicos del chip de investigación Teraflops.

Otras características destacadas del chip Teraflops Research incluyen su administración de energía detallada con 21 regiones de suspensión independientes en un mosaico y suspensión dinámica de mosaicos, y una eficiencia energética muy alta con un pico teórico de 27 GFLOPS/W a 0,6 V y 19,4 GFLOPS/W reales para plantilla a 0,75 V. [4] [9]

Asuntos

Intel tenía como objetivo ayudar al desarrollo de software para la nueva arquitectura exótica mediante la creación de un nuevo modelo de programación , especialmente para el chip, llamado Ct . El modelo nunca obtuvo lo que Intel esperaba y finalmente se incorporó a Intel Array Building Blocks , una biblioteca de C++ ahora desaparecida.

Ver también

Notas

  1. ^ Aunque Intel demostró más tarde que el chip alcanzaba los 5,67 GHz.
  2. ^ A 1,07 V y 4,27 GHz.
  3. ^ Todas las mediciones presentan el rendimiento con los 80 núcleos activos.
  4. ^ En 2008 se lograron frecuencias sustancialmente más altas con los mismos voltajes (en comparación con el informe inicial de la ISSCC) con el uso de una solución de enfriamiento personalizada.
  5. ^ Los valores en cursiva fueron extrapolados por , donde la frecuencia máxima se extrajo manualmente de los gráficos y, por lo tanto, son solo de naturaleza aproximada.
  6. ^ Los valores en cursiva se extrajeron manualmente de los gráficos y, por lo tanto, son solo de naturaleza aproximada.

Referencias

  1. ^ Corporación Intel . "Chip de investigación de Teraflops". Archivado desde el original el 22 de julio de 2010.
  2. ^ abcdefghijkl Vangal, Sriram; Howard, Jason; Ruhl, Gregorio; Dighe, Saurabh; Wilson, Howard; Tschanz, James; Finán, David; Iyer, Priya; Singh, Arvind; Jacob, Tiju; Jainista, Shailendra (2007). "Una red en chip de 1,28 TFLOPS de 80 mosaicos en CMOS de 65 nm". Conferencia internacional de circuitos de estado sólido IEEE 2007. Compendio de artículos técnicos . págs. 98–589. doi :10.1109/ISSCC.2007.373606. ISBN 978-1-4244-0852-8. S2CID  20065641.
  3. ^ abcd Peh, Li-Shiuan; Keckler, Stephen W.; Vangal, Sriram (2009), Keckler, Stephen W.; Olukotun, Kunle; Hofstee, H. Peter (eds.), "Redes en chip para sistemas multinúcleo", Procesadores y sistemas multinúcleo , Springer EE. UU., págs. 35–71, Bibcode :2009mps..book...35P, doi :10.1007/978 -1-4419-0263-4_2, ISBN 978-1-4419-0262-7, recuperado el 14 de mayo de 2020
  4. ^ abcdefghijklmnopqrstu Vangal, SR; Howard, J.; Ruhl, G.; Dighe, S.; Wilson, H.; Tschanz, J.; Finán, D.; Singh, A.; Jacob, T.; Jainista, S.; Erraguntla, V. (2008). "Un procesador TeraFLOPS de 80 mosaicos de menos de 100 W en CMOS de 65 nm". Revista IEEE de circuitos de estado sólido . 43 (1): 29–41. Código Bib : 2008IJSSC..43...29V. doi :10.1109/JSSC.2007.910957. ISSN  0018-9200. S2CID  15672087.
  5. ^ "Intel desarrolla chips de investigación a escala Tera". Comunicado de prensa de Intel . 2006.
  6. ^ Intel Corporation (11 de febrero de 2007). "La investigación de Intel avanza en la era de Tera'". Sala de prensa de Intel . Archivado desde el original el 13 de abril de 2009.
  7. ^ Bautista, Jerry (2008). Desafíos de interconexión y computación a escala Tera: consideraciones de apilamiento 3D. 2008 Simposio IEEE Hot Chips 20 (HCS). Stanford, California, Estados Unidos: IEEE. págs. 1–34. doi :10.1109/HOTCIPS.2008.7476514. ISBN 978-1-4673-8871-9. S2CID  26400101.
  8. ^ Chip de investigación Teraflops de Intel (PDF) . Corporación Intel . 2007. Archivado desde el original (PDF) el 18 de febrero de 2020.
  9. ^ Fossum, Tryggve (2007). MPSOC de gama alta: la supercomputadora personal (PDF) . Conferencia MPSoC 2007. p. 6.