stringtranslate.com

Chip de investigación de teraflops

Intel Teraflops Research Chip (nombre en código Polaris ) es un procesador multinúcleo de investigación que contiene 80 núcleos , que utiliza una arquitectura de red en chip , desarrollado por el Programa de investigación de computación a escala tera de Intel . [1] Se fabricó utilizando un proceso CMOS de 65 nm con ocho capas de interconexión de cobre y contiene 100 millones de transistores en una matriz de 275 mm 2 . [2] [3] [4] Su objetivo de diseño era demostrar una arquitectura modular capaz de un rendimiento sostenido de 1,0 TFLOPS mientras disipa menos de 100 W. [3] La investigación del proyecto se incorporó posteriormente a Xeon Phi . El líder técnico del proyecto fue Sriram R. Vangal. [4]

El procesador se presentó inicialmente en el Intel Developer Forum el 26 de septiembre de 2006 [5] y se anunció oficialmente el 11 de febrero de 2007. [6] Se presentó un chip funcional en la Conferencia Internacional de Circuitos de Estado Sólido IEEE de 2007 , junto con especificaciones técnicas. [2]

Arquitectura

El chip consta de una red de malla 2D de 10x8 núcleos y funciona nominalmente a 4 GHz. [nb 1] Cada núcleo, llamado mosaico (3 mm 2 ), contiene un motor de procesamiento y un enrutador conmutado por agujero de gusano de 5 puertos (0,34 mm 2 ) con interfaces mesócronas , con un ancho de banda de 80 GB/s y una latencia de 1,25 ns a 4 GHz. [2] El motor de procesamiento de cada mosaico contiene dos unidades independientes de canalización de 9 etapas , multiplicador acumulador de punto flotante de precisión simple (FPMAC), 3 KB de memoria de instrucciones de ciclo único y 2 KB de memoria de datos. [3] Cada unidad FPMAC es capaz de realizar 2 operaciones de punto flotante de precisión simple por ciclo . Por tanto, cada mosaico tiene un rendimiento máximo estimado de 16 GFLOPS en la configuración estándar de 4 GHz. Una palabra de instrucción muy larga (VLIW) de 96 bits codifica hasta ocho operaciones por ciclo. [3] El conjunto de instrucciones personalizado incluye instrucciones para enviar y recibir paquetes hacia/desde la red del chip, así como instrucciones para poner en reposo y despertar un mosaico en particular. [4] Debajo de cada mosaico, se apiló en 3D un módulo SRAM de 256 KB (nombre en código Freya ) , acercando así la memoria al procesador para aumentar el ancho de banda de memoria general a 1 TB/s, a expensas de un mayor costo, estrés térmico y latencia, y una pequeña capacidad total de 20 MB. [7] Se demostró que la red de Polaris tiene un ancho de banda de bisección de 1,6 Tbit/s a 3,16 GHz y 2,92 Tbit/s a 5,67 GHz. [8]

Diagrama de mosaico del chip de investigación Teraflops.

Otras características destacadas del chip Teraflops Research incluyen su gestión de energía de grano fino con 21 regiones de suspensión independientes en un mosaico y suspensión de mosaico dinámica, y una eficiencia energética muy alta con un pico teórico de 27 GFLOPS/W a 0,6 V y 19,4 GFLOPS/W reales para plantilla a 0,75 V. [4] [9]

Asuntos

Intel se propuso ayudar al desarrollo de software para la nueva arquitectura exótica creando un nuevo modelo de programación , especialmente para el chip, llamado Ct . El modelo nunca tuvo el apoyo que Intel esperaba y finalmente se incorporó a Intel Array Building Blocks , una biblioteca C++ ahora descontinuada.

Véase también

Notas

  1. ^ Aunque posteriormente Intel demostró que el chip podía funcionar a una velocidad de hasta 5,67 GHz.
  2. ^ A 1,07 V y 4,27 GHz.
  3. ^ Todas las mediciones presentan el rendimiento con los 80 núcleos activos.
  4. ^ En 2008 se lograron frecuencias sustancialmente más altas con los mismos voltajes (en comparación con el informe inicial de ISSCC) con el uso de una solución de enfriamiento personalizada.
  5. ^ Los valores en cursiva fueron extrapolados por , donde la frecuencia máxima se extrajo manualmente de los gráficos y, por lo tanto, son solo aproximados en su naturaleza.
  6. ^ Los valores en cursiva se extrajeron manualmente de los gráficos y, por lo tanto, son solo aproximados en su naturaleza.

Referencias

  1. ^ Intel Corporation . «Teraflops Research Chip». Archivado desde el original el 22 de julio de 2010.
  2. ^ abcdefghijkl Vangal, Sriram; Howard, Jason; Ruhl, Gregory; Dighe, Saurabh; Wilson, Howard; Tschanz, James; Finan, David; Iyer, Priya; Singh, Arvind; Jacob, Tiju; Jain, Shailendra (2007). "Una red en chip de 80 mosaicos y 1,28 TFLOPS en CMOS de 65 nm". Conferencia internacional de circuitos de estado sólido IEEE de 2007. Compendio de artículos técnicos . págs. 98–589. doi :10.1109/ISSCC.2007.373606. ISBN. 978-1-4244-0852-8.S2CID20065641  .​
  3. ^ abcd Peh, Li-Shiuan; Keckler, Stephen W.; Vangal, Sriram (2009), Keckler, Stephen W.; Olukotun, Kunle; Hofstee, H. Peter (eds.), "Redes en chip para sistemas multinúcleo", Procesadores y sistemas multinúcleo , Springer US, págs. 35–71, Bibcode :2009mps..book...35P, doi :10.1007/978-1-4419-0263-4_2, ISBN 978-1-4419-0262-7, consultado el 14 de mayo de 2020
  4. ^ abcdefghijklmnopqrstu Vangal, SR; Howard, J.; Ruhl, G.; Dighe, S.; Wilson, H.; Tschanz, J.; Finán, D.; Singh, A.; Jacob, T.; Jainista, S.; Erraguntla, V. (2008). "Un procesador TeraFLOPS de 80 mosaicos de menos de 100 W en CMOS de 65 nm". Revista IEEE de circuitos de estado sólido . 43 (1): 29–41. Código Bib : 2008IJSSC..43...29V. doi :10.1109/JSSC.2007.910957. ISSN  0018-9200. S2CID  15672087.
  5. ^ "Intel desarrolla chips de investigación a escala de terabytes". Comunicado de prensa de Intel . 2006.
  6. ^ Intel Corporation (11 de febrero de 2007). "Intel Research Advances 'Era Of Tera'". Sala de prensa de Intel . Archivado desde el original el 13 de abril de 2009.
  7. ^ Bautista, Jerry (2008). Computación a escala de tera y desafíos de interconexión: consideraciones sobre apilamiento 3D. Simposio IEEE Hot Chips 2008 (HCS). Stanford, CA, EE. UU.: IEEE. pp. 1–34. doi :10.1109/HOTCHIPS.2008.7476514. ISBN. 978-1-4673-8871-9. Número de identificación S2C:  26400101.
  8. ^ Chip de investigación de Teraflops de Intel (PDF) . Intel Corporation . 2007. Archivado desde el original (PDF) el 18 de febrero de 2020.
  9. ^ Fossum, Tryggve (2007). MPSOC de gama alta: la supercomputadora personal (PDF) . Conferencia MPSoC 2007. p. 6.