stringtranslate.com

Procesador de muchos núcleos

Los procesadores Manycore son tipos especiales de procesadores multinúcleo diseñados para un alto grado de procesamiento paralelo , que contienen numerosos núcleos de procesador independientes y más simples (desde unas pocas decenas de núcleos hasta miles o más). Los procesadores Manycore se utilizan ampliamente en computadoras integradas y en computación de alto rendimiento .

Contraste con la arquitectura multinúcleo

Los procesadores Manycore se diferencian de los procesadores multinúcleo en que están optimizados desde el principio para un mayor grado de paralelismo explícito y para un mayor rendimiento (o menor consumo de energía) a expensas de la latencia y un menor rendimiento de un solo subproceso .

Por el contrario, la categoría más amplia de procesadores multinúcleo suele estar diseñada para ejecutar eficientemente código tanto en paralelo como en serie y, por lo tanto, pone más énfasis en un alto rendimiento de un solo subproceso (por ejemplo, dedicar más silicio a la ejecución fuera de orden , canalizaciones más profundas , unidades de ejecución más superescalares y cachés más grandes y generales) y memoria compartida . Estas técnicas dedican recursos de tiempo de ejecución a descubrir el paralelismo implícito en un solo hilo. Se utilizan en sistemas donde han evolucionado continuamente (con compatibilidad con versiones anteriores) a partir de procesadores de un solo núcleo. Por lo general, tienen "unos pocos" núcleos (por ejemplo, 2, 4, 8) y pueden complementarse con un acelerador de muchos núcleos (como una GPU ) en un sistema heterogéneo .

Motivación

La coherencia de la caché es un problema que limita el escalado de los procesadores multinúcleo. Los procesadores Manycore pueden evitar esto con métodos tales como paso de mensajes , [1] memoria temporal , DMA , [2] espacio de direcciones global particionado , [3] o cachés de solo lectura/no coherentes. Un procesador de muchos núcleos que utiliza una red en un chip y memorias locales brinda al software la oportunidad de optimizar explícitamente el diseño espacial de las tareas (por ejemplo, como se ve en las herramientas desarrolladas para TrueNorth ). [4]

Los procesadores de muchos núcleos pueden tener más en común (conceptualmente) con tecnologías originadas en la informática de alto rendimiento, como los clústeres y los procesadores vectoriales . [5]

Las GPU pueden considerarse una forma de procesador de muchos núcleos que tiene múltiples unidades de procesamiento de sombreado y que solo son adecuadas para código altamente paralelo (alto rendimiento, pero rendimiento de un solo subproceso extremadamente pobre).

Modelos de programación adecuados

Clases de sistemas de muchos núcleos.

Arquitecturas de muchos núcleos específicas

Computadoras de muchos núcleos específicas con más de 1 millón de núcleos de CPU

Varias computadoras construidas con procesadores multinúcleo tienen un millón o más de núcleos de CPU individuales. Ejemplos incluyen:

Computadoras específicas con 5 millones o más de núcleos de CPU

Un buen número de supercomputadoras tienen más de 5 millones de núcleos de CPU. Cuando también hay coprocesadores, por ejemplo, se utilizan GPU, esos núcleos no figuran en el recuento de núcleos, entonces bastantes computadoras más alcanzarían esos objetivos.

Ver también

Referencias

  1. ^ Mattson, Tim (enero de 2010). "El futuro de la informática con muchos núcleos: una historia de dos procesadores" (PDF) .
  2. ^ Hendry, Gilbert; Kretschmann, Mark. "Procesador celular IBM" (PDF) .
  3. ^ Olofsson, Andreas; Nordström, Tomas; Ul-Abdin, Zain (2014). "Impulsar arquitecturas Manycore de alto rendimiento y eficiencia energética con Epiphany". arXiv : 1412.5538 [cs.AR].
  4. ^ Amir, Arnon (11 de junio de 2015). "Análisis profundo de IBM SyNAPSE, parte 3". Investigación de IBM. Archivado desde el original el 21 de diciembre de 2021.
  5. ^ "arquitectura celular"."La arquitectura Cell no se parece a nada que hayamos visto nunca en microprocesadores básicos; su diseño se acerca más a los superordenadores vectoriales multiprocesadores"
  6. ^ Rick Merritt (20 de junio de 2011), "Los OEM muestran sistemas con chips Intel MIC", www.eetimes.com , EE Times
  7. ^ Barker, J; Bowden, J (2013). "Paralelismo de muchos núcleos a través de OpenMP". OpenMP en la era de los dispositivos y aceleradores de bajo consumo . YOMP. Apuntes de conferencias sobre informática, vol 8122. Springer. doi :10.1007/978-3-642-40698-0_4.
  8. ^ Morgan, Timothy Prickett (10 de febrero de 2021). "Un primer vistazo a la supercomputadora de exaescala Sunway de China". La próxima plataforma . Consultado el 18 de noviembre de 2021 .
  9. ^ Hemsoth, Nicole (19 de abril de 2021). "La supercomputadora prototipo de exaescala de China prueba cargas de trabajo de IA". La próxima plataforma . Consultado el 18 de noviembre de 2021 .
  10. ^ Chen, Yu-Hsin; Krishna, Tushar; Emer, Joel; Sze, Vivienne (2016). "Eyeriss: un acelerador reconfigurable de bajo consumo para redes neuronales convolucionales profundas". Conferencia internacional de circuitos de estado sólido del IEEE, ISSCC 2016, resumen de artículos técnicos . págs. 262-263.

enlaces externos