stringtranslate.com

Procesador de múltiples núcleos

Los procesadores multinúcleo son tipos especiales de procesadores multinúcleo diseñados para un alto grado de procesamiento en paralelo , que contienen numerosos núcleos de procesador independientes más simples (desde unas pocas decenas de núcleos hasta miles o más). Los procesadores multinúcleo se utilizan ampliamente en computadoras integradas y computación de alto rendimiento .

Contraste con la arquitectura multinúcleo

Los procesadores manycore se diferencian de los procesadores multi-core en que están optimizados desde el principio para un mayor grado de paralelismo explícito y para un mayor rendimiento (o menor consumo de energía) a expensas de la latencia y un menor rendimiento de un solo hilo .

La categoría más amplia de procesadores multinúcleo , por el contrario, suele estar diseñada para ejecutar de forma eficiente tanto código paralelo como serial, y por lo tanto pone más énfasis en el alto rendimiento de un solo subproceso (por ejemplo, dedicando más silicio a la ejecución fuera de orden , pipelines más profundos , más unidades de ejecución superescalares y cachés más grandes y generales) y memoria compartida . Estas técnicas dedican recursos de tiempo de ejecución a descubrir el paralelismo implícito en un solo subproceso. Se utilizan en sistemas en los que han evolucionado continuamente (con compatibilidad con versiones anteriores) a partir de procesadores de un solo núcleo. Por lo general, tienen 'unos pocos' núcleos (por ejemplo, 2, 4, 8) y pueden complementarse con un acelerador de muchos núcleos (como una GPU ) en un sistema heterogéneo .

Motivación

La coherencia de la caché es un problema que limita el escalamiento de los procesadores multinúcleo. Los procesadores multinúcleo pueden evitar esto con métodos como el paso de mensajes , [1] memoria de borrador , DMA , [2] espacio de direcciones global particionado , [3] o cachés de solo lectura/no coherentes. Un procesador multinúcleo que utiliza una red en un chip y memorias locales le da al software la oportunidad de optimizar explícitamente la disposición espacial de las tareas (por ejemplo, como se ve en las herramientas desarrolladas para TrueNorth ). [4]

Los procesadores multinúcleo pueden tener más en común (conceptualmente) con tecnologías originadas en la computación de alto rendimiento, como los clústeres y los procesadores vectoriales . [5]

Las GPU pueden considerarse una forma de procesador multinúcleo que tiene múltiples unidades de procesamiento de sombreado y solo es adecuada para código altamente paralelo (alto rendimiento, pero rendimiento de subproceso único extremadamente bajo).

Modelos de programación adecuados

Clases de sistemas multinúcleo

Arquitecturas específicas de varios núcleos

Computadoras multinúcleo específicas con más de 1 millón de núcleos de CPU

Una serie de computadoras construidas con procesadores multinúcleo tienen un millón o más de núcleos de CPU individuales. Algunos ejemplos incluyen:

Computadoras específicas con 5 millones o más de núcleos de CPU

Un buen número de supercomputadoras tienen más de 5 millones de núcleos de CPU. Si también hay coprocesadores, por ejemplo, GPU, y esos núcleos no se incluyen en el recuento de núcleos, muchas más computadoras alcanzarían esos objetivos.

Véase también

Referencias

  1. ^ Mattson, Tim (enero de 2010). "El futuro de la computación con muchos núcleos: una historia de dos procesadores" (PDF) .
  2. ^ Hendry, Gilbert; Kretschmann, Mark. "Procesador celular IBM" (PDF) .
  3. ^ Olofsson, Andreas; Nordström, Tomas; Ul-Abdin, Zain (2014). "Puesta en marcha de arquitecturas de múltiples núcleos de alto rendimiento y eficiencia energética con Epiphany". arXiv : 1412.5538 [cs.AR].
  4. ^ Amir, Arnon (11 de junio de 2015). "IBM SyNAPSE Deep Dive Part 3". IBM Research. Archivado desde el original el 21 de diciembre de 2021.
  5. ^ "arquitectura celular"."La arquitectura Cell no se parece a nada que hayamos visto antes en microprocesadores convencionales; su diseño se acerca más al de las supercomputadoras vectoriales multiprocesador"
  6. ^ Rick Merritt (20 de junio de 2011), "Los fabricantes de equipos originales muestran sistemas con chips Intel MIC", www.eetimes.com , EE Times
  7. ^ Barker, J; Bowden, J (2013). "Paralelismo multinúcleo mediante OpenMP". OpenMP en la era de los dispositivos y aceleradores de bajo consumo . IWOMP. Lecture Notes in Computer Science, vol. 8122. Springer. doi :10.1007/978-3-642-40698-0_4.
  8. ^ Morgan, Timothy Prickett (10 de febrero de 2021). "Un primer vistazo a la supercomputadora de exaescala Sunway de China". The Next Platform . Consultado el 18 de noviembre de 2021 .
  9. ^ Hemsoth, Nicole (19 de abril de 2021). "El prototipo de supercomputadora a escala exaescala de China prueba cargas de trabajo de IA". The Next Platform . Consultado el 18 de noviembre de 2021 .
  10. ^ Chen, Yu-Hsin; Krishna, Tushar; Emer, Joel; Sze, Vivienne (2016). "Eyeriss: Un acelerador reconfigurable de bajo consumo energético para redes neuronales convolucionales profundas". IEEE International Solid-State Circuits Conference, ISSCC 2016, Digest of Technical Papers . págs. 262–263.

Enlaces externos