Multi-core processor with a large number of cores
Los procesadores multinúcleo son tipos especiales de procesadores multinúcleo diseñados para un alto grado de procesamiento en paralelo , que contienen numerosos núcleos de procesador independientes más simples (desde unas pocas decenas de núcleos hasta miles o más). Los procesadores multinúcleo se utilizan ampliamente en computadoras integradas y computación de alto rendimiento .
Contraste con la arquitectura multinúcleo
Los procesadores manycore se diferencian de los procesadores multi-core en que están optimizados desde el principio para un mayor grado de paralelismo explícito y para un mayor rendimiento (o menor consumo de energía) a expensas de la latencia y un menor rendimiento de un solo hilo .
La categoría más amplia de procesadores multinúcleo , por el contrario, suele estar diseñada para ejecutar de forma eficiente tanto código paralelo como serial, y por lo tanto pone más énfasis en el alto rendimiento de un solo subproceso (por ejemplo, dedicando más silicio a la ejecución fuera de orden , pipelines más profundos , más unidades de ejecución superescalares y cachés más grandes y generales) y memoria compartida . Estas técnicas dedican recursos de tiempo de ejecución a descubrir el paralelismo implícito en un solo subproceso. Se utilizan en sistemas en los que han evolucionado continuamente (con compatibilidad con versiones anteriores) a partir de procesadores de un solo núcleo. Por lo general, tienen 'unos pocos' núcleos (por ejemplo, 2, 4, 8) y pueden complementarse con un acelerador de muchos núcleos (como una GPU ) en un sistema heterogéneo .
Motivación
La coherencia de la caché es un problema que limita el escalamiento de los procesadores multinúcleo. Los procesadores multinúcleo pueden evitar esto con métodos como el paso de mensajes , [1] memoria de borrador , DMA , [2] espacio de direcciones global particionado , [3] o cachés de solo lectura/no coherentes. Un procesador multinúcleo que utiliza una red en un chip y memorias locales le da al software la oportunidad de optimizar explícitamente la disposición espacial de las tareas (por ejemplo, como se ve en las herramientas desarrolladas para TrueNorth ). [4]
Los procesadores multinúcleo pueden tener más en común (conceptualmente) con tecnologías originadas en la computación de alto rendimiento, como los clústeres y los procesadores vectoriales . [5]
Las GPU pueden considerarse una forma de procesador multinúcleo que tiene múltiples unidades de procesamiento de sombreado y solo es adecuada para código altamente paralelo (alto rendimiento, pero rendimiento de subproceso único extremadamente bajo).
Modelos de programación adecuados
Clases de sistemas multinúcleo
Arquitecturas específicas de varios núcleos
- ZettaScaler [1], módulos japoneses de 2048 núcleos de PEZY Computing
- Coprocesador Xeon Phi , que tiene arquitectura MIC ( Many Integrated Cores )
- Tilera
- Arquitectura Adapteva Epiphany, un chip multinúcleo que utiliza memoria PGAS
- Procesador Coherent Logix hx3100, un procesador DSP/GPP de 100 núcleos basado en la arquitectura HyperX
- Movidius Myriad 2 , una unidad de procesamiento de visión (VPU) de múltiples núcleos
- Kalray , un acelerador PCI-e multinúcleo para tareas con uso intensivo de datos
- Chip de investigación de teraflops , un procesador de múltiples núcleos que utiliza el paso de mensajes
- TrueNorth , un acelerador de IA con una arquitectura de red multinúcleo en un chip
- Matrices verdes, un procesador multinúcleo que utiliza el paso de mensajes destinado a aplicaciones de bajo consumo
- Sunway SW26010 , un procesador multinúcleo de 260 núcleos utilizado en la entonces supercomputadora número uno, Sunway TaihuLight
- SW52020 , una variante mejorada de 520 núcleos [8] [9] de SW26010, con SIMD de 512 bits (que también agrega soporte para media precisión), utilizada en un prototipo, destinada a un sistema de exaescala (y en el futuro un sistema de 10 exaescala), y según datacenterdynamics, se rumorea que China ya tiene dos sistemas de exaescala separados en secreto [ cita requerida ]
- Eyeriss , un procesador multinúcleo diseñado para ejecutar redes neuronales convolucionales para aplicaciones de visión integrada [10]
- Graphcore , un acelerador de IA multinúcleo
Computadoras multinúcleo específicas con más de 1 millón de núcleos de CPU
Una serie de computadoras construidas con procesadores multinúcleo tienen un millón o más de núcleos de CPU individuales. Algunos ejemplos incluyen:
Computadoras específicas con 5 millones o más de núcleos de CPU
Un buen número de supercomputadoras tienen más de 5 millones de núcleos de CPU. Si también hay coprocesadores, por ejemplo, GPU, y esos núcleos no se incluyen en el recuento de núcleos, muchas más computadoras alcanzarían esos objetivos.
- Frontera
- Fugaku , una supercomputadora japonesa que utiliza núcleos Fujitsu A64FX basados en ARM, 7.630.848 en total.
- Sunway TaihuLight , una supercomputadora china masivamente paralela (10 millones de núcleos de CPU) , alguna vez una de las supercomputadoras más rápidas del mundo, que utiliza una arquitectura multinúcleo personalizada. [ cita requerida ] En noviembre de 2018, era la tercera supercomputadora más rápida del mundo (según la clasificación de la lista TOP500 ), obteniendo su rendimiento de 40,960 procesadores multinúcleo SW26010 , cada uno con 256 núcleos.
Véase también
Referencias
- ^ Mattson, Tim (enero de 2010). "El futuro de la computación con muchos núcleos: una historia de dos procesadores" (PDF) .
- ^ Hendry, Gilbert; Kretschmann, Mark. "Procesador celular IBM" (PDF) .
- ^ Olofsson, Andreas; Nordström, Tomas; Ul-Abdin, Zain (2014). "Puesta en marcha de arquitecturas de múltiples núcleos de alto rendimiento y eficiencia energética con Epiphany". arXiv : 1412.5538 [cs.AR].
- ^ Amir, Arnon (11 de junio de 2015). "IBM SyNAPSE Deep Dive Part 3". IBM Research. Archivado desde el original el 21 de diciembre de 2021.
- ^ "arquitectura celular"."La arquitectura Cell no se parece a nada que hayamos visto antes en microprocesadores convencionales; su diseño se acerca más al de las supercomputadoras vectoriales multiprocesador"
- ^ Rick Merritt (20 de junio de 2011), "Los fabricantes de equipos originales muestran sistemas con chips Intel MIC", www.eetimes.com , EE Times
- ^ Barker, J; Bowden, J (2013). "Paralelismo multinúcleo mediante OpenMP". OpenMP en la era de los dispositivos y aceleradores de bajo consumo . IWOMP. Lecture Notes in Computer Science, vol. 8122. Springer. doi :10.1007/978-3-642-40698-0_4.
- ^ Morgan, Timothy Prickett (10 de febrero de 2021). "Un primer vistazo a la supercomputadora de exaescala Sunway de China". The Next Platform . Consultado el 18 de noviembre de 2021 .
- ^ Hemsoth, Nicole (19 de abril de 2021). "El prototipo de supercomputadora a escala exaescala de China prueba cargas de trabajo de IA". The Next Platform . Consultado el 18 de noviembre de 2021 .
- ^ Chen, Yu-Hsin; Krishna, Tushar; Emer, Joel; Sze, Vivienne (2016). "Eyeriss: Un acelerador reconfigurable de bajo consumo energético para redes neuronales convolucionales profundas". IEEE International Solid-State Circuits Conference, ISSCC 2016, Digest of Technical Papers . págs. 262–263.
Enlaces externos
- Soluciones arquitectónicas para el futuro de Manycore, publicado el 19 de febrero de 2010 (más de un enlace roto en la diapositiva)
- Arquitectura Eyeriss