Multi-core processor with a large number of cores
Los procesadores multinúcleo son tipos especiales de procesadores multinúcleo diseñados para un alto grado de procesamiento en paralelo , que contienen numerosos núcleos de procesador independientes más simples (desde unas pocas decenas de núcleos hasta miles o más). Los procesadores multinúcleo se utilizan ampliamente en computadoras integradas y computación de alto rendimiento .
Contraste con la arquitectura multinúcleo
Los procesadores manycore se diferencian de los procesadores multi-core en que están optimizados desde el principio para un mayor grado de paralelismo explícito y para un mayor rendimiento (o menor consumo de energía) a expensas de la latencia y un menor rendimiento de un solo hilo .
La categoría más amplia de procesadores multinúcleo , por el contrario, suele estar diseñada para ejecutar de forma eficiente tanto código paralelo como serial, y por lo tanto pone más énfasis en el alto rendimiento de un solo subproceso (por ejemplo, dedicando más silicio a la ejecución fuera de orden , pipelines más profundos , más unidades de ejecución superescalares y cachés más grandes y generales) y memoria compartida . Estas técnicas dedican recursos de tiempo de ejecución a descubrir el paralelismo implícito en un solo subproceso. Se utilizan en sistemas en los que han evolucionado continuamente (con compatibilidad con versiones anteriores) a partir de procesadores de un solo núcleo. Por lo general, tienen 'unos pocos' núcleos (por ejemplo, 2, 4, 8) y pueden complementarse con un acelerador de muchos núcleos (como una GPU ) en un sistema heterogéneo .
Motivación
La coherencia de la caché es un problema que limita el escalamiento de los procesadores multinúcleo. Los procesadores multinúcleo pueden evitar esto con métodos como el paso de mensajes , [1] memoria de borrador , DMA , [2] espacio de direcciones global particionado , [3] o cachés de solo lectura/no coherentes. Un procesador multinúcleo que utiliza una red en un chip y memorias locales le da al software la oportunidad de optimizar explícitamente la disposición espacial de las tareas (por ejemplo, como se ve en las herramientas desarrolladas para TrueNorth ). [4]
Los procesadores multinúcleo pueden tener más en común (conceptualmente) con tecnologías originadas en la computación de alto rendimiento, como los clústeres y los procesadores vectoriales . [5]
Las GPU pueden considerarse una forma de procesador multinúcleo que tiene múltiples unidades de procesamiento de sombreado y solo es adecuada para código altamente paralelo (alto rendimiento, pero rendimiento de subproceso único extremadamente bajo).
Modelos de programación adecuados
Clases de sistemas multinúcleo
Arquitecturas específicas de varios núcleos
- ZettaScaler [1], módulos japoneses de 2048 núcleos de PEZY Computing
- Coprocesador Xeon Phi , que tiene arquitectura MIC ( Many Integrated Cores )
- Tilera
- Arquitectura Adapteva Epiphany, un chip multinúcleo que utiliza memoria PGAS
- Procesador Coherent Logix hx3100, un procesador DSP/GPP de 100 núcleos basado en la arquitectura HyperX
- Movidius Myriad 2 , una unidad de procesamiento de visión (VPU) de múltiples núcleos
- Kalray , un acelerador PCI-e multinúcleo para tareas con uso intensivo de datos
- Chip de investigación de teraflops , un procesador de múltiples núcleos que utiliza el paso de mensajes
- TrueNorth , un acelerador de IA con una arquitectura de red multinúcleo en un chip
- Matrices verdes, un procesador multinúcleo que utiliza el paso de mensajes destinado a aplicaciones de bajo consumo
- Sunway SW26010 , un procesador multinúcleo de 260 núcleos utilizado en la entonces supercomputadora número uno, Sunway TaihuLight
- SW52020 , una variante mejorada de 520 núcleos [8] [9] de SW26010, con SIMD de 512 bits (que también agrega soporte para media precisión), utilizada en un prototipo, destinada a un sistema de exaescala (y en el futuro un sistema de 10 exaescala), y según datacenterdynamics, se rumorea que China ya tiene dos sistemas de exaescala separados en secreto [ cita requerida ]
- Eyeriss , un procesador multinúcleo diseñado para ejecutar redes neuronales convolucionales para aplicaciones de visión integrada [10]
- Graphcore , un acelerador de IA multinúcleo
Computadoras multinúcleo específicas con más de 1 millón de núcleos de CPU
Una serie de computadoras construidas con procesadores multinúcleo tienen un millón o más de núcleos de CPU individuales. Algunos ejemplos incluyen:
Computadoras específicas con 5 millones o más de núcleos de CPU
Un buen número de supercomputadoras tienen más de 5 millones de núcleos de CPU. Si también hay coprocesadores, por ejemplo, GPU, y esos núcleos no se incluyen en el recuento de núcleos, muchas más computadoras alcanzarían esos objetivos.
- Frontera
- Fugaku , una supercomputadora japonesa que utiliza núcleos Fujitsu A64FX basados en ARM, 7.630.848 en total.
- Sunway TaihuLight , una supercomputadora china masivamente paralela (10 millones de núcleos de CPU) , alguna vez una de las supercomputadoras más rápidas del mundo, que utiliza una arquitectura de muchos núcleos personalizada. [ cita requerida ] En noviembre de 2018, era la tercera supercomputadora más rápida del mundo (según la clasificación de la lista TOP500 ), obteniendo su rendimiento de 40,960 procesadores SW26010 de muchos núcleos, cada uno con 256 núcleos.
Véase también
Referencias
- ^ Mattson, Tim (enero de 2010). "El futuro de la computación con muchos núcleos: una historia de dos procesadores" (PDF) .
- ^ Hendry, Gilbert; Kretschmann, Mark. "Procesador celular IBM" (PDF) .
- ^ Olofsson, Andreas; Nordström, Tomas; Ul-Abdin, Zain (2014). "Puesta en marcha de arquitecturas de múltiples núcleos de alto rendimiento y eficiencia energética con Epiphany". arXiv : 1412.5538 [cs.AR].
- ^ Amir, Arnon (11 de junio de 2015). "IBM SyNAPSE Deep Dive Part 3". IBM Research. Archivado desde el original el 21 de diciembre de 2021.
- ^ "arquitectura celular"."La arquitectura Cell no se parece a nada que hayamos visto antes en microprocesadores convencionales; su diseño se acerca más al de las supercomputadoras vectoriales multiprocesador"
- ^ Rick Merritt (20 de junio de 2011), "Los fabricantes de equipos originales muestran sistemas con chips Intel MIC", www.eetimes.com , EE Times
- ^ Barker, J; Bowden, J (2013). "Paralelismo multinúcleo mediante OpenMP". OpenMP en la era de los dispositivos y aceleradores de bajo consumo . IWOMP. Lecture Notes in Computer Science, vol. 8122. Springer. doi :10.1007/978-3-642-40698-0_4.
- ^ Morgan, Timothy Prickett (10 de febrero de 2021). "Un primer vistazo a la supercomputadora de exaescala Sunway de China". The Next Platform . Consultado el 18 de noviembre de 2021 .
- ^ Hemsoth, Nicole (19 de abril de 2021). "El prototipo de supercomputadora a escala exaescala de China prueba cargas de trabajo de IA". The Next Platform . Consultado el 18 de noviembre de 2021 .
- ^ Chen, Yu-Hsin; Krishna, Tushar; Emer, Joel; Sze, Vivienne (2016). "Eyeriss: Un acelerador reconfigurable de bajo consumo energético para redes neuronales convolucionales profundas". IEEE International Solid-State Circuits Conference, ISSCC 2016, Digest of Technical Papers . págs. 262–263.
Enlaces externos
- Soluciones arquitectónicas para el futuro de Manycore, publicado el 19 de febrero de 2010 (más de un enlace roto en la diapositiva)
- Arquitectura Eyeriss