Procesador multinúcleo con una gran cantidad de núcleos.
Los procesadores Manycore son tipos especiales de procesadores multinúcleo diseñados para un alto grado de procesamiento paralelo , que contienen numerosos núcleos de procesador independientes y más simples (desde unas pocas decenas de núcleos hasta miles o más). Los procesadores Manycore se utilizan ampliamente en computadoras integradas y en computación de alto rendimiento .
Contraste con la arquitectura multinúcleo
Los procesadores Manycore se diferencian de los procesadores multinúcleo en que están optimizados desde el principio para un mayor grado de paralelismo explícito y para un mayor rendimiento (o menor consumo de energía) a expensas de la latencia y un menor rendimiento de un solo subproceso .
Por el contrario, la categoría más amplia de procesadores multinúcleo suele estar diseñada para ejecutar eficientemente código tanto en paralelo como en serie y, por lo tanto, pone más énfasis en un alto rendimiento de un solo subproceso (por ejemplo, dedicar más silicio a la ejecución fuera de orden , canalizaciones más profundas , unidades de ejecución más superescalares y cachés más grandes y generales) y memoria compartida . Estas técnicas dedican recursos de tiempo de ejecución a descubrir el paralelismo implícito en un solo hilo. Se utilizan en sistemas donde han evolucionado continuamente (con compatibilidad con versiones anteriores) a partir de procesadores de un solo núcleo. Por lo general, tienen "unos pocos" núcleos (por ejemplo, 2, 4, 8) y pueden complementarse con un acelerador de muchos núcleos (como una GPU ) en un sistema heterogéneo .
Motivación
La coherencia de la caché es un problema que limita el escalado de los procesadores multinúcleo. Los procesadores Manycore pueden evitar esto con métodos tales como paso de mensajes , [1] memoria temporal , DMA , [2] espacio de direcciones global particionado , [3] o cachés de solo lectura/no coherentes. Un procesador de muchos núcleos que utiliza una red en un chip y memorias locales brinda al software la oportunidad de optimizar explícitamente el diseño espacial de las tareas (por ejemplo, como se ve en las herramientas desarrolladas para TrueNorth ). [4]
Los procesadores de muchos núcleos pueden tener más en común (conceptualmente) con tecnologías originadas en la informática de alto rendimiento, como los clústeres y los procesadores vectoriales . [5]
Las GPU pueden considerarse una forma de procesador de muchos núcleos que tiene múltiples unidades de procesamiento de sombreado y que solo son adecuadas para código altamente paralelo (alto rendimiento, pero rendimiento de un solo subproceso extremadamente pobre).
Modelos de programación adecuados
Clases de sistemas de muchos núcleos.
Arquitecturas de muchos núcleos específicas
- ZettaScaler [1], módulos japoneses PEZY Computing de 2048 núcleos
- Coprocesador Xeon Phi , que tiene arquitectura MIC ( Many Integrated Cores )
- Tilera
- Adapteva Epiphany Architecture, un chip de muchos núcleos que utiliza memoria scratchpad PGAS
- Procesador Coherent Logix hx3100, un procesador DSP/GPP de 100 núcleos basado en la arquitectura HyperX
- Movidius Myriad 2 , una unidad de procesamiento de visión (VPU) de muchos núcleos
- Kalray , un acelerador PCI-e de muchos núcleos para tareas con uso intensivo de datos
- Teraflops Research Chip , un procesador de muchos núcleos que utiliza el paso de mensajes
- TrueNorth , un acelerador de IA con una red de muchos núcleos en una arquitectura de chip
- Green arrays, un procesador de muchos núcleos que utiliza paso de mensajes dirigido a aplicaciones de bajo consumo
- Sunway SW26010 , un procesador de muchos núcleos de 260 núcleos utilizado en la entonces mejor supercomputadora Sunway TaihuLight
- SW52020 , una variante mejorada de 520 núcleos [8] [9] de SW26010, con SIMD de 512 bits (que también agrega soporte para media precisión), utilizada en un prototipo, destinada a un sistema de exaescala (y en el futuro, sistema de 10 exaescala ), y según datacenterdynamics, se rumorea que China ya tiene dos sistemas de exaescala separados en secreto [ cita necesaria ]
- Eyeriss , un procesador de muchos núcleos diseñado para ejecutar redes neuronales convolucionales para aplicaciones de visión integradas [10]
- Graphcore , un acelerador de IA de muchos núcleos
Computadoras de muchos núcleos específicas con más de 1 millón de núcleos de CPU
Varias computadoras construidas con procesadores multinúcleo tienen un millón o más de núcleos de CPU individuales. Ejemplos incluyen:
Computadoras específicas con 5 millones o más de núcleos de CPU
Un buen número de supercomputadoras tienen más de 5 millones de núcleos de CPU. Cuando también hay coprocesadores, por ejemplo, se utilizan GPU, esos núcleos no figuran en el recuento de núcleos, entonces bastantes computadoras más alcanzarían esos objetivos.
- Frontera
- Fugaku , un superordenador japonés que utiliza núcleos Fujitsu A64FX basados en ARM, 7.630.848 en total.
- Sunway TaihuLight , una supercomputadora china masivamente paralela (10 millones de núcleos de CPU) , que alguna vez fue una de las supercomputadoras más rápidas del mundo, que utiliza una arquitectura personalizada de muchos núcleos. [ cita necesaria ] En noviembre de 2018, era la tercera supercomputadora más rápida del mundo (según la lista TOP500 ), obteniendo su rendimiento de 40,960 procesadores SW26010 de muchos núcleos, cada uno con 256 núcleos.
Ver también
Referencias
- ^ Mattson, Tim (enero de 2010). "El futuro de la informática con muchos núcleos: una historia de dos procesadores" (PDF) .
- ^ Hendry, Gilbert; Kretschmann, Mark. "Procesador celular IBM" (PDF) .
- ^ Olofsson, Andreas; Nordström, Tomas; Ul-Abdin, Zain (2014). "Impulsar arquitecturas Manycore de alto rendimiento y eficiencia energética con Epiphany". arXiv : 1412.5538 [cs.AR].
- ^ Amir, Arnon (11 de junio de 2015). "Análisis profundo de IBM SyNAPSE, parte 3". Investigación de IBM. Archivado desde el original el 21 de diciembre de 2021.
- ^ "arquitectura celular"."La arquitectura Cell no se parece a nada que hayamos visto nunca en microprocesadores básicos; su diseño se acerca más a los superordenadores vectoriales multiprocesadores"
- ^ Rick Merritt (20 de junio de 2011), "Los OEM muestran sistemas con chips Intel MIC", www.eetimes.com , EE Times
- ^ Barker, J; Bowden, J (2013). "Paralelismo de muchos núcleos a través de OpenMP". OpenMP en la era de los dispositivos y aceleradores de bajo consumo . YOMP. Apuntes de conferencias sobre informática, vol 8122. Springer. doi :10.1007/978-3-642-40698-0_4.
- ^ Morgan, Timothy Prickett (10 de febrero de 2021). "Un primer vistazo a la supercomputadora de exaescala Sunway de China". La próxima plataforma . Consultado el 18 de noviembre de 2021 .
- ^ Hemsoth, Nicole (19 de abril de 2021). "La supercomputadora prototipo de exaescala de China prueba cargas de trabajo de IA". La próxima plataforma . Consultado el 18 de noviembre de 2021 .
- ^ Chen, Yu-Hsin; Krishna, Tushar; Emer, Joel; Sze, Vivienne (2016). "Eyeriss: un acelerador reconfigurable de bajo consumo para redes neuronales convolucionales profundas". Conferencia internacional de circuitos de estado sólido del IEEE, ISSCC 2016, resumen de artículos técnicos . págs. 262-263.
enlaces externos
- Soluciones de arquitectura para el futuro de Manycore, publicado el 19 de febrero de 2010 (más de un enlace inactivo en la diapositiva)
- Arquitectura Eyeriss