stringtranslate.com

Arquitectura de memoria multicanal

En los campos de la electrónica digital y el hardware informático , la arquitectura de memoria multicanal es una tecnología que aumenta la velocidad de transferencia de datos entre la memoria DRAM y el controlador de memoria añadiendo más canales de comunicación entre ellos. Teóricamente, esto multiplica la velocidad de datos exactamente por el número de canales presentes. La memoria de doble canal emplea dos canales. La técnica se remonta a la década de 1960 y se utilizó en IBM System/360 Model 91 y en CDC 6600. [ 1]

Los procesadores de escritorio y estaciones de trabajo de gama alta modernos, como la serie AMD Ryzen Threadripper y la línea Intel Core i9 Extreme Edition, admiten memoria de cuatro canales. Los procesadores de servidor de la serie AMD Epyc y las plataformas Intel Xeon admiten un ancho de banda de memoria que va desde un diseño de módulo de cuatro canales hasta un diseño de hasta 12 canales. [2] En marzo de 2010, AMD lanzó los procesadores Socket G34 y Magny-Cours Opteron 6100 [3] con soporte para memoria de cuatro canales. En 2006, Intel lanzó chipsets que admiten memoria de cuatro canales para su plataforma LGA771 [4] y más tarde en 2011 para su plataforma LGA2011 . [5] Se diseñaron chipsets para microcomputadoras con incluso más canales; por ejemplo, el chipset de AlphaStation 600 (1995) admite memoria de ocho canales, pero la placa base de la máquina limitaba el funcionamiento a cuatro canales. [6]

Arquitectura de doble canal

Ranuras de memoria de doble canal, codificadas por colores naranja y amarillo para esta placa base en particular.

Los controladores de memoria habilitados para doble canal en una arquitectura de sistema de PC utilizan dos canales de datos de 64 bits. El doble canal no debe confundirse con la doble velocidad de datos (DDR), en la que el intercambio de datos se produce dos veces por ciclo de DRAM. Las dos tecnologías son independientes entre sí y muchas placas base utilizan ambas mediante el uso de memoria DDR en una configuración de doble canal.

Operación

La arquitectura de doble canal requiere una placa base con capacidad para dos canales y dos o más módulos de memoria DDR. Los módulos de memoria se instalan en bancos correspondientes, cada uno de los cuales pertenece a un canal diferente. El manual de la placa base proporcionará una explicación de cómo instalar la memoria para esa unidad en particular. Por lo general, se puede colocar un par de módulos de memoria correspondientes en el primer banco de cada canal y un par de módulos de diferente capacidad en el segundo banco. [7] Los módulos con diferentes velocidades se pueden ejecutar en modo de doble canal, aunque la placa base ejecutará todos los módulos de memoria a la velocidad del módulo más lento. Sin embargo, algunas placas base tienen problemas de compatibilidad con ciertas marcas o modelos de memoria cuando intentan usarlos en modo de doble canal. Por este motivo, generalmente se recomienda utilizar pares idénticos de módulos de memoria, por lo que la mayoría de los fabricantes de memoria ahora venden "kits" de DIMM de pares correspondientes. Varios fabricantes de placas base solo admiten configuraciones en las que se utiliza un "par correspondiente" de módulos. Un par correspondiente debe coincidir en:

En teoría, cualquier par de módulos de memoria emparejados se puede utilizar en operaciones de canal único o doble, siempre que la placa base admita esta arquitectura.

Con la introducción de DDR5 , cada DIMM DDR5 tiene dos subcanales independientes.

Actuación

En teoría, las configuraciones de doble canal duplican el ancho de banda de la memoria en comparación con las configuraciones de un solo canal. Esto no debe confundirse con la memoria de doble velocidad de datos (DDR), que duplica el uso del bus DRAM al transferir datos tanto en los flancos ascendentes como descendentes de las señales de reloj del bus de memoria.

Agrupados versus no agrupados

El modo dual-channel se concibió originalmente como una forma de maximizar el rendimiento de la memoria mediante la combinación de dos buses de 64 bits en un solo bus de 128 bits. [ disputadodiscutir ] [ cita requerida ] Esto se denomina retrospectivamente el modo "ganged". Sin embargo, debido a las mejoras de rendimiento mediocres en las aplicaciones de consumo, [8] las implementaciones más modernas del modo dual-channel utilizan el modo "unanged" de forma predeterminada, que mantiene dos buses de memoria de 64 bits pero permite el acceso independiente a cada canal, en apoyo del multithreading con procesadores multi-core . [9] [10]

La diferencia entre "agrupado" y "desagrupado" también se podría considerar como una analogía con el modo en que funciona RAID 0 , en comparación con JBOD . [11] Con RAID 0 (que es análogo al modo "agrupado"), depende de la capa lógica adicional proporcionar un uso mejor (idealmente uniforme) de todas las unidades de hardware disponibles (dispositivos de almacenamiento o módulos de memoria) y un mayor rendimiento general. Por otro lado, con JBOD (que es análogo al modo "desagrupado") se depende de los patrones de uso estadísticos para garantizar un mayor rendimiento general mediante un uso uniforme de todas las unidades de hardware disponibles. [9] [10]

Arquitectura de triple canal

Operación

La arquitectura de triple canal DDR3 se utiliza en la serie Intel Core i7-900 (la serie Intel Core i7-800 solo admite hasta doble canal). La plataforma LGA 1366 (por ejemplo, Intel X58) admite triple canal DDR3, normalmente 1333 y 1600 MHz, pero puede funcionar a velocidades de reloj más altas en ciertas placas base. Los procesadores AMD Socket AM3 no utilizan la arquitectura de triple canal DDR3, sino que utilizan memoria DDR3 de doble canal. Lo mismo se aplica a las series Intel Core i3, Core i5 y Core i7-800, que se utilizan en las plataformas LGA 1156 (por ejemplo, Intel P55 ). Según Intel, un Core i7 con DDR3 que funcione a 1066 MHz ofrecerá velocidades máximas de transferencia de datos de 25,6 GB/s cuando funcione en modo intercalado de triple canal . Esto, afirma Intel, conduce a un rendimiento del sistema más rápido, así como a un mayor rendimiento por vatio . [12]

Cuando se opera en modo de triple canal, la latencia de la memoria se reduce gracias al entrelazado, lo que significa que se accede a cada módulo de forma secuencial para obtener fragmentos de datos más pequeños en lugar de llenar por completo un módulo antes de acceder al siguiente. Los datos se distribuyen entre los módulos en un patrón alterno, lo que potencialmente triplica el ancho de banda de memoria disponible para la misma cantidad de datos, en lugar de almacenarlos todos en un módulo.

La arquitectura sólo se puede utilizar cuando los tres módulos de memoria, o un múltiplo de tres, son idénticos en capacidad y velocidad y están colocados en ranuras de tres canales. Cuando se instalan dos módulos de memoria, la arquitectura funcionará en modo de arquitectura de doble canal. [13]

Procesadores de soporte

Arquitectura de cuatro canales

Operación

La memoria de cuatro canales debutó en la plataforma Nehalem-EX LGA 1567 de CPU Xeon de Intel, también conocida como Beckton en 2010, y se introdujo en la línea de productos de gama alta en la plataforma Intel X79 LGA 2011 con Sandy Bridge-E a fines de 2011. DDR4 reemplazó a DDR3 en la plataforma Intel X99 LGA 2011 , también conocida como Haswell-E, y también se utiliza en la plataforma Threadripper de AMD . [16] La arquitectura de cuatro canales DDR3 se utiliza en la plataforma AMD G34 y en las CPU Intel mencionadas anteriormente antes de Haswell. Los procesadores AMD para la plataforma C32 y los procesadores Intel para la plataforma LGA 1155 (por ejemplo, Intel Z68 ) usan memoria DDR3 de doble canal en su lugar.

La arquitectura se puede utilizar únicamente cuando los cuatro módulos de memoria (o un múltiplo de cuatro) son idénticos en capacidad y velocidad, y están colocados en ranuras de cuatro canales. Cuando se instalan dos módulos de memoria, la arquitectura funcionará en modo de doble canal; cuando se instalan tres módulos de memoria, la arquitectura funcionará en modo de triple canal. [13]

Actuación

Un benchmark realizado por TweakTown, utilizando SiSoftware Sandra, midió alrededor de un 70% de aumento en el rendimiento de una configuración de cuatro canales, en comparación con una configuración de dos canales. [17] : p. 5  Otras pruebas realizadas por TweakTown sobre el mismo tema no mostraron diferencias significativas en el rendimiento, lo que llevó a la conclusión de que no todo el software de benchmark está a la altura de la tarea de explotar el mayor paralelismo que ofrecen las configuraciones de memoria multicanal. [17] : p. 6 

Procesadores de soporte

Arquitectura de canal hexa

Compatible con procesadores de servidor Qualcomm Centriq , [20] y procesadores de la plataforma escalable Intel Xeon. [21]

Arquitectura de ocho canales

La imagen muestra 4 ranuras de RAM a la izquierda y 4 a la derecha. En el centro de la imagen se muestra el zócalo y el procesador AMD Ryzen Threadripper Pro 7995WX
Configuración de ocho canales con un AMD Ryzen Threadripper Pro 7995WX

Compatible con los procesadores de servidor Cavium ThunderX2 , los procesadores de servidor AMD de su plataforma Epyc y la línea Threadripper PRO de procesadores para estaciones de trabajo de clase profesional. [22] [23] [24]

Arquitectura de dodecacanal

Sistema de servidor que contiene dos CPU AMD Epyc con un canal dodeca por CPU (768 GiB de RAM en total)

La arquitectura de memoria de canal dodeca o de 12 canales se introduce con los procesadores de servidor de AMD a partir de su plataforma Epyc 9004 lanzada en 2022, utilizando memoria DDR5 . [25]

Véase también

Referencias

  1. ^ Jacob, Bruce; Ng, Spencer; Wang, David (2007). Sistemas de memoria: caché, DRAM, disco . Morgan Kaufmann. pág. 318. ISBN 978-0-12-379751-3.
  2. ^ Shilov, Anton. «AMD confirma doce canales de memoria DDR5 para las CPU Zen 4 EPYC». Tom's Hardware . Future US Inc. Consultado el 22 de abril de 2024 .
  3. ^ ab "Guía de referencia rápida de la plataforma de la serie Opteron 6000" (PDF) . AMD. Archivado desde el original (PDF) el 2012-05-12 . Consultado el 2012-10-15 .
  4. ^ Controlador de memoria 5000P, Intel.
  5. ^ Se muestra el chipset Intel LGA2011 socket x68 express, Tech power up.
  6. ^ John H. Zurawski; John E. Murray; Paul J. Lemmon, "El diseño y la verificación de la estación de trabajo AlphaStation 600 serie 5", HP , 7 (1), archivado desde el original el 25 de febrero de 2021 , consultado el 19 de octubre de 2011.
  7. ^ "Informe técnico sobre la arquitectura de memoria DDR de canal dual de Intel" (PDF) (edición Rev. 1.0). Infineon Technologies North America y Kingston Technology. Septiembre de 2003. Archivado desde el original (PDF, 1021  KB ) el 29 de septiembre de 2011. Consultado el 6 de septiembre de 2007 .
  8. ^ "Controlador de memoria AMD Phenom X4 en modo agrupado/desagrupado". ixbtlabs.com . 2008-08-16 . Consultado el 2014-01-09 .
  9. ^ por Gionatan Danti (17 de junio de 2010). "El controlador de memoria Phenom/PhenomII: comparación entre el modo agrupado y el modo no agrupado". ilsistemista.net . Consultado el 9 de enero de 2014 .
  10. ^ ab "BIOS and Kernel Developer's Guide (BKDG) For AMD Family 10h Processors" (PDF) . amd.com . 2013-01-11. pp. 107–108 . Consultado el 2014-01-09 . Cuando las DCT están en modo agrupado, como se especifica en [El registro bajo de selección del controlador DRAM] F2x110 [DctGangEn], cada DIMM lógico tiene dos canales de ancho. Cada DIMM físico de una DIMM lógica de 2 canales debe tener el mismo tamaño y utilizar los mismos parámetros de temporización. Ambas DCT deben programarse con la misma información (consulte 2.8.1 [Registros de configuración de DCT]). Cuando las DCT están en modo no agrupado, una DIMM lógica es equivalente a una DIMM física de 64 bits y cada canal está controlado por una DCT diferente. Se recomienda que los sistemas típicos se ejecuten en modo no agrupado para aprovechar el paralelismo adicional generado al usar las DCT de forma independiente. Consulte 2.12.2 [Consideraciones de DRAM para ECC] para conocer las implicaciones de ECC de DRAM del modo agrupado y no agrupado. El modo agrupado no es compatible con los procesadores S1g3, S1g4, ASB2 y G34.
  11. ^ Rouse, Margaret (septiembre de 2005). "JBOD (solo un montón de discos o solo un montón de unidades)". SearchStorage.TechTarget.com . Consultado el 9 de enero de 2014 .
  12. ^ Descripción del producto X58 (PDF) , Intel
  13. ^ ab Desktop Boards – Triple Memory Modules, Intel, archivado desde el original el 8 de marzo de 2009 , consultado el 1 de octubre de 2011Modos de memoria monocanal y multicanal
  14. ^ "Comparación de productos de la familia Core i7". Intel. Especificaciones de memoria: cantidad de canales de memoria.
  15. ^ "Comparación de productos de la familia Xeon". Intel. Especificaciones de memoria: cantidad de canales de memoria.
  16. ^ AMD Ryzen Threadripper y Vega atacan a Prey en 4K, GPU cuádruples destrozan Blender, Radeon RX Vega llega en julio, "...con 16 núcleos y 32 subprocesos con soporte para memoria DDR4 de cuatro canales..."
  17. ^ por Shawn Baker (16 de noviembre de 2011). "Análisis del rendimiento de la memoria Intel X79 de cuatro canales y Z68 de doble canal". TweakTown . Consultado el 30 de noviembre de 2013 .
  18. ^ "Guía de referencia rápida del procesador AMD Opteron serie 6300" (PDF) . Consultado el 11 de diciembre de 2013 .
  19. ^ "Guía de referencia rápida del procesador AMD Opteron serie 6200" (PDF) . Consultado el 15 de octubre de 2012 .
  20. ^ Kennedy, Patrick (23 de agosto de 2017). «CPU Qualcomm Centriq 2400 ARM de Hot Chips 29». Serve The Home . Consultado el 14 de noviembre de 2017 .
  21. ^ "Procesador Intel® Xeon® Bronze 3106 (caché de 11 M, 1,70 GHz)". www.intel.in .
  22. ^ Cutress, Ian (7 de marzo de 2017). "AMD prepara CPU Naples de 32 núcleos para servidores 1P y 2P: llegarán en el segundo trimestre". Anandtech . Consultado el 7 de marzo de 2017 .
  23. ^ Kennedy, Patrick (9 de noviembre de 2017). «Detalles de la plataforma Cavium ThunderX2 y OCP». Serve the Home . Consultado el 14 de noviembre de 2017 .
  24. ^ Cutress, Ian (14 de julio de 2021). "Revisión de AMD Threadripper Pro: ¿una mejora con respecto al Threadripper normal?". AnandTech . Consultado el 18 de agosto de 2021 .
  25. ^ Goetting, Chris (10 de noviembre de 2022). "Lanzamiento de la serie AMD EPYC 9004 de cuarta generación: Genoa se pone a prueba en un desafío de referencia de centros de datos". HotHardware . Consultado el 7 de diciembre de 2023 .

Enlaces externos