Intel QuickPath Interconnect ( QPI ) [1] [2] es una interconexión de procesador punto a punto desarrollada por Intel que reemplazó al bus frontal (FSB) en Xeon , Itanium y ciertas plataformas de escritorio a partir de 2008. Aumentó la escalabilidad y el ancho de banda disponible. Antes del anuncio del nombre, Intel se refería a él como Interfaz de sistema común ( CSI ). [3] Las encarnaciones anteriores se conocían como Yet Another Protocol (YAP) y YAP+.
QPI 1.1 es una versión significativamente renovada introducida con Sandy Bridge-EP ( plataforma Romley ). [4]
QPI fue reemplazado por Intel Ultra Path Interconnect (UPI) en los procesadores Skylake -SP Xeon basados en el socket LGA 3647. [5]
Aunque a veces se lo denomina "bus", QPI es una interconexión punto a punto. Fue diseñado para competir con HyperTransport , que Advanced Micro Devices (AMD) había utilizado desde aproximadamente 2003. [6] [7] Intel desarrolló QPI en su Centro de Diseño de Microprocesadores de Massachusetts (MMDC) por miembros de lo que había sido el Grupo de Desarrollo Alpha , que Intel había adquirido de Compaq y HP y que a su vez provenía originalmente de Digital Equipment Corporation (DEC). [8] Su desarrollo había sido reportado ya en 2004. [9]
Intel lo lanzó por primera vez para procesadores de escritorio en noviembre de 2008 en el chipset Intel Core i7-9xx y X58 . Se lanzó en procesadores Xeon con nombre en código Nehalem en marzo de 2009 y en procesadores Itanium en febrero de 2010 (con nombre en código Tukwila). [10]
Fue reemplazado por Intel Ultra Path Interconnect a partir de 2017 en las plataformas Xeon Skylake-SP . [11]
El QPI es un elemento de una arquitectura de sistema que Intel llama arquitectura QuickPath que implementa lo que Intel llama tecnología QuickPath . [12] En su forma más simple en una placa base de un solo procesador, se utiliza un solo QPI para conectar el procesador al concentrador IO (por ejemplo, para conectar un Intel Core i7 a un X58 ). En instancias más complejas de la arquitectura, pares de enlaces QPI separados conectan uno o más procesadores y uno o más concentradores IO o concentradores de enrutamiento en una red en la placa base, lo que permite que todos los componentes accedan a otros componentes a través de la red. Al igual que con HyperTransport, la arquitectura QuickPath asume que los procesadores tendrán controladores de memoria integrados y habilita una arquitectura de acceso a memoria no uniforme (NUMA).
Cada QPI comprende dos enlaces de datos punto a punto de 20 carriles, uno en cada dirección ( dúplex completo ), con un par de relojes separado en cada dirección, para un total de 42 señales. Cada señal es un par diferencial , por lo que el número total de pines es 84. Los 20 carriles de datos se dividen en cuatro "cuadrantes" de 5 carriles cada uno. La unidad básica de transferencia es el flit de 80 bits , que tiene 8 bits para la detección de errores, 8 bits para el "encabezado de la capa de enlace" y 64 bits para datos. Un flit de 80 bits se transfiere en dos ciclos de reloj (cuatro transferencias de 20 bits, dos por tic de reloj). Los anchos de banda de QPI se anuncian calculando la transferencia de 64 bits (8 bytes) de datos cada dos ciclos de reloj en cada dirección. [8]
Aunque las implementaciones iniciales utilizan enlaces de cuatro cuadrantes individuales, la especificación QPI permite otras implementaciones. Cada cuadrante se puede utilizar de forma independiente. En servidores de alta fiabilidad, un enlace QPI puede funcionar en un modo degradado. Si una o más de las 20+1 señales fallan, la interfaz funcionará utilizando 10+1 o incluso 5+1 señales restantes, incluso reasignando el reloj a una señal de datos si el reloj falla. [8] La implementación inicial de Nehalem utilizó una interfaz completa de cuatro cuadrantes para alcanzar 25,6 GB/s (6,4 GT/s × 1 byte × 4), lo que proporciona exactamente el doble del ancho de banda teórico del FSB de 1600 MHz de Intel utilizado en el chipset X48.
Aunque algunos procesadores Core i7 de alta gama exponen QPI, otros procesadores de escritorio y móviles Nehalem "convencionales" destinados a placas de un solo socket (por ejemplo, LGA 1156 Core i3, Core i5 y otros procesadores Core i7 de las familias Lynnfield / Clarksfield y sucesores) no exponen QPI externamente, porque estos procesadores no están destinados a participar en sistemas de múltiples sockets.
Sin embargo, QPI se utiliza internamente en estos chips para comunicarse con el " uncore ", que es parte del chip que contiene controladores de memoria, PCI Express del lado de la CPU y GPU, si está presente; el uncore puede o no estar en el mismo chip que el núcleo de la CPU, por ejemplo, está en un chip separado en Clarkdale / Arrandale basado en Westmere . [13] [14] [15] [16] : 3
En los chips de un solo socket posteriores a 2009, empezando por Lynnfield, Clarksfield, Clarkdale y Arrandale, las funciones tradicionales de puente norte están integradas en estos procesadores, que por lo tanto se comunican externamente a través de las interfaces DMI y PCI Express, más lentas.
Por lo tanto, no es necesario incurrir en el gasto de exponer la interfaz de bus frontal (anterior) a través del zócalo del procesador. [17]
Aunque el enlace QPI entre núcleo y núcleo no está presente en los procesadores Sandy Bridge de escritorio y móviles (como sí lo estaba en Clarkdale, por ejemplo), la interconexión de anillo interna entre los núcleos en el chip también se basa en los principios detrás de QPI, al menos en lo que respecta a la coherencia de caché . [16] : 10
Al ser un circuito síncrono , el QPI opera a una frecuencia de reloj de 2,4 GHz, 2,93 GHz, 3,2 GHz, 3,6 GHz, 4,0 GHz o 4,8 GHz (las frecuencias de 3,6 GHz y 4,0 GHz se introdujeron con la plataforma Sandy Bridge-E/EP y las de 4,8 GHz con la plataforma Haswell-E/EP). La frecuencia de reloj de un enlace en particular depende de las capacidades de los componentes en cada extremo del enlace y de las características de la señal de la ruta de la señal en la placa de circuito impreso. Los procesadores Core i7 9xx no extremos están restringidos a una frecuencia de 2,4 GHz en los relojes de referencia de fábrica.
Las transferencias de bits ocurren tanto en los flancos ascendentes como descendentes del reloj, por lo que la tasa de transferencia es el doble de la frecuencia del reloj.
Intel describe el rendimiento de datos (en GB/s) contando solo la carga útil de datos de 64 bits en cada flit de 80 bits. Sin embargo, Intel duplica el resultado porque el par de enlaces de envío y recepción unidireccionales pueden estar activos simultáneamente. Por lo tanto, Intel describe un par de enlaces QPI de 20 carriles (envío y recepción) con una frecuencia de reloj de 3,2 GHz como si tuviera una velocidad de datos de 25,6 GB/s. Una frecuencia de reloj de 2,4 GHz produce una velocidad de datos de 19,2 GB/s. De manera más general, según esta definición, un QPI de 20 carriles y dos enlaces transfiere ocho bytes por ciclo de reloj, cuatro en cada dirección.
La tasa se calcula de la siguiente manera:
QPI se especifica como una arquitectura de cinco capas , con capas físicas, de enlace, de enrutamiento, de transporte y de protocolo separadas. [1] En dispositivos destinados solo para uso de QPI punto a punto sin reenvío, como los procesadores Core i7-9xx y Xeon DP, la capa de transporte no está presente y la capa de enrutamiento es mínima.
{{cite news}}
: CS1 maint: URL no apta ( enlace ){{cite news}}
: CS1 maint: URL no apta ( enlace ){{cite news}}
: CS1 maint: URL no apta ( enlace ){{cite web}}
: CS1 maint: nombres numéricos: lista de autores ( enlace )