En este chip se basa la microarquitectura TeraScale , las unidades shader están organizadas en tres grupos SIMD con 16 procesadores por grupo, para un total de 48 procesadores. Cada uno de estos procesadores está compuesto por una unidad vectorial de 5 anchos (en total 5 ALU FP32 ), lo que da como resultado 240 unidades, que pueden ejecutar en serie hasta dos instrucciones por ciclo (una multiplicación y una suma). Todos los procesadores de un grupo SIMD ejecutan la misma instrucción, por lo que en total pueden estar en ejecución simultáneamente hasta tres hilos de instrucciones.
GPU principal de 500 MHz en proceso TSMC de 90 nm , 65 nm (desde 2008, nombre en código Gunga) o proceso GlobalFoundries de 45 nm (desde 2010, con CPU en el mismo chip) de un total de 232 millones de transistores, proceso de 32 nm (desde 2014, con eDRAM integrado en el mismo chip)
Procesadores vectoriales de punto flotante de 240 unidades vectoriales para ejecución de sombreadores , divididos en tres grupos SIMD programados dinámicamente de 80 unidades cada uno. [3]
10 operaciones FP por procesador vectorial por ciclo (5 operaciones de multiplicación-adición fusionadas)
Cantidad máxima de vértices : 1,21 mil millones de vértices por segundo
Cantidad máxima de polígonos : ~500 millones de polígonos por segundo
Operaciones máximas de sombreado: 240 mil millones de operaciones de sombreado por segundo (3 canales de sombreado × 80 unidades × 2 ALU × 0,5 GHz (500 MHz))
Tecnología de síntesis procedimental (XPS): durante la transmisión de lectura a la CPU, una instrucción de precarga personalizada, el bloque de caché de datos extendido táctil (xDCBT), precarga los datos directamente en la caché de datos L1 del núcleo de destino, que omite colocar los datos en la caché L2 para evitar saturar la caché L2. La transmisión de escritura desde cada núcleo omite la caché L1, debido a su asignación de no escritura (evita saturar los flujos de datos transitorios, de solo escritura y de gran ancho de banda en la caché L1), y va directamente a la caché L2. El sistema permite que la GPU lea directamente los datos producidos por la CPU sin ir a la memoria principal. En este caso específico de transmisión de datos, llamado síntesis procedimental de Xbox (XPS), la CPU es efectivamente un descompresor de datos, que genera geometría sobre la marcha para el consumo por parte del núcleo 3D de la GPU.
Velocidad máxima de relleno de píxeles : 16 gigamuestras por segundo de velocidad de relleno utilizando anti-aliasing multimuestra (MSAA) 4X, o 32 gigamuestras utilizando la operación solo Z; 4 gigapíxeles por segundo sin MSAA (8 ROP × 500 MHz)
Frecuencia máxima de muestreo Z: 8 gigamuestras por segundo (2 muestras Z × 8 ROP × 500 MHz), 32 gigamuestras por segundo utilizando anti-aliasing 4X (2 muestras Z × 8 ROP × 4X AA × 500 MHz) [1]
Frecuencia máxima de muestreo anti-aliasing: 16 gigamuestras por segundo (4 muestras AA × 8 ROP × 500 MHz) [1]
Soporte para filtrado bilineal, trilineal, anisotrópico, alfa a cobertura, teselación de hardware y mosaico predicado. [7]
Refrigeración : Tanto la GPU como la CPU de la consola tienen disipadores de calor . El disipador de calor de la GPU utiliza tecnología de tubos de calor para conducir el calor desde la GPU y el chip eDRAM hasta las aletas del disipador de calor. Los disipadores de calor se enfrían activamente mediante un par de ventiladores de escape de 60 mm. El nuevo rediseño del chipset XCGPU se incluye tanto en la Xbox 360 S como en la Xbox 360 E e integra la CPU ( Xenon ) y la GPU (Xenos) en un solo paquete y se enfría activamente mediante un solo disipador de calor en lugar de dos.