La GPU R420 , desarrollada por ATI Technologies , fue la base de la empresa para sus tarjetas gráficas de tercera generación compatibles con DirectX 9.0/ OpenGL 2.0 . Utilizada por primera vez en la Radeon X800, la R420 se produjo mediante un proceso de fotolitografía de baja densidad de 0,13 micrómetros (130 nm ) y utilizó memoria GDDR-3 . El chip fue diseñado para tarjetas gráficas AGP .
El soporte del controlador de este núcleo se interrumpió a partir de Catalyst 9.4 y, como resultado, no hay soporte oficial de Windows 7 para ninguno de los productos X700 - X850. [1]
En términos de características DirectX compatibles, la R420 (con nombre en código Loki ) era muy similar a la R300 . Básicamente, la R420 adopta un enfoque de "cuanto más ancho, mejor" con respecto a la arquitectura anterior, con algunos pequeños ajustes para mejorarla de varias maneras. El chip venía equipado con más del doble de recursos de empuje de píxeles y vértices en comparación con la R360 de la Radeon 9800 XT (una evolución menor de la R350), con 16 canales de píxeles DirectX 9.0b y 16 ROP. No sería muy extraño ver a la X800 XT básicamente como un par de núcleos Radeon 9800 conectados entre sí y también funcionando con una velocidad de reloj un 30 % superior.
El diseño del R420 era una disposición de 4 "quads" (4 pipelines por quad). Esta organización interna permitió a ATI desactivar los "quads" defectuosos y vender chips con pipelines de 12, 8 o incluso 4 píxeles, una evolución de la técnica utilizada con Radeon 9500/9700 y 9800SE/9800. La separación en "quads" también permitió a ATI diseñar un sistema para optimizar la eficiencia del chip en general. Conocido como "sistema de despacho de quads", la pantalla está dividida en mosaicos y el trabajo se distribuye de manera uniforme entre los "quads" separados para optimizar su rendimiento. Así es como los chips de la serie R300 también realizaban sus tareas, pero el R420 refinó esto al permitir tamaños de mosaico programables para controlar el flujo de trabajo en un nivel de granularidad más fino. Aparentemente, al reducir los tamaños de mosaico, ATI pudo optimizar para diferentes tamaños de triángulos.
Cuando ATI duplicó el número de canales de píxeles, también aumentó el número de motores de sombreado de vértices de 4 a 6. Esto cambió la relación de sombreadores de píxeles/vértices de 2:1 (en la R300) a 8:3, lo que demuestra que ATI creía que la carga de trabajo en los juegos a partir de 2004 en adelante estaba más orientada al sombreado de píxeles y al texturizado que a la geometría. El mapeo normal y de paralaje estaba reemplazando la pura complejidad geométrica por el detalle del modelo, por lo que, sin duda, ese era parte del razonamiento. Curiosamente, la tarjeta principal X700 (RV410) tenía 6 sombreadores de vértices mientras que solo estaba equipada con 2 quads. Como tal, este chip obviamente fue diseñado para una carga de geometría más pesada que la texturización, tal vez siendo adaptado para un papel como chip FireGL . RV410 también superó significativamente a la GeForce 6600GT de NVIDIA (3 sombreadores de vértices) en rendimiento de geometría. Con los 6 sombreadores de vértices del R420 y el RV410 combinados con velocidades de reloj más altas que la generación anterior, ATI pudo más que duplicar la capacidad de procesamiento de geometría del 9800XT.
Aunque los chips basados en R420 son básicamente similares a los núcleos basados en R300, ATI modificó y mejoró las unidades de sombreado de píxeles para lograr una mayor flexibilidad. Una nueva versión de sombreado de píxeles (PS2.b) permitió una flexibilidad de programas de sombreado ligeramente mayor que la PS2.0 simple, pero aún estaba lejos de las capacidades completas de la PS3.0. Esta nueva revisión de la PS2.0 aumentó la cantidad máxima de instrucciones y registros disponibles para los programas de sombreado de píxeles. [2]
ATI presentó Temporal Anti-Aliasing , una nueva tecnología de anti-aliasing de la que eran capaces sus chips. Al aprovechar los efectos de cuadro a ojo de una frecuencia de cuadros superior a 60 cuadros/s , la GPU puede suavizar mejor los bordes alias al rotar el patrón de muestreo de anti-aliasing entre cuadros. Una configuración de software de 2X se convirtió perceptivamente en equivalente a 4X. Desafortunadamente, requería que el sistema pudiera mantener al menos 60 cuadros/s o el anti-aliasing temporal causaría un parpadeo notable, porque el usuario podría ver los patrones de AA alternados. Si no se podía mantener la frecuencia de cuadros, el controlador deshabilitaría el anti-aliasing temporal. Sin embargo, en los juegos en los que se podía mantener este nivel de rendimiento, el anti-aliasing temporal fue una buena adición a las excelentes opciones de anti-aliasing de ATI. Tenga en cuenta que el "AA temporal" de ATI era en realidad un filtro de tramado temporal para AA espacial, no un anti-aliasing temporal de facto (que debe implicar una mezcla controlada de las submuestras temporales de pantallas consecutivas).
Otra notable incorporación al núcleo fue un nuevo tipo de compresión de mapas normales , denominada " 3Dc ". De forma similar a cómo la compresión de texturas había sido parte de la especificación Direct3D durante años y se utilizó para comprimir texturas normales, la compresión de mapas normales compactó este nuevo tipo de capa de detalle de superficie. Debido a que DirectX Texture Compression ( DXTC ) estaba basada en bloques y no estaba diseñada para las diferentes propiedades de datos de un mapa normal, se necesitaba un nuevo método de compresión para evitar la pérdida de detalles y otros artefactos. 3Dc se basaba en un modo DXT5 modificado, que de hecho era una opción de respaldo para el hardware que no soportaba 3Dc. El software que hacía un uso intensivo del mapeo normal podía obtener un aumento significativo de velocidad gracias a los ahorros en tasa de relleno y ancho de banda al utilizar 3Dc. ATI mostró muchas de las nuevas características de su chip en la demostración promocional en tiempo real llamada Ruby: The Doublecross .
La mayor parte del resto de la GPU era extremadamente similar a la R300. El controlador de memoria y las técnicas de optimización del ancho de banda de memoria ( HyperZ ) eran idénticas.
R420 fue en realidad un proyecto secundario de cuarta generación para ATI, con el plan original R400, internamente llamado "Crayola", siendo descartado. [3] R400 habría sido más completo en cuanto a características, con soporte unificado para shader Model 3 entre otras mejoras, pero se cree que ATI consideró que R400 era innecesariamente complejo para las aplicaciones que estarían disponibles, y potencialmente riesgoso de desarrollar en los procesos de fabricación de semiconductores disponibles en ese momento. [4] La arquitectura R400 se implementó solo en el chip Xenos utilizado en la consola de videojuegos Xbox 360 , [5] y se convirtió en la base para la GPU móvil Qualcomm Adreno 200, inicialmente llamada AMD Z430. [6] En la línea Radeon, el soporte para las características de Direct3D 9.0c se trasladó a la generación posterior basada en la arquitectura R500 , mientras que la cuarta generación se sirvió con el R420 derivado de R300.
Las primeras tarjetas de la serie Radeon X800 se basaban en el núcleo R420. La línea incluía la Radeon X800 XT Platinum Edition y la Radeon X800 Pro . La X800 XT PE venía con una frecuencia de reloj de 520 MHz en el núcleo y 560 MHz en RAM, con 16 canales habilitados. La X800 Pro venía con una frecuencia de reloj de 475/450 MHz con un cuádruple deshabilitado, dejando funcionales los canales de 12 píxeles. Básicamente, la X800 Pro está construida sobre núcleos R420 semi-defectuosos. También se lanzó una X800 Pro VIVO (Video-in-Video-out) que fue popular entre los overclockers porque el cuádruple deshabilitado generalmente se podía habilitar, lo que daba como resultado una X800 XT PE completamente funcional a un costo menor.
La serie Radeon X700 (RV410) reemplazó a la X600 en septiembre de 2004. La X700 Pro tiene una frecuencia de reloj de 425 MHz y se produce en un proceso de 0,11 micrómetros. La RV410 utilizaba un diseño que consistía en 8 canales de píxeles conectados a 4 ROP (similar a la GeForce 6 600) mientras que mantenía los 6 sombreadores de vértices de la X800. El proceso de 110 nm era un proceso de reducción de costos, diseñado no para altas velocidades de reloj sino para reducir el tamaño del chip manteniendo altos rendimientos. Se planeó producir una X700 XT y se analizó en varios sitios web de hardware, pero nunca se lanzó. Se creía que la X700 XT establecía un límite de reloj demasiado alto para que ATI pudiera producirla de manera rentable. La X700 XT tampoco era lo suficientemente competitiva con la impresionante GeForce 6 600GT de nVidia. ATI seguiría produciendo una tarjeta de la serie X800 para competir en su lugar.
La serie de 110 nanómetros basada en Radeon X800 "R430" se presentó a fines de 2004 junto con las nuevas tarjetas X850 de ATI . La X800 fue diseñada para reemplazar la posición que la X700 XT no pudo asegurar, con 12 canales y un bus de RAM de 256 bits. La tarjeta superó con creces a la 6600GT con un rendimiento similar al de la GeForce 6 800. Un pariente cercano, la nueva X800 XL , se posicionó para destronar a la GeForce 6800 GT de NVIDIA con velocidades de memoria más altas y 16 canales completos para aumentar el rendimiento. La R430 no pudo alcanzar altas velocidades de reloj, ya que se diseñó principalmente para reducir el costo por GPU, por lo que aún se necesitaba un nuevo núcleo de primera línea. La nueva generación de procesadores de gama alta R4x0 llegó con la serie X850, equipada con varios ajustes básicos para lograr un rendimiento ligeramente superior al de la serie X800 basada en "R420". La línea X850 basada en "R480" estaba disponible en tres formatos: X850 Pro , X850 XT y X850 XT Platinum Edition , y se basaba en el confiable proceso Low-K de 130 nm y alto rendimiento .
En 2005, ATI tenía una gran cantidad de matrices que "funcionaban", pero no lo suficientemente bien como para ser utilizadas en las tarjetas de la serie X800 o X850. Por lo tanto, se creó un nuevo SKU , el X800 GT . Utilizaba cualquier matriz X850 "R480" o matriz X800 XL "R430" que tuviera 2 quads funcionales y pudiera funcionar a 475 MHz. Estaban destinados a competir con la GeForce 6600GT junto con la X800 anterior basada en "R430". ATI también lanzó la X800 GTO , que era una tarjeta de 12 pipelines (3 quads) que usaba matrices "R480" o "R430" con una velocidad de reloj de 400 MHz. Esta tarjeta tenía un rendimiento entre la X800 GT y la X800 XL. Era más rápida que la GeForce 6 800 simple, pero más lenta que la GeForce 6800 GT. Las altas ventas de esta tarjeta se debieron a su rendimiento relativamente alto junto con un costo apenas superior al de la X800 GT. La comunidad de overclocking descubrió que la GTO basada en R480 podía alcanzar con frecuencia velocidades de reloj cercanas a la X850 XT.
Finalmente, otro SKU fue el X800 GTO² , nuevamente basado en R480. Fue fabricado nuevamente por Sapphire Technology , como el X800 GTO. Esta tarjeta generalmente venía con una configuración de 3 quads, como X800 GTO. El GTO² era único en la serie GTx porque, con un cambio de BIOS, casi siempre se podían convertir en una tarjeta de 4 quads completos. [7] Algunas tarjetas X800 GTO² se enviaron con los 4 quads completos ya habilitados, pero de estas algunas eran R430 en lugar de R480 y no podían alcanzar velocidades de reloj similares a las de X850. Las variaciones finales de la serie GTO fueron las placas GTO especiales con 16 pipelines habilitados oficialmente, como el X800 GTO-16 basado en "R430" de Powercolor .
1 Sombreadores de píxeles : Sombreadores de vértices : Unidades de mapeo de texturas : Unidades de salida de renderizado
1 Sombreadores de píxeles : Sombreadores de vértices : Unidades de mapeo de texturas : Unidades de salida de renderizado
1 Sombreadores de píxeles : Sombreadores de vértices : Unidades de mapeo de texturas : Unidades de salida de renderizado
Estas GPU están integradas en la placa base u ocupan un módulo PCI Express móvil (MXM) .
1 Sombreadores de vértices : Sombreadores de píxeles : Unidades de mapeo de texturas : Unidades de salida de renderizado .
1 Sombreadores de vértices : Sombreadores de píxeles : Unidades de mapeo de texturas : Unidades de salida de renderizado .