Núcleo de gráficos Siguiente

Graphics Core Next ( GCN ) ^[1] es el nombre en clave de una serie de microarquitecturas y una arquitectura de conjunto de instrucciones que fueron desarrolladas por AMD para sus GPU como sucesora de su microarquitectura TeraScale . El primer producto con GCN se lanzó el 9 de enero de 2012. ^[2]

GCN es una microarquitectura SIMD de conjunto de instrucciones reducido que contrasta con la arquitectura SIMD de palabras de instrucción muy largas de TeraScale. ^[3] GCN requiere considerablemente más transistores que TeraScale, pero ofrece ventajas para el cálculo de GPU de propósito general (GPGPU) debido a un compilador más simple .

Los chips gráficos GCN se fabricaron con CMOS a 28 nm y con FinFET a 14 nm (por Samsung Electronics y GlobalFoundries ) y 7 nm (por TSMC ), disponibles en modelos seleccionados en Radeon HD 7000 , HD 8000 , 200 , 300 , 400 de AMD. , 500 y Vega de tarjetas gráficas, incluida la Radeon VII lanzada por separado. GCN también se utilizó en la parte gráfica de las Unidades de procesamiento acelerado (APU), incluidas las de PlayStation 4 y Xbox One .

Conjunto de instrucciones

El conjunto de instrucciones GCN es propiedad de AMD y fue desarrollado específicamente para GPU. No tiene microoperación para división .

La documentación está disponible para:

el conjunto de instrucciones Graphics Core Next 1,
el conjunto de instrucciones Graphics Core Next 2,
los conjuntos de instrucciones Graphics Core Next 3 y 4, ^[4]
el conjunto de instrucciones Graphics Core Next 5, y
la arquitectura del conjunto de instrucciones "Vega" de 7 nm (también conocida como Graphics Core Next 5.1).

Hay un back-end del compilador LLVM disponible para el conjunto de instrucciones GCN. ^[5] Es utilizado por Mesa 3D .

GNU Compiler Collection 9 admite GCN 3 y GCN 5 desde 2019 ^[6] para programas independientes de un solo subproceso, y GCC 10 también se descarga a través de OpenMP y OpenACC . ^[7]

MIAOW es una implementación RTL de código abierto de la microarquitectura GPGPU de AMD Southern Islands .

En noviembre de 2015, AMD anunció su Iniciativa Boltzmann, cuyo objetivo es permitir la migración de aplicaciones basadas en CUDA a un modelo de programación C++ común . ^[8]

En el evento Super Computing 15, AMD mostró un compilador de computación heterogénea (HCC), un controlador Linux sin cabeza y una infraestructura de tiempo de ejecución HSA para computación de alto rendimiento de clase cluster, y una herramienta de interfaz de computación heterogénea para portabilidad (HIP) para portar aplicaciones CUDA. al modelo común de C++ antes mencionado.

Microarquitecturas

En julio de 2017, el conjunto de instrucciones Graphics Core Next ha tenido cinco iteraciones. Las diferencias entre las primeras cuatro generaciones son bastante mínimas, pero la arquitectura GCN de quinta generación presenta procesadores de flujo muy modificados para mejorar el rendimiento y admitir el procesamiento simultáneo de dos números de menor precisión en lugar de un único número de mayor precisión. ^[9]

Procesamiento de comandos

Procesador de comandos de gráficos

El procesador de comandos de gráficos (GCP) es una unidad funcional de la microarquitectura GCN. Entre otras tareas, se encarga del manejo de sombreadores asíncronos . ^[10]

Motor de cálculo asíncrono

El motor de cómputo asíncrono (ACE) es un bloque funcional distinto que sirve para fines informáticos, cuyo propósito es similar al del procesador de comandos de gráficos. ^{[ ambiguo ]}

Programadores

Desde la tercera iteración de GCN, el hardware contiene dos programadores : uno para programar "frentes de onda" durante la ejecución del sombreador (el Programador CU o Programador de la unidad de cómputo) y el otro para programar la ejecución de las colas de dibujo y cómputo. Este último ayuda al rendimiento al ejecutar operaciones informáticas cuando las unidades informáticas (CU) están infrautilizadas debido a comandos gráficos limitados por la velocidad o el ancho de banda de la canalización de funciones fijas. Esta funcionalidad se conoce como Computación asíncrona.

Para un sombreador determinado, los controladores de la GPU también pueden programar instrucciones en la CPU para minimizar la latencia.

Procesador geométrico

El procesador de geometría contiene un Ensamblador de geometría, un Tesselator y un Ensamblador de vértices.

El Tesselator es capaz de realizar teselación en hardware según lo definido por Direct3D 11 y OpenGL 4.5 (consulte AMD el 21 de enero de 2017), ^[11] y sucedió a ATI TruForm y la teselación de hardware en TeraScale como el núcleo de propiedad intelectual de semiconductores más reciente de AMD en ese momento .

Unidades de cálculo

Una unidad de cómputo (CU) combina 64 procesadores de sombreado con 4 unidades de mapeo de texturas (TMU). ^[12]^[13] Las unidades de cálculo están separadas de las unidades de salida de renderizado (ROP), pero se alimentan de ellas. ^[13] Cada unidad de cómputo consta de lo siguiente:

un programador CU
una sucursal y unidad de mensajes
4 unidades vectoriales SIMD de 16 carriles de ancho (SIMD-VU)
4 archivos de registro de propósito general vectorial (VGPR) de 64 KiB
1 unidad escalar (SU)
un archivo GPR escalar de 8 KiB ^[14]
un intercambio de datos local de 64 KiB
4 unidades de filtro de textura
16 unidades de carga/almacenamiento de recuperación de textura
un caché de nivel 1 (L1) de 16 KiB

Cuatro unidades de cómputo están conectadas para compartir un caché de instrucciones L1 de 16 KB y un caché de datos L1 de 32 KB, ambos de solo lectura. Un SIMD-VU opera con 16 elementos a la vez (por ciclo), mientras que un SU puede operar con uno a la vez (uno/ciclo). Además, la SU maneja algunas otras operaciones, como la bifurcación. ^[15]

Cada SIMD-VU tiene una memoria privada donde almacena sus registros. Hay dos tipos de registros: registros escalares (S0, S1, etc.), que contienen números de 4 bytes cada uno, y registros vectoriales (V0, V1, etc.), cada uno de los cuales representa un conjunto de 64 números de 4 bytes. En los registros vectoriales, cada operación se realiza en paralelo con los 64 números. que corresponden a 64 entradas. Por ejemplo, puede funcionar en 64 píxeles diferentes a la vez (para cada uno de ellos las entradas son ligeramente diferentes y, por lo tanto, al final se obtiene un color ligeramente diferente).

Cada SIMD-VU tiene espacio para 512 registros escalares y 256 registros vectoriales.

AMD ha afirmado que cada unidad de cómputo (CU) GCN tiene 64 KiB de recursos compartidos de datos locales (LDS). ^[dieciséis]

planificador CU

El programador CU es el bloque funcional de hardware que elige qué frentes de onda ejecuta el SIMD-VU. Elige un SIMD-VU por ciclo para la programación. No debe confundirse con otros programadores de hardware o software.

frente de onda

Un sombreador es un pequeño programa escrito en GLSL que realiza procesamiento de gráficos, y un kernel es un pequeño programa escrito en OpenCL que realiza procesamiento GPGPU. Estos procesos no necesitan tantos registros, pero sí necesitan cargar datos desde la memoria del sistema o de los gráficos. Esta operación viene con una latencia significativa. AMD y Nvidia eligieron enfoques similares para ocultar esta latencia inevitable: la agrupación de múltiples subprocesos . AMD llama a este grupo "frente de onda", mientras que Nvidia lo llama "deformación". Un grupo de subprocesos es la unidad más básica de programación de GPU que implementan este enfoque para ocultar la latencia. Es el tamaño mínimo de los datos procesados en forma SIMD, la unidad de código ejecutable más pequeña y la forma de procesar una sola instrucción en todos los subprocesos que contiene al mismo tiempo.

En todas las GPU GCN, un "frente de onda" consta de 64 subprocesos, y en todas las GPU Nvidia, un "warp" consta de 32 subprocesos.

La solución de AMD es atribuir múltiples frentes de onda a cada SIMD-VU. El hardware distribuye los registros a los diferentes frentes de onda, y cuando un frente de onda está esperando algún resultado, que se encuentra en la memoria, el Programador CU asigna al SIMD-VU otro frente de onda. Los frentes de onda se atribuyen por SIMD-VU. Los SIMD-VU no intercambian frentes de onda. Se puede atribuir un máximo de 10 frentes de onda por SIMD-VU (por lo tanto, 40 por CU).

AMD CodeXL muestra tablas con la relación entre el número de SGPR y VGPR y el número de frentes de onda, pero esencialmente, para SGPRS es entre 104 y 512 por número de frentes de onda, y para VGPRS es 256 por número de frentes de onda.

Tenga en cuenta que, junto con las instrucciones SSE , este concepto del nivel más básico de paralelismo a menudo se denomina "ancho de vector". El ancho del vector se caracteriza por el número total de bits que contiene.

Unidad vectorial SIMD

Cada Unidad Vectorial SIMD tiene:

una unidad lógica aritmética (ALU) de vector de coma flotante y enteros de 16 carriles
Archivo de registro de propósito general vectorial (VGPR) de 64 KiB
10 contadores de programa de 48 bits
Búfer de instrucciones para 10 frentes de onda (cada frente de onda es un grupo de 64 subprocesos, o el tamaño de un VGPR lógico)
Un frente de onda de 64 hilos emite a una unidad SIMD de 16 carriles durante cuatro ciclos

Cada SIMD-VU tiene 10 buffers de instrucciones de frente de onda y se necesitan 4 ciclos para ejecutar un frente de onda.

Bloques de aceleración de audio y vídeo.

Muchas implementaciones de GCN suelen ir acompañadas de varios de los otros bloques ASIC de AMD . Incluyendo, entre otros, Unified Video Decoder , Video Coding Engine y AMD TrueAudio .

Motor de codificación de vídeo

Video Coding Engine es un ASIC de codificación de vídeo , introducido por primera vez con la serie Radeon HD 7000 . ^[17]

La versión inicial de VCE agregó soporte para codificar fotogramas I y P H.264 en el formato de píxeles YUV420 , junto con codificación temporal SVE y modo de codificación de visualización, mientras que la segunda versión agregó soporte de fotograma B para fotogramas I YUV420 y YUV444.

VCE 3.0 formó parte de la tercera generación de GCN, añadiendo escalado de vídeo de alta calidad y el códec HEVC (H.265).

VCE 4.0 era parte de la arquitectura Vega y posteriormente fue sucedido por Video Core Next .

TrueAudio

Memoria virtual unificada

En una vista previa de 2011, AnandTech escribió sobre la memoria virtual unificada, compatible con Graphics Core Next. ^[18]

Arquitectura de computadora de escritorio clásica con una tarjeta gráfica distinta a través de PCI Express . La CPU y la GPU tienen su propia memoria física, con diferentes espacios de direcciones. Es necesario copiar todos los datos a través del bus PCIe. Nota: el diagrama muestra los anchos de banda, pero no la latencia de la memoria .
GCN admite la "memoria virtual unificada", por lo que permite la copia cero ; en lugar de los datos, solo se copian y "pasan" los punteros . Esta es una característica primordial de la HSA .
Las soluciones de gráficos integrados (y las APU AMD con gráficos TeraScale ) sufren una memoria principal particionada : una parte de la memoria del sistema se asigna exclusivamente a la GPU. La copia cero no es posible, los datos deben copiarse (a través del bus de memoria del sistema) de una partición a otra.
Las APU AMD con gráficos GCN se benefician de la memoria principal unificada y conservan el escaso ancho de banda. ^[19]

Arquitectura de sistemas heterogéneos (HSA)

Algunas de las características específicas de HSA implementadas en el hardware necesitan soporte del kernel del sistema operativo (sus subsistemas) y/o de controladores de dispositivos específicos. Por ejemplo, en julio de 2014, AMD publicó un conjunto de 83 parches que se fusionarían en la línea principal 3.17 del kernel de Linux para admitir sus tarjetas gráficas Radeon basadas en Graphics Core Next. El llamado controlador del kernel HSA reside en el directorio /drivers/gpu/hsa , mientras que los controladores de dispositivos gráficos DRM residen en /drivers/gpu/drm ^[21] y aumentan los controladores DRM ya existentes para las tarjetas Radeon. ^[22] Esta primera implementación se centra en una única APU "Kaveri" y funciona junto con el controlador de gráficos del kernel Radeon existente (kgd).

Compresión de color delta sin pérdidas

Programadores de hardware

Los programadores de hardware se utilizan para realizar la programación ^[23] y descargar la asignación de colas de computación a las ACE desde el controlador al hardware, almacenando en buffer estas colas hasta que haya al menos una cola vacía en al menos una ACE. Esto hace que el HWS asigne inmediatamente colas almacenadas en búfer a las ACE hasta que todas las colas estén llenas o no haya más colas para asignar de forma segura. ^[24]

Parte del trabajo de programación realizado incluye colas priorizadas que permiten que las tareas críticas se ejecuten con una prioridad más alta que otras tareas sin requerir que las tareas de menor prioridad sean reemplazadas para ejecutar la tarea de alta prioridad, permitiendo así que las tareas se ejecuten simultáneamente con las tareas de alta prioridad. programado para acaparar la GPU tanto como sea posible y al mismo tiempo permitir que otras tareas utilicen los recursos que las tareas de alta prioridad no están utilizando. ^[23] Estos son esencialmente motores de cómputo asincrónicos que carecen de controladores de despacho. ^[23] Se introdujeron por primera vez en la microarquitectura GCN de cuarta generación, ^[23] pero estaban presentes en la microarquitectura GCN de tercera generación para fines de pruebas internas. ^[25] Una actualización del controlador ha habilitado los programadores de hardware en piezas GCN de tercera generación para uso en producción. ^[23]

Acelerador de descarte primitivo

Esta unidad descarta los triángulos degenerados antes de que entren en el sombreador de vértices y los triángulos que no cubren ningún fragmento antes de que entren en el sombreador de fragmentos. ^[26] Esta unidad se introdujo con la microarquitectura GCN de cuarta generación. ^[26]

Generaciones

Núcleo de gráficos Siguiente 1

La microarquitectura GCN 1 se utilizó en varias tarjetas gráficas de la serie Radeon HD 7000 .

soporte para direccionamiento de 64 bits ( espacio de direcciones x86-64 ) con espacio de direcciones unificado para CPU y GPU ^[18]
- soporte para PCIe 3.0 ^[27]
- La GPU envía solicitudes de interrupción a la CPU en varios eventos (como fallas de página )
soporte para texturas parcialmente residentes, ^[28] que habilitan el soporte de memoria virtual a través de extensiones DirectX y OpenGL
Compatibilidad con AMD PowerTune , que ajusta dinámicamente el rendimiento para mantenerse dentro de un TDP específico ^[29]
soporte para Manto (API)

Hay motores de computación asincrónicos que controlan el cálculo y el envío. ^[15]^[30]

Potencia de núcleo cero

ZeroCore Power es una tecnología de ahorro de energía inactiva prolongada que apaga las unidades funcionales de la GPU cuando no está en uso. ^[31] La tecnología AMD ZeroCore Power complementa a AMD PowerTune .

Papas fritas

GPU discretas (familia de las Islas del Sur):

Hainan
Öland
Cabo Verde
Pitcairn
Tahití

Núcleo de gráficos siguiente 2

La segunda generación de GCN se introdujo con la Radeon HD 7790 y también se encuentra en las Radeon HD 8770 , R7 260/260X, R9 290/290X, R9 295X2 , R7 360 y R9 390/390X , así como en las basadas en Steamroller . APU de escritorio "Kaveri" y APU móvil "Kaveri" y en las APU "Beema" y "Mullins" basadas en Puma . Tiene múltiples ventajas sobre el GCN original, incluida la compatibilidad con FreeSync , AMD TrueAudio y una versión revisada de la tecnología AMD PowerTune .

La segunda generación de GCN introdujo una entidad llamada "Shader Engine" (SE). Un Shader Engine comprende un procesador de geometría, hasta 44 CU (chip Hawaii), rasterizadores, ROP y caché L1. No forman parte de un Shader Engine el procesador de comandos de gráficos, los 8 ACE, la caché L2 y los controladores de memoria, así como los aceleradores de audio y video, los controladores de pantalla, los 2 controladores DMA y la interfaz PCIe .

El A10-7850K "Kaveri" contiene 8 CU (unidades de cómputo) y 8 motores de cómputo asíncronos para programación independiente y envío de elementos de trabajo. ^[32]

En la AMD Developer Summit (APU) de noviembre de 2013, Michael Mantor presentó la Radeon R9 290X . ^[33]

Papas fritas

GPU discretas (familia Sea Islands):

Bonaire
Hawai

Integrado en APU:

temash
Cabaña
Liverpool (es decir, la APU que se encuentra en PlayStation 4)
Durango (es decir, la APU que se encuentra en Xbox One y Xbox One S)
Kaveri
Godavari
Mullins
beema
Carrizo-L

Núcleo de gráficos Siguiente 3

La tercera generación de GCN ^[34] se introdujo en 2014 con las Radeon R9 285 y R9 M295X, que tienen la GPU "Tonga". Cuenta con un rendimiento de teselación mejorado, compresión delta de color sin pérdidas para reducir el uso del ancho de banda de la memoria, un conjunto de instrucciones actualizado y más eficiente, un nuevo escalador de alta calidad para video, codificación HEVC (VCE 3.0) y decodificación HEVC (UVD 6.0) y una nueva interfaz multimedia. motor (codificador/decodificador de vídeo). La compresión de color delta es compatible con Mesa. ^[35] Sin embargo, su rendimiento de doble precisión es peor en comparación con la generación anterior. ^[36]

Papas fritas

GPU discretas:

Tonga (familia de Islas Volcánicas), viene con UVD 5.0 (Unified Video Decoder)
Fiji (familia Pirate Islands), viene con UVD 6.0 y memoria de alto ancho de banda (HBM 1)

Integrado en APU:

Carrizo, viene con UVD 6.0
Cresta de Bristol ^[37]
Cresta pedregosa ^[37]

Núcleo de gráficos Siguiente 4

Las GPU de la familia Arctic Islands se introdujeron en el segundo trimestre de 2016 con la serie AMD Radeon 400 . El motor 3D (es decir, GCA (matriz de gráficos y computación) o GFX) es idéntico al que se encuentra en los chips Tonga. ^[38] Pero Polaris presenta un motor de controlador de pantalla más nuevo, UVD versión 6.3, etc.

Todos los chips basados en Polaris, excepto el Polaris 30, se producen mediante el proceso FinFET de 14 nm , desarrollado por Samsung Electronics y con licencia de GlobalFoundries . ^[39] El Polaris 30, ligeramente más nuevo y actualizado, se basa en el nodo de proceso LP FinFET de 12 nm, desarrollado por Samsung y GlobalFoundries. La arquitectura del conjunto de instrucciones GCN de cuarta generación es compatible con la tercera generación. Es una optimización para el proceso FinFET de 14 nm que permite velocidades de reloj de GPU más altas que con la tercera generación de GCN. ^[40] Las mejoras arquitectónicas incluyen nuevos programadores de hardware, un nuevo acelerador de descarte primitivo, un nuevo controlador de pantalla y un UVD actualizado que puede decodificar HEVC en resoluciones 4K a 60 fotogramas por segundo con 10 bits por canal de color.

Papas fritas

GPU discretas: ^[41]

Polaris 10 (también con nombre en código Ellesmere ) que se encuentra en las tarjetas gráficas de las marcas "Radeon RX 470" y "Radeon RX 480".
Polaris 11 (también con nombre en código Baffin ) que se encuentra en las tarjetas gráficas de la marca "Radeon RX 460" (también Radeon RX 560 D )
Polaris 12 (también con nombre en código Lexa) que se encuentra en las tarjetas gráficas de las marcas "Radeon RX 550" y "Radeon RX 540"
Polaris 20, que es un Polaris 10 actualizado ( proceso LPP Samsung / GloFo FinFET de 14 nm ) con relojes más altos, utilizado para tarjetas gráficas de las marcas "Radeon RX 570" y "Radeon RX 580" ^[42]
Polaris 21, que es un Polaris 11 actualizado (proceso LPP Samsung/GloFo FinFET de 14 nm), utilizado para tarjetas gráficas de la marca "Radeon RX 560".
Polaris 22, que se encuentra en las tarjetas gráficas de las marcas "Radeon RX Vega M GH" y "Radeon RX Vega M GL" (como parte de Kaby Lake-G )
Polaris 23, que es una Polaris 12 actualizada (proceso LPP Samsung/GloFo FinFET de 14 nm), utilizada para tarjetas gráficas de las marcas "Radeon Pro WX 3200" y "Radeon RX 540X" (también Radeon RX 640) [43 ^]
Polaris 30, que es un Polaris 20 actualizado (proceso LP GloFo FinFET de 12 nm) con relojes más altos, utilizado para tarjetas gráficas de la marca "Radeon RX 590" ^[44]

Además de las GPU dedicadas, Polaris se utiliza en las APU de PlayStation 4 Pro y Xbox One X, denominadas "Neo" y "Scorpio", respectivamente.

Rendimiento de precisión

El rendimiento FP64 de todas las GPU GCN de cuarta generación es ^1/16_del rendimiento FP32.

Núcleo de gráficos Siguiente 5

AMD comenzó a publicar detalles de su próxima generación de arquitectura GCN, denominada 'Unidad de Computación de Próxima Generación', en enero de 2017. ^[40]^[45]^[46] Se esperaba que el nuevo diseño aumentara las instrucciones por reloj , mayores velocidades de reloj , soporte para HBM2 , un espacio de direcciones de memoria más grande . Los conjuntos de chips de gráficos discretos también incluyen "HBCC (controlador de caché de alto ancho de banda)", pero no cuando están integrados en APU. ^[47] Además, se esperaba que los nuevos chips incluyeran mejoras en las unidades de salida de rasterización y renderizado . Los procesadores de flujo están muy modificados con respecto a las generaciones anteriores para admitir la tecnología Rapid Pack Math de matemáticas empaquetadas para números de 8, 16 y 32 bits. Con esto, existe una ventaja de rendimiento significativa cuando se acepta una precisión menor (por ejemplo: procesar dos números de media precisión al mismo ritmo que un único número de precisión simple ).

Nvidia introdujo la rasterización y el binning basados en mosaicos con Maxwell , ^[48] y esta fue una gran razón para el aumento de la eficiencia de Maxwell. En enero, AnandTech asumió que Vega finalmente alcanzaría a Nvidia en cuanto a optimizaciones de eficiencia energética debido al nuevo "DSBR (Draw Stream Binning Rasterizer)" que se introducirá con Vega. ^[49]

También agregó soporte para una nueva etapa de sombreado : Primitive Shaders. ^[50]^[51] Los sombreadores primitivos proporcionan un procesamiento de geometría más flexible y reemplazan los sombreadores de vértices y geometría en una canalización de renderizado. A partir de diciembre de 2018, los sombreadores Primitive no se pueden utilizar porque aún no se han realizado los cambios de API necesarios. ^[52]

Vega 10 y Vega 12 utilizan el proceso FinFET de 14 nm , desarrollado por Samsung Electronics y con licencia de GlobalFoundries . Vega 20 utiliza el proceso FinFET de 7 nm desarrollado por TSMC .

Papas fritas

GPU discretas:

Vega 10 ( proceso Samsung / GloFo FinFET de 14 nm ) (también con nombre en código Groenlandia ^[53] ) que se encuentra en "Radeon RX Vega 64", "Radeon RX Vega 56", "Radeon Vega Frontier Edition", "Radeon Pro V340", Radeon Pro Tarjetas gráficas WX 9100 y Radeon Pro WX 8200 ^[54]
Vega 12 (proceso Samsung/GloFo FinFET de 14 nm) encontrado en tarjetas gráficas móviles de las marcas "Radeon Pro Vega 20" y "Radeon Pro Vega 16" ^[55]
Vega 20 ( proceso TSMC FinFET de 7 nm ) que se encuentra en tarjetas aceleradoras de las marcas "Radeon Instinct MI50" y "Radeon Instinct MI60", ^[56] tarjetas gráficas de las marcas "Radeon Pro Vega II" y "Radeon VII". ^[57]

Integrado en APU:

Raven Ridge ^[58] vino con VCN 1 que reemplaza a VCE y UVD y permite la decodificación VP9 de función fija completa.

Rendimiento de precisión

El rendimiento de punto flotante de doble precisión (FP64) de todas las GPU GCN de quinta generación, excepto Vega 20, es una decimosexta parte del rendimiento de FP32. Para Vega 20 con Radeon Instinct, esto es la mitad del rendimiento de FP32. Para Vega 20 con Radeon VII esto es una cuarta parte del rendimiento de FP32. ^[59] Todas las GPU de quinta generación de GCN admiten cálculos de punto flotante de media precisión (FP16) , que es el doble del rendimiento de FP32.

Comparación de chips GCN

La tabla contiene solo chips GPU discretos (incluidos los móviles). La APU (IGP) y los chips de consola no figuran en la lista.

¹ Los nombres en clave antiguos como Treasure (Lexa) o Hawaii Refresh (Ellesmere) no figuran en la lista.
² Fecha de lanzamiento inicial. Las fechas de lanzamiento de chips variantes como Polaris 20 (abril de 2017) no figuran en la lista.

Ver también

Lista de unidades de procesamiento de gráficos AMD

enlaces externos

Sitio web oficial de AMD.com Graphics Core Next (GCN)

Referencias

^ AMD Developer Central (31 de enero de 2014). "GS-4106 La arquitectura AMD GCN: un curso intensivo, por Layla Mah". Slideshare.net .
^ "AMD lanza la tarjeta gráfica de GPU única más rápida del mundo: AMD Radeon HD 7970" (Presione soltar). AMD. 22 de diciembre de 2011. Archivado desde el original el 20 de enero de 2015 . Consultado el 20 de enero de 2015 .
^ Gulati, Abheek (11 de noviembre de 2019). "Una inmersión arquitectónica profunda en las arquitecturas de GPU TeraScale, GCN y RDNA de AMD". Medio . Consultado el 12 de diciembre de 2021 .
^ "Foros de la comunidad AMD". Comunidad.amd.com . 15 de julio de 2016.
^ "AMDGPU de fondo de LLVM". Llvm.org .
^ "Cambios, nuevas funciones y correcciones de la serie de versiones de GCC 9" . Consultado el 13 de noviembre de 2019 .
^ "Soporte de descarga de AMD GCN" . Consultado el 13 de noviembre de 2019 .
^ "Iniciativa AMD Boltzmann: interfaz de computación heterogénea para la portabilidad (HIP)". 16 de noviembre de 2015. Archivado desde el original el 26 de enero de 2016 . Consultado el 8 de diciembre de 2019 .
^ Smith, Ryan (5 de enero de 2017). "Vista previa de la arquitectura de la GPU AMD Vega". Anandtech.com . Consultado el 11 de julio de 2017 .
^ Smith, Ryan. "AMD profundiza en el sombreado asincrónico". Anandtech.com .
^ "Productos conformes". Khronos.org . 26 de octubre de 2017.
^ Documento técnico sobre núcleos de computación (PDF) . AMD. 2014. pág. 5.
^ ab Smith, Ryan (21 de diciembre de 2011). "Vista previa siguiente del núcleo de gráficos de AMD". Anandtech.com . Consultado el 18 de abril de 2017 .
^ "Arquitectura Graphics Core Next (GCN) de AMD" (PDF) . TechPowerUp . Consultado el 26 de febrero de 2024 .
^ ab Mantor, Michael; Houston, Mike (15 de junio de 2011). "Núcleo de gráficos AMD siguiente" (PDF) . AMD . pag. 40 . Consultado el 15 de julio de 2014 . Motor de computación asíncrono (ACE)
^ "Optimización de la ocupación de la GPU y el uso de recursos con grandes grupos de subprocesos". GPU AMDAbrir . Consultado el 1 de enero de 2024 .
^ "Informe técnico AMD UnifiedVideoDecoder (UVD)" (PDF) . 15 de junio de 2012 . Consultado el 20 de mayo de 2017 .
^ ab "No solo una nueva arquitectura, sino también nuevas funciones". AnandTech . 21 de diciembre de 2011 . Consultado el 11 de julio de 2014 .
^ "Microarquitectura Kaveri". Semipreciso . 15 de enero de 2014.
^ Airlie, Dave (26 de noviembre de 2014). "Fusionar AMDKFD". freedesktop.org . Consultado el 21 de enero de 2015 .
^ "/controladores/gpu/drm". Kernel.org .
^ "[PARCHE 00/83] Controlador del kernel AMD HSA". LKML . 10 de julio de 2014 . Consultado el 11 de julio de 2014 .
^ abcde Angelini, Chris (29 de junio de 2016). "Revisión de AMD Radeon RX 480 8GB". Hardware de Tom . pag. 1 . Consultado el 11 de agosto de 2016 .
^ "Diseccionando la arquitectura Polaris" (PDF) . 2016. Archivado desde el original (PDF) el 20 de septiembre de 2016 . Consultado el 12 de agosto de 2016 .
^ Shrout, Ryan (29 de junio de 2016). "Revisión de AMD Radeon RX 480: la promesa de Polaris". Perspectiva de la PC . pag. 2. Archivado desde el original el 10 de octubre de 2016 . Consultado el 12 de agosto de 2016 .
^ ab Smith, Ryan (29 de junio de 2016). "La vista previa de AMD Radeon RX 480: Polaris deja su huella en la corriente principal". AnandTech . pag. 3 . Consultado el 11 de agosto de 2016 .
^ "La serie AMD Radeon HD 7000 será compatible con PCI-Express 3.0". TechPowerUp . Consultado el 21 de julio de 2011 .
^ "AMD detalla la arquitectura de GPU de próxima generación" . Consultado el 3 de agosto de 2011 .
^ Tony Chen; Jason Greaves, "Arquitectura Graphics Core Next (GCN) de AMD" (PDF) , AMD , consultado el 13 de agosto de 2016
^ "Próxima vista previa del núcleo de gráficos de AMD: nueva GPU de AMD, diseñada para informática". AnandTech . 21 de diciembre de 2011 . Consultado el 15 de julio de 2014 . Los nuevos motores de cómputo asincrónicos de AMD sirven como procesadores de comando para operaciones informáticas en GCN. El objetivo principal de las ACE será aceptar el trabajo y enviarlo a las CU para su procesamiento.
^ "Gestión de la energía inactiva: presentación de ZeroCore Power". AnandTech.com . 22 de diciembre de 2011 . Consultado el 29 de abril de 2015 .
^ "Probado el Kaveri A10-7850K de AMD". AnandTech . 14 de enero de 2014 . Consultado el 7 de julio de 2014 .
^ "AMD Radeon R9-290X". 21 de noviembre de 2013.
^ "Descripción general de Carrizo" (PNG) . Imágenes.anandtech.com . Consultado el 20 de julio de 2018 .
^ "Agregar soporte DCC". Freedesktop.org . 11 de octubre de 2015.
^ Smith, Ryan (10 de septiembre de 2014). "Revisión de AMD Radeon R9 285". Anandtech.com . Consultado el 13 de marzo de 2017 .
^ ab Cutress, Ian (1 de junio de 2016). "AMD anuncia APU de séptima generación". Anandtech.com . Consultado el 1 de junio de 2016 .
^ "Función Radeon". www.x.org .
^ "Radeon Technologies Group - enero de 2016 - Arquitectura AMD Polaris". Guru3d.com .
^ ab Smith, Ryan (5 de enero de 2017). "El avance de la arquitectura AMD Vega: IPC superior, mosaico y más, disponible en el primer semestre de 2017". Anandtech.com . Consultado el 10 de enero de 2017 .
^ WhyCry (24 de marzo de 2016). "AMD confirma que Polaris 10 es Ellesmere y Polaris 11 es Baffin". VideoCardz . Consultado el 8 de abril de 2016 .
^ "Datos de hardware rápidos y completos para la serie Radeon RX 500 de AMD". www.3dcenter.org .
^ "AMD Polaris 23". TechPowerUp . Consultado el 12 de mayo de 2022 .
^ Oh, Nate (15 de noviembre de 2018). "Revisión de AMD Radeon RX 590, con XFX y PowerColor: Polaris regresa (otra vez)". anandtech.com . Consultado el 24 de noviembre de 2018 .
^ Kampman, Jeff (5 de enero de 2017). "Se levanta el telón de la arquitectura Vega de AMD". TechReport.com . Consultado el 10 de enero de 2017 .
^ Shrout, Ryan (5 de enero de 2017). "Vista previa de la arquitectura de GPU AMD Vega: arquitectura de memoria rediseñada". Perspectiva de la PC . Consultado el 10 de enero de 2017 .
^ Kampman, Jeff (26 de octubre de 2017). "Reveladas las APU Ryzen 7 2700U y Ryzen 5 2500U de AMD". Techreport.com . Consultado el 26 de octubre de 2017 .
^ Raevenlord (1 de marzo de 2017). "Sobre el renderizado basado en mosaicos de NVIDIA". tecnologíaPowerUp .
^ "Vega Teaser: Rasterizador de binning de Draw Stream". Anandtech.com .
^ "Se revela Radeon RX Vega: AMD promete rendimiento de juegos 4K por $ 499 - Reseñas confiables". Trustedreviews.com . 31 de julio de 2017. Archivado desde el original el 14 de julio de 2017 . Consultado el 20 de marzo de 2017 .
^ "Se levanta el telón de la arquitectura Vega de AMD". Techreport.com . Archivado desde el original el 1 de septiembre de 2017 . Consultado el 20 de marzo de 2017 .
^ Kampman, Jeff (23 de enero de 2018). "Los sombreadores primitivos Radeon RX Vega necesitarán soporte API". Techreport.com . Consultado el 29 de diciembre de 2018 .
^ "ROCm-OpenCL-Runtime/libUtils.cpp en el maestro · RadeonOpenCompute/ROCm-OpenCL-Runtime". github.com . 3 de mayo de 2017 . Consultado el 10 de noviembre de 2018 .
^ "Revisión de AMD Radeon RX Vega 64 y RX Vega 56: Vega ardiendo brillante". Anandtech.com . 14 de agosto de 2017 . Consultado el 16 de noviembre de 2017 .
^ "Vega Mobile Lives de AMD: Vega Pro 20 y 16 en MacBook Pros actualizados en noviembre". Anandtech.com . 30 de octubre de 2018 . Consultado el 10 de noviembre de 2018 .
^ "AMD anuncia los aceleradores Radeon Instinct MI60 y MI50: impulsados por Vega de 7 nm". Anandtech.com . 6 de noviembre de 2018 . Consultado el 10 de noviembre de 2018 .
^ "AMD presenta la primera GPU para juegos de 7 nm del mundo: ofrece un rendimiento excepcional y experiencias increíbles para jugadores, creadores y entusiastas" (Comunicado de prensa). Las Vegas, Nevada: AMD. 9 de enero de 2019 . Consultado el 12 de enero de 2019 .
^ Ferreira, Bruno (16 de mayo de 2017). "Las APU Ryzen Mobile llegarán a una computadora portátil cercana". Informe técnico . Consultado el 16 de mayo de 2017 .
^ "AMD presenta las primeras GPU para centros de datos de 7 nm del mundo: impulsando la próxima era de inteligencia artificial, computación en la nube y computación de alto rendimiento (HPC) | AMD". AMD.com (Comunicado de prensa). 6 de noviembre de 2018 . Consultado el 10 de noviembre de 2018 .
^ "Función Radeon". x.Org . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Tahiti". TechPowerUp . Consultado el 20 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Pitcairn". TechPowerUp . Consultado el 20 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Cabo Verde". TechPowerUp . Consultado el 20 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Öland". TechPowerUp . Consultado el 20 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Hainan". TechPowerUp . Consultado el 20 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Bonaire". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Hawaii". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Topaz". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Tonga". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Fiji". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Ellesmere". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Baffin". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Lexa". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Vega 10". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Vega 12". TechPowerUp . Consultado el 21 de noviembre de 2022 .
^ "Especificaciones de la GPU AMD Vega 20". TechPowerUp . Consultado el 21 de noviembre de 2022 .