Microarquitectura de GPU de Nvidia
Ampere es el nombre en clave de una microarquitectura de unidad de procesamiento gráfico (GPU) desarrollada por Nvidia como sucesora de las arquitecturas Volta y Turing . Se anunció oficialmente el 14 de mayo de 2020 y lleva el nombre del matemático y físico francés André-Marie Ampère . [1] [2]
Nvidia anunció las GPU de consumo de la serie GeForce 30 con arquitectura Ampere en un evento especial de GeForce el 1 de septiembre de 2020. [3] [4] Nvidia anunció la GPU A100 de 80 GB en SC20 el 16 de noviembre de 2020. [5] Las tarjetas gráficas RTX móviles y la RTX 3060 basada en la arquitectura Ampere se revelaron el 12 de enero de 2021. [6]
Nvidia anunció el sucesor de Ampere, Hopper , en GTC 2022, y "Ampere Next Next" ( Blackwell ) para un lanzamiento en 2024 en la GPU Technology Conference 2021.
Detalles
Las mejoras arquitectónicas de la arquitectura Ampere incluyen las siguientes:
- Capacidad de cómputo CUDA 8.0 para A100 y 8.6 para la serie GeForce 30 [7]
- Proceso FinFET de 7 nm de TSMC para el chip A100
- Versión personalizada del proceso de 8 nm (8N) de Samsung para la serie GeForce 30 [8]
- Núcleos Tensor de tercera generación con soporte para FP16, bfloat16 , TensorFloat-32 (TF32) y FP64 y aceleración de escasez. [9] Los núcleos Tensor individuales tienen, con 256 operaciones FMA FP16 por reloj, una potencia de procesamiento 4x (solo GA100, 2x en GA10x) en comparación con las generaciones anteriores de núcleos Tensor; el recuento de núcleos Tensor se reduce a uno por SM.
- Núcleos de trazado de rayos de segunda generación; trazado de rayos, sombreado y computación simultáneos para la serie GeForce 30
- Memoria de gran ancho de banda 2 (HBM2) en A100 de 40 GB y A100 de 80 GB
- Memoria GDDR6X para GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti
- Doble núcleo FP32 por SM en GPU GA10x
- NVLink 3.0 con un rendimiento de 50 Gbit/s por par [9]
- PCI Express 4.0 con soporte SR-IOV (SR-IOV está reservado solo para A100)
- Función de virtualización de GPU de múltiples instancias (MIG) y partición de GPU en A100 que admite hasta siete instancias
- Conjunto de funciones K de PureVideo para decodificación de video por hardware con decodificación por hardware AV1 [10] para la serie GeForce 30 y conjunto de funciones J para A100
- 5 NVDEC para A100
- Añade un nuevo decodificador JPEG de 5 núcleos basado en hardware ( NVJPG ) con YUV420, YUV422, YUV444, YUV400, RGBA. No debe confundirse con NVJPEG de Nvidia ( biblioteca acelerada por GPU para codificación/decodificación JPEG)
Papas fritas
- GA100 [11]
- GA102
- GA103
- GA104
- GA106
- GA107
- GA10B
Comparación de la capacidad de cómputo: GP100 vs GV100 vs GA100 [12]
Comparación de la matriz de soporte de precisión [13] [14]
Leyenda:
- FPnn: punto flotante con nn bits
- INTn: entero con n bits
- INT1: binario
- TF32: TensorFloat32
- BF16: flotador bf16
Comparación del rendimiento de decodificación
El amperio muere
Acelerador A100 y DGX A100
El acelerador A100 basado en Ampere se anunció y lanzó el 14 de mayo de 2020. [9] El A100 presenta 19,5 teraflops de rendimiento FP32, 6912 núcleos CUDA FP32/INT32, 3456 núcleos CUDA FP64, 40 GB de memoria gráfica y 1,6 TB/s de ancho de banda de memoria gráfica. [22] El acelerador A100 inicialmente solo estaba disponible en la tercera generación del servidor DGX , incluidos 8 A100. [9] También se incluyen en el DGX A100 15 TB de almacenamiento NVMe PCIe gen 4 , [22] dos CPU AMD Rome 7742 de 64 núcleos , 1 TB de RAM e interconexión HDR InfiniBand con tecnología Mellanox . El precio inicial del DGX A100 fue de 199.000 dólares. [9]
Comparación de aceleradores utilizados en DGX: [23] [24] [25]
Productos que utilizan Ampere
- Serie GeForce MX
- GeForce MX570 (móvil) (GA107)
- Serie GeForce 20
- GeForce RTX 2050 (móvil) (GA107)
- Serie GeForce 30
- GPU para portátiles GeForce RTX 3050 (GA107)
- GeForce RTX 3050 (GA106 o GA107) [26]
- GPU para computadora portátil GeForce RTX 3050 Ti (GA107)
- GPU para computadora portátil GeForce RTX 3060 (GA106)
- GeForce RTX 3060 (GA106 o GA104) [27]
- GeForce RTX 3060 Ti (GA104 o GA103) [28]
- GPU para computadora portátil GeForce RTX 3070 (GA104)
- GeForce RTX 3070 (GA104)
- GPU para computadora portátil GeForce RTX 3070 Ti (GA104)
- GeForce RTX 3070 Ti (GA104 o GA102) [29]
- GPU para computadora portátil GeForce RTX 3080 (GA104)
- GeForce RTX 3080 (GA102)
- GeForce RTX 3080 de 12 GB (GA102)
- GPU para portátiles GeForce RTX 3080 Ti (GA103)
- GeForce RTX 3080 Ti (GA102)
- GeForce RTX 3090 (GA102)
- GeForce RTX 3090 Ti (GA102)
- GPU para estaciones de trabajo de Nvidia (anteriormente Quadro )
- RTX A1000 (móvil) (GA107)
- RTX A2000 (móvil) (GA106)
- RTX A2000 (GA106)
- RTX A3000 (móvil) (GA104)
- RTX A4000 (móvil) (GA104)
- RTX A4000 (GA104)
- RTX A5000 (móvil) (GA104)
- RTX A5500 (móvil) (GA103)
- RTX A4500 (GA102)
- RTX A5000 (GA102)
- RTX A5500 (GA102)
- RTX A6000 (GA102)
- A800 Activo
- GPU para centros de datos de Nvidia (anteriormente Tesla )
- Nvidia A2 (GA107)
- Nvidia A10 (GA102)
- Nvidia A16 (4xGA107)
- Nvidia A30 (GA100)
- Nvidia A40 (GA102)
- Nvidia A100 (GA100)
- Nvidia A100 80 GB (GA100)
- Nvidia A100X
- NVIDIA A30X
- SoC Tegra
- AGX Orin (GA10B)
- Orin NX (GA10B)
- Orin Nano (GA10B)
Véase también
Referencias
- ^ Sala de prensa, NVIDIA. "La nueva GPU Ampere para centros de datos de NVIDIA en plena producción". Sala de prensa de NVIDIA Sala de prensa .
- ^ "Arquitectura Ampere de NVIDIA en profundidad". Blog para desarrolladores de NVIDIA . 14 de mayo de 2020.
- ^ "NVIDIA ofrece el mayor salto generacional de la historia con las GPU GeForce RTX serie 30". Sala de prensa de Nvidia . 1 de septiembre de 2020 . Consultado el 9 de abril de 2023 .
- ^ "Cuenta regresiva para NVIDIA GeForce Ultimate". Nvidia .
- ^ "NVIDIA apuesta a lo grande: anuncia la GPU A100 de 80 GB, que potencia la GPU más potente del mundo para la supercomputación con IA". Sala de prensa de Nvidia . 16 de noviembre de 2020 . Consultado el 9 de abril de 2023 .
- ^ "NVIDIA GeForce Beyond en CES 2023". NVIDIA .
- ^ "I.7. Compute Capability 8.x". Nvidia . Consultado el 23 de septiembre de 2020 .
- ^ Bosnjak, Dominik (1 de septiembre de 2020). "La vieja tecnología de 8 nm de Samsung en el corazón de las monstruosas tarjetas Ampere de NVIDIA". SamMobile . Consultado el 19 de septiembre de 2020 .
- ^ abcde Smith, Ryan (14 de mayo de 2020). "NVIDIA Ampere Unleashed: NVIDIA anuncia una nueva arquitectura de GPU, la GPU A100 y un acelerador". AnandTech.
- ^ Delgado, Gerardo (1 de septiembre de 2020). «GPU GeForce RTX serie 30: marcando el comienzo de una nueva era de contenido de video con decodificación AV1». Nvidia . Consultado el 9 de abril de 2023 .
- ^ Morgan, Timothy Prickett (29 de mayo de 2020). "Profundizando en la arquitectura de GPU Ampere de Nvidia". The Next Platform . Consultado el 24 de marzo de 2022 .
- ^ "Arquitectura de GPU NVIDIA A100 Tensor Core: aceleración sin precedentes en todas las escalas" (PDF) . Nvidia . Consultado el 18 de septiembre de 2020 .
- ^ "Núcleos Tensor de NVIDIA: versatilidad para HPC e IA". NVIDIA .
- ^ "Resumen". docs.nvidia.com .
- ^ "Arquitectura de GPU NVIDIA A100 Tensor Core" (PDF) . NVIDIA Corporation . Consultado el 29 de abril de 2024 .
- ^ "Especificaciones de la GPU NVIDIA GA102". TechPowerUp . Consultado el 29 de abril de 2024 .
- ^ "Especificaciones de la GPU NVIDIA GA103". TechPowerUp . Consultado el 29 de abril de 2024 .
- ^ "Especificaciones de la GPU NVIDIA GA104". TechPowerUp . Consultado el 29 de abril de 2024 .
- ^ "Especificaciones de la GPU NVIDIA GA106". TechPowerUp . Consultado el 29 de abril de 2024 .
- ^ "Especificaciones de la GPU NVIDIA GA107". TechPowerUp . Consultado el 29 de abril de 2024 .
- ^ "Resumen técnico de la serie NVIDIA AGX Orin v1.2" (PDF) . Corporación NVIDIA . Consultado el 29 de abril de 2024 .
- ^ de Tom Warren; James Vincent (14 de mayo de 2020). "La primera GPU Ampere de Nvidia está diseñada para centros de datos e inteligencia artificial, no para tu PC". The Verge.
- ^ Smith, Ryan (22 de marzo de 2022). "Se anuncia la arquitectura de GPU NVIDIA Hopper y el acelerador H100: trabajo más inteligente y más duro". AnandTech.
- ^ Smith, Ryan (14 de mayo de 2020). "NVIDIA Ampere Unleashed: NVIDIA anuncia una nueva arquitectura de GPU, la GPU A100 y un acelerador". AnandTech.
- ^ "NVIDIA Tesla V100 probada: potencia de GPU casi increíble". TweakTown . 17 de septiembre de 2017.
- ^ Igor, Wallossek (13 de febrero de 2022). «Las dos caras de la GeForce RTX 3050 8GB». Igor's Lab . Consultado el 23 de febrero de 2022 .
- ^ Shilov, Anton (25 de septiembre de 2021). "Gainward y Galax listan tarjetas GeForce RTX 3060 con GPU GA104". Tom's Hardware . Consultado el 23 de septiembre de 2022 .
- ^ Tyson, Mark (23 de febrero de 2022). "Zotac presenta las primeras tarjetas de escritorio RTX 3060 Ti con GPU GA103". Tom's Hardware . Consultado el 23 de septiembre de 2022 .
- ^ WhyCry (26 de octubre de 2022). "ZOTAC lanza GeForce RTX 3070 Ti con GPU GA102-150". VideoCardz . Consultado el 21 de mayo de 2023 .
Enlaces externos
- Documento técnico sobre la arquitectura de la GPU Tensor Core de Nvidia A100
- Documento técnico sobre la arquitectura de la GPU Nvidia Ampere GA102
- Arquitectura de Nvidia Ampere
- GPU Nvidia A100 con núcleo tensor
- Arquitectura Ampere de Nvidia en profundidad