Microarquitectura GPU de Nvidia
Ampere es el nombre en clave de una microarquitectura de unidad de procesamiento de gráficos (GPU) desarrollada por Nvidia como sucesora de las arquitecturas Volta y Turing . Fue anunciado oficialmente el 14 de mayo de 2020 y lleva el nombre del matemático y físico francés André-Marie Ampère . [1] [2]
Nvidia anunció las GPU de consumo de la serie GeForce 30 con arquitectura Ampere en un evento especial de GeForce el 1 de septiembre de 2020. [3] [4] Nvidia anunció la GPU A100 de 80 GB en SC20 el 16 de noviembre de 2020. [5] Tarjetas gráficas RTX móviles y RTX 3060 basado en la arquitectura Ampere se reveló el 12 de enero de 2021. [6]
Nvidia anunció el sucesor de Ampere, Hopper , en GTC 2022, y "Ampere Next Next" para un lanzamiento en 2024 en GPU Technology Conference 2021.
Detalles
Las mejoras arquitectónicas de la arquitectura Ampere incluyen lo siguiente:
- CUDA Compute Capability 8.0 para A100 y 8.6 para la serie GeForce 30 [7]
- Proceso FinFET de 7 nm de TSMC para A100
- Versión personalizada del proceso de 8 nm (8N) de Samsung para la serie GeForce 30 [8]
- Tensor Cores de tercera generación con soporte FP16, bfloat16 , TensorFloat-32 (TF32) y FP64 y aceleración de dispersión. [9] Los núcleos Tensor individuales tienen 256 operaciones FMA FP16 por reloj 4 veces más potencia de procesamiento (solo GA100, 2 veces en GA10x) en comparación con las generaciones anteriores de Tensor Core; el recuento de núcleos tensoriales se reduce a uno por SM.
- Núcleos de trazado de rayos de segunda generación; trazado de rayos, sombreado y computación simultáneos para la serie GeForce 30
- Memoria de alto ancho de banda 2 (HBM2) en A100 de 40 GB y A100 de 80 GB
- Memoria GDDR6X para GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti
- Doble núcleo FP32 por SM en GPU GA10x
- NVLink 3.0 con un rendimiento de 50 Gbit/s por par [9]
- PCI Express 4.0 con soporte SR-IOV (SR-IOV está reservado solo para A100)
- Función de virtualización de GPU (MIG) de instancias múltiples y partición de GPU en A100 que admite hasta siete instancias
- Conjunto de funciones PureVideo decodificación de vídeo por hardware K con decodificación de hardware AV1 [10] para la serie GeForce 30 y conjunto de funciones J para A100
- 5 NVDEC para A100
- Agrega una nueva decodificación JPEG de 5 núcleos ( NVJPG ) basada en hardware con YUV420, YUV422, YUV444, YUV400, RGBA. No debe confundirse con Nvidia NVJPEG ( biblioteca acelerada por GPU para codificación/decodificación JPEG)
Papas fritas
- GA100 [11]
- GA102
- GA103
- GA104
- GA106
- GA107
Comparación de la capacidad informática: GP100 frente a GV100 frente a GA100 [12]
Comparación de la matriz de soporte de precisión [13] [14]
Leyenda:
- FPnn: punto flotante con nn bits
- INTn: entero con n bits
- INT1: binario
- TF32: TensorFloat32
- BF16: bfloat16
Comparación del rendimiento de decodificación
Acelerador A100 y DGX A100
El acelerador A100 basado en Ampere se anunció y lanzó el 14 de mayo de 2020. [9] El A100 presenta 19,5 teraflops de rendimiento FP32, 6912 núcleos CUDA, 40 GB de memoria gráfica y 1,6 TB/s de ancho de banda de memoria gráfica. [15] El acelerador A100 inicialmente estaba disponible solo en la tercera generación del servidor DGX , incluidos 8 A100. [9] También se incluyen en el DGX A100 15 TB de almacenamiento NVMe PCIe gen 4 , [15] dos CPU AMD Rome 7742 de 64 núcleos , 1 TB de RAM e interconexión HDR InfiniBand con tecnología Mellanox . El precio inicial del DGX A100 era de 199.000 dólares. [9]
Comparación de aceleradores utilizados en DGX: [16] [17] [18]
Productos que utilizan amperios
- Serie GeForce MX
- GeForce MX570 (móvil) (GA107)
- Serie GeForce 20
- GeForce RTX 2050 (móvil) (GA107)
- Serie GeForce 30
- GPU para portátil GeForce RTX 3050 (GA107)
- GeForce RTX 3050 (GA106 o GA107) [19]
- GPU para portátil GeForce RTX 3050 Ti (GA107)
- GPU para portátil GeForce RTX 3060 (GA106)
- GeForce RTX 3060 (GA106 o GA104) [20]
- GeForce RTX 3060 Ti (GA104 o GA103) [21]
- GPU para portátil GeForce RTX 3070 (GA104)
- GeForce RTX 3070 (GA104)
- GPU para portátil GeForce RTX 3070 Ti (GA104)
- GeForce RTX 3070 Ti (GA104 o GA102) [22]
- GPU para portátil GeForce RTX 3080 (GA104)
- GeForce RTX 3080 (GA102)
- GeForce RTX 3080 12GB (GA102)
- GPU para portátil GeForce RTX 3080 Ti (GA103)
- Tarjeta GeForce RTX 3080 Ti (GA102)
- GeForce RTX 3090 (GA102)
- Tarjeta GeForce RTX 3090 Ti (GA102)
- GPU para estaciones de trabajo Nvidia (anteriormente Quadro )
- RTX A1000 (móvil) (GA107)
- RTX A2000 (móvil) (GA106)
- RTX A2000 (GA106)
- RTX A3000 (móvil) (GA104)
- RTX A4000 (móvil) (GA104)
- RTX A4000 (GA104)
- RTX A4500 (GA102)
- RTX A5000 (móvil) (GA104)
- RTX A5000 (GA102)
- RTX A5500 (GA102)
- RTX A6000 (GA102)
- GPU de centro de datos de Nvidia (anteriormente Tesla )
- Nvidia A2 (GA107)
- Tarjeta gráfica Nvidia A10 (GA102)
- Nvidia A16 (4 × GA107)
- Tarjeta gráfica Nvidia A30 (GA100)
- Tarjeta gráfica Nvidia A40 (GA102)
- Tarjeta gráfica Nvidia A100 (GA100)
- Tarjeta gráfica Nvidia A100 de 80 GB (GA100)
- SoC Jetson Orin
- Jetson Orin AGX
- Supersónico Orin NX
- Supersónico Orin Nano
Ver también
Referencias
- ^ Sala de redacción, NVIDIA. "La nueva GPU Ampere para centro de datos de NVIDIA en plena producción". Sala de prensa de NVIDIA .
- ^ "Arquitectura NVIDIA Ampere en profundidad". Blog para desarrolladores de NVIDIA . 14 de mayo de 2020.
- ^ "NVIDIA ofrece el mayor salto generacional jamás visto con las GPU GeForce RTX serie 30". Sala de prensa de Nvidia . 1 de septiembre de 2020 . Consultado el 9 de abril de 2023 .
- ^ "Cuenta atrás de NVIDIA GeForce Ultimate". NVIDIA .
- ^ "NVIDIA se duplica: anuncia la GPU A100 de 80 GB, la GPU más potente del mundo para supercomputación de IA". Sala de prensa de Nvidia . 16 de noviembre de 2020 . Consultado el 9 de abril de 2023 .
- ^ "NVIDIA GeForce Beyond en CES 2023". NVIDIA .
- ^ "I.7. Capacidad informática 8.x". NVIDIA . Consultado el 23 de septiembre de 2020 .
- ^ Bosnjak, Dominik (1 de septiembre de 2020). "La antigua tecnología de 8 nm de Samsung en el corazón de las monstruosas tarjetas Ampere de NVIDIA". SamMobile . Consultado el 19 de septiembre de 2020 .
- ^ abcde Smith, Ryan (14 de mayo de 2020). "NVIDIA Ampere Unleashed: NVIDIA anuncia nueva arquitectura de GPU, GPU A100 y acelerador". AnandTech.
- ↑ Delgado, Gerardo (1 de septiembre de 2020). "GPU GeForce RTX serie 30: marcando el comienzo de una nueva era de contenido de vídeo con decodificación AV1". NVIDIA . Consultado el 9 de abril de 2023 .
- ^ Morgan, Timothy Prickett (29 de mayo de 2020). "Profundizando en la arquitectura de GPU Nvidia Ampere". La próxima plataforma . Consultado el 24 de marzo de 2022 .
- ^ "Arquitectura de GPU NVIDIA A100 Tensor Core: aceleración sin precedentes en todas las escalas" (PDF) . NVIDIA . Consultado el 18 de septiembre de 2020 .
- ^ "NVIDIA Tensor Cores: versatilidad para HPC e IA". NVIDIA .
- ^ "Resumen". docs.nvidia.com .
- ^ ab Tom Warren; James Vincent (14 de mayo de 2020). "La primera GPU Ampere de Nvidia está diseñada para centros de datos e inteligencia artificial, no para su PC". El borde.
- ^ Smith, Ryan (22 de marzo de 2022). "Se anuncian la arquitectura de GPU NVIDIA Hopper y el acelerador H100: trabajar de forma más inteligente y más intensa". AnandTech.
- ^ Smith, Ryan (14 de mayo de 2020). "NVIDIA Ampere Unleashed: NVIDIA anuncia nueva arquitectura de GPU, GPU A100 y acelerador". AnandTech.
- ^ "NVIDIA Tesla V100 probada: potencia de GPU casi increíble". TweakTown . 17 de septiembre de 2017.
- ^ ab Igor, Wallossek (13 de febrero de 2022). "Las dos caras de la GeForce RTX 3050 8GB". El laboratorio de Igor . Consultado el 23 de febrero de 2022 .
- ^ ab Shilov, Anton (25 de septiembre de 2021). "Lista de tarjetas GeForce RTX 3060 de Gainward y Galax con GPU GA104". Hardware de Tom . Consultado el 23 de septiembre de 2022 .
- ^ ab Tyson, Mark (23 de febrero de 2022). "Zotac presenta las primeras tarjetas de escritorio RTX 3060 Ti con GPU GA103". Hardware de Tom . Consultado el 23 de septiembre de 2022 .
- ^ ab WhyCry (26 de octubre de 2022). "ZOTAC lanza GeForce RTX 3070 Ti con GPU GA102-150". VideoCardz . Consultado el 21 de mayo de 2023 .
enlaces externos
- Documento técnico sobre la arquitectura de la GPU NVIDIA A100 Tensor Core
- Informe técnico sobre arquitectura de GPU Nvidia Ampere GA102
- Arquitectura de Nvidia Ampere
- GPU Nvidia A100 Tensor Core
- Arquitectura NVIDIA Ampere en profundidad