Amperio (microarquitectura)

Ampere es el nombre en clave de una microarquitectura de unidad de procesamiento de gráficos (GPU) desarrollada por Nvidia como sucesora de las arquitecturas Volta y Turing . Fue anunciado oficialmente el 14 de mayo de 2020 y lleva el nombre del matemático y físico francés André-Marie Ampère . ^[1]^[2]

Nvidia anunció las GPU de consumo de la serie GeForce 30 con arquitectura Ampere en un evento especial de GeForce el 1 de septiembre de 2020. ^[3]^[4] Nvidia anunció la GPU A100 de 80 GB en SC20 el 16 de noviembre de 2020. ^[5] Tarjetas gráficas RTX móviles y RTX 3060 basado en la arquitectura Ampere se reveló el 12 de enero de 2021. ^[6]

Nvidia anunció el sucesor de Ampere, Hopper , en GTC 2022, y "Ampere Next Next" para un lanzamiento en 2024 en GPU Technology Conference 2021.

Detalles

Las mejoras arquitectónicas de la arquitectura Ampere incluyen lo siguiente:

CUDA Compute Capability 8.0 para A100 y 8.6 para la serie GeForce 30 ^[7]
Proceso FinFET de 7 nm de TSMC para A100
Versión personalizada del proceso de 8 nm (8N) de Samsung para la serie GeForce 30 ^[8]
Tensor Cores de tercera generación con soporte FP16, bfloat16 , TensorFloat-32 (TF32) y FP64 y aceleración de dispersión. ^[9] Los núcleos Tensor individuales tienen 256 operaciones FMA FP16 por reloj 4 veces más potencia de procesamiento (solo GA100, 2 veces en GA10x) en comparación con las generaciones anteriores de Tensor Core; el recuento de núcleos tensoriales se reduce a uno por SM.
Núcleos de trazado de rayos de segunda generación; trazado de rayos, sombreado y computación simultáneos para la serie GeForce 30
Memoria de alto ancho de banda 2 (HBM2) en A100 de 40 GB y A100 de 80 GB
Memoria GDDR6X para GeForce RTX 3090, RTX 3080 Ti, RTX 3080, RTX 3070 Ti
Doble núcleo FP32 por SM en GPU GA10x
NVLink 3.0 con un rendimiento de 50 Gbit/s por par ^[9]
PCI Express 4.0 con soporte SR-IOV (SR-IOV está reservado solo para A100)
Función de virtualización de GPU (MIG) de instancias múltiples y partición de GPU en A100 que admite hasta siete instancias
Conjunto de funciones PureVideo decodificación de vídeo por hardware K con decodificación de hardware AV1 ^[10] para la serie GeForce 30 y conjunto de funciones J para A100
5 NVDEC para A100
Agrega una nueva decodificación JPEG de 5 núcleos ( NVJPG ) basada en hardware con YUV420, YUV422, YUV444, YUV400, RGBA. No debe confundirse con Nvidia NVJPEG ( biblioteca acelerada por GPU para codificación/decodificación JPEG)

Papas fritas

GA100 ^[11]
GA102
GA103
GA104
GA106
GA107

Comparación de la capacidad informática: GP100 frente a GV100 frente a GA100 ^[12]

Comparación de la matriz de soporte de precisión ^[13]^[14]

Leyenda:

FPnn: punto flotante con nn bits
INTn: entero con n bits
INT1: binario
TF32: TensorFloat32
BF16: bfloat16

Comparación del rendimiento de decodificación

Acelerador A100 y DGX A100

El acelerador A100 basado en Ampere se anunció y lanzó el 14 de mayo de 2020. ^[9] El A100 presenta 19,5 teraflops de rendimiento FP32, 6912 núcleos CUDA, 40 GB de memoria gráfica y 1,6 TB/s de ancho de banda de memoria gráfica. ^[15] El acelerador A100 inicialmente estaba disponible solo en la tercera generación del servidor DGX , incluidos 8 A100. ^[9] También se incluyen en el DGX A100 15 TB de almacenamiento NVMe PCIe gen 4 , ^{[15] dos CPU AMD}Rome 7742 de 64 núcleos , 1 TB de RAM e interconexión HDR InfiniBand con tecnología Mellanox . El precio inicial del DGX A100 era de 199.000 dólares. ^[9]

Comparación de aceleradores utilizados en DGX: ^[16]^[17]^[18]

Productos que utilizan amperios

Serie GeForce MX
- GeForce MX570 (móvil) (GA107)
Serie GeForce 20
- GeForce RTX 2050 (móvil) (GA107)
Serie GeForce 30
- GPU para portátil GeForce RTX 3050 (GA107)
- GeForce RTX 3050 (GA106 o GA107) ^[19]
- GPU para portátil GeForce RTX 3050 Ti (GA107)
- GPU para portátil GeForce RTX 3060 (GA106)
- GeForce RTX 3060 (GA106 o GA104) ^[20]
- GeForce RTX 3060 Ti (GA104 o GA103) ^[21]
- GPU para portátil GeForce RTX 3070 (GA104)
- GeForce RTX 3070 (GA104)
- GPU para portátil GeForce RTX 3070 Ti (GA104)
- GeForce RTX 3070 Ti (GA104 o GA102) ^[22]
- GPU para portátil GeForce RTX 3080 (GA104)
- GeForce RTX 3080 (GA102)
- GeForce RTX 3080 12GB (GA102)
- GPU para portátil GeForce RTX 3080 Ti (GA103)
- Tarjeta GeForce RTX 3080 Ti (GA102)
- GeForce RTX 3090 (GA102)
- Tarjeta GeForce RTX 3090 Ti (GA102)
GPU para estaciones de trabajo Nvidia (anteriormente Quadro )
- RTX A1000 (móvil) (GA107)
- RTX A2000 (móvil) (GA106)
- RTX A2000 (GA106)
- RTX A3000 (móvil) (GA104)
- RTX A4000 (móvil) (GA104)
- RTX A4000 (GA104)
- RTX A4500 (GA102)
- RTX A5000 (móvil) (GA104)
- RTX A5000 (GA102)
- RTX A5500 (GA102)
- RTX A6000 (GA102)
GPU de centro de datos de Nvidia (anteriormente Tesla )
- Nvidia A2 (GA107)
- Tarjeta gráfica Nvidia A10 (GA102)
- Nvidia A16 (4 × GA107)
- Tarjeta gráfica Nvidia A30 (GA100)
- Tarjeta gráfica Nvidia A40 (GA102)
- Tarjeta gráfica Nvidia A100 (GA100)
- Tarjeta gráfica Nvidia A100 de 80 GB (GA100)
SoC Jetson Orin
- Jetson Orin AGX
- Supersónico Orin NX
- Supersónico Orin Nano

Ver también

Referencias

^ Sala de redacción, NVIDIA. "La nueva GPU Ampere para centro de datos de NVIDIA en plena producción". Sala de prensa de NVIDIA .
^ "Arquitectura NVIDIA Ampere en profundidad". Blog para desarrolladores de NVIDIA . 14 de mayo de 2020.
^ "NVIDIA ofrece el mayor salto generacional jamás visto con las GPU GeForce RTX serie 30". Sala de prensa de Nvidia . 1 de septiembre de 2020 . Consultado el 9 de abril de 2023 .
^ "Cuenta atrás de NVIDIA GeForce Ultimate". NVIDIA .
^ "NVIDIA se duplica: anuncia la GPU A100 de 80 GB, la GPU más potente del mundo para supercomputación de IA". Sala de prensa de Nvidia . 16 de noviembre de 2020 . Consultado el 9 de abril de 2023 .
^ "NVIDIA GeForce Beyond en CES 2023". NVIDIA .
^ "I.7. Capacidad informática 8.x". NVIDIA . Consultado el 23 de septiembre de 2020 .
^ Bosnjak, Dominik (1 de septiembre de 2020). "La antigua tecnología de 8 nm de Samsung en el corazón de las monstruosas tarjetas Ampere de NVIDIA". SamMobile . Consultado el 19 de septiembre de 2020 .
^ abcde Smith, Ryan (14 de mayo de 2020). "NVIDIA Ampere Unleashed: NVIDIA anuncia nueva arquitectura de GPU, GPU A100 y acelerador". AnandTech.
↑ Delgado, Gerardo (1 de septiembre de 2020). "GPU GeForce RTX serie 30: marcando el comienzo de una nueva era de contenido de vídeo con decodificación AV1". NVIDIA . Consultado el 9 de abril de 2023 .
^ Morgan, Timothy Prickett (29 de mayo de 2020). "Profundizando en la arquitectura de GPU Nvidia Ampere". La próxima plataforma . Consultado el 24 de marzo de 2022 .
^ "Arquitectura de GPU NVIDIA A100 Tensor Core: aceleración sin precedentes en todas las escalas" (PDF) . NVIDIA . Consultado el 18 de septiembre de 2020 .
^ "NVIDIA Tensor Cores: versatilidad para HPC e IA". NVIDIA .
^ "Resumen". docs.nvidia.com .
^ ab Tom Warren; James Vincent (14 de mayo de 2020). "La primera GPU Ampere de Nvidia está diseñada para centros de datos e inteligencia artificial, no para su PC". El borde.
^ Smith, Ryan (22 de marzo de 2022). "Se anuncian la arquitectura de GPU NVIDIA Hopper y el acelerador H100: trabajar de forma más inteligente y más intensa". AnandTech.
^ Smith, Ryan (14 de mayo de 2020). "NVIDIA Ampere Unleashed: NVIDIA anuncia nueva arquitectura de GPU, GPU A100 y acelerador". AnandTech.
^ "NVIDIA Tesla V100 probada: potencia de GPU casi increíble". TweakTown . 17 de septiembre de 2017.
^ ab Igor, Wallossek (13 de febrero de 2022). "Las dos caras de la GeForce RTX 3050 8GB". El laboratorio de Igor . Consultado el 23 de febrero de 2022 .
^ ab Shilov, Anton (25 de septiembre de 2021). "Lista de tarjetas GeForce RTX 3060 de Gainward y Galax con GPU GA104". Hardware de Tom . Consultado el 23 de septiembre de 2022 .
^ ab Tyson, Mark (23 de febrero de 2022). "Zotac presenta las primeras tarjetas de escritorio RTX 3060 Ti con GPU GA103". Hardware de Tom . Consultado el 23 de septiembre de 2022 .
^ ab WhyCry (26 de octubre de 2022). "ZOTAC lanza GeForce RTX 3070 Ti con GPU GA102-150". VideoCardz . Consultado el 21 de mayo de 2023 .

enlaces externos

Documento técnico sobre la arquitectura de la GPU NVIDIA A100 Tensor Core
Informe técnico sobre arquitectura de GPU Nvidia Ampere GA102
Arquitectura de Nvidia Ampere
GPU Nvidia A100 Tensor Core
Arquitectura NVIDIA Ampere en profundidad