Ada Lovelace (microarquitectura)

Ada Lovelace , también conocida simplemente como Lovelace , ^[1] es una microarquitectura de unidad de procesamiento gráfico (GPU) desarrollada por Nvidia como sucesora de la arquitectura Ampere , anunciada oficialmente el 20 de septiembre de 2022. Lleva el nombre de la matemática inglesa Ada Lovelace , ^[2] una de las primeras programadoras de computadoras . Nvidia anunció la arquitectura junto con las GPU de consumo de la serie GeForce RTX 40 ^[3] y la tarjeta gráfica para estaciones de trabajo RTX 6000 Ada Generation. ^[4] La arquitectura Lovelace está fabricada en el proceso 4N personalizado de TSMC , que ofrece una mayor eficiencia con respecto a los procesos Samsung 8 nm y TSMC N7 anteriores utilizados por Nvidia para su arquitectura Ampere de la generación anterior. ^[5]

Fondo

La arquitectura Ada Lovelace es la continuación de la arquitectura Ampere que se lanzó en 2020. La arquitectura Ada Lovelace fue anunciada por el director ejecutivo de Nvidia, Jensen Huang, durante una conferencia magistral de GTC 2022 el 20 de septiembre de 2022, y la arquitectura impulsa las GPU de Nvidia para juegos, estaciones de trabajo y centros de datos. ^[6]

Detalles arquitectónicos

Las mejoras arquitectónicas de la arquitectura de Ada Lovelace incluyen las siguientes: ^[7]

Capacidad de cómputo de CUDA 8.9 ^[8]
Proceso 4N de TSMC (diseñado a medida para Nvidia): no debe confundirse con el nodo N4 normal de TSMC
Núcleos Tensor de cuarta generación con FP8, FP16, bfloat16, TensorFloat-32 (TF32) y aceleración de escasez
Núcleos de trazado de rayos de tercera generación, además de trazado de rayos y sombreado simultáneos y computación
Reordenamiento de ejecución de sombreadores (SER) ^[9]
Codificador/decodificador de vídeo Nvidia (NVENC/NVDEC) con codificación de hardware de función fija AV1 de 8K, 10 bits y 60 FPS ^[10]^[11]
Sin soporte para NVLink ^[12]^[13]

Multiprocesadores de streaming (SM)

Núcleos CUDA

Se incluyen 128 núcleos CUDA en cada SM.

Núcleos RT

Ada Lovelace cuenta con núcleos RT de tercera generación. La RTX 4090 cuenta con 128 núcleos RT en comparación con los 84 de la generación anterior, la RTX 3090 Ti. Estos 128 núcleos RT pueden proporcionar hasta 191 TFLOPS de cómputo con 1,49 TFLOPS por núcleo RT. ^[14] Se agrega una nueva etapa en el flujo de trabajo de trazado de rayos llamada Shader Execution Reordering (SER) en la arquitectura Lovelace que, según Nvidia, proporciona una mejora del rendimiento de 2x en las cargas de trabajo de trazado de rayos. ^[6]

Núcleos tensoriales

Los nuevos núcleos Tensor de cuarta generación de Lovelace habilitan la tecnología de IA utilizada en las técnicas de generación de cuadros de DLSS 3. Al igual que Ampere, cada SM contiene 4 núcleos Tensor, pero Lovelace contiene una mayor cantidad de núcleos Tensor en general debido a su mayor cantidad de SM.

Velocidades de reloj

Hay un aumento significativo en las velocidades de reloj con la arquitectura Ada Lovelace, siendo la velocidad de reloj base de la RTX 4090 mayor que la velocidad de reloj de impulso de la RTX 3090 Ti.

Subsistema de memoria y caché

La última matriz AD102 Lovelace habilitada cuenta con 96 MB de caché L2, un aumento de 16x con respecto a los 6 MB de la matriz GA102 basada en Ampere. ^[15] El hecho de que la GPU tenga acceso rápido a una gran cantidad de caché L2 beneficia las operaciones complejas como el trazado de rayos en comparación con la GPU que busca datos de la memoria de video GDDR, que es más lenta. Depender menos del acceso a la memoria para almacenar datos importantes y a los que se accede con frecuencia significa que se puede usar un ancho de bus de memoria más estrecho junto con una caché L2 grande.

Cada controlador de memoria utiliza una conexión de 32 bits con hasta 12 controladores presentes para un ancho de bus de memoria combinado de 384 bits. La arquitectura Lovelace puede utilizar memoria GDDR6 o GDDR6X . La memoria GDDR6X está presente en la serie GeForce RTX 40 de escritorio, mientras que la memoria GDDR6, más eficiente energéticamente, se utiliza en sus versiones móviles correspondientes y en las GPU para estaciones de trabajo RTX A6000.

Eficiencia energética y nodo de proceso

La arquitectura Ada Lovelace puede utilizar voltajes más bajos en comparación con su predecesora. ^[6] Nvidia afirma un aumento de rendimiento de 2x para la RTX 4090 con los mismos 450 W utilizados por el buque insignia de la generación anterior, la RTX 3090 Ti. ^[16]

La mayor eficiencia energética se puede atribuir en parte al nodo de fabricación más pequeño utilizado por la arquitectura Lovelace. La arquitectura Ada Lovelace se fabrica en el vanguardista proceso 4N de TSMC , un nodo de proceso diseñado a medida para Nvidia. La arquitectura Ampere de la generación anterior utilizó el nodo de proceso 8N basado en 8 nm de Samsung de 2018, que tenía dos años en el momento del lanzamiento de Ampere. ^[17]^[18] La matriz AD102 con sus 76,3 mil millones de transistores tiene una densidad de transistores de 125,5 millones por mm ² , un aumento del 178% en la densidad de los 45,1 millones por mm ² del GA102 .

Motor de medios

La arquitectura Lovelace utiliza el nuevo codificador de video Nvidia NVENC de octava generación y el decodificador de video NVDEC de séptima generación introducido por Ampere Returns. ^[19]

Se agrega la codificación de hardware NVENC AV1 con soporte para una resolución de hasta 8K a 60 FPS en color de 10 bits , lo que permite una mayor fidelidad de video a velocidades de bits más bajas en comparación con los códecs H.264 y H.265 . ^[20] Nvidia afirma que su codificador NVENC AV1 incluido en la arquitectura Lovelace es un 40% más eficiente que el codificador H.264 en la arquitectura Ampere. ^[21]

La arquitectura Lovelace recibió críticas por no soportar la conexión DisplayPort 2.0 que admite un mayor ancho de banda de datos de pantalla y, en su lugar, utiliza el antiguo DisplayPort 1.4a, que está limitado a un ancho de banda máximo de 32 Gbit/s. ^[22] Como resultado, las GPU Lovelace estarían limitadas por las frecuencias de actualización admitidas por DisplayPort 1.4a a pesar de que el rendimiento de la GPU puede alcanzar frecuencias de cuadro más altas. Las GPU Arc de Intel que también se lanzaron en octubre de 2022 incluían DisplayPort 2.0. La arquitectura RDNA 3 de AMD se lanzó solo dos meses después de que Lovelace incluyera DisplayPort 2.1 . ^[23]

Muere Ada Lovelace

Productos basados en Ada Lovelace

Consumidor

De oficina

Serie GeForce 40
- GeForce RTX 4060 (AD107)
- GeForce RTX 4060 Ti (AD106)
- GeForce RTX 4070 (AD104)
- GeForce RTX 4070 SUPER (AD104)
- GeForce RTX 4070 Ti (AD104)
- GeForce RTX 4070 Ti SUPER (AD103)
- GeForce RTX 4080 (AD103)
- GeForce RTX 4080 SUPER (AD103)
- GeForce RTX 4090 D (AD102)
- GeForce RTX 4090 (AD102)

Móvil

Serie GeForce 40
- Portátil con GeForce RTX 4050 (AD107)
- Portátil con GeForce RTX 4060 (AD107)
- Portátil con GeForce RTX 4070 (AD106)
- Portátil con GeForce RTX 4080 (AD104)
- Portátil con GeForce RTX 4090 (AD103)

Profesional

Estación de trabajo de escritorio

GPU para estaciones de trabajo de Nvidia (anteriormente Quadro )
- Nvidia RTX 2000 Generación Ada (AD107)
- Nvidia RTX 4000 Generación Ada (AD104)
- Nvidia RTX 4000 SFF Generación Ada (AD104)
- Nvidia RTX 4500 Generación Ada (AD104)
- Nvidia RTX 5000 Generación Ada (AD102)
- Nvidia RTX 5880 Generación Ada (AD102)
- Nvidia RTX 6000 Generación Ada (AD102)

Estación de trabajo móvil

GPU para estaciones de trabajo de Nvidia (anteriormente Quadro )
- Portátil Nvidia RTX 2000 Max-Q generación Ada (AD107)
- Portátil Nvidia RTX 2000 generación Ada (AD107)
- Portátil Nvidia RTX 3000 generación Ada (AD106)
- Portátil Nvidia RTX 3500 generación Ada (AD104)
- Portátil Nvidia RTX 4000 generación Ada (AD104)
- Portátil Nvidia RTX 5000 generación Ada (AD103)

Centro de datos

GPU para centros de datos de Nvidia (anteriormente Tesla )
- Nvidia L4 (AD104)
- Nvidia L40 (AD102)
- Nvidia L40G (AD102)
- Nvidia L40CNX (AD102)

Véase también

Lista de epónimos de las microarquitecturas de GPU de Nvidia

Referencias

^ Freund, Karl (20 de septiembre de 2022). «Nvidia lanza la GPU Lovelace, servicios en la nube, envía las GPU H100 y la nueva unidad Thor». Forbes . Consultado el 18 de noviembre de 2022 .
^ Mujtaba, Hassan (15 de septiembre de 2022). "Confirmada la arquitectura de GPU para juegos Ada Lovelace de próxima generación de Nvidia para la serie GeForce RTX 40". Wccftech . Consultado el 18 de noviembre de 2022 .
^ "Nvidia ofrece un gran salto en el rendimiento y presenta una nueva era de renderizado neuronal con la serie GeForce RTX 40". Sala de prensa de Nvidia (nota de prensa). 20 de septiembre de 2022 . Consultado el 20 de septiembre de 2022 .
^ "La nueva GPU Ada Lovelace RTX de Nvidia llega para diseñadores y creadores". Sala de prensa de Nvidia . 20 de septiembre de 2022 . Consultado el 18 de noviembre de 2022 .
^ Machkovec, Sam (20 de septiembre de 2022). «Generación de GPU Ada Lovelace de Nvidia: $1,599 por RTX 4090, $899 y más por 4080». Ars Technica . Consultado el 18 de noviembre de 2022 .
^ abc Chiappetta, Marco (22 de septiembre de 2022). «Descripción general de la arquitectura NVIDIA GeForce RTX 40: se revela la salsa especial de Ada». HotHardware . Consultado el 8 de abril de 2023 .
^ "Arquitectura NVIDIA Ada Lovelace". NVIDIA . 20 de septiembre de 2022 . Consultado el 20 de septiembre de 2022 .
^ "Guía de programación CUDA C++". docs.nvidia.com . Consultado el 15 de abril de 2023 .
^ "Mejora el rendimiento de los sombreadores y la velocidad de cuadros en el juego con la reordenación de la ejecución de los sombreadores". Blog técnico de NVIDIA . 13 de octubre de 2022 . Consultado el 6 de abril de 2023 .
^ Deigado, Gerado (20 de septiembre de 2022). "Creatividad a la velocidad de la luz: las tarjetas gráficas GeForce RTX serie 40 ofrecen hasta el doble de rendimiento en renderizado 3D, IA y exportaciones de video para jugadores y creadores". NVIDIA . Consultado el 20 de septiembre de 2022 .
^ "SDK de códec de vídeo de Nvidia". NVIDIA Developer . 20 de septiembre de 2022 . Consultado el 18 de noviembre de 2022 .
^ Chuong Nguyen (21 de septiembre de 2022). «Nvidia elimina NVLink en RTX 4090». Windows Central . Consultado el 1 de enero de 2023 .
^ btarunr (21 de septiembre de 2022). "Jensen confirma: la compatibilidad con NVLink en Ada Lovelace ha desaparecido". TechPowerUp . Consultado el 18 de noviembre de 2022 .
^ "Arquitectura de GPU Nvidia Ada Lovelace: diseñada para ofrecer juegos y creación excepcionales, gráficos profesionales, IA y rendimiento informático" (PDF) . Nvidia . p. 30 . Consultado el 5 de abril de 2023 .
^ "Arquitectura de GPU Nvidia Ada Lovelace: diseñada para ofrecer juegos y creación excepcionales, gráficos profesionales, IA y rendimiento informático" (PDF) . Nvidia . p. 12 . Consultado el 6 de abril de 2023 .
^ "Arquitectura de GPU Nvidia Ada Lovelace: diseñada para ofrecer juegos y creación excepcionales, gráficos profesionales, IA y rendimiento informático" (PDF) . Nvidia . p. 12 . Consultado el 5 de abril de 2023 .
^ James, Dave (1 de septiembre de 2020). «Nvidia confirma el proceso de 8 nm de Samsung para RTX 3090, RTX 3080 y RTX 3070». PC Gamer . Consultado el 5 de abril de 2023 .
^ Bosnjak, Dominik (1 de septiembre de 2020). "La vieja tecnología de 8 nm de Samsung en el corazón de las monstruosas tarjetas Ampere de NVIDIA". SamMobile . Consultado el 5 de abril de 2023 .
^ "Arquitectura de GPU Nvidia Ada Lovelace: diseñada para ofrecer juegos y creación excepcionales, gráficos profesionales, IA y rendimiento informático" (PDF) . Nvidia . p. 25 . Consultado el 5 de abril de 2023 .
^ Muthana, Prathap; Mishra, Sampurnananda; Patait, Abhijit (18 de enero de 2023). "Mejora de la calidad y el rendimiento del vídeo con AV1 y la arquitectura NVIDIA Ada Lovelace". Desarrollador Nvidia . Consultado el 5 de abril de 2023 .
^ "Nvidia Ada Science: Cómo Ada avanza en la ciencia de los gráficos con DLSS 3" (PDF) . Nvidia . p. 13 . Consultado el 5 de abril de 2023 .
^ Garreffa, Anthony (25 de septiembre de 2022). "La serie GeForce RTX 40 de próxima generación de NVIDIA carece de conectividad DP2.0, qué tontería". TweakTown . Consultado el 5 de abril de 2023 .
^ Judd, Will (3 de noviembre de 2022). «AMD anuncia las tarjetas gráficas 7900 XTX y 7900 XT con FSR 3». Eurogamer . Consultado el 5 de abril de 2023 .
^ "NVIDIA confirma las especificaciones de la GPU Ada 102/103/104, AD104 tiene más transistores que GA102". VideoCardz . 23 de septiembre de 2022 . Consultado el 23 de septiembre de 2022 .
^ "Especificaciones de la GPU NVIDIA AD102". TechPowerUp . Consultado el 17 de diciembre de 2022 .
^ "Especificaciones de la GPU NVIDIA AD103". TechPowerUp . Consultado el 16 de julio de 2024 .
^ "Especificaciones de la GPU NVIDIA AD104". TechPowerUp . Consultado el 18 de octubre de 2022 .
^ "Especificaciones de la GPU NVIDIA AD106". TechPowerUp . Consultado el 17 de diciembre de 2022 .
^ "Especificaciones de la GPU NVIDIA AD107". TechPowerUp . Consultado el 17 de diciembre de 2022 .

Enlaces externos

Documento técnico sobre la ARQUITECTURA DE LA GPU NVIDIA ADA