stringtranslate.com

Pascal (microarquitectura)

Pintura de Blaise Pascal, epónimo de la arquitectura

Pascal es el nombre en clave de una microarquitectura GPU desarrollada por Nvidia , como sucesora de la arquitectura Maxwell . La arquitectura se introdujo por primera vez en abril de 2016 con el lanzamiento del Tesla P100 (GP100) el 5 de abril de 2016, y se usa principalmente en la serie GeForce 10 , comenzando con GeForce GTX 1080 y GTX 1070 (ambas usando la GPU GP104). , que se publicaron el 27 de mayo de 2016 y el 10 de junio de 2016, respectivamente. Pascal se fabricó utilizando el proceso FinFET de 16 nm de TSMC , [1] y posteriormente el proceso FinFET de 14 nm de Samsung . [2]  

La arquitectura lleva el nombre del matemático y físico francés del siglo XVII, Blaise Pascal .

En abril de 2019, Nvidia habilitó una implementación de software de DirectX Raytracing en tarjetas basadas en Pascal a partir de la GTX 1060 de 6 GB, y en las tarjetas de la serie 16 , una característica reservada a la serie RTX basada en Turing hasta ese momento. [3] [4]

Detalles

Troquelado de la GPU GP100 utilizada en las tarjetas Nvidia Tesla P100
Imagen de la GPU GP102 encontrada dentro de las tarjetas GeForce GTX 1080 Ti
Troquel de la GPU GP106 encontrada dentro de las tarjetas GTX 1060

En marzo de 2014, Nvidia anunció que la sucesora de Maxwell sería la microarquitectura Pascal; anunciado el 6 de mayo de 2016 y lanzado el 27 de mayo del mismo año. El Tesla P100 (chip GP100) tiene una versión diferente de la arquitectura Pascal en comparación con las GPU GTX (chip GP104). Las unidades de sombreado del GP104 tienen un diseño similar al de Maxwell . [5]

Las mejoras arquitectónicas de la arquitectura GP100 incluyen lo siguiente: [6] [7] [8]

Las mejoras arquitectónicas de la arquitectura GP104 incluyen lo siguiente: [5]

Descripción general

Clúster de procesadores de gráficos

Un chip se divide en clústeres de procesadores de gráficos (GPC). Para los chips GP104, un GPC abarca 5 SM.

Streaming multiprocesador "Pascal"

Un "multiprocesador de transmisión" es análogo a la unidad de cómputo de AMD . Un SM abarca 128 ALU de precisión simple ("núcleos CUDA") en chips GP104 y 64 ALU de precisión simple en chips GP100. Si bien todas las versiones de CU constan de 64 procesadores de sombreado (es decir, 4 unidades vectoriales SIMD, cada una de 16 carriles de ancho), Nvidia experimentó con números muy diferentes de núcleos CUDA:

Motor polimorfo 4.0

La versión 4.0 del Polymorph Engine es la unidad responsable de la teselación . Se corresponde funcionalmente con el Procesador Geométrico de AMD . Se ha movido del módulo de sombreado al TPC para permitir que un motor Polymorph alimente múltiples SM dentro del TPC. [19]

Papas fritas

PCB y troquel GTX 1080 Ti

Actuación

La potencia teórica de procesamiento de precisión simple de una GPU Pascal en GFLOPS se calcula como 2 × operaciones por instrucción FMA por núcleo CUDA por ciclo × número de núcleos CUDA × velocidad de reloj del núcleo (en GHz).

La potencia teórica de procesamiento de doble precisión de una GPU Pascal es la mitad del rendimiento de precisión simple de Nvidia GP100 y 1/32 de Nvidia GP102, GP104, GP106, GP107 y GP108.

La potencia de procesamiento teórica de media precisión de una GPU Pascal es 2 veces el rendimiento de precisión simple en GP100 [12] y 1/64 en GP104, GP106, GP107 y GP108. [18]

Sucesor

La arquitectura Pascal fue reemplazada en 2017 por Volta en los mercados de HPC , computación en la nube y automóviles autónomos , y en 2018 por Turing en el mercado de consumo y empresarial. [33]

Ver también

Referencias

  1. ^ "TSMC construirá GPU NVIDIA de próxima generación de 7 nm". Wccftech . 24 de junio de 2018 . Consultado el 6 de julio de 2019 .
  2. ^ "Samsung reducirá ópticamente NVIDIA" Pascal "a 14 nm" . Consultado el 13 de agosto de 2016 .
  3. ^ "Aceleración del ecosistema de trazado de rayos en tiempo real: DXR para GeForce RTX y GeForce GTX". NVIDIA .
  4. ^ "Ray Tracing llega a las GPU Nvidia GTX: aquí se explica cómo habilitarlo". 11 de abril de 2019.
  5. ^ ab "NVIDIA GeForce GTX 1080" (PDF) . Internacional.download.nvidia.com . Consultado el 15 de septiembre de 2016 .
  6. ^ Gupta, Sumit (21 de marzo de 2014). "NVIDIA actualiza la hoja de ruta de GPU; anuncia Pascal". Blogs.nvidia.com . Consultado el 25 de marzo de 2014 .
  7. ^ "Paralelo para todos". Zona de desarrolladores de NVIDIA . Devblogs.nvidia.com. Archivado desde el original el 26 de marzo de 2014 . Consultado el 25 de marzo de 2014 .
  8. ^ "NVIDIA Tesla P100" (PDF) . Internacional.download.nvidia.com . Consultado el 15 de septiembre de 2016 .
  9. ^ "Inside Pascal: la plataforma informática más nueva de NVIDIA". 5 de abril de 2016.
  10. ^ Denis Foley (25 de marzo de 2014). "NVLink, Pascal y Stacked Memory: alimentando el apetito por Big Data". nvidia.com . Consultado el 7 de julio de 2014 .
  11. ^ "La arquitectura de GPU Pascal de próxima generación de NVIDIA proporcionará una velocidad 10 veces mayor para aplicaciones de aprendizaje profundo". El blog oficial de NVIDIA . Consultado el 23 de marzo de 2015 .
  12. ^ ab Smith, Ryan (5 de abril de 2015). "NVIDIA anuncia el acelerador Tesla P100: Pascal GP100 Power para HPC". AnandTech . Consultado el 27 de mayo de 2016 . Cada uno de esos SM también contiene 32 núcleos FP64 CUDA, lo que nos da la tasa de 1/2 para FP64, y una novedad en la arquitectura Pascal es la capacidad de empaquetar 2 operaciones FP16 dentro de un solo núcleo FP32 CUDA en las circunstancias adecuadas.
  13. ^ abc Smith, Ryan (20 de julio de 2016). "Revisión de las ediciones Founders de NVIDIA GeForce GTX 1080 y GTX 1070: inicio de la generación FinFET". AnandTech . pag. 9 . Consultado el 21 de julio de 2016 .
  14. ^ abcde Smith, Ryan (20 de julio de 2016). "Revisión de las ediciones Founders de NVIDIA GeForce GTX 1080 y GTX 1070: inicio de la generación FinFET". AnandTech . pag. 10 . Consultado el 21 de julio de 2016 .
  15. ^ "Tarjeta gráfica GTX 1080". GeForce . Consultado el 15 de septiembre de 2016 .
  16. ^ Carbotte, Kevin (17 de mayo de 2016). "Nvidia GeForce GTX 1080 Computación asíncrona y multiproyección simultánea". Tomshardware.com . Consultado el 15 de septiembre de 2016 .
  17. ^ "Nvidia Pascal HDCP 2.2". Página de hardware de Nvidia . Consultado el 8 de mayo de 2016 .
  18. ^ ab Smith, Ryan (20 de julio de 2016). "Revisión de las ediciones Founders de NVIDIA GeForce GTX 1080 y GTX 1070: inicio de la generación FinFET". AnandTech . pag. 5 . Consultado el 21 de julio de 2016 .
  19. ^ Smith, Ryan (20 de julio de 2016). "Revisión de las ediciones Founders de NVIDIA GeForce GTX 1080 y GTX 1070: inicio de la generación FinFET". AnandTech . pag. 4 . Consultado el 21 de julio de 2016 .
  20. ^ Harris, Mark (5 de abril de 2016). "Inside Pascal: la plataforma informática más nueva de NVIDIA". Paralelo Forall . NVIDIA . Consultado el 3 de junio de 2016 .
  21. ^ "Tarjeta gráfica NVIDIA TITAN Xp con arquitectura Pascal". NVIDIA .
  22. ^ "Tarjeta gráfica NVIDIA TITAN X con Pascal". GeForce . Consultado el 15 de septiembre de 2016 .
  23. ^ "Nuevos gráficos Quadro basados ​​en la arquitectura Pascal". NVIDIA . Consultado el 15 de septiembre de 2016 .
  24. ^ "Acelerar las cargas de trabajo del centro de datos con GPU". NVIDIA . Consultado el 15 de septiembre de 2016 .
  25. ^ Zhiye Liu (22 de octubre de 2018). "Nvidia GeForce GTX 1060 obtiene GDDR5X en su quinto cambio de imagen". Hardware de Tom . Consultado el 2 de febrero de 2024 .
  26. ^ "Tarjetas gráficas NVIDIA GeForce serie 10". NVIDIA .
  27. ^ "NVIDIA GeForce GTX 1060 se lanzará el 7 de julio". VideoCardz.com . 29 de junio de 2016 . Consultado el 15 de septiembre de 2016 .
  28. ^ "Tarjetas gráficas GTX 1060". GeForce . Consultado el 15 de septiembre de 2016 .
  29. ^ Smith, Ryan (12 de noviembre de 2012). "NVIDIA lanza Tesla K20 y K20X: GK110 llega por fin". AnandTech . pag. 3 . Consultado el 24 de julio de 2016 .
  30. ^ abcdef Nvidia (1 de septiembre de 2015). "Guía de programación CUDA C" . Consultado el 24 de julio de 2016 .
  31. ^ abcdefghijklmno Triolet, Damien (24 de mayo de 2016). "¡Nvidia GeForce GTX 1080, la principal GPU de 16 nm en prueba!". Hardware.fr (en francés). pag. 2 . Consultado el 24 de julio de 2016 .
  32. ^ ab Smith, Ryan (26 de enero de 2015). "GeForce GTX 970: corrección de las especificaciones y exploración de la asignación de memoria". AnandTech . pag. 1 . Consultado el 24 de julio de 2016 .
  33. ^ "Fecha de lanzamiento de NVIDIA Turing". Tecradar . 2 de febrero de 2021.