stringtranslate.com

Pascal (microarquitectura)

Cuadro de Blaise Pascal, epónimo de la arquitectura

Pascal es el nombre en clave de una microarquitectura de GPU desarrollada por Nvidia , como sucesora de la arquitectura Maxwell . La arquitectura se introdujo por primera vez en abril de 2016 con el lanzamiento de la Tesla P100 (GP100) el 5 de abril de 2016, y se utiliza principalmente en la serie GeForce 10 , comenzando con la GeForce GTX 1080 y GTX 1070 (ambas con la GPU GP104), que se lanzaron el 27 de mayo de 2016 y el 10 de junio de 2016, respectivamente. Pascal se fabricó utilizando el proceso FinFET de 16 nm de TSMC , [1] y más tarde el proceso FinFET de 14 nm de Samsung . [2]  

La arquitectura lleva el nombre del matemático y físico francés del siglo XVII, Blaise Pascal .

En abril de 2019, Nvidia habilitó una implementación de software de DirectX Raytracing en tarjetas basadas en Pascal a partir de la GTX 1060 de 6 GB, y en las tarjetas de la serie 16 , una característica reservada a la serie RTX basada en Turing hasta ese momento. [3] [4]

Detalles

Imagen de la GPU GP100 utilizada en las tarjetas Nvidia Tesla P100
Imagen de la GPU GP102 encontrada en el interior de las tarjetas GeForce GTX 1080 Ti
Imagen de la GPU GP106 encontrada dentro de las tarjetas GTX 1060

En marzo de 2014, Nvidia anunció que el sucesor de Maxwell sería la microarquitectura Pascal; se anunció el 6 de mayo de 2016 y se lanzó el 27 de mayo del mismo año. El Tesla P100 (chip GP100) tiene una versión diferente de la arquitectura Pascal en comparación con las GPU GTX (chip GP104). Las unidades de sombreado en GP104 tienen un diseño similar al de Maxwell . [5]

Las mejoras arquitectónicas de la arquitectura GP100 incluyen las siguientes: [6] [7] [8]

Las mejoras arquitectónicas de la arquitectura GP104 incluyen las siguientes: [5]

Descripción general

Clúster de procesadores gráficos

Un chip se divide en clústeres de procesadores gráficos (GPC). En el caso de los chips GP104, un GPC comprende 5 SM.

Multiprocesador de transmisión "Pascal"

Un "Multiprocesador de transmisión" es análogo a la Unidad de cómputo de AMD . Un SM comprende 128 ALU de precisión simple ("núcleos CUDA") en chips GP104 y 64 ALU de precisión simple en chips GP100. Si bien todas las versiones de CU constan de 64 procesadores shader (es decir, 4 unidades vectoriales SIMD, cada una de 16 carriles de ancho), Nvidia experimentó con cantidades muy diferentes de núcleos CUDA:

Motor polimórfico 4.0

El motor Polymorph versión 4.0 es la unidad responsable de la teselación . Funcionalmente, se corresponde con el procesador geométrico de AMD . Se ha trasladado del módulo de sombreado al TPC para permitir que un motor Polymorph alimente varios SM dentro del TPC. [19]

Papas fritas

Placa de circuito impreso y matriz GTX 1080 Ti

Actuación

La potencia de procesamiento teórica de precisión simple de una GPU Pascal en GFLOPS se calcula como 2 × operaciones por instrucción FMA por núcleo CUDA por ciclo × número de núcleos CUDA × velocidad de reloj del núcleo (en GHz).

La potencia de procesamiento teórica de doble precisión de una GPU Pascal es la mitad del rendimiento de precisión simple de Nvidia GP100 y 1/32 de Nvidia GP102, GP104, GP106, GP107 y GP108.

La potencia de procesamiento teórica de media precisión de una GPU Pascal es el doble del rendimiento de precisión simple en GP100 [12] y 1/64 en GP104, GP106, GP107 y GP108. [18]

Sucesor

La arquitectura Pascal fue reemplazada en 2017 por Volta en los mercados de HPC , computación en la nube y automóviles autónomos , y en 2018 por Turing en el mercado de consumo y empresarial. [33]

Véase también

Referencias

  1. ^ "TSMC fabricará GPU de próxima generación de 7 nm de NVIDIA". Wccftech . 24 de junio de 2018 . Consultado el 6 de julio de 2019 .
  2. ^ "Samsung reducirá ópticamente la densidad de NVIDIA "Pascal" a 14 nm" . Consultado el 13 de agosto de 2016 .
  3. ^ "Aceleración del ecosistema de trazado de rayos en tiempo real: DXR para GeForce RTX y GeForce GTX". NVIDIA .
  4. ^ "El trazado de rayos llega a las GPU Nvidia GTX: aquí te explicamos cómo habilitarlo". 11 de abril de 2019.
  5. ^ ab "NVIDIA GeForce GTX 1080" (PDF) . International.download.nvidia.com . Consultado el 15 de septiembre de 2016 .
  6. ^ Gupta, Sumit (21 de marzo de 2014). "NVIDIA actualiza la hoja de ruta de la GPU; anuncia Pascal". Blogs.nvidia.com . Consultado el 25 de marzo de 2014 .
  7. ^ "Parallel Forall". NVIDIA Developer Zone . Devblogs.nvidia.com. Archivado desde el original el 26 de marzo de 2014 . Consultado el 25 de marzo de 2014 .
  8. ^ "NVIDIA Tesla P100" (PDF) . International.download.nvidia.com . Consultado el 15 de septiembre de 2016 .
  9. ^ "Dentro de Pascal: la plataforma informática más nueva de NVIDIA". 5 de abril de 2016.
  10. ^ Denis Foley (25 de marzo de 2014). "NVLink, Pascal y memoria apilada: alimentando el apetito por los macrodatos". nvidia.com . Consultado el 7 de julio de 2014 .
  11. ^ "La arquitectura de GPU Pascal de próxima generación de NVIDIA proporcionará una aceleración 10 veces mayor para aplicaciones de aprendizaje profundo". El blog oficial de NVIDIA . Consultado el 23 de marzo de 2015 .
  12. ^ ab Smith, Ryan (5 de abril de 2015). "NVIDIA anuncia el acelerador Tesla P100: potencia Pascal GP100 para HPC". AnandTech . Consultado el 27 de mayo de 2016. Cada uno de esos SM también contiene 32 núcleos CUDA FP64, lo que nos da la tasa de 1/2 para FP64, y una novedad en la arquitectura Pascal es la capacidad de incluir 2 operaciones FP16 dentro de un solo núcleo CUDA FP32 en las circunstancias adecuadas.
  13. ^ abc Smith, Ryan (20 de julio de 2016). "Revisión de las NVIDIA GeForce GTX 1080 y GTX 1070 Founders Editions: el puntapié inicial de la generación FinFET". AnandTech . p. 9 . Consultado el 21 de julio de 2016 .
  14. ^ abcde Smith, Ryan (20 de julio de 2016). "Revisión de las NVIDIA GeForce GTX 1080 y GTX 1070 Founders Editions: el puntapié inicial de la generación FinFET". AnandTech . p. 10 . Consultado el 21 de julio de 2016 .
  15. ^ "Tarjeta gráfica GTX 1080". GeForce . Consultado el 15 de septiembre de 2016 .
  16. ^ Carbotte, Kevin (17 de mayo de 2016). "Nvidia GeForce GTX 1080 Simultaneous Multi-Projection & Async Compute". Tomshardware.com . Consultado el 15 de septiembre de 2016 .
  17. ^ "Nvidia Pascal HDCP 2.2". Página de hardware de Nvidia . Consultado el 8 de mayo de 2016 .
  18. ^ ab Smith, Ryan (20 de julio de 2016). "Revisión de las NVIDIA GeForce GTX 1080 y GTX 1070 Founders Editions: el puntapié inicial de la generación FinFET". AnandTech . p. 5 . Consultado el 21 de julio de 2016 .
  19. ^ Smith, Ryan (20 de julio de 2016). "Revisión de las NVIDIA GeForce GTX 1080 y GTX 1070 Founders Editions: el puntapié inicial de la generación FinFET". AnandTech . p. 4 . Consultado el 21 de julio de 2016 .
  20. ^ Harris, Mark (5 de abril de 2016). "Inside Pascal: NVIDIA's Newest Computing Platform". Parallel Forall . Nvidia . Consultado el 3 de junio de 2016 .
  21. ^ "Tarjeta gráfica NVIDIA TITAN Xp con arquitectura Pascal". NVIDIA .
  22. ^ "Tarjeta gráfica NVIDIA TITAN X con Pascal". GeForce . Consultado el 15 de septiembre de 2016 .
  23. ^ "Nuevas tarjetas gráficas Quadro basadas en la arquitectura Pascal". NVIDIA . Consultado el 15 de septiembre de 2016 .
  24. ^ "Aceleración de cargas de trabajo en centros de datos con GPU". NVIDIA . Consultado el 15 de septiembre de 2016 .
  25. ^ Zhiye Liu (22 de octubre de 2018). "Nvidia GeForce GTX 1060 obtiene GDDR5X en su quinto cambio de imagen". Tom's Hardware . Consultado el 2 de febrero de 2024 .
  26. ^ "Tarjetas gráficas NVIDIA GeForce serie 10". NVIDIA .
  27. ^ "La NVIDIA GeForce GTX 1060 se lanzará el 7 de julio". VideoCardz.com . 29 de junio de 2016 . Consultado el 15 de septiembre de 2016 .
  28. ^ "Tarjetas gráficas GTX 1060". GeForce . Consultado el 15 de septiembre de 2016 .
  29. ^ Smith, Ryan (12 de noviembre de 2012). "NVIDIA lanza Tesla K20 y K20X: llega por fin la GK110". AnandTech . p. 3 . Consultado el 24 de julio de 2016 .
  30. ^ abcdef Nvidia (1 de septiembre de 2015). «CUDA C Programming Guide» . Consultado el 24 de julio de 2016 .
  31. ^ abcdefghijklmno Triolet, Damien (24 de mayo de 2016). "¡Nvidia GeForce GTX 1080, la principal GPU de 16 nm en prueba!". Hardware.fr (en francés). pag. 2 . Consultado el 24 de julio de 2016 .
  32. ^ ab Smith, Ryan (26 de enero de 2015). "GeForce GTX 970: Corrección de las especificaciones y exploración de la asignación de memoria". AnandTech . p. 1 . Consultado el 24 de julio de 2016 .
  33. ^ "Fecha de lanzamiento de NVIDIA Turing". Techradar . 2 de febrero de 2021.