stringtranslate.com

Serie GeForce 400

La serie GeForce 400 es una serie de unidades de procesamiento gráfico desarrolladas por Nvidia , que sirven como introducción a la microarquitectura Fermi . Su lanzamiento estaba previsto originalmente para noviembre de 2009, [2] sin embargo, después de retrasos, se lanzó el 26 de marzo de 2010, y estuvo disponible en abril de 2010.

Su competidor directo fue la serie Radeon HD 5000 de ATI .

Arquitectura

Nvidia describió la microarquitectura Fermi como el siguiente gran paso en su línea de GPU después de la microarquitectura Tesla utilizada desde la G80 . El GF100, el primer producto con arquitectura Fermi, es grande: 512 procesadores de flujo , en dieciséis grupos de 32, y 3.000 millones de transistores, fabricados por TSMC en un proceso de 40 nm. Es el primer chip de Nvidia compatible con OpenGL 4.0 y Direct3D 11. Nunca se vendió ningún producto con una GPU GF100 completamente habilitada. La GTX 480 tenía un multiprocesador de transmisión deshabilitado. La GTX 470 tenía dos multiprocesadores de transmisión y un controlador de memoria deshabilitados. La GTX 465 tenía cinco multiprocesadores de transmisión y dos controladores de memoria deshabilitados. Las tarjetas GeForce para consumidores venían con 256 MB conectados a cada uno de los controladores de memoria GDDR5 habilitados, para un total de 1,5, 1,25 o 1,0 GB; La Tesla C2050 tenía 512 MB en cada uno de los seis controladores, y la Tesla C2070 tenía 1024 MB por controlador. Ambas tarjetas Tesla tenían catorce grupos activos de procesadores de flujo.

Los chips de alto rendimiento de la marca Tesla incorporan memoria con ECC opcional y la capacidad de realizar una operación de punto flotante de doble precisión por ciclo por núcleo; las tarjetas GeForce para consumidores están limitadas artificialmente por el controlador a una operación de punto flotante cada cuatro ciclos. Con estas características, combinadas con el soporte para Visual Studio y C++ , Nvidia apuntaba a los mercados profesionales y comerciales, así como al uso en computación de alto rendimiento .

Fermi debe su nombre al físico italiano Enrico Fermi .

Limitaciones y compensaciones actuales

La cantidad de SRAM incorporada por ALU en realidad disminuyó proporcionalmente en comparación con la generación G200 anterior, a pesar del aumento de la caché L2 de 256 kB por 240 ALU a 768 kB por 512 ALU, ya que Fermi tiene solo 32768 registros por 32 ALU (en comparación con 16384 por 8 ALU), solo 48 kB de memoria compartida por 32 ALU (en comparación con 16 kB por 8 ALU) y solo 16 kB de caché por 32 ALU (en comparación con 8 kB de caché constante por 8 ALU + 24 kB de caché de textura por 24 ALU). Los parámetros como la cantidad de registros se pueden encontrar en la Tabla de comparación de capacidad de cómputo de CUDA en el manual de referencia. [3]

Historia

El 30 de septiembre de 2009, Nvidia publicó un informe técnico que describe la arquitectura: [4] el chip cuenta con 16 "Multiprocesadores de transmisión", cada uno con 32 "Núcleos CUDA" capaces de realizar una operación de precisión simple por ciclo o una operación de precisión doble cada dos ciclos, un espacio de direcciones virtuales de 40 bits que permite que la memoria del host se asigne al espacio de direcciones del chip, lo que significa que solo hay un tipo de puntero y hace que la compatibilidad con C++ sea significativamente más sencilla, y una interfaz de memoria GDDR5 de 384 bits de ancho. Al igual que con el G80 y el GT200 , los subprocesos se programan en "warps", conjuntos de 32 subprocesos cada uno que se ejecutan en un solo núcleo de sombreado. Mientras que el GT200 tenía 16 KB de 'memoria compartida' asociada con cada grupo de sombreadores y requería que los datos se leyeran a través de las unidades de texturizado si se necesitaba un caché, el GF100 tiene 64 KB de memoria asociada con cada grupo, que se puede usar como un caché de 48 KB más 16 KB de memoria compartida, o como un caché de 16 KB más 48 KB de memoria compartida, junto con un caché L2 de 768 KB compartido por los 16 grupos.

El libro blanco describe el chip mucho más como un procesador de propósito general para cargas de trabajo que abarcan decenas de miles de subprocesos (que recuerda a la arquitectura Tera MTA , aunque sin el soporte de esa máquina para un acceso a memoria aleatoria muy eficiente) que como un procesador de gráficos.

Muchos usuarios informaron de altas temperaturas y un consumo de energía elevado, al tiempo que recibían mejoras de rendimiento correspondientemente bajas en las GPU Fermi de la serie GeForce 400 en comparación con la serie Radeon HD 5000 de su competidor rival, AMD , lo que llevó a AMD a crear y lanzar un vídeo promocional "The Misunderstanding" [5] para burlarse del problema. En el vídeo, se ve a una unidad policial iniciando una redada en una casa con un gran perfil térmico, lo que indica una operación de cultivo . Sin embargo, al entrar en la casa es evidente que la fuente de la alta temperatura es una GPU Fermi. [6] [7] Se convirtió en una broma común que uno podría freír un huevo en una GPU Fermi a plena carga. [8]

Productos

SP - Procesador Shader (Unified Shader, CUDA Core), SFU - Unidad de función especial, SM - Multiprocesador de transmisión.

Todos los productos se producen en un proceso de fabricación de 40 nm. Todos los productos admiten Direct3D 12.0 en un nivel de características 11_0, OpenGL 4.6 y OpenCL 1.1. La única excepción es la GeForce 405, una tarjeta solo OEM, que se basa en el núcleo GT218 ( Tesla ) que solo admite DirectX 10.1, OpenGL 3.3 y no admite OpenCL, y es la única tarjeta en la gama GeForce 400 que no se basa en la microarquitectura Fermi. Por los parámetros, la GeForce 405 es idéntica a la GeForce 310 , también una tarjeta solo OEM, que se basa en la GeForce 210. Todos los productos tienen un solo conector VGA DB15 en una tarjeta de altura y longitud completas, excepto que se indique lo contrario.

El 8 de noviembre de 2010, Nvidia lanzó el chip GF110 junto con la GTX 580 (reemplazo de la 480). Se trata de un chip GF100 rediseñado que consume mucha menos energía. Esto le permitió a Nvidia habilitar los 16 SM (los 16 núcleos), lo que antes era imposible en la GF100 "Nvidia GeForce GTX 580".Varias características de la arquitectura GF100 solo estaban disponibles en las series de tarjetas más caras Quadro y Tesla. [12] Para los productos de consumo GeForce, el rendimiento de doble precisión es una cuarta parte del de la arquitectura Fermi "completa". La comprobación y corrección de errores de memoria (ECC) tampoco funciona en las tarjetas de consumo. [13] Las tarjetas GF100 proporcionan Compute Capability 2.0, mientras que las tarjetas GF104/106/108 proporcionan Compute Capability 2.1.

Soporte discontinuado

Nvidia anunció que después del lanzamiento de los controladores de la versión 390, ya no lanzará controladores de 32 bits para sistemas operativos de 32 bits. [14]

Nvidia anunció en abril de 2018 que Fermi pasará al estado de soporte de controladores heredados y se mantendrá hasta enero de 2019. [15]

Tabla de conjuntos de chips

  1. ^ ab Sombreadores unificados : unidades de mapeo de texturas : unidades de salida de renderizado
  2. ^ ab Cada SM en el GF100 contiene 4 unidades de filtrado de textura por cada unidad de dirección de textura. El chip GF100 completo contiene 64 unidades de dirección de textura y 256 unidades de filtrado de textura. [10] Cada SM en la arquitectura GF104/106/108 contiene 8 unidades de filtrado de textura por cada unidad de dirección de textura, pero ha duplicado tanto las unidades de direccionamiento como las de filtrado. El chip GF104 completo también contiene 64 unidades de dirección de textura y 512 unidades de filtrado de textura a pesar de la reducción a la mitad del número de SM, el chip GF106 completo contiene 32 unidades de dirección de textura y 256 unidades de filtrado de textura y el chip GF108 completo contiene 16 unidades de dirección de textura y 128 unidades de filtrado de textura. [16]
  3. ^ ab Para calcular la potencia de procesamiento, consulte Fermi (microarquitectura)#Rendimiento .
  4. ^ abcde Tenga en cuenta que si bien el TDP de la GTX 460 es comparable al de la serie HD5000 de AMD, las tarjetas basadas en GF100 (GTX 480/470/465) tienen una clasificación mucho más baja pero consumen significativamente más energía, por ejemplo, la GTX 480 con un TDP de 250 W consume más energía que una HD 5970 con un TDP de 297 W. [17]
  5. ^ ab La serie 400 es la única familia no OEM, desde la serie GeForce 9 hasta la 700, que no incluye un sistema oficial de doble GPU. Sin embargo, el 18 de marzo de 2011, EVGA lanzó la primera tarjeta de una sola placa con dos GPU 460 integradas. La tarjeta venía con 2048 MB de memoria a 3600 MHz y 672 procesadores shader a 1400 MHz y se ofrecía a un precio de venta sugerido de 429 dólares.
  6. ^ La tarjeta GeForce 405 es una GeForce 310 renombrada, que a su vez es una GeForce 210 renombrada.

Véase también

Notas

Referencias

  1. ^ Killian, Zak (3 de julio de 2017). "Nvidia finalmente permite que los propietarios de GPU Fermi disfruten de DirectX 12". Tech Report . Consultado el 4 de julio de 2017 .
  2. ^ "OFICIAL: NVIDIA dice que la GT300 está programada para el cuarto trimestre de 2009 y que los rendimientos son buenos - Bright Side Of News*". Brightsideofnews.com. 25 de septiembre de 2009. Consultado el 20 de septiembre de 2010 .
  3. ^ Tabla de comparación de capacidad de cómputo en "Página 147-148, Apéndice G.1, Manual de referencia oficial de CUDA 3.1" (PDF) .En la página 97 del Apéndice A se enumeran las GPU NVIDIA más antiguas y se muestra que todas las series G200 tienen capacidad de cómputo 1.3, mientras que las tarjetas basadas en Fermi tienen capacidad de cómputo 2.x (página 14, Sección 2.5).
  4. ^ Documento técnico sobre la arquitectura informática NVIDIA Fermi nvidia.com
  5. ^ Archivado en Ghostarchive y Wayback Machine: "El malentendido - Presentado por AMD". YouTube .
  6. ^ "AMD se burla de la emisión de calor de la GPU Fermi de NVIDIA en el video "The Misunderstanding"". 9 de agosto de 2010.
  7. ^ "GPU NVIDIA Fermi GF100: demasiado pequeñas, demasiado tardías, demasiado calientes y demasiado caras". ZDNet .
  8. ^ "GeForce GTX 480: ¿Hace suficiente calor como para freír un huevo?". Archivado desde el original el 20 de septiembre de 2019. Consultado el 20 de septiembre de 2019 .
  9. ^ siliconmadness.com (2010). "Nvidia Announces Tesla 20 Series". Archivado desde el original el 21 de mayo de 2010.
  10. ^ ab "Resumen de la GF100: GeForce GTX 480 y GTX 470 de Nvidia: 6 meses de retraso, ¿valió la pena la espera?". Anandtech.com . Archivado desde el original el 5 de agosto de 2011. Consultado el 11 de diciembre de 2015 .
  11. ^ Smith, Ryan. "La GeForce GTX 460 de NVIDIA: la reina de los 200 dólares". www.anandtech.com . Consultado el 16 de mayo de 2024 .
  12. ^ "Foros oficiales de NVIDIA". NVIDIA . Consultado el 16 de mayo de 2024 .
  13. ^ "Página web de NVIDIA Tesla C2xxx"., tenga en cuenta que de la descripción se puede inferir que en Teslas, el ECC se puede activar y desactivar usando 1/8 de la memoria integrada existente, a diferencia de los módulos de memoria ECC estándar que requieren 1/8 de chips de memoria adicionales (es decir, se debe montar un chip adicional en la placa de circuito impreso por cada 8).
  14. ^ "Plan de soporte para sistemas operativos de 32 bits y 64 bits | NVIDIA".
  15. ^ "Plan de soporte para las GPU GeForce de la serie Fermi | NVIDIA".
  16. ^ "GF104: Nvidia se vuelve superescalar - La GeForce GTX 460 de Nvidia: la reina de los $200". Anandtech.com . Archivado desde el original el 22 de diciembre de 2015. Consultado el 11 de diciembre de 2015 .
  17. ^ "GeForce GTX 480 y 470: ¡de Fermi y GF100 a tarjetas reales!". Tomshardware.com . 27 de marzo de 2010. Consultado el 11 de diciembre de 2015 .
  18. ^ "El Grupo Khronos". 31 de mayo de 2022.
  19. ^ "Informe técnico sobre la arquitectura informática de Nvidia Fermi" (PDF) . Archivado (PDF) del original el 22 de noviembre de 2009. Consultado el 17 de abril de 2010 . (855 KB) , página 11 de 22

Enlaces externos