La serie GeForce 600 es una serie de unidades de procesamiento gráfico desarrolladas por Nvidia , lanzada por primera vez en 2012. Sirvió como la introducción de la arquitectura Kepler . Le sucedió la serie GeForce 700 .
Mientras que el objetivo de la arquitectura anterior, Fermi, era aumentar el rendimiento bruto (en particular para el cálculo y la teselación), el objetivo de Nvidia con la arquitectura Kepler era aumentar el rendimiento por vatio, sin dejar de esforzarse por conseguir aumentos del rendimiento general. [3] La forma principal en que Nvidia logró este objetivo fue mediante el uso de un reloj unificado. Al abandonar el reloj de sombreado que se encontraba en sus diseños de GPU anteriores, se aumenta la eficiencia, aunque se requieren más núcleos para lograr niveles similares de rendimiento. Esto no se debe solo a que los núcleos son más eficientes energéticamente (dos núcleos Kepler utilizan aproximadamente el 90% de la energía de un núcleo Fermi, según las cifras de Nvidia), sino también a que la reducción de la velocidad del reloj ofrece una reducción del 50% en el consumo de energía en esa área. [4]
Kepler también introdujo una nueva forma de manejo de texturas conocida como texturas sin enlaces. Anteriormente, las texturas debían estar enlazadas por la CPU a una ranura particular en una tabla de tamaño fijo antes de que la GPU pudiera hacer referencia a ellas. Esto condujo a dos limitaciones: una era que debido a que la tabla era de tamaño fijo, solo podía haber tantas texturas en uso a la vez como pudieran caber en esta tabla (128). La segunda era que la CPU estaba haciendo un trabajo innecesario: tenía que cargar cada textura y también enlazar cada textura cargada en la memoria a una ranura en la tabla de enlaces. [3] Con las texturas sin enlaces, se eliminan ambas limitaciones. La GPU puede acceder a cualquier textura cargada en la memoria, lo que aumenta la cantidad de texturas disponibles y elimina la penalización de rendimiento del enlace.
Finalmente, con Kepler, Nvidia pudo aumentar la frecuencia de reloj de la memoria a 6 GHz. Para lograrlo, Nvidia necesitaba diseñar un controlador de memoria y un bus completamente nuevos. Si bien todavía está lejos de la limitación teórica de 7 GHz de GDDR5 , está muy por encima de la velocidad de 4 GHz del controlador de memoria para Fermi. [4]
Kepler debe su nombre al matemático, astrónomo y astrólogo alemán Johannes Kepler .
La serie GeForce 600 incluye productos de las generaciones anteriores de GPU de Nvidia, Fermi, y de las generaciones más nuevas de GPU Kepler. Los miembros de la serie 600 basados en Kepler agregan las siguientes características estándar a la familia GeForce:
La arquitectura Kepler emplea una nueva arquitectura de multiprocesador de transmisión por secuencias denominada SMX. Los SMX son el método clave para la eficiencia energética de Kepler, ya que toda la GPU utiliza un único "reloj de núcleo" en lugar del "reloj de sombreado" de doble bomba. [4] El uso de SMX de un único reloj unificado aumenta la eficiencia energética de la GPU debido al hecho de que dos núcleos CUDA Kepler consumen el 90% de la energía de un núcleo CUDA Fermi. En consecuencia, el SMX necesita unidades de procesamiento adicionales para ejecutar una deformación completa por ciclo. Kepler también necesitaba aumentar el rendimiento bruto de la GPU para seguir siendo competitivo. Como resultado, duplicó los núcleos CUDA de 16 a 32 por matriz CUDA, de una matriz de 3 núcleos CUDA a una matriz de 6 núcleos CUDA, de 1 grupo de carga/almacenamiento y 1 grupo SFU a 2 grupos de carga/almacenamiento y 2 grupos SFU. Los recursos de procesamiento de la GPU también se duplican. De 2 programadores warp a 4 programadores warp, 4 unidades de despacho se convirtieron en 8 y el archivo de registros se duplicó a 64K entradas para aumentar el rendimiento. Con la duplicación de las unidades de procesamiento de la GPU y los recursos que aumentan el uso de los espacios de la matriz, la capacidad del motor PolyMorph no se duplica sino que se mejora, lo que lo hace capaz de generar un polígono en 2 ciclos en lugar de 4. [5] Con Kepler, Nvidia no solo trabajó en la eficiencia energética sino también en la eficiencia del área. Por lo tanto, Nvidia optó por usar ocho núcleos CUDA FP64 dedicados en un SMX para ahorrar espacio en la matriz, al mismo tiempo que ofrece capacidades FP64 ya que todos los núcleos CUDA Kepler no son compatibles con FP64. Con la mejora que realizó Nvidia en Kepler, los resultados incluyen un aumento en el rendimiento gráfico de la GPU al tiempo que minimizan el rendimiento FP64.
Se obtienen áreas de matriz adicionales reemplazando el complejo programador de hardware con un programador de software simple. Con la programación de software, la programación de warps se trasladó al compilador de Nvidia y, como el flujo de cálculo de GPU ahora tiene una latencia fija, ahora incluye la utilización de paralelismo a nivel de instrucción y ejecución superescalar además del paralelismo a nivel de subproceso. Como las instrucciones se programan estáticamente, la programación dentro de un warp se vuelve redundante ya que la latencia del flujo de cálculo ya se conoce. Esto resultó en un aumento en el espacio del área de matriz y la eficiencia energética. [4] [6] [3]
GPU Boost es una nueva función que es más o menos análoga al turbo boosting de una CPU. La GPU siempre tiene la garantía de funcionar a una velocidad de reloj mínima, denominada "reloj base". Esta velocidad de reloj se establece en el nivel que garantizará que la GPU se mantenga dentro de las especificaciones de TDP , incluso con cargas máximas. [3] Sin embargo, cuando las cargas son menores, hay margen para aumentar la velocidad de reloj sin superar el TDP. En estos escenarios, GPU Boost aumentará gradualmente la velocidad de reloj en pasos, hasta que la GPU alcance un objetivo de potencia predefinido (que es 170 W por defecto). [4] Al adoptar este enfoque, la GPU aumentará o disminuirá su reloj de forma dinámica, de modo que proporcione la máxima cantidad de velocidad posible sin exceder las especificaciones de TDP.
El objetivo de potencia, así como el tamaño de los pasos de aumento de reloj que realizará la GPU, se pueden ajustar a través de utilidades de terceros y proporcionan un medio para realizar overclocking de tarjetas basadas en Kepler. [3]
Tanto las tarjetas basadas en Fermi como las basadas en Kepler admiten Direct3D 11 , ambas también admiten Direct3D 12, aunque no todas las funciones las proporciona la API. [7] [8]
Exclusivo de las GPU Kepler, TXAA es un nuevo método anti-aliasing de Nvidia que está diseñado para su implementación directa en motores de juegos. TXAA se basa en la técnica MSAA y filtros de resolución personalizados. Su diseño aborda un problema clave en los juegos conocido como shimmering o aliasing temporal ; TXAA lo resuelve suavizando la escena en movimiento, asegurándose de que cualquier escena del juego se limpie de cualquier aliasing y shimmering. [9]
NVENC es el bloque SIP de Nvidia que realiza la codificación de video, de manera similar a Quick Sync Video de Intel y VCE de AMD . NVENC es una tubería de función fija de bajo consumo de energía que puede tomar códecs, decodificar, preprocesar y codificar contenido basado en H.264. Los formatos de entrada de la especificación NVENC están limitados a la salida H.264. Pero aún así, NVENC, a través de su formato limitado, puede realizar la codificación en resoluciones de hasta 4096×4096. [10]
Al igual que Quick Sync de Intel, NVENC está actualmente expuesto a través de una API propietaria, aunque Nvidia tiene planes de proporcionar el uso de NVENC a través de CUDA. [10]
En los controladores R300, lanzados junto con la GTX 680, Nvidia introdujo una nueva característica llamada Adaptive VSync. Esta característica está destinada a combatir la limitación de v-sync que, cuando la velocidad de cuadros cae por debajo de 60 FPS, hay tartamudeo ya que la velocidad de v-sync se reduce a 30 FPS, luego a otros factores de 60 si es necesario. Sin embargo, cuando la velocidad de cuadros está por debajo de 60 FPS, no hay necesidad de v-sync ya que el monitor podrá mostrar los cuadros cuando estén listos. Para solucionar este problema (mientras se mantienen las ventajas de v-sync con respecto al desgarro de la pantalla), Adaptive VSync se puede activar en el panel de control del controlador. Habilitará VSync si la velocidad de cuadros es igual o superior a 60 FPS, mientras que lo deshabilitará si la velocidad de cuadros disminuye. Nvidia afirma que esto dará como resultado una visualización general más fluida. [3]
Si bien esta función debutó junto con la GTX 680, está disponible para los usuarios de tarjetas Nvidia más antiguas que instalen los controladores actualizados. [3]
La superresolución dinámica (DSR) se agregó a las GPU Fermi y Kepler con un lanzamiento de los controladores de Nvidia en octubre de 2014. Esta función tiene como objetivo aumentar la calidad de la imagen mostrada, al representar el escenario con una resolución más alta y más detallada (escalado ascendente) y reducirla para que coincida con la resolución nativa del monitor ( muestreo descendente ). [11]
En septiembre de 2010, Nvidia anunció por primera vez Kepler. [12]
A principios de 2012, aparecieron los detalles de los primeros componentes de la serie 600. Estos primeros componentes eran GPU para portátiles de nivel de entrada basadas en la antigua arquitectura Fermi.
El 22 de marzo de 2012, Nvidia presentó la GPU de la serie 600: la GTX 680 para PC de escritorio y las GeForce GT 640M, GT 650M y GTX 660M para PC portátiles. [13] [14]
El 29 de abril de 2012, se anunció la GTX 690 como el primer producto Kepler con doble GPU. [15]
El 10 de mayo de 2012, se anunció oficialmente la GTX 670. [16]
El 4 de junio de 2012, se anunció oficialmente la GTX 680M. [17]
El 16 de agosto de 2012, se anunció oficialmente la GTX 660 Ti. [18]
El 13 de septiembre de 2012, se anunciaron oficialmente las GTX 660 y GTX 650. [19]
El 9 de octubre de 2012, se anunció oficialmente la GTX 650 Ti. [20]
El 26 de marzo de 2013, se anunció oficialmente la GTX 650 Ti BOOST. [21]
La arquitectura de la serie GeForce 600M para portátiles. La potencia de procesamiento se obtiene multiplicando la velocidad del reloj del shader, la cantidad de núcleos y la cantidad de instrucciones que los núcleos son capaces de ejecutar por ciclo.
(*)-Apple MacBook Pro Retina 2012 con configuración de 512MB o 1024MB GDDR5.
Nvidia dejó de lanzar controladores de 32 bits para sistemas operativos de 32 bits después de que se lanzara el último controlador Release 390, 391.35, en marzo de 2018. [35]
Las GPU para portátiles Kepler pasaron a tener soporte heredado en abril de 2019 y dejaron de recibir actualizaciones de seguridad críticas en abril de 2020. [36] Varias GPU Geforce 6xxM para portátiles se vieron afectadas por este cambio, siendo las restantes GPU Fermi de gama baja que ya no tenían soporte desde enero de 2019. [37]
Nvidia anunció que después de la versión 470 de los controladores, trasladaría el soporte de los controladores para los sistemas operativos Windows 7 y Windows 8.1 al estado heredado y continuaría brindando actualizaciones de seguridad críticas para estos sistemas operativos hasta septiembre de 2024. [38]
Nvidia anunció que todas las GPU de escritorio Kepler restantes pasarían a tener soporte heredado a partir de septiembre de 2021 y recibirían soporte para actualizaciones de seguridad críticas hasta septiembre de 2024. [39] Todas las GPU GeForce 6xx restantes se verían afectadas por este cambio.