Esta semana, sin duda, ha estado llena de noticias interesantísimas, primero, Nvidia anuncia la Pascal P100, que enfoca su desempeño al segmento profesional para cómputo mediante el uso del GPU y a su vez, introduciendo el uso de la arquitectura de memoria apilable HBM2; ahora nos anuncia la NVIDIA Pascal GP100, que será la P100 pero para gaming.
NVIDIA Pascal GP100, el P100 para gaming.
Pues ahora, como complemento a este plato fuerte nos presenta la GP100, un silicón de gama alta enfocado al gaming. La versión completa incorpora 3840 CUDA cores con 240 TMUs y vendrá acompañada de 16GB de la nueva arquitectura de memoria apilable HBM2 (lo cual, considerando los estándares actuales, es una enorme cantidad de memoria), con 8 controladores de 512 bits, resultando en una interfaz de memoria de 4096 bits, y un ancho de banda de 720GB/s. Todo lo anterior construido sobre una litografía de 16nm FinFET, por lo cual podemos esperar una mejora significativa en el desempeño con menor consumo de energía.
El dispositivo de referencia Pascal GP100 corre a una velocidad base de 1328MHz y a 1480Mhz en modo turbo con un consumo de 300W, mientras las versiones de otros integradores llegan a superar la barrera de 1500MHz.
Tal como podemos hallar en la arquitectura previa (Tesla), en el chip se integran Graphic Processing Cluster (GPCs), Streaming Multiprocessors (SMs) y controladores de memoria; en Pascal se integran 6 GPCs, 60SMs y 8 controladores de memoria de 512bits. Este update será comercializado en el primer cuarto de 2017.
Pascal integrará también NVLink, que es la nueva tecnología de interconexión de GPUS para los procesos de cómputo basados en GPU e incrementan significativamente el desempeño en la comunicación de GPU a GPU y el acceso de los GPU a la memoria del sistema
Para darnos una idea, una tarjeta Nvidia GTX980Ti (GM200), incorpora 6GPCs, 24 SMs y 176 TMUs con 2816 CUDA cores, y una interfaz de aproximadamente 6 controladores de 64bits para 6GB de memoria GDDR5 con un ancho de banda de memoria de 336.5 GB/s.
Actualmente no hay un GPU que maneje resoluciones 4k@60fps por sí solo. Sin embargo, la primera o segunda generación de Pascal, debería llegar a esta marca sin ningún problema con las innovaciones tecnológicas caminando en esta dirección.
La nomenclatura que Nvidia está utilizando para esta nueva generación de chips es: «G» para referirse a que el chip en cuestión será un GPU, mientras la segunda letra indica la arquitectura, Pascal para este caso. El primer dígito denota la generación del chip, mientras los dos restantes indican el desempeño relativo en orden inverso, siendo 00 para el más alto y 04 para el que le sigue y así consecutivamente. Entonces considerando que el chip GX X04 será menos poderoso, se espera que sea desarrollado para el consumidor en general.
A continuación te dejamos una tabla comparativa de alto nivel entre los GPU´s anteriores y el nuevo GP100:
Tesla Products | Tesla K40 | Tesla M40 | Tesla P100 |
GPU | GK110 (Kepler) | GM200 (Maxwell) | GP100 (Pascal) |
SMs | fifteen | 24 | 56 |
TPCs | fifteen | 24 | 28 |
FP32 CUDA Cores / SM | 192 | 128 | 64 |
FP32 CUDA Cores / GPU | 2880 | 3072 | 3584 |
FP64 CUDA Cores / SM | 64 | 4 | 32 |
FP64 CUDA Cores / GPU | 960 | 96 | 1792 |
Base Clock | 745 MHz | 948 MHz | 1328 MHz |
GPU Boost Clock | 810/875 MHz | 1114 MHz | 1480 MHz |
FP64 GFLOPs | 1680 | 213 | 5304 |
texture Units | 240 | 192 | 224 |
Memory Interface | 384-bit GDDR5 | 384-bit GDDR5 | 4096-bit HBM2 |
Memory Size | Up to 12 GB | Up to 24GB | 16 GB |
L2 Cache Size | 1536 KB | 3072 KB | 4096 KB |
Register File Size / SM | 256 KB | 256 KB | 256 KB |
Register File Size / GPU | 3840 KB | 6144 KB | 14336 KB |
TDP | 235 Watts | 250 Watts | 300 Watts |
Transistors | 7.1 billion | 8 billion | 15.3 billion |
GPU Die Size | 551 mm² | 601 mm² | 610 mm² |
Manufacturing Process | 28nm | 28nm | 16nm |