NVIDIA revela Pascal GP100, la P100 para gaming.

Paola Espinoza

hace 10 años

Esta semana, sin duda, ha estado llena de noticias interesantísimas, primero, Nvidia anuncia la Pascal P100, que enfoca su desempeño al segmento profesional para cómputo mediante el uso del GPU y a su vez, introduciendo el uso de la arquitectura de memoria apilable HBM2; ahora nos anuncia la NVIDIA Pascal GP100, que será la P100 pero para gaming.

NVIDIA Pascal GP100, el P100 para gaming.

Pues ahora, como complemento a este plato fuerte nos presenta la GP100, un silicón de gama alta enfocado al gaming. La versión completa incorpora 3840 CUDA cores con 240 TMUs y vendrá acompañada de 16GB de la nueva arquitectura de memoria apilable HBM2 (lo cual, considerando los estándares actuales, es una enorme cantidad de memoria), con 8 controladores de 512 bits, resultando en una interfaz de memoria de 4096 bits, y un ancho de banda de 720GB/s. Todo lo anterior construido sobre una litografía de 16nm FinFET, por lo cual podemos esperar una mejora significativa en el desempeño con menor consumo de energía.

El dispositivo de referencia Pascal GP100 corre a una velocidad base de 1328MHz y a 1480Mhz en modo turbo con un consumo de 300W, mientras las versiones de otros integradores llegan a superar la barrera de 1500MHz.

Tal como podemos hallar en la arquitectura previa (Tesla), en el chip se integran Graphic Processing Cluster (GPCs), Streaming Multiprocessors (SMs) y controladores de memoria; en Pascal se integran 6 GPCs, 60SMs y 8 controladores de memoria de 512bits. Este update será comercializado en el primer cuarto de 2017.

Chip de referencia para el GP100

Pascal integrará también NVLink, que es la nueva tecnología de interconexión de GPUS para los procesos de cómputo basados en GPU e incrementan significativamente el desempeño en la comunicación de GPU a GPU y el acceso de los GPU a la memoria del sistema

Para darnos una idea, una tarjeta Nvidia GTX980Ti (GM200), incorpora 6GPCs, 24 SMs y 176 TMUs con 2816 CUDA cores, y una interfaz de aproximadamente 6 controladores de 64bits para 6GB de memoria GDDR5 con un ancho de banda de memoria de 336.5 GB/s.

Actualmente no hay un GPU que maneje resoluciones 4k@60fps por sí solo. Sin embargo, la primera o segunda generación de Pascal, debería llegar a esta marca sin ningún problema con las innovaciones tecnológicas caminando en esta dirección.

La nomenclatura que Nvidia está utilizando para esta nueva generación de chips es: «G» para referirse a que el chip en cuestión será un GPU, mientras la segunda letra indica la arquitectura, Pascal para este caso. El primer dígito denota la generación del chip, mientras los dos restantes indican el desempeño relativo en orden inverso, siendo 00 para el más alto y 04 para el que le sigue y así consecutivamente. Entonces considerando que el chip GX X04 será menos poderoso, se espera que sea desarrollado para el consumidor en general.

A continuación te dejamos una tabla comparativa de alto nivel entre los GPU´s anteriores y el nuevo GP100:

Tesla Products	Tesla K40	Tesla M40	Tesla P100
GPU	GK110 (Kepler)	GM200 (Maxwell)	GP100 (Pascal)
SMs	fifteen	24	56
TPCs	fifteen	24	28
FP32 CUDA Cores / SM	192	128	64
FP32 CUDA Cores / GPU	2880	3072	3584
FP64 CUDA Cores / SM	64	4	32
FP64 CUDA Cores / GPU	960	96	1792
Base Clock	745 MHz	948 MHz	1328 MHz
GPU Boost Clock	810/875 MHz	1114 MHz	1480 MHz
FP64 GFLOPs	1680	213	5304
texture Units	240	192	224
Memory Interface	384-bit GDDR5	384-bit GDDR5	4096-bit HBM2
Memory Size	Up to 12 GB	Up to 24GB	16 GB
L2 Cache Size	1536 KB	3072 KB	4096 KB
Register File Size / SM	256 KB	256 KB	256 KB
Register File Size / GPU	3840 KB	6144 KB	14336 KB
TDP	235 Watts	250 Watts	300 Watts
Transistors	7.1 billion	8 billion	15.3 billion
GPU Die Size	551 mm²	601 mm²	610 mm²
Manufacturing Process	28nm	28nm	16nm