La segunda versión (DIGITS 2) del sistema de capacitación de aprendizaje profundo acelerado por GPU NVIDIA DIGITS, y la tercera versión (cuDNN 3) de la red neuronal profunda, NVIDIA CUDA, proporcionan mejoras de rendimiento significativas y nuevas capacidades. Para los científicos de datos, ahora, DIGITS 2 ofrece la escala automática de capacitación de redes neuronales a través de múltiples GPU de alto rendimiento. Esto puede duplicar la velocidad de la capacitación de redes neuronales profundas para la clasificación de imágenes en comparación con una sola GPU.
«Las GPU de alto rendimiento son los cimientos tecnológicos sólidos que impulsan una serie de investigaciones de aprendizaje profundo y desarrollo de productos en el mundo académico y en las principales empresas de Internet» comenta Ian Buck, vicepresidente de Informática acelerada de NVIDIA. «Al trabajar en estrecha colaboración con científicos de datos, desarrolladores de estructura y la comunidad de aprendizaje profundo, estamos aplicando las tecnologías de GPU más potentes para superar los límites de lo posible».
La nueva capacidad de escala automática en varias GPU de DIGITS 2 aumenta los recursos disponibles de la GPU mediante la distribución automática de las cargas de trabajo de capacitación de aprendizaje profundo en todas las GPU del sistema. Con DIGITS 2, los ingenieros de NVIDIA capacitan el reconocido modelo de red neuronal AlexNet a más del doble de velocidad en cuatro GPU basadas en la arquitectura NVIDIA Maxwell, en comparación con una sola GPU. Los resultados iniciales de los primeros clientes están demostrando mejores resultados.
cuDNN es una librería acelerada por GPU de rutinas matemáticas para redes neuronales profundas que los desarrolladores integran en las estructuras de aprendizaje de máquinas de nivel superior. cuDNN 3 agrega soporte para almacenamiento de datos de punto flotante de 16 bits en la memoria de la GPU. De esta manera, se duplica la cantidad de datos que se pueden almacenar y se optimiza el ancho de banda de la memoria. Con esta capacidad, cuDNN 3 permite a los investigadores capacitar redes neuronales más grandes y sofisticadas.
cuDNN 3 también ofrece aceleraciones significativas de rendimiento en comparación con cuDNN 2 para la capacitación de redes neuronales en una sola GPU. Los ingenieros de NVIDIA capacitaron los modelo AlexNet dos veces más rápido en una sola GPU GeForce GTX TITAN X de NVIDIA.