AMD presenta las primeras GPUs de centros de datos de 7nm del mundo

Nallely Saldaña

hace 7 años

AMD presentó los aceleradores 0, las primeras GPUs de centros de datos de 7nm del mundo, diseñadas para brindar el rendimiento de cómputo requerido para la próxima generación de aprendizaje profundo, HPC, computación en la nube y aplicaciones de renderizado. Investigadores, científicos y desarrolladores usarán los aceleradores AMD Radeon Instinct para resolver desafíos difíciles e interesantes, que incluyen simulaciones a gran escala, cambio climático, biología computacional, prevención de enfermedades y más.

«Las arquitecturas de GPU tradicionales limitan a los gerentes de TI en abordar de manera efectiva las demandas, en constante evolución, del procesamiento y análisis de grandes conjuntos de datos para las cargas de trabajo modernas del centro de datos de la nube», dijo David Wang, vicepresidente senior de ingeniería, Radeon Technologies Group en AMD. “Combinando el rendimiento de clase mundial y una arquitectura flexible, con una plataforma de software robusta y el ecosistema vanguardia de la industria de software abierto ROCm, los nuevos aceleradores AMD Radeon Instinct™ proporcionan los componentes críticos necesarios para resolver los desafíos más difíciles de computación en la nube actuales y futuros».

Los aceleradores AMD Radeon Instinct™ MI60 y MI50 tienen capacidades flexibles de precisión mixta, impulsados por unidades de cómputo de alto rendimiento que amplían los tipos de cargas de trabajo que estos aceleradores pueden abordar, incluida una gama de aplicaciones de aprendizaje profundo y HPC. Los nuevos aceleradores AMD Radeon Instinct™ MI60 y MI50 fueron diseñados para procesar eficientemente las cargas de trabajo, como el entrenamiento rápido en redes neuronales complejas, que ofrecen niveles más altos de rendimiento de coma flotante, mayor eficiencia y nuevas funciones para implementaciones de centros de datos y departamentos.

Los aceleradores AMD Radeon Instinct MI60 y MI50 ofrecen un rendimiento de coma flotante ultrarrápido y HBM2 (memoria de alto ancho de banda de segunda generación) con velocidades de ancho de banda de memoria de hasta 1 TB/s. También, son las primeras GPUs capaces de admitir la interconexión PCIe® 4.0 de próxima generación², que es hasta 2 veces más rápida que otras tecnologías de interconexión de CPU a GPU x86³, y cuentan con la tecnología de interconexión de GPU AMD Infinity Fabric Link que permite la comunicación de GPU a GPU hasta 6 veces más rápida que las velocidades de interconexión PCIe Gen 3.

AMD también anunció una nueva versión de la plataforma de software abierto ROCm para computación que soporta las características arquitectónicas de los nuevos aceleradores, incluidas las operaciones de aprendizaje profundo optimizadas (DLOPS) y la tecnología de interconexión AMD Infinity Fabric™ Link GPU. Diseñado para la escala, ROCm permite a los clientes implementar sistemas informáticos heterogéneos de alto rendimiento y eficiencia energética en un entorno abierto.

«Google cree que el código abierto es bueno para todos», dijo Rajat Monga, director de ingeniería, TensorFlow en Google. «Hemos visto lo útil que puede ser para la tecnología de aprendizaje automático y nos complace ver que AMD lo adopta. Con la plataforma de software abierta ROCm, los usuarios de TensorFlow se beneficiarán de la aceleración de la GPU y de un ecosistema de aprendizaje automático de código abierto más robusto«.

Las características clave de los aceleradores AMD Radeon Instinct MI60 y MI50 incluyen:

Operaciones optimizadas de aprendizaje profundo: proporciona capacidades flexibles de FP16, FP32 e INT4/INT8 de precisión mixta para satisfacer la creciente demanda de cargas de trabajo dinámicas y siempre cambiantes, desde el entrenamiento de redes neuronales complejas hasta la ejecución de inferencia contra esas redes capacitadas.
El acelerador PCIe®² de doble precisión más rápido del mundo: AMD Radeon Instinct™ MI60 es el acelerador de PCIe 4.0 de doble precisión más rápido del mundo, ofreciendo hasta 7.4 TFLOPS de rendimiento FP64 máximo, permitiendo a los científicos e investigadores procesar aplicaciones HPC de manera más eficiente en una variedad de industrias, incluyendo ciencias de la vida, energía, finanzas, automotriz, aeroespacial, académicos, gobierno, defensa y más. AMD Radeon Instinct™ MI50 ofrece hasta 6.7 TFLOPS FP64 de rendimiento máximo¹, al tiempo que brinda una solución eficiente y económica para una variedad de cargas de trabajo de aprendizaje profundo, además de permitir una alta reutilización en Infraestructura de Escritorio Virtual (VDI), Desktop-as-a-Service (DaaS) y entornos de nube.
Transferencia de datos hasta 6 veces más rápida: dos enlaces Infinity Fabric™ por GPU ofrecen hasta 200 GB/s de ancho de banda peer-to-peer (hasta 6X más rápido que el PCIe 3.04 solo⁴) y permiten la conexión de hasta 4 GPUs en una configuración de anillo de colmena (2 colmenas en 8 servidores de GPU).
Memoria HBM2 ultrarrápida: AMD Radeon Instinct™ MI60 proporciona 32GB de memoria con código de corrección de errores (ECC) HBM2, y Radeon Instinct™ MI50 proporciona 16 GB de memoria ECC HBM2. Ambas GPUs ofrecen tecnologías de ECC y fiabilidad, accesibilidad y facilidad de servicio (RAS)⁷ de chip completo, que son fundamentales para proporcionar resultados informáticos más precisos para implementaciones de HPC a gran escala.
Compatibilidad con la carga de trabajo virtualizada segura: la tecnología AMD MxGPU, la única solución de virtualización de GPU basada en hardware de la industria, que se basa en la tecnología SR-IOV (Single Root I / O Virtualization) estándar de la industria, hace que sea difícil para los piratas informáticos atacar al nivel de hardware, ayudando a proporcionar seguridad para implementaciones de nube virtualizadas.

Plataforma actualizada de software abierto ROCm

AMD también anunció una nueva versión de su plataforma de software abierto ROCm, diseñada para acelerar el desarrollo de sistemas informáticos heterogéneos de alto rendimiento y eficiencia energética. Además del soporte para los nuevos aceleradores Radeon Instinct™, la versión 2.0 del software ROCm proporciona bibliotecas matemáticas actualizadas para DLOPS; soporte para sistemas operativos Linux de 64 bits, incluidos CentOS, RHEL y Ubuntu; optimizaciones de componentes existentes; y soporte para las últimas versiones de los marcos de aprendizaje profundo más populares, incluidos TensorFlow 1.11, PyTorch (Caffe2) y otros. Conoce más sobre el software ROCm 2.0 aquí.

Disponibilidad

Se espera que el acelerador AMD Radeon Instinct™ MI60 se envíe a los clientes de centro de datos a finales de 2018. El acelerador AMD Radeon Instinct™ MI50 comenzará a distribuirse a los clientes de centro de datos a fines del primer trimestre de 2019. Se prevé que la plataforma de software abierto ROCm 2.0 esté disponible a fines de 2018.