NVIDIA DGX A100 el sistema de Inteligencia Artificial (IA) más avanzado del mundo para luchar contra el COVID.

Nallely Saldaña

hace 6 años

NVIDIA presentó NVIDIA DGX™ A100, la tercera generación del más avanzado sistema de IA del mundo, con 5 petaflops de desempeño de IA, que consolida la potencia y las capacidades de todo un data center en una única plataforma flexible, por primera vez en la historia.

Inmediatamente disponibles, los sistemas DGX A100 han comenzado a enviarse a todo el mundo. El primer pedido corresponde al Laboratorio Nacional Argonne del Departamento de Energía de los EE. UU., que usará la potencia de la computación y la IA del clúster para estudiar mejor el COVID-19 y luchar contra esta enfermedad.

“NVIDIA DGX A100 es la herramienta definitoria para la IA”, dijo Jensen Huang, fundador y CEO de NVIDIA. “NVIDIA DGX es el primer sistema de IA creado para el flujo de trabajo de aprendizaje automátizado de punta a punta, desde análisis de datos hasta la capacitación y la inferencia. Y con el salto de rendimiento gigante de la nueva DGX, los ingenieros de aprendizaje automátizado pueden adelantarse al tamaño exponencialmente creciente de los modelos y datos de la IA».

Los sistemas DGX A100 integran ocho de las nuevas GPU NVIDIA® A100 con núcleos Tensor, que proporcionan 320 GB de memoria para entrenar los conjuntos de datos de IA más grandes y las últimas interconexiones NVIDIA Mellanox HDR 200 Gbps de alta velocidad.

Las múltiples más pequeñas cargas de trabajo se pueden acelerar al dividir el DGX A100 en hasta 56 instancias por sistema, utilizando la función de multi-instance GPU de A100. La combinación de estas capacidades permite a las empresas optimizar la potencia de cómputo y los recursos bajo demanda para acelerar diversas cargas de trabajo, incluyendo el análisis de datos, el entrenamiento y la inferencia, en una única plataforma integrada y definida por el software.

Inmediata compatibilidad y adopción de DGX A100.

Varias de las compañías, proveedores de servicios y agencias gubernamentales más grandes del mundo han realizado pedidos iniciales para el DGX A100. Los primeros sistemas se entregaron a Argonne a principios de este mes.

“Estamos utilizando las supercomputadoras más potentes de Estados Unidos en la lucha contra COVID-19, ejecutando modelos y simulaciones de inteligencia artificial con la última tecnología disponible, como el NVIDIA DGX A100”, dijo Rick Stevens, Director de Laboratorio Asociado para el Procesamiento, Medio Ambiente y Ciencias de la Vida en Argonne. “La potencia de procesamiento del nuevo DGX A100 que llega a Argonne ayudará a los investigadores a explorar tratamientos, vacunas y estudiar la propagación del virus, lo que permitirá a los científicos acelerar los trabajos que antes realizaban en años, ahora con IA lo harán en meses, semanas o incluso días.”

«La Universidad de Florida tiene la visión de ser un líder nacional en inteligencia artificial y NVIDIA es un socio increíblemente valioso en nuestro propósito para lograrlo», dijo el Rector de la Universidad de Florida, Kent Fuchs. «En todas las disciplinas, nuestros nuevos sistemas NVIDIA DGX A100 posicionarán a nuestros investigadores para resolver algunos de los desafíos más apremiantes de nuestro mundo y equiparán a toda una generación de estudiantes con las habilidades que revolucionarán la futura fuerza laboral».

Otros de los primeros adoptantes fueron:

El Centro de IA Biomédica: en Centro Médico Universitario Hamburg-Eppendorf, de Alemania, que aprovechará la DGX A100 para avanzar en la toma de decisiones clínicas y la optimización de procesos.
La Universidad de Chulalongkorn, la principal universidad intensiva en investigación de Thailandia, utilizará DGX A100 para acelerar su investigación pionera, como el Procesamiento del Lenguaje Natural Tailandés (TNLP), el reconocimiento automático del habla, la visión por computadora y las imágenes médicas.
Element AI: un desarrollador de Montreal de soluciones y servicios de inteligencia artificial, está implementando DGX A100 para acelerar el rendimiento y la optimización de funciones para que Orkestrator, su programador de GPU, cumpla con las crecientes demandas de aplicaciones y entrenamiento de IA.
El Centro de Investigación Alemán para la Inteligencia Artificial (DFKI) utilizará los sistemas DGX A100 para acelerar aún más su investigación sobre nuevos métodos de aprendizaje profundo y su explicabilidad mientras reduce significativamente el consumo de espacio y energía.
Harrison.ai: una empresa de IA de Sydney, implementará los primeros sistemas de DGX A100 en Australia para acelerar el desarrollo de su IA como dispositivos médicos.
La Oficina de Inteligencia Artificial de los EAU, la primera en el Medio Oriente en desplegar el nuevo DGX A100, está construyendo una infraestructura nacional para acelerar la investigación, el desarrollo y la adopción de IA en los sectores público y privado.
VinAI Research, el principal laboratorio de investigación de IA líder en Vietnam, con sede en Hanoi y la Ciudad Ho Chi Minh, utilizará el DGX A100 para realizar investigaciones de alto impacto y acelerar la aplicación de IA.

Miles de sistemas DGX de generaciones anteriores están siendo utilizados en todo el mundo por una gran variedad de organizaciones públicas y privadas. Entre ellos se encuentran algunas de las empresas líderes del mundo, incluidos fabricantes de automóviles, proveedores de atención médica, vendedores minoristas, instituciones financieras y empresas de logística que están impulsando la inteligencia artificial en todas sus industrias.

NVIDIA desarrolla la DGX SuperPOD de 700 petaflops de próxima generación.

NVIDIA también presentó su next-generation DGX SuperPOD, un grupo de 140 sistemas DGX A100 capaces de lograr 700 petaflops de potencia de cómputo de IA. Combinando 140 sistemas DGX A100 con interconexiones Mellanox HDR 200 Gbps InfiniBand, NVIDIA construyó su propia supercomputadora de IA DGX SuperPOD de próxima generación para la investigación interna en áreas como la IA conversacional, la genómica y conducción autónoma.

El clúster es una de las supercomputadoras de IA más rápidas del mundo, ya que logra un nivel de rendimiento que anteriormente requería miles de servidores. La arquitectura y el rendimiento listos para la empresa de DGX A100 permitieron a NVIDIA construir el sistema en un sólo mes, en lugar de tomar meses o años de planificación y adquisición de componentes especializados previamente requeridos para ofrecer estas capacidades de supercomputación.

Para ayudar a los clientes a construir sus propios centros de datos con tecnología A100, NVIDIA ha lanzado un nuevo DGX con Arquitectura de referencia SuperPOD. Ofrece a los clientes un plan que sigue el mismo diseño, principios y mejores prácticas que NVIDIA utilizó para construir su supercomputadora de inteligencia artificial basada en el cluster DGX A100.

Programa DGXpert, software DGX-Ready.

NVIDIA también lanzó el programa NVIDIA DGXpert, que reúne a los clientes de DGX con los expertos en inteligencia artificial de la compañía, y el programa NVIDIA DGX-Ready Software, que ayuda a los clientes que aprovechan el software certificado de nivel empresarial para los flujos de trabajo de IA.

Los DGXperts son especialistas versados en IA que pueden ayudar a guiar a los clientes en las implementaciones de IA desde la planificación a la implementación y hasta la optimización continua. Estas personas pueden ayudar a los clientes DGX A100 a construir y mantener una infraestructura de IA de última generación.

El programa de software NVIDIA DGX-Ready ayuda a los clientes a identificar y aprovechar rápidamente el software MLOps de terceros probado por NVIDIA que puede ayudarlos a aumentar la productividad de la ciencia de datos, acelerar los flujos de trabajo de la IA y mejorar la accesibilidad y la utilización de la infraestructura de IA. Los primeros socios del programa certificados por NVIDIA son Allegro AI, cnvrg.io, Core Scientific, Domino Data Lab, Iguazio y Paperspace.

Especificaciones técnicas de DGX A100.

Ocho GPU NVIDIA A100 con núcleos Tensor, que ofrecen 5 petaflops de potencia de IA, con 320 GB de memoria total de GPU, con 12.4 TB por segundo de ancho de banda.
Seis NVIDIA NVSwitch ™ de interconexión de fábrica, con tecnología NVIDIA NVLink® de tercera generación para transmitir 4.8 TB por segundo en el ancho de banda bi-direccional.
Nueve interfaces de red NVIDIA Mellanox ConnectX-6 HDR, que ofrecen un total de 3.6 Tb por segundo de procesamiento en el ancho de banda bi-direccional.
Aprovecha los motores de aceleración de red y de procesamiento en red de Mellanox como RDMA, GPUDirect® y el protocolo de agregación y reducción jerárquica escalable (SHARP) ™ para permitir el mayor rendimiento y escalabilidad.
15 TB de almacenamiento interno Gen4 NVMe, que es 2 veces más rápido que los SSD Gen3 NVMe.
Cuenta con la tecnología del conjunto de software NVIDIA DGX, que incluye software optimizado para IA y cargas de trabajo de ciencia de datos, para brindar un rendimiento maximizado, lo que permite a las empresas lograr un retorno más rápido de su inversión en infraestructura de IA.

Un solo rack de cinco sistemas DGX A100 reemplaza un data center de entrenamiento de IA e infraestructura de inferencia, con un vigésimo (1/20) de energía, un cuarto (1/25) del espacio y un décimo (1/10) del costo.

Disponibilidad.

Los sistemas NVIDIA DGX A100 ya están en producción y ahora se envían a través de revendedores de NVIDIA Partner Network en todo el mundo. Los proveedores de tecnología de almacenamiento DDN Storage, Dell Technologies, IBM, NetApp, Pure Storage y Vast planean integrar DGX A100 en sus ofertas, incluidas las basadas en las arquitecturas de referencia NVIDIA DGX POD y DGX SuperPOD.

NVIDIA DGX-Ready Data Center partners ofrecen servicios de colocación en más de 122 ubicaciones en 26 países para ayudar a los clientes que buscan instalaciones rentables para albergar sus infraestructuras de DGX. Los clientes pueden aprovechar estos servicios para alojar y acceder a la infraestructura DGX A100 dentro de instalaciones de centro de datos validadas de clase mundial. Puedes encontrar más información, incluidas las especificaciones técnicas detalladas y datos para pedidos, en NVIDIA DGX™ A100.