NVIDIA heeft zijn volgende generatie AI-supercomputer aangekondigd, de NVIDIA DGX SuperPOD™, aangedreven door NVIDIA GB200 Grace Blackwell Superchips, ontworpen om modellen met biljoenen parameters te verwerken met een constante uptime voor grootschalige generatieve AI-trainings- en inferentieworkloads.
Voorzien van een bijzonder efficiënte rack-schaal vloeistofarchitectuur, is de nieuwe DGX SuperPOD gebouwd met NVIDIA DGX™ GB200-systemen en levert hij 11,5 exaflops aan AI-supercomputerkracht met FP4-precisie en 240 terabytes aan snelle geheugencapaciteit, en kan verder worden geschaald met extra racks.
Elk DGX GB200-systeem is uitgerust met 36 NVIDIA GB200 Superchips, die 36 NVIDIA Grace CPU’s en 72 NVIDIA Blackwell GPU’s bevatten, met elkaar verbonden als een supercomputer via NVIDIA’s vijfde generatie NVLink®. De GB200 Superchips bieden tot een 30-voudige prestatieverbetering vergeleken met de NVIDIA H100 Tensor Core GPU voor inspannende workloads van grote taalmodellen.
“De NVIDIA DGX-supercomputers zijn de fabrieken van de AI-industriële revolutie,” zei Jensen Huang, oprichter en CEO van NVIDIA. “De nieuwe DGX SuperPOD combineert NVIDIA’s nieuwste vooruitgang op het gebied van versnelde rekenkracht, netwerken en software om elke onderneming, industrie en land in staat te stellen hun eigen AI te verfijnen en te genereren.”
De DGX SuperPOD, aangedreven door Grace Blackwell, beschikt over acht of meer DGX GB200-systemen en kan opschalen naar tienduizenden GB200 Superchips verbonden via NVIDIA Quantum InfiniBand. Voor een enorme gedeelde geheugenruimte die nodig is om de volgende-generatiemodellen van AI te voeden, kunnen klanten een configuratie implementeren die de 576 Blackwell GPU’s in acht DGX GB200-systemen met elkaar verbindt via NVLink.
Nieuwe DGX SuperPOD-architectuur voor het tijdperk van generatieve AI
De nieuwe DGX SuperPOD met DGX GB200-systemen beschikt over een verenigd rekenweefsel. Naast de vijfde generatie van NVIDIA NVLink, omvat het weefsel NVIDIA BlueField®-3 DPU’s en zal het het vandaag afzonderlijk aangekondigde NVIDIA Quantum-X800 InfiniBand-netwerk ondersteunen. Deze architectuur levert tot 1.800 gigabytes per seconde aan bandbreedte voor elke GPU op het platform.
Bovendien biedt de vierde generatie van de Scalable Hierarchical Aggregation and Reduction Protocol (SHARP)™-technologie 14.4 teraflops aan netwerkcomputatie, een vier keer verhoogde netwerkcomputatie in de volgende generatie DGX SuperPOD-architectuur vergeleken met de vorige generatie.
Sleutelklare architectuur met geavanceerde software voor ongekende uptime
De nieuwe DGX SuperPOD is een volledige AI-supercomputer op datacentrum-schaal die wordt geïntegreerd met high-performance opslag van door NVIDIA gecertificeerde partners om te voldoen aan de eisen van generatieve AI-workloads. Elke eenheid wordt gebouwd, bedraad en getest in de fabriek om de implementatie in klantdatacentra drastisch te versnellen.
De op Grace Blackwell aangedreven DGX SuperPOD beschikt over intelligente voorspellende beheercapaciteiten om continu duizenden datapunten in hardware en software te monitoren om bronnen van downtime en inefficiëntie te voorspellen en te onderscheppen, wat tijd, energie en rekentijd bespaart.
De software kan zorgpunten identificeren en onderhoud plannen, rekenbronnen flexibel aanpassen en taken automatisch opslaan en hervatten om downtime te voorkomen, zelfs zonder aanwezigheid van systeembeheerders.
Gevorderde NVIDIA DGX B200-systemen brengen AI-supercomputing naar de industrieën
NVIDIA introduceerde ook het NVIDIA DGX B200-systeem, een verenigd AI-supercomputingplatform voor AI-modeltraining, fijntunen en inferentie.