NVIDIA heeft de uitbreiding van hun samenwerking met Microsoft aangekondigd, met het doel ontwikkelaars te helpen bij het sneller en efficiënter bouwen en implementeren van kunstmatige intelligentie (AI) applicaties. Deze samenwerking wordt benadrukt tijdens het jaarlijkse ontwikkelaarsevenement, Microsoft Build, dat dit jaar plaatsvindt in Seattle tot 23 mei.
Optimalisaties van AI-modellen op NVIDIA GPU’s
De laatste AI-modellen ontwikkeld door Microsoft, waaronder de familie van kleine taalmodellen Phi-3, worden geoptimaliseerd om te draaien op NVIDIA GPU’s en zullen beschikbaar worden gesteld als NVIDIA NIM versnelde inferentiemicroservices. Deze modellen omvatten Phi-3-mini met 3,8 miljard parameters, en nieuwe kleine (7 miljard parameters) en middelgrote (14 miljard parameters) modellen, evenals een multimodaal model met 4,2 miljard parameters, Phi-3-vision, dat zowel afbeeldingen als tekst ondersteunt.
De API’s voor de door NIM ondersteunde Phi-3 modellen zijn beschikbaar op ai.nvidia.com en via NVIDIA AI Enterprise in de Azure Marketplace.
NVIDIA cuOpt Beschikbaar op Azure Marketplace
NVIDIA cuOpt, een door GPU versnelde AI-microservice voor routeoptimalisatie, is nu beschikbaar op Azure Marketplace via NVIDIA AI Enterprise. CuOpt gebruikt massaal parallelle algoritmen die realtime logistiek beheer mogelijk maken voor verzendservices, spoorwegsystemen, magazijnen en fabrieken.
Het cuOpt-model heeft twee dozijn wereldrecords gevestigd op de belangrijkste routeringsbenchmarks, waarbij het de beste nauwkeurigheid en de snelste tijden aantoonde. Het zou miljarden dollars kunnen besparen voor de logistiek- en toeleveringsketenindustrieën door het optimaliseren van voertuigroutes, besparing op reistijd en het minimaliseren van de downtime.
AI-prestatieoptimalisaties op NVIDIA RTX PC’s
De versnelde computing-platform van NVIDIA vormt de ruggengraat van moderne AI, waarmee ontwikkelaars oplossingen kunnen bouwen voor meer dan 100 miljoen GeForce RTX-pc’s met Windows en NVIDIA RTX-werkstations over de hele wereld. NVIDIA en Microsoft bieden nieuwe optimalisaties en integraties aan Windows-ontwikkelaars om AI in toekomstige generatie PC- en workstation-applicaties te versnellen. Deze omvatten:
- Snelere inferentieprestaties voor grote taalmodellen via de DirectX driver van NVIDIA, de Generative AI ONNX Runtime-extensie en DirectML. Deze optimalisaties, nu beschikbaar in de GeForce Game Ready drivers, NVIDIA Studio en NVIDIA RTX Enterprise drivers, bieden tot 3 keer meer prestaties op NVIDIA- en GeForce RTX GPU’s.
- Geoptimaliseerde prestaties op RTX GPU’s voor AI-modellen zoals Stable Diffusion en Whisper via WebNN, een APIApplication Programming Interface… waarmee ontwikkelaars AI-modellen in webtoepassingen kunnen versnellen met lokale hardware.
- Met Windows dat PyTorch via DirectML gaat ondersteunen, zullen duizenden Hugging Face-modellen native draaien op Windows. NVIDIA en Microsoft werken samen om de prestaties op meer dan 100 miljoen RTX GPU’s te verbeteren.
Deelname aan Microsoft Build
Conferentiebezoekers kunnen de stand van NVIDIA, FP28, bezoeken om te spreken met ontwikkelexperts en live demonstraties te ervaren van NVIDIA NIM, NVIDIA cuOpt, NVIDIA Omniverse en het NVIDIA RTX AI-platform. De stand belicht ook het NVIDIA MONAI-platform voor medische beeldverwerking workflows en het generatieve AI NVIDIA BioNeMo-platform voor geneesmiddelontdekking, beide beschikbaar op Azure als onderdeel van NVIDIA AI Enterprise.
Sessies en Demonstraties
Bezoekers kunnen ook sessies bijwonen met sprekers van NVIDIA om meer te leren over de capaciteiten van het NVIDIA RTX AI-platform op Windows PC’s en ontdekken hoe generatieve AI-tools en digitale tweelingen te implementeren op Microsoft Azure. Daarnaast kunnen ze zich inschrijven voor de Developer Showcase, die op woensdag plaatsvindt, om te ontdekken hoe ontwikkelaars innovatieve generatieve AI-oplossingen bouwen met NVIDIA AI-software op Azure.
Met deze uitgebreide samenwerking zijn NVIDIA en Microsoft gepositioneerd om de ontwikkeling en implementatie van hoogwaardige AI-toepassingen te leiden, ontwikkelaars stuwende richting een toekomst waar AI een integraal onderdeel is van technologische innovatie.