Intel en Aible versnellen GenAI-werklasten met Xeon-processors

Intel en Aible, een geïntegreerde bedrijfsoplossing voor generatieve kunstmatige intelligentie (GenAI) en serverloze uitgebreide analyse, hebben nieuwe oplossingen voor gezamenlijke klanten aangekondigd die het mogelijk maken om geavanceerde use cases van GenAI en generatie door versterkte ophaling (RAG) uit te voeren op meerdere generaties Intel® Xeon® CPU’s. Deze samenwerking, inclusief engineeringoptimalisaties en een benchmarkingprogramma, verbetert het vermogen van Aible om GenAI-resultaten tegen lage kosten te leveren aan zakelijke klanten en helpt ontwikkelaars om kunstmatige intelligentie in hun applicaties te integreren.

Innovaties in GenAI-prestaties met Intel Xeon

De oplossingen van Aible demonstreren hoe CPU’s aanzienlijk de prestaties kunnen verbeteren in een verscheidenheid van moderne AI-werklasten, variërend van taalmodellenuitvoering tot RAG. Geoptimaliseerd voor Intel-processors, gebruikt de technologie van Aible een efficiënte serverloze aanpak voor AI, consumeert bronnen alleen wanneer er actieve gebruikersverzoeken zijn. Bijvoorbeeld, de vectoriële databank activeren zich slechts voor enkele seconden om relevante informatie voor een gebruikersaanvraag op te halen, en het taalmodel schakelt kort in om de aanvraag te verwerken en te beantwoorden. Deze vraaggestuurde werking helpt om de totale eigendomskosten (TCO) te verlagen.

newsroom aible performance data intel

Hoewel RAG vaker met GPU’s (grafische verwerkingseenheden) en versnellers wordt uitgevoerd om te profiteren van hun parallelle rekenmogelijkheden, maakt de serverloze aanpak van Aible, in combinatie met de schaalbare Intel® Xeon®-processors, het runnen van RAG-use cases puur door CPU’s mogelijk. Performantie data toont aan dat meerdere generaties Intel Xeon-processoren RAG-werklasten efficiënt kunnen uitvoeren.

Strategische Samenwerking voor Efficiëntie in AI

Mishali Naik, leidinggevend topingenieur bij Intel in de Datacenter- en AI-groep, benadrukte: “Klanten zoeken efficiënte en zakelijke oplossingen om de kracht van AI te benutten. Onze samenwerking met Aible laat zien hoe we nauw samenwerken met de industrie om innovatie in AI te leveren en de toegangsdrempel voor veel klanten te verlagen zodat zij de nieuwste GenAI-werklasten kunnen runnen op Intel Xeon-processors.”

Kostenvermindering en Efficiëntieverhoging

Aible stelt klanten in staat om de operationele kosten van GenAI-projecten te verminderen door uitsluitend gebruik te maken van CPU’s op een serverloze manier om dezelfde onderliggende computingbronnen op een veiligere manier te delen tussen meerdere klanten. Volgens de benchmarkanalyse van Aible kunnen klanten tot 55 keer besparen door RAG-modellen te draaien op hun serverloze CPU-gebaseerde oplossingen. Deze kostenvermindering is een getuigenis van de effectiviteit van de unieke aanpak van Aible, die de noodzaak voor duurdere GPU-gebaseerde infrastructuren overbodig maakt.

Resultaten van de Intel-Aible-samenwerking

Intel, inclusief Intel Labs, heeft samengewerkt met Aible om AI-werklasten in Xeon-processoren te optimaliseren. Opvallend is dat bij het optimaliseren van de Aible-code voor AVX-512, Aible significante winst zag in peformance en zijn vermogen om te presteren op Xeon-processors verbeterde, en zo het impact aantoont van strategische softwareoptimalisaties op de algemene efficiëntie.

De combinatie van RAG-modellen met Intel Xeon-processoren, mogelijk gemaakt door platforms zoals Aible, kunnen toepassingen zoals:

  • Natuurlijke taalverwerking (NLP)
  • Aanbevelingssystemen
  • Beslissingsondersteunende systemen
  • Contentgeneratie