Noi criterii de evaluare a inteligenței artificiale

6980_60556200
Inteligență artificială / sursa foto: Freepik.com
Grupul de inteligență artificială MLCommons a dezvăluit două noi criterii care, conform acestuia, pot ajuta la determinarea vitezei cu care hardware-ul și software-ul de ultimă generație pot executa aplicații de inteligență artificială.

De la lansarea ChatGPT de către OpenAI acum mai bine de doi ani, producătorii de cipuri s-au concentrat pe dezvoltarea de hardware capabil să ruleze eficient codul necesar pentru ca milioane de oameni să utilizeze instrumente de IA. Deoarece modelele de bază trebuie să răspundă unui număr tot mai mare de solicitări pentru a alimenta aplicații de IA precum chatboții și motoarele de căutare, MLCommons a dezvoltat două noi versiuni ale benchmark-urilor MLPerf pentru a evalua viteza acestora.

Un nou benchmark bazat pe modelul Meta

Unul dintre noile benchmark-uri este bazat pe modelul de IA al Meta, denumit Llama 3.1, care are 405 miliarde de parametri. Testul vizează răspunsurile la întrebări generale, matematica și generarea de cod. Noul format testează capacitatea unui sistem de a procesa cereri voluminoase și de a sintetiza date provenite din multiple surse.

Nvidia a supus mai multe dintre cipurile sale acestui test de referință, la fel ca și producători de sisteme precum Dell Technologies. Conform datelor furnizate de MLCommons, Advanced Micro Devices (AMD) nu a trimis nicio componentă pentru testul major de 405 miliarde de parametri.

Performanța serverelor Nvidia

Pentru noul test, ultima generație de servere de inteligență artificială de la Nvidia – denumită Grace Blackwell și echipată cu 72 unități de procesare grafică (GPU) – a fost de 2,8 până la 3,4 ori mai rapidă decât generația anterioară. Această comparație a fost realizată utilizând doar opt GPU-uri din noul server pentru a asigura o paralelă directă cu modelul precedent, a declarat compania într-o conferință de presă marți.

Nvidia lucrează pentru a accelera conexiunile dintre cipurile din interiorul serverelor sale, un aspect crucial pentru activitățile de inteligență artificială, în care un chatbot funcționează simultan pe mai multe cipuri.

Un al doilea benchmark pentru răspunsuri instantanee

Cel de-al doilea benchmark este, de asemenea, bazat pe un model de IA open-source dezvoltat de Meta. Testul își propune să simuleze mai fidel așteptările privind performanța aplicațiilor de IA utilizate de publicul larg, precum ChatGPT.

Obiectivul acestuia este de a reduce timpul de răspuns al benchmark-ului și de a-l apropia cât mai mult de o reacție instantanee.

Abonează-te la canalul nostru WhatsApp pentru mai multe știri 

Articole recomandate Vezi toate articolele
x close