Gigantul tehnologic Nvidia își consolidează poziția dominantă în industria inteligenței artificiale și anunță o expansiune agresivă pe segmentul de inferență, considerat următorul mare câmp de luptă al tehnologiei AI.
CEO-ul Jensen Huang a declarat, în cadrul conferinței GTC, că Nvidia estimează o cerere de cel puțin 1.000 de miliarde de dolari pentru sistemele sale AI până în 2027. Estimarea dublează practic proiecțiile anterioare, care indicau aproximativ 500 de miliarde de dolari până în 2026.
Creșterea accelerată vine pe fondul exploziei aplicațiilor AI și al cererii tot mai mari pentru putere de calcul.
Un nou sistem de inferență de 35 de ori mai rapid
În cadrul evenimentului, compania a prezentat un nou sistem de inferență — Nvidia Groq 3 LPX — capabil să accelereze sarcinile de procesare de până la 35 de ori.
Tehnologia integrează soluții dezvoltate de startup-ul Groq, în urma unui acord de aproximativ 20 de miliarde de dolari semnat la finalul anului trecut, și este construită pe arhitectura Vera Rubin.
Producția noilor cipuri este realizată de Samsung, iar livrările sunt așteptate în a doua jumătate a anului.
De ce este inferența noua miză în AI
Inferența reprezintă procesul prin care modelele AI iau decizii sau fac predicții — etapa efectivă de utilizare a inteligenței artificiale.
Pe măsură ce aplicațiile AI devin omniprezente, cererea pentru astfel de operațiuni crește rapid, mai ales în contextul dezvoltării agenților AI capabili să execute sarcini autonome.
„Momentul de cotitură pentru inferență a sosit”, a spus Jensen Huang.
Deși GPU-urile Nvidia domină în continuare piața AI, competiția devine tot mai puternică,scrie Business Insider. Mari companii tehnologice și startup-uri dezvoltă cipuri specializate, mai eficiente și mai ieftine pentru inferență.
Inclusiv OpenAI a început să caute alternative la hardware-ul Nvidia și a încheiat recent un acord de aproximativ 10 miliarde de dolari cu startup-ul Cerebras.
Un nou front strategic pentru industria tech
Mutarea Nvidia arată că bătălia pentru supremația în AI se mută de la antrenarea modelelor către utilizarea lor în viața reală.
Dacă estimările companiei se confirmă, piața globală a cipurilor AI ar putea intra într-o nouă etapă de creștere explozivă, cu implicații majore pentru întreaga economie digitală.