DCBusiness IT&C China vs SUA în cursa AI. Costurile reduse ale DeepSeek ridică semne de întrebare și suspiciuni

China vs SUA în cursa AI. Costurile reduse ale DeepSeek ridică semne de întrebare și suspiciuni

DeepSeek
Provocare pentru giganții americani: Startup-ul chinez DeepSeek susține că a antrenat modelul AI cu doar 294.000 dolari

Dezvoltatorul chinez de inteligență artificială DeepSeek a anunțat că a cheltuit doar 294.000 de dolari pentru antrenarea modelului său R1 – o sumă mult mai mică decât cele raportate de rivalii americani. Dezvăluirea, publicată miercuri într-un articol revizuit de colegi în prestigioasa revistă Nature, riscă să reaprindă dezbaterea privind poziția Beijingului în cursa globală pentru AI, transmite Reuters.

Este prima dată când compania din Hangzhou face publică o estimare a costurilor pentru R1. În ianuarie, lansarea unor modele proprii considerate „mai ieftine” a declanșat panică pe bursele globale, unde investitorii s-au temut că DeepSeek ar putea submina dominația giganților americani, inclusiv Nvidia. De atunci, compania și fondatorul său, Liang Wenfeng, au păstrat un profil discret, cu rare actualizări de produs.

Potrivit articolului din Nature, R1 a fost antrenat timp de 80 de ore pe un cluster de 512 chipuri Nvidia H800, create special pentru piața chineză după ce Washingtonul a interzis exportul modelelor mai performante H100 și A100. În documentele suplimentare, DeepSeek recunoaște pentru prima dată că deține și A100, folosite în etapele preliminare.

Datele contrastează puternic cu estimările din SUA: CEO-ul OpenAI, Sam Altman, spunea încă din 2023 că antrenarea modelelor fundamentale costă „mult peste 100 de milioane de dolari”.

Declarațiile DeepSeek ridică însă semne de întrebare. Oficialii americani susțin că firma ar avea acces la „volume mari” de chipuri H100 achiziționate după restricțiile din 2022. Nvidia a declarat pentru Reuters că DeepSeek utilizează legal H800, nu H100.

Compania răspunde totodată, indirect, acuzațiilor că și-ar fi „distilat” modelele pe baza celor dezvoltate de rivali, inclusiv OpenAI. DeepSeek apără această tehnică, susținând că distilarea permite performanțe ridicate cu costuri mult mai mici și acces mai larg la tehnologia AI. În cazul modelului V3, compania recunoaște că datele de antrenament au inclus pagini web generate de modele OpenAI, dar precizează că acest lucru s-a întâmplat incidental, nu intenționat.

OpenAI nu a comentat deocamdată informațiile.

Oana Pavelescu este jurnalist specializat în domeniul economic și financiar, cu experiență solidă în analiza politicilor fiscale, a piețelor energetice și a evoluțiilor macroeconomice din România și din spațiul european. Abordează subiectele cu rigoare, atenție la detaliu și orientare către impactul concret asupra mediului de afaceri și asupra populației. Are expertiză în interpretarea documentelor oficiale – de la acte normative publicate în Monitorul Oficial până la rapoarte ale BNR, ANRE sau ale altor instituții-cheie – pe care le transformă în materiale clare, bine structurate și relevante pentru publicul interesat de economie, companii și politici publice.