DCBusiness IT&C AI-ul care sperie lumea: prea periculos pentru a fi lansat public

AI-ul care sperie lumea: prea periculos pentru a fi lansat public

Inteligența artificială / Foto: Freepik
Anthropic lansează Claude Mythos, cel mai avansat model AI, dar îl restricționează din cauza riscurilor. Acces doar pentru giganți tech și securitate cibernetică.

Un nou nivel de risc în AI: Anthropic lansează Claude Mythos, dar îl ține departe de public

Modelul „prea puternic” pentru utilizatori obișnuiți

Compania Anthropic a anunțat lansarea unui nou model de inteligență artificială, Claude Mythos Preview, pe care îl descrie drept un „salt spectaculos” față de orice există în prezent pe piață. Cu toate acestea, modelul nu va fi disponibil publicului larg, nici măcar contra unui abonament premium estimat la aproximativ 200 de euro pe lună.

Motivul este simplu: riscurile sunt considerate prea mari. Anthropic susține că nivelul actual al capabilităților AI în domeniul programării și securității cibernetice a depășit praguri critice, modelul fiind capabil să identifice și să exploateze vulnerabilități software mai eficient decât majoritatea experților umani.

Acces restricționat pentru giganții din tehnologie

În locul unei lansări publice, Anthropic a decis să ofere acces limitat doar unui grup select de companii și organizații, în cadrul inițiativei Project Glasswing. Printre participanți se numără nume majore precum Amazon Web Services, Apple, Microsoft, Google și Nvidia.

În total, 12 organizații vor avea acces direct la model, iar alte aproximativ 40 de entități care administrează software critic îl vor putea folosi pentru identificarea vulnerabilităților.

Această abordare a fost deja comparată de unii analiști cu un „proiect Manhattan al inteligenței artificiale”, sugerând impactul potențial major asupra securității globale.

Performanțe care depășesc competiția

Potrivit companiei, Claude Mythos depășește semnificativ performanțele rivalilor precum Gemini sau GPT-5.4 în sarcini de programare și raționament.

Modelul a obținut o rată de succes de 87,3% în testul SWE-bench Pro, un benchmark complex pentru evaluarea capabilităților de programare, în timp ce alte modele se situează între 53% și 58%.

Anthropic afirmă că Mythos nu reprezintă o simplă îmbunătățire incrementală, ci un salt major în capacitatea de analiză, codare și execuție autonomă a sarcinilor.

Capabilități care ridică semnale de alarmă

Modelul a identificat deja mii de vulnerabilități critice, inclusiv unele existente de zeci de ani, în sisteme majore precum Linux, OpenBSD sau browsere web importante.

Printre descoperiri se numără:

  • vulnerabilități vechi de 27 de ani în OpenBSD, exploatabile de la distanță
  • breșe în nucleul Linux care permit escaladarea privilegiilor
  • vulnerabilități în biblioteci criptografice precum TLS sau SSH
  • atacuri complexe precum bypass de autentificare, SQL injection sau cross-site scripting

Mai mult, ingineri fără pregătire în securitate au reușit să genereze exploatări funcționale peste noapte folosind modelul, ceea ce ridică semne serioase de întrebare privind utilizarea abuzivă.

Un „arme cibernetică” greu de controlat

Deși modelul refuză majoritatea cererilor malițioase (peste 90% în testele interne), Anthropic recunoaște că sistemele actuale de protecție nu sunt suficiente pentru a preveni complet utilizările periculoase.

În scenarii sensibile, precum manipularea electorală sau polarizarea socială, rata de succes a modelului este mult mai ridicată, ceea ce amplifică îngrijorările.

Compania a confirmat că este în discuții cu autoritățile din SUA pentru a gestiona implicațiile asupra securității naționale.

Un nou prag în securitatea cibernetică

Oficialii din industrie recunosc că acest tip de tehnologie schimbă fundamental regulile jocului. Anthony Grieco, responsabil de securitate la Cisco, a declarat că AI a depășit un prag critic care obligă la reacții rapide pentru protejarea infrastructurilor esențiale.

Anthropic susține că obiectivul final este utilizarea în siguranță a acestor modele la scară largă, însă până atunci accesul va rămâne strict controlat.