Gigantul tehnologic chinez Alibaba 9988.HK a lansat miercuri o nouă versiune a modelului său de inteligență artificială, Qwen 2.5, pe care îl consideră superior mult apreciatului DeepSeek-V3.
Momentul neobișnuit al lansării – chiar în prima zi a Anului Nou Lunar, când majoritatea chinezilor sunt liberi și alături de familii – sugerează presiunea uriașă exercitată de ascensiunea fulminantă a startup-ului chinez de AI DeepSeek asupra rivalilor internaționali, dar și asupra concurenței locale.
„Qwen 2.5-Max depășește ... aproape pe toate fronturile GPT-4o, DeepSeek-V3 și Llama-3.1-405B”, a anunțat divizia cloud a Alibaba pe contul oficial de WeChat, făcând referire la cele mai avansate modele open-source dezvoltate de OpenAI și Meta.
Lansarea pe 10 ianuarie a asistentului AI DeepSeek, alimentat de modelul DeepSeek-V3, urmată de introducerea modelului R1 pe 20 ianuarie, a luat prin surprindere Silicon Valley și a dus la scăderea acțiunilor unor companii tech. Costurile reduse de dezvoltare și utilizare ale DeepSeek i-au făcut pe investitori să-și pună semne de întrebare cu privire la sumele uriașe cheltuite de marile companii americane de AI.
Succesul DeepSeek a declanșat însă și o cursă a marilor jucători chinezi pentru a-și îmbunătăți modelele de inteligență artificială.
Doar două zile după lansarea DeepSeek-R1, ByteDance, compania-mamă a TikTok, a anunțat o actualizare a modelului său de AI, susținând că acesta a depășit modelul o1 al OpenAI, susținut de Microsoft, în testul AIME – un reper important pentru evaluarea capacității modelelor AI de a înțelege și răspunde la instrucțiuni complexe.
Această declarație reflectă și afirmațiile DeepSeek, care susține că modelul său R1 rivalizează cu OpenAI o1 în mai multe teste de performanță.