Kinijos „DeepSeek“ vėl metė pirštinę lyderiams: naujas DI modelis pranoko „ChatGPT-5“
TRUMPAI
- • „DeepSeek“ pristatė du naujus V3.2 serijos DI modelius.
- • V3.2-Speciale demonstruoja itin aukštas samprotavimo galimybes, aplenkė „ChatGPT-5“.
- • Pristatymas paaštrino Kinijos ir JAV DI konkurenciją.
2025 m. gruodžio 1 d. Kinijos dirbtinio intelekto (DI) bendrovė „DeepSeek“ pristatė naujus V3.2 serijos modelius — V3.2 ir V3.2-Speciale. Tai pažangūs modeliai, kurių išleidimo technologijų bendruomenė laukė jau kelis mėnesius. Analitikai vertina, kad šis pristatymas gali reikšmingai pakeisti 2026 m. pasaulinę DI konkurenciją tarp Kinijos ir JAV.
Įveikė „ChatGPT-5“, prilygsta „Gemini 3 Pro“
„DeepSeek“ pristatė du modelius: V3.2 — oficialų V3.2-Exp įpėdinį, ir V3.2-Speciale, kuris orientuotas į maksimalias samprotavimo ir loginio mąstymo galimybes. Pasak bendrovės, V3.2 siūlo subalansuotą našumą ir išteklių naudojimą, todėl laikomas universaliu kasdieniu modeliu. Jis jau prieinamas „DeepSeek“ programėlėje, žiniatinklyje ir API.
Tuo tarpu V3.2-Speciale pritaikytas sudėtingiausioms užduotims. Bendrovė nurodo, kad šis modelis maksimalių samprotavimo galimybių („max-out reasoning capabilities“) lygiu gali varžytis su „Gemini 3.0 Pro“ ir pasiekė aukščiausio lygio rezultatus tarptautiniuose loginio mąstymo konkursuose, tokiuose kaip IMO, CMO, ICPC World Finals ir IOI 2025. Šis modelis kol kas prieinamas tik per API bei yra skirtas profesionaliam vertinimui ir tyrimams.
Pažymėtina, jog „DeepSeek“ V3.2-Speciale savo galimybėmis ryškiai lenkia ir „ChatGPT-5“ — tuo tarpu „OpenAI“ vadovas Samas Altmanas įmonės viduje paskelbė „raudonąjį pavojaus kodą“, ragindamas spartinti „ChatGPT“ tobulinimą dėl sparčiai augančios konkurencijos.
Nauja agentų treniravimo kryptis
„DeepSeek“ taip pat paskelbė išplėtusi agentų treniravimo metodus. Naujo tipo „thinking in tool-use“ technologija leidžia modeliams generuoti loginį planą ir jį iškart taikyti dirbant su įrankiais.
Bendrovės teigimu, naujoji treniravimo duomenų sintezė apima daugiau nei 1 800 aplinkų ir 85 tūkst. sudėtingų instrukcijų — tai žymiai platesnis spektras nei ankstesniuose modeliuose.
V3.2 yra pirmasis „DeepSeek“ modelis, palaikantis įrankių naudojimą tiek „thinking“, tiek „non-thinking“ režimu. Tai reiškia, kad modelis gali priimti tarpinio samprotavimo sprendimus ir tiesiogiai juos taikyti naudojant API įrankius.
V3.2-Speciale ir API naujovės
Bendrovė taip pat paskelbė apie laikiną specialią V3.2-Speciale API prieigą, kuri galios iki 2025 m. gruodžio 15 d. 15:59 UTC. Modelio kainodara tokia pati kaip V3.2, tačiau jam netaikomas įrankių naudojimas. Sprendimas priimtas siekiant sumažinti apkrovas ir sudaryti sąlygas tyrėjams jį vertinti stabilioje aplinkoje.
Tuo tarpu V3.2 API naudojimas nekeičia ankstesnio V3.2-Exp modelio darbo principų, todėl perėjimas esamiems naudotojams turėtų būti sklandus.
Besikeičiantys geopolitiniai prioritetai
JAV valdžia vis dažniau reiškia susirūpinimą Kinijos DI raida ir šių modelių naudojimu už šalies ribų. Pasak ekspertų, 2026 metais Vašingtonas dar atidžiau vertins Kinijos OS/OW (red. past.: ką tai reiškia paaiškiname straipsnio pabaigoje) modelius, ypač atsižvelgiant į jų sparčiai augantį naudojimą versle, tyrimuose ir gamybos sektoriuje.
Tikimasi, kad bus tęsiamos eksportui taikomos GPU apribojimų diskusijos, o technologijų įmonės spaudžia JAV administraciją leisti platesnes išimtis pažangesniems H200 kartos lustams.
Tikėtina, kad Kinijos bendrovės ir toliau naudosis pažangiais GPU užsienio duomenų centruose, o vietinių alternatyvų, tokių kaip „Huawei“ ar kitų Kinijos lustų kūrėjų, pajėgumai 2026 metais dar labiau augs.
Analitikai pažymi, kad tai padės Kinijai išlikti konkurencingai net esant ribojimams dėl tiesioginės prieigos prie JAV gaminamų procesorių. Tuo metu JAV DI sektorius svarsto aktyviau plėsti atvirojo kodo modelių pasiūlą, siekdamas sumažinti Kinijos lyderystę šioje srityje.
Rinkos analitikai sutaria, kad „DeepSeek“ naujojo modelio pristatymas gali tapti dar vienu lūžio tašku pasaulinėje DI konkurencijoje. Tai būtų tęsinys tendencijos, kuri pradėjo formuotis dar 2025 metais, kai atvirojo kodo modeliai iš Kinijos pradėjo sparčiai plisti visame pasaulyje.
Kol JAV ir Kinija balansuoja tarp bendradarbiavimo ir konkurencijos, DI rinką 2026-aisiais greičiausiai formuos būtent modelių plėtros tempas ir technologinė pažanga, o ne reguliaciniai apribojimai.
„DeepSeek“ V3.2 modelių išleidimas žymi reikšmingą žingsnį pasaulinėje dirbtinio intelekto konkurencijoje. Nauji samprotavimo modeliai, ypač V3.2-Speciale, gali stipriai pakeisti situaciją 2026 metais, nes jie sukurti spręsti sudėtingiausias matematines, logines ir agentines užduotis.
Šis pristatymas dar labiau paaštrina konkurenciją tarp JAV ir Kinijos, o pasaulio technologijų sektorius laukia, kaip šie modeliai paveiks DI ekosistemos raidą kitais metais.
Paaiškiname: ką reiškia OS/OW?
Open Source (OS) reiškia DI modelio kodą, kuris yra viešai prieinamas — tad galima matyti jo architektūrą, veikimą, koreguoti, naudoti jį savo projektuose.
Open Weights (OW) – tai yra viešai prieinami ne tik modelio aprašymai, bet ir modelio svoriai — tai reiškia, kad modelį galima atsisiųsti, paleisti, treniruoti ar pritaikyti lokaliai, be kūrėjo apribojimų.
Kaip vertinate šį straipsnį?
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
Rokas Baltrušaitis - redaktorius, žurnalistas, videografas, kūrybinių industrijų magistras VILNIUS TECH universitete. Turite klausimų? Rašykite: redaktorius@technaujienos.lt.
DIENOS SKAITOMIAUSI
„Apple“ naudotojai pavojuje: per „ChatGPT“ ir „Grok“ platinama kenkėjiška programa
2Europolas įspėja: iki 2035 m. gali kilti karas tarp robotų ir žmonių
3Kinijoje pristatytas šešiarankis humanoidas, pranokstantis žmogų: netrukus pradės dirbti gamykloje
4Ar Holivudą užvaldys dirbtinis intelektas? „Disney“ investuos į „ChatGPT“ kūrėją „OpenAI“
5Kaip mus įsivaizduoja dirbtinis intelektas? Neįprastas tyrimas pateikė naujų įžvalgų
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.