Skip to content
Kinijos dirbtinio intelekto modelis „Qwen-3 Max“ pranoko „ChatGPT“ ir „Gemini“

Kinijos rinka dar kartą primena apie sparčiai tobulėjančius savo sprendimus DI lenktynėse.

Kinijos dirbtinio intelekto modelis „Qwen-3 Max“ pranoko „ChatGPT“ ir „Gemini“

TRUMPAI

  • • „Qwen-3 Max Thinking“ svarbiuose testuose aplenkė „ChatGPT“ ir „Gemini“.
  • • Modeliui pranašumą suteikia pažangūs mąstymo metodai ir įrankių integracija.
  • • Rezultatai rodo spartų Kinijos DI konkurencingumo augimą.

Kinijos technologijų milžinės „Alibaba“ dirbtinio intelekto (DI) komanda pristatė naujausią „Qwen-3 Max Thinking“ modelio versiją. Remiantis naujausiais testų rezultatais, kai kuriose konkrečiose užduotyse ji pranoksta tokius konkurentus kaip „OpenAI“ „GPT-5.2“ ar „Google Gemini 3 Pro“.

REKLAMA

„Qwen-3 Max Thinking“ modelio stiprybės

Pažangus Kinijos kalbos modelis sukurtas su milijardo parametrų mišria architektūra ir apmokytas milžinišku kiekiu duomenų – daugiau nei 36 trilijonais žetonų.

Modelis gali automatiškai integruoti išorinius įrankius, pavyzdžiui, interneto paiešką, taip sumažindamas vadinamųjų „haliucinacijų“ skaičių. Tačiau pagrindinė jo stiprybė atsiskleidžia taikant „Test-Time Scaling“ metodą – jo metu modelis atlieka kelių lygių gilų mąstymą, kuris leidžia tiksliau ir nuosekliau spręsti sudėtingas užduotis, tokias kaip programavimo ar aukšto lygio matematiniai klausimai.

REKLAMA

Rezultatai „Humanity’s Last Exam“ ir kituose testuose

Nepriklausomi testai rodo, kad „Qwen-3 Max Thinking“ pasiekė labai gerus rezultatus vadinamajame „Humanity’s Last Exam“ teste. Tai sudėtingas testų rinkinys, skirtas patikrinti, kaip DI modeliai susidoroja su sudėtingomis, akademinių žinių reikalaujančiomis užduotimis.

Šiame teste „Qwen-3 Max Thinking“ surinko 49,8 proc. teisingų atsakymų ir aplenkė tiek „Gemini 3 Pro“ – 45,8 proc., tiek „GPT-5.2 Thinking“ – 45,5 proc.

Be minėto testo, modelis taip pat gerai pasirodė programavimo ir matematikos užduotyse. Aukšti rezultatai kituose testuose rodo, kad „Qwen-3 Max Thinking“ geba efektyviai spręsti tiek techninius, tiek akademinius klausimus ir gali konkuruoti su pažangiausiais šiuo metu rinkoje esančiais DI modeliais.

REKLAMA
„Qwen-3 Max-Thinking“, ypač taikant „Test-Time Scaling“ metodą, pasiekia labai aukštus rezultatus įvairiuose mokslo, matematikos ir programavimo testuose. Daugelyje vertinimų modelis yra lygiavertis arba lenkia „GPT-5.2“, „Gemini 3 Pro“, „Claude Opus 4.5“ ir „DeepSeek-V3.2“, ypač užduotyse, kuriose leidžiama naudoti papildomus įrankius. Šaltinis: „Qwen“.

Ar kartojasi „DeepSeek“ „momentas“?

„Qwen-3 Max Thinking“ rezultatai neišvengiamai primena „DeepSeek“ proveržį praėjusiais metais, kai Kinijoje sukurtas DI modelis netikėtai pasiekė likusio pasaulio technologijų milžinų lygį.

Kaip ir tada, testų duomenys rodo, kad Kinijos DI ekosistema geba sparčiai kurti konkurencingus modelius, ypač tobulinant mąstymo metodus ir efektyvų skaičiavimo resursų naudojimą.

Visgi tikrasis proveržis bus matomas vėliau – pavieniai testai rodo pažangą, tačiau kur kas svarbiau išlieka ir ilgalaikis modelio pritaikomumas ir konkurencingumo palaikymas dinamiškoje aplinkoje.

Plačiau apie pasaulinio dėmesio ir daug parsisiuntimų sulaukusį „DeepSeek“ skaitykite čia.

Kaip vertinate šį straipsnį?

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas
Dalyvaukite diskusijose
Naujienas gaukite pirmieji
1 700+ narių jau seka mūsų puslapį, laukiame tavęs!
10

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.