Nuotrauka: Patrick Gamelkoorn
„ChatGPT 5.2“ jau čia: ką rodo pirmieji testai?
TRUMPAI
- • „ChatGPT 5.2“ pristatytas kaip profesionalams skirtas atnaujinimas, orientuotas į stabilumą ir gilų kontekstą.
- • Pirmieji kūrėjų testai rodo realius patobulinimus, bet kartu išryškina ir trūkumus.
- • Modelio pristatymas įvyko didėjančios konkurencijos fone.
Gruodžio 11 dieną „OpenAI“ pristatė „ChatGPT 5.2“ modelio atnaujinimą, kuris jau diegiamas mokamuose „ChatGPT“ planuose. Pirmieji kūrėjų testai ir praktinės apžvalgos pasirodė iškart po paleidimo, o jų rezultatai rodo tiek reikšmingus patobulinimus, tiek aiškius kompromisus, ypač kainos ir greičio srityse.
Modelis buvo testuojamas realiose kūrėjų užduotyse – nuo programavimo iki sudėtingo samprotavimo scenarijų. Remiantis viešai paskelbtais bandymais, „ChatGPT 5.2“ orientuotas į profesionalesnį naudojimą, kai svarbus stabilumas, ilgas kontekstas ir darbas su sudėtingomis užduočių sekomis.
Pats „ChatGPT“ vadovas Samas Altmanas sako, jog šis modelis yra „labai protingas“ ir kad „nueitas ilgas kelias lyginant su 5.1 modeliu“.
Kodėl „ChatGPT 5.2“ laikomas reikšmingu atnaujinimu
„ChatGPT 5.2“ nėra vienas modelis – tai kelių variantų serija, skirta skirtingiems naudojimo scenarijams. „Instant“ versija pritaikyta greitoms kasdienėms užklausoms, „Thinking“ – sudėtingesniam planavimui, programavimui ir analitiniam mąstymui, o „Pro“ orientuotas į maksimalų tikslumą ir nuoseklumą profesionaliose užduotyse.
„OpenAI“ nurodo, kad pagrindinis atnaujinimo tikslas – patikimesnis darbas su ilgu kontekstu ir sudėtingomis daugiažingsnėmis užduotimis. Tai ypač aktualu kuriant dirbtinio intelekto (DI) agentus, automatizuotas darbo eigas ar sistemas, kurios turi ilgą laiką „išlaikyti“ kontekstą.
Oficialiuose testuose „ChatGPT 5.2 Thinking“ pasiekė aukštesnius rezultatus programavimo ir užduočių sprendimo vertinimuose, palyginti su ankstesnėmis versijomis.
Kūrėjų testai atskleidė ne tik privalumus
Nepriklausomų kūrėjų bandymai rodo, kad „ChatGPT 5.2“ geriau susidoroja su didesniais programavimo kodų blokais, sudėtingesne logika ir nuosekliu užduočių išskaidymu. Kai kuriuose projektuose pastebėtas mažesnis klaidų skaičius ir stabilesnis elgesys ilgesnių sesijų metu.
Tačiau kartu išryškėjo ir trūkumai. Dalis kūrėjų atkreipė dėmesį, kad „Thinking“ ir „Pro“ režimai veikia lėčiau nei ankstesni modeliai, ypač paprastesnėse užklausose.
Taip pat pažymima, kad patobulinimai ne visose srityse jaučiami vienodai – kai kuriuose nišiniuose testuose rezultatai mažai skiriasi nuo ankstesnių versijų arba net yra ne tokie stabilūs.
Kainodara ir praktinės pasekmės verslui
Kartu su techniniais patobulinimais atėjo ir reikšmingas kainodaros pokytis. API naudojimui „ChatGPT 5.2“ yra brangesnis už ankstesnius modelius, o „Pro“ versija kainuoja kelis kartus daugiau.
„OpenAI“ akcentuoja, kad didesnė kaina turėtų atsipirkti tais atvejais, kai modelis leidžia sutaupyti laiko ar sumažinti klaidų skaičių sudėtinguose procesuose.
Praktikoje tai reiškia, kad produktų komandos ir kūrėjai turės atsakingiau rinktis, kur naudoti „ChatGPT 5.2“. Paprastesnėms užduotims gali pakakti pigesnių modelių, o nauja versija labiausiai pasiteisina ten, kur reikalingas ilgas kontekstas, sudėtingas samprotavimas ir patikimas darbas su įrankiais.
Pirmieji bandymai rodo, kad „ChatGPT 5.2“ nėra universalus sprendimas visiems scenarijams, tačiau jis aiškiai žymi kryptį, kuria juda OpenAI – link profesionalesnių, agentiniams sprendimams pritaikytų modelių.
Aiškesnis vaizdas išryškės artimiausiais mėnesiais, kai modelį išbandys daugiau kūrėjų ir atsiras daugiau viešų, pakartojamų testų.
„ChatGPT“ susiduria su didžiule konkurencija
„ChatGPT 5.2“ pasirodymas sutampa su vis intensyvėjančia konkurencija DI rinkoje. Pastaruoju metu dėmesio sulaukė ir Kinijos bendrovės „DeepSeek“ naujausias DI modelis, kuris, kaip skelbta Technaujienos.lt publikacijoje, kai kuriuose testuose aplenkė „OpenAI“ sprendimus.
Tuo pačiu „OpenAI“ pastaruoju metu susiduria ir su reputaciniais iššūkiais. Gruodžio pradžioje, „ChatGPT“ kūrėjas Samas Altmanas įmonės viduje paskelbė „raudonąjį pavojaus kodą“, perspėdamas, kad „ChatGPT“ turi sparčiau tobulėti, jog neatsiliktų nuo konkurentų.
Vidinis laiškas, kurį matė „The Wall Street Journal“ žurnalistai darbuotojus pasiekė po to, kai „Google“ pristatė naująjį, itin pažangų „Gemini 3“ DI modelį, kuris, remiantis testais, aplenkė „ChatGPT“ net keliose srityse.
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
DI „krikštatėvis“ perspėja: dirbtinio intelekto lenktynių jau niekas nebesustabdys
2Kas nutinka, kai DI paliekamas veikti vienas? Eksperimentas pateikė neraminančių atsakymų
3Ar LED apšvietimas veikia mūsų ląsteles? Naujas tyrimas pateikė netikėtų užuominų
4Atnaujintas planas žmonijai: kas įvyktų gavus signalą iš ateivių?
5Dirbtinis intelektas gali pradėti kurti pats save: „Anthropic“ įspėja dėl artėjančio lūžio
NAUJAUSI
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.