Nuo tada, kai 2023 m. kovą – prieš 18 mėnesių – buvo pristatytas galingas patentuotas „OpenAI“ didelės kalbos modelis (LLM) „GPT-4“, naudotojai ir kūrėjai teiravosi, kada Silicio slėnyje ir visame pasaulyje generatyvinio dirbtinio intelekto šėlsmą sukėlusi bendrovė pristatys kitą versiją, kuri, kaip spėjama, vadinsis „GPT-5“.
Tačiau pasirodo, kad „GPT“ seriją kol kas lenkia visai nauja modelių šeima, kuri galės pateikti daktaro laipsnio lygio atsakymus.
Organizacijų pasirengimas dirbtinio intelekto amžiuje: nuo technologijų iki transformacijos
Šiandien, po kelis mėnesius trukusių pranešimų ir gandų, kurie suintensyvėjo pastarosiomis dienomis, „OpenAI“ paskelbė savo „o1“ dirbtinio intelekto modelių šeimą, prasidedančią dviem modeliais: „o1-preview“ ir „o1-mini“, kurie, bendrovės teigimu, skirti „pagrįsti sudėtingas užduotis ir spręsti sunkesnes problemas“ nei GPT serijos modeliai.
Abu modeliai jau šiandien prieinami „ChatGPT Plus“ naudotojams, tačiau iš pradžių jiems taikomas 30 žinučių per savaitę apribojimas („o1-preview“) ir 50 žinučių per savaitę („o1-mini“).
Tačiau „OpenAI“ taip pat įspėja, kad „kaip ankstyvasis modelis jis dar neturi daugelio funkcijų, dėl kurių „ChatGPT“ yra naudinga, pavyzdžiui, informacijos naršymo internete ir failų bei vaizdų siuntimo. Daugeliui įprastų atvejų „GPT-4o“ artimiausiu metu bus pajėgesnis“.
Kol kas API platformos „OpenAI“ svetainėje bendrovė paaiškina, kad beta versijos būsenos modelių šeima palaiko „tik tekstą, vaizdai nepalaikomi“.
Ką „o1“ daro geriau nei „GPT“?
„OpenAI“ teigia, kad naujoji „o1“ serija ypač tinka naudotojams, sprendžiantiems sudėtingas problemas tokiose srityse kaip mokslas, sveikatos priežiūra ir technologijos.
„OpenAI“ numato, kad šie modeliai bus naudojami įvairiose srityse – nuo pagalbos fizikams kuriant kvantinės optikos matematines formules iki pagalbos sveikatos priežiūros mokslininkams anotuojant ląstelių sekos duomenis.
Programuotojams „o1-mini“ modelis taip pat bus veiksmingas kuriant ir vykdant daugiapakopes darbo eigas, derinant kodą ir efektyviai sprendžiant programavimo uždavinius.
„o1-preview“ veikia daktaro laipsnio lygmeniu
Modelis „o1-preview“ sukurtas taip, kad galėtų susidoroti su sudėtingomis užduotimis skirdamas daugiau laiko mąstymui ir atsakymų tobulinimui, panašiai kaip žmogus spręstų sudėtingą problemą.
Atliekant bandymus, šis metodas leido modeliui pasiekti rezultatų, artimų fizikos, chemijos ir biologijos mokslų daktarų lygiui.
Be to, „o1-preview“ modelis puikiai koduoja – „Codeforces“ varžybose jis užėmė 89 procentilę, o tai rodo, kad jis geba valdyti kelių etapų darbo eigą, derinti sudėtingą kodą ir generuoti tikslius sprendimus.
Atlikdamas tokias lyginamąsias užduotis, kaip Tarptautinės matematikos olimpiados (IMO) kvalifikacinis egzaminas, „o1-preview“ pademonstravo savo meistriškumą ir išsprendė 83 % uždavinių, t. y. gerokai pagerino savo pirmtako „GPT-4o“ 13 % sėkmės rodiklį.
Ją „ChatGPT“ jau gali naudoti „Plus“ ir „Team“ naudotojai, o „Enterprise“ ir „Edu“ naudotojai galės ja naudotis kitą savaitę. Kūrėjai, atitinkantys 5 API naudojimo lygį, modelius taip pat gali naudoti per „OpenAI“ API, tačiau iš pradžių bus taikomi tarifų apribojimai.
„o1-mini“ yra mažiau galingas, bet 80 % pigesnis
Kartu su „o1-preview“ „OpenAI“ taip pat pristatė „o1-mini“ modelį – supaprastintą versiją, skirtą greitesnėms ir pigesnėms samprotavimo galimybėms.
Nors „o1-mini“ pirmiausia optimizuotas kodavimui ir STEM užduotims, jis vis tiek pasižymi dideliu našumu, ypač matematikos ir programavimo srityse.
Atlikdamas IMO matematikos lyginamąjį testą, „o1-mini“ surinko 70 % taškų ir beveik prilygo „o1-preview“ 74 % taškų rezultatui, o išvedimo sąnaudos buvo gerokai mažesnės. Be to, jis konkurencingai pasirodė ir kodavimo vertinimuose – „Codeforces“ teste jis pasiekė 1650 Elo balų ir pateko tarp 86 % geriausių programuotojų.
Palyginti su „o1-preview“, „o1-mini“ kaina yra 80 % mažesnė, todėl jis skirtas programuotojams ir tyrėjams, kuriems reikalingos samprotavimo galimybės, bet nereikia platesnių žinių, kurias siūlo pažangesnis „o1-preview“ modelis.
Šiuo ekonomišku sprendimu taip pat galės naudotis „ChatGPT Plus“, „Team“, „Enterprise“ ir „Edu“ naudotojai, o ateityje planuojama išplėsti prieigą ir „ChatGPT Free“ naudotojams.
Saugumo patobulinimai
Laikantis „OpenAI“ įsipareigojimo užtikrinti saugumą, abiejuose modeliuose įdiegtas naujas saugos mokymo metodas, kuris pagerina jų gebėjimą laikytis saugos ir derinimo gairių.
„OpenAI“ pabrėžia, kad „o1-preview“ pasiekė įspūdingą 84 balų rezultatą viename iš sunkiausių „jailbreaking“ testų, o tai yra gerokai daugiau nei „GPT-4o“ 22 balų rezultatas. Galimybė pagrįsti saugos taisykles kontekste leidžia šiems modeliams geriau elgtis su nesaugiais raginimais ir išvengti netinkamo turinio generavimo.
Įgyvendindama platesnio masto saugos pastangas, „OpenAI“ sudarė susitarimus su JAV ir Jungtinės Karalystės dirbtinio intelekto saugos institutais.
Šios partnerystės apima išankstinės prieigos prie „o1“ modelių tiriamosios versijos suteikimą, siekiant padėti įvertinti ir išbandyti būsimas dirbtinio intelekto sistemas.
Į „OpenAI“ saugos darbą taip pat įeina visapusiškas vidaus valdymas ir bendradarbiavimas su federaline vyriausybe, kurį sustiprina reguliarūs bandymai, pakartotinė atranka ir bendrovės valdybos lygio saugos ir saugumo komiteto priežiūra.
Kas toliau laukia „OpenAI“ „o1“ serijos?
Nors modeliai „o1-preview“ ir „o1-mini“ yra galingi samprotavimo ir problemų sprendimo įrankiai, „OpenAI“ pripažįsta, kad tai tik pradžia.
Bendrovė planuoja reguliariai atnaujinti ir tobulinti šiuos modelius, įskaitant tokių funkcijų, kaip naršymas, failų ir paveikslėlių įkėlimas bei funkcijų iškvietimas, kurių šiuo metu nėra API versijoje, pridėjimą.
Žvelgdama į ateitį, „OpenAI“ toliau plėtos tiek „GPT“, tiek „o1“ serijas, toliau plėsdama dirbtinio intelekto galimybes įvairiose srityse. Vartotojai gali tikėtis nuolatinės pažangos, nes bendrovė siekia didinti šių modelių naudingumą ir prieinamumą įvairiose taikomosiose programose.