Naujas Monrealio universiteto tyrimas rodo, kad pagrindiniai didieji kalbos modeliai jau pranoksta vidutinį žmogaus kūrybiškumo lygį.
Šią savybę dirbtinis intelektas jau išvystęs geriau nei vidutinis žmogus, teigia mokslininkai
TRUMPAI
- • DI modeliai jau viršija vidutinio žmogaus kūrybiškumą, bet nesugeba pranokti kūrybiškiausių žmonių.
- • Kūrybiškumas buvo lyginamas per žodžių asociacijų testus ir kūrybinio rašymo užduotis.
- • Tyrime dalyvavo daugiau nei 100 000 žmonių, juos lyginant pagrindiniais DI modeliais.
Ar generatyvinio dirbtinio intelekto (DI) sistemos, tokios kaip „ChatGPT“, yra pajėgios kurti taip pat kūrybiškai kaip žmogus? Naujame Kanados Monrealio universiteto didelio masto tyrime atliktas iki šiol išsamiausias žmonių ir didžiųjų kalbos modelių kūrybinių gebėjimų palyginimas – tai leido mokslininkams pateikti itin svarbių įžvalgų.
DI pranoksta vidutinį žmogaus kūrybiškumo lygį
Tyrėjai įvertino kelis pagrindinius didžiuosius kalbos modelius, įskaitant „ChatGPT“, „Claude“, „Gemini“, bei palygino juos su 100 000 žmonių duomenimis. Jų gauti rezultatai žymi aiškų lūžio tašką: kai kurios DI sistemos, įskaitant GPT-4, užduotyse, skirtose divergentiniam (skirtingajam) lingvistiniam kūrybiškumui matuoti, surinko daugiau balų nei vidutinis žmogus.
„Mūsų tyrimas rodo, kad kai kurios DI sistemos, paremtos didžiaisiais kalbos modeliais, dabar gali pranokti vidutinį žmogaus kūrybiškumą aiškiai apibrėžtose užduotyse. Šis rezultatas gali stebinti – netgi kelti nerimą – tačiau mūsų tyrimas taip pat pabrėžia ne mažiau svarbią išvadą: net ir geriausios DI sistemos vis dar nepasiekia pačių kūrybiškiausių žmonių lygio“, – teigė tyrimui vadovavęs Monrealio universiteto Psichologijos katedros profesorius Karimas Jerbi.
Tyrėjai nustatė, kad aukštesnio kūrybiškumo lygio žmonės pasiekė aukštesnius už vidutinius rezultatus nei visos testuotos DI sistemos. Šis skirtumas buvo dar ryškesnis tarp kūrybiškiausių 10 proc. tiriamųjų.
Kaip buvo matuojamas žmonių ir DI kūrybiškumas
Siekdama užtikrinti sąžiningą žmonių ir mašinų palyginimą, tyrėjų komanda taikė kelis metodus. Pagrindinis įrankis buvo Skirtingųjų asociacijų užduotis (angl. Divergent Association Task, DAT) – psichologinis testas, skirtas divergentinio kūrybiškumo arba gebėjimo iš vieno stimulo sukurti daug originalių ir įvairių idėjų, matavimui.
DAT prašo dalyvių – tiek žmonių, tiek DI – pateikti dešimt žodžių, kurių reikšmės tarpusavyje būtų kuo labiau skirtingos. Itin kūrybiškas atsakymas galėtų apimti tokius žodžius, kaip „galaktika, šakutė, laisvė, dumbliai, armonika, kvantas, nostalgija, aksomas, uraganas, fotosintezė“.
Žmonių pasirodymas atliekant šią užduotį glaudžiai atitinka rezultatus kituose gerai įsitvirtinusiuose kūrybiškumo testuose, naudojamuose idėjų generavimo, rašymo ir kūrybinio problemų sprendimui vertinimui.
Nors DAT yra paremta kalba, ji nėra vien tik žodyno patikrinimas. Priešingai, ji atskleidžia platesnius kognityvinius procesus, susijusius su kūrybiniu mąstymu įvairiose srityse. Dar vienas DAT privalumas – greitis ir prieinamumas: užduočiai atlikti pakanka dviejų–keturių minučių, o pats testas yra laisvai prieinamas internete plačiajai visuomenei.
Remdamiesi DAT rezultatais, tyrėjai nagrinėjo, ar DI pasirodymas atliekant paprastą žodžių asociacijų užduotį gali būti perkeltas į sudėtingesnes kūrybines veiklas. Siekdami tai patikrinti jie tiesiogiai palygino DI sistemas ir žmones kūrybinio rašymo užduotyse.
Šios užduotys apėmė haiku (trumpos trijų eilučių poetinės formos) rašymą, filmų siužetų santraukų kūrimą ir trumpų apsakymų rašymą. Ir vėl išryškėjo aiškus dėsningumas: nors DI kartais pranokdavo vidutinio kūrybiškumo lygio tiriamuosius, labiausiai įgudę kūrėjai išlaikė akivaizdų pranašumą prieš DI.
Ar galima reguliuoti DI kūrybiškumą?
Šios išvados iškėlė svarbų tolesnį klausimą – ar DI kūrybiškumą galima formuoti ar kontroliuoti?
Remiantis tyrimu, tai įmanoma. Vienas pagrindinių veiksnių yra modelio temperatūra – techninis nustatymas, lemiantis, kiek DI atsakymai bus nuspėjami ar drąsūs.
Esant žemai temperatūrai, DI sistemos linkusios generuoti saugesnius ir labiau nuspėjamus rezultatus. Esant aukštesnei temperatūrai, atsakymai tampa įvairesni ir mažiau suvaržyti, skatinantys rizikavimą ir originalesnes asociacijas.
Tyrėjai taip pat nustatė, kad labai svarbus vaidmuo tenka pačių užklausų (promptų) formulavimui. Pavyzdžiui, užklausos, skatinančios DI modelius atsižvelgti į žodžių kilmę ir sandarą pasitelkiant etimologiją, lemia netikėtesnes idėjas ir aukštesnius kūrybiškumo įverčius. Kartu šie rezultatai rodo, kad DI kūrybiškumas labai priklauso nuo žmogaus indėlio ir gebėjimo valdyti DI, todėl žmonių ir mašinų sąveika tampa esmine kūrybinio proceso dalimi.
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
Kosminis susidūrimas: kas nutiks, jei asteroidas YR4 2032 m. smogs į Mėnulį
2Kripto rinka per parą neteko 200 mlrd. JAV dolerių kapitalizacijos: kas vyksta?
3Mėsos valgymas siejamas su galimybe sulaukti 100 metų, rodo naujas tyrimas
4Atskleista 500 metų paslaptis: Rafaelio šedevre „Madonna“ vienas veidas tapytas ne jo
5Nutekintos „Galaxy S26“ serijos kainos: „Ultra“ bus pigesnis nei prognozuota
NAUJAUSI
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.