Naujas Monrealio universiteto tyrimas rodo, kad pagrindiniai didieji kalbos modeliai jau pranoksta vidutinį žmogaus kūrybiškumo lygį.

Šią savybę dirbtinis intelektas jau išvystęs geriau nei vidutinis žmogus, teigia mokslininkai

TRUMPAI

• DI modeliai jau viršija vidutinio žmogaus kūrybiškumą, bet nesugeba pranokti kūrybiškiausių žmonių.
• Kūrybiškumas buvo lyginamas per žodžių asociacijų testus ir kūrybinio rašymo užduotis.
• Tyrime dalyvavo daugiau nei 100 000 žmonių, juos lyginant pagrindiniais DI modeliais.

Dirbtinis Intelektas

Rokas Baltrušaitis 2026-02-01

Ar generatyvinio dirbtinio intelekto (DI) sistemos, tokios kaip „ChatGPT“, yra pajėgios kurti taip pat kūrybiškai kaip žmogus? Naujame Kanados Monrealio universiteto didelio masto tyrime atliktas iki šiol išsamiausias žmonių ir didžiųjų kalbos modelių kūrybinių gebėjimų palyginimas – tai leido mokslininkams pateikti itin svarbių įžvalgų.

REKLAMA

DI pranoksta vidutinį žmogaus kūrybiškumo lygį

Tyrėjai įvertino kelis pagrindinius didžiuosius kalbos modelius, įskaitant „ChatGPT“, „Claude“, „Gemini“, bei palygino juos su 100 000 žmonių duomenimis. Jų gauti rezultatai žymi aiškų lūžio tašką: kai kurios DI sistemos, įskaitant GPT-4, užduotyse, skirtose divergentiniam (skirtingajam) lingvistiniam kūrybiškumui matuoti, surinko daugiau balų nei vidutinis žmogus.

„Mūsų tyrimas rodo, kad kai kurios DI sistemos, paremtos didžiaisiais kalbos modeliais, dabar gali pranokti vidutinį žmogaus kūrybiškumą aiškiai apibrėžtose užduotyse. Šis rezultatas gali stebinti – netgi kelti nerimą – tačiau mūsų tyrimas taip pat pabrėžia ne mažiau svarbią išvadą: net ir geriausios DI sistemos vis dar nepasiekia pačių kūrybiškiausių žmonių lygio“, – teigė tyrimui vadovavęs Monrealio universiteto Psichologijos katedros profesorius Karimas Jerbi.

REKLAMA

Tyrėjai nustatė, kad aukštesnio kūrybiškumo lygio žmonės pasiekė aukštesnius už vidutinius rezultatus nei visos testuotos DI sistemos. Šis skirtumas buvo dar ryškesnis tarp kūrybiškiausių 10 proc. tiriamųjų.

Kaip buvo matuojamas žmonių ir DI kūrybiškumas

Siekdama užtikrinti sąžiningą žmonių ir mašinų palyginimą, tyrėjų komanda taikė kelis metodus. Pagrindinis įrankis buvo Skirtingųjų asociacijų užduotis (angl. Divergent Association Task, DAT) – psichologinis testas, skirtas divergentinio kūrybiškumo arba gebėjimo iš vieno stimulo sukurti daug originalių ir įvairių idėjų, matavimui.

DAT prašo dalyvių – tiek žmonių, tiek DI – pateikti dešimt žodžių, kurių reikšmės tarpusavyje būtų kuo labiau skirtingos. Itin kūrybiškas atsakymas galėtų apimti tokius žodžius, kaip „galaktika, šakutė, laisvė, dumbliai, armonika, kvantas, nostalgija, aksomas, uraganas, fotosintezė“.

REKLAMA

Žmonių pasirodymas atliekant šią užduotį glaudžiai atitinka rezultatus kituose gerai įsitvirtinusiuose kūrybiškumo testuose, naudojamuose idėjų generavimo, rašymo ir kūrybinio problemų sprendimui vertinimui.

Nors DAT yra paremta kalba, ji nėra vien tik žodyno patikrinimas. Priešingai, ji atskleidžia platesnius kognityvinius procesus, susijusius su kūrybiniu mąstymu įvairiose srityse. Dar vienas DAT privalumas – greitis ir prieinamumas: užduočiai atlikti pakanka dviejų–keturių minučių, o pats testas yra laisvai prieinamas internete plačiajai visuomenei.

Remdamiesi DAT rezultatais, tyrėjai nagrinėjo, ar DI pasirodymas atliekant paprastą žodžių asociacijų užduotį gali būti perkeltas į sudėtingesnes kūrybines veiklas. Siekdami tai patikrinti jie tiesiogiai palygino DI sistemas ir žmones kūrybinio rašymo užduotyse.

Šios užduotys apėmė haiku (trumpos trijų eilučių poetinės formos) rašymą, filmų siužetų santraukų kūrimą ir trumpų apsakymų rašymą. Ir vėl išryškėjo aiškus dėsningumas: nors DI kartais pranokdavo vidutinio kūrybiškumo lygio tiriamuosius, labiausiai įgudę kūrėjai išlaikė akivaizdų pranašumą prieš DI.

Ar galima reguliuoti DI kūrybiškumą?

Šios išvados iškėlė svarbų tolesnį klausimą – ar DI kūrybiškumą galima formuoti ar kontroliuoti?

Remiantis tyrimu, tai įmanoma. Vienas pagrindinių veiksnių yra modelio temperatūra – techninis nustatymas, lemiantis, kiek DI atsakymai bus nuspėjami ar drąsūs.

Esant žemai temperatūrai, DI sistemos linkusios generuoti saugesnius ir labiau nuspėjamus rezultatus. Esant aukštesnei temperatūrai, atsakymai tampa įvairesni ir mažiau suvaržyti, skatinantys rizikavimą ir originalesnes asociacijas.

Tyrėjai taip pat nustatė, kad labai svarbus vaidmuo tenka pačių užklausų (promptų) formulavimui. Pavyzdžiui, užklausos, skatinančios DI modelius atsižvelgti į žodžių kilmę ir sandarą pasitelkiant etimologiją, lemia netikėtesnes idėjas ir aukštesnius kūrybiškumo įverčius. Kartu šie rezultatai rodo, kad DI kūrybiškumas labai priklauso nuo žmogaus indėlio ir gebėjimo valdyti DI, todėl žmonių ir mašinų sąveika tampa esmine kūrybinio proceso dalimi.

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.

„MIRĘS INTERNETAS“: KODĖL DIDŽIOJI DALIS INTERNETO NĖRA ŽMONĖS

5 SENOVĖS TECHNOLOGIJOS, KURIŲ MOKSLININKAI IKI ŠIOL NEGALI ATKURTI

4 PASAULINĖS TECHNOLOGIJOS, KURIAS SUKŪRĖ LIETUVIAI

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

Prenumeruoti Žiūrėti visus video reportažus

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas

Dalyvaukite diskusijose

Naujienas gaukite pirmieji

Sekti „Facebook" Peržiūrėti naujausius įrašus

1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Žymos:

ChatGPT

Claude

didieji kalbos modeliai

Monrealio universitetas

Rokas Baltrušaitis

Rokas Baltrušaitis Technologijų žurnalistas, videografas, kūrybinių industrijų bakalauras VILNIUS TECH universitete. El. p. redakcija@technaujienos.lt.