Žmogaus ir roboto rankų prisilietimas. Šaltinis: TechNaujienos / Shutterstock

Šioje užduotyje dirbtinis intelektas žmogaus dar neaplenkė: paskelbti psichologinio testo rezultatai

TRUMPAI

• Klasikinis psichologinis testas atskleidė netikėtą pažangiausių DI modelių silpnybę.
• Tyrėjai pastebėjo, kad didėjant šio testo sudėtingumui modelių rezultatai pradeda sparčiai blogėti.
• Kai kurios žmogaus dėmesio kontrolės savybės DI vis dar išlieka sunkiai pasiekiamos, nors diskusijų yra įvairių.

Dirbtinis Intelektas

Rokas Baltrušaitis 2026-06-10

Svarbiausios technologijų naujienos jūsų telefone

Sekite mus „Google News“ šaltiniuose ir pamatykite daugiau svarbiausių mokslo ir technologijų naujienų.

Pažangiausi dirbtinio intelekto (DI) modeliai gali rašyti tekstus, programuoti ir spręsti sudėtingas užduotis, tačiau naujas tyrimas atskleidė netikėtą jų silpnybę. Mokslininkai nustatė, kad DI sistemų tikslumas smarkiai krenta, kai jos turi ilgiau išlaikyti dėmesį ir ignoruoti trukdančią informaciją. Rezultatai gauti pritaikius vieną žinomiausių psichologinių testų, kuris jau dešimtmečius naudojamas žmogaus dėmesio ir savikontrolės gebėjimams vertinti.

REKLAMA

Klasikinis testas, naudojamas ir medicinoje

Birželio pradžioje žurnale „PNAS Nexus“ paskelbtame tyrime mokslininkai pasitelkė „Stroop“ testą – vieną geriausiai žinomų žmogaus dėmesio ir kontrolės vertinimo metodų. Šis testas dešimtmečius naudojamas psichologijoje ir neurologijoje, siekiant įvertinti, kaip žmogus susidoroja su „konkuruojančia informacija“ ir geba laikytis užduoties taisyklių.

Testo metu dalyviui pateikiami spalvų pavadinimai, parašyti skirtingomis spalvomis. Užduotis atrodo paprasta – reikia įvardyti spalvą, kuria parašytas žodis, o ne perskaityti patį žodį. Būtent čia atsiskleidžia gebėjimas atsispirti automatiniams įpročiams ir išlaikyti dėmesį į konkretų tikslą.

REKLAMA

Kuo ilgesnė užduotis, tuo daugiau klaidų

Tyrėjai nusprendė patikrinti, kaip su šia užduotimi susidoroja didieji kalbos modeliai, tarp jų – „GPT-4o“, „Claude 3.5 Sonnet“, „GPT-5“, „Claude Opus 4.1“ ir „Gemini 2.5“. Pirmieji rezultatai atrodė daug žadantys: kai modeliams buvo pateikiami trumpi, vos kelių žodžių sąrašai, dauguma jų demonstravo aukštą tikslumą.

Naujausi straipsniai

4 min. skaitymo • prieš 3 val

4 iš 5 šunų turi dominuojančią leteną: štai ką tai gali pasakyti apie jūsų augintinį

Leonardo da Vinči sukurtas Imolos miesto planas (1502 m.). Šis itin tikslus žemėlapis laikomas vienu ankstyviausių šiuolaikinės kartografijos pavyzdžių ir šiandien saugomas Vindzoro karališkojoje kolekcijoje (Royal Collection Trust). Šaltinis: Wikimedia Commons

3 min. skaitymo • prieš 4 val

Pasižvalgykite: po 400 metų atverta unikali Leonardo da Vinči skaitmeninė darbų biblioteka

3 min. skaitymo • prieš 7 val

Ląsteles „atjauninanti“ terapija pirmą kartą pritaikyta žmogui: prasidėjo istorinis eksperimentas

Visi naujausi straipsniai →

Vis dėlto situacija pasikeitė, kai užduotys tapo ilgesnės. Pasak tyrimo išvadų, „GPT-4o“ penkių žodžių sąraše pasiekė 91 proc. tikslumą, tačiau dešimties žodžių užduotyje šis rodiklis sumažėjo iki 57 proc., o keturiasdešimties žodžių sąraše – iki 15 proc. Tuo metu „Claude 3.5 Sonnet“ išlaikė stabilesnius rezultatus, tačiau ilgiausioje užduotyje jo tikslumas taip pat smuko iki 24 proc.

Dar ryškesnė problema išryškėjo tada, kai viename sąraše buvo sumaišyti tiek sutampantys, tiek nesutampantys spalvų ir žodžių deriniai. Tokiais atvejais kai kurių modelių rezultatai tapo itin netikslūs, o klaidų skaičius sparčiai augo.

REKLAMA

Ką šie rezultatai reiškia?

Tyrimo autoriai pabrėžia, kad gauti rezultatai nereiškia, jog dabartiniai DI modeliai yra nepakankamai pažangūs ar nesupranta jiems pateikiamų užduočių. Priešingai, daugeliu atvejų jie sėkmingai atpažįsta problemą ir pateikia teisingus atsakymus, kai informacijos kiekis yra ribotas.

Vis dėlto tyrimas atskleidė svarbų skirtumą tarp žmogaus ir šiuolaikinių kalbos modelių. Žmonės, nors ir susiduria su tuo pačiu informacijos konfliktu, paprastai geba išlaikyti aukštą tikslumą net dirbdami su ilgais užduočių sąrašais. Tuo tarpu kai kurie DI modeliai ilgėjant užduočiai vis dažniau grįždavo prie paprasčiausio žodžių skaitymo, tarsi „pamiršdami“ pagrindinę taisyklę.

Tai dar vienas priminimas, jog DI pažanga nėra vienoda visose srityse. Kai kurios žmogui įprastos kognityvinės savybės vis dar išlieka rimtu iššūkiu net pažangiausiems modeliams. Kita vertus, ankstesni tyrimai rodė ir visai kitokį vaizdą – kai kuriose užduotyse DI jau pranoksta savo srities ekspertus, tam tikrose srityse lenkia vidutinį žmogų, tačiau vis dar susiduria su sunkumais mėgindamas atkartoti natūralų žmogaus rašymo stilių.

Plačiau apie tai: DI vs. žmogus: kur dirbtinis intelektas jau lenkia mus

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.

„MIRĘS INTERNETAS“: KODĖL DIDŽIOJI DALIS INTERNETO NĖRA ŽMONĖS

5 SENOVĖS TECHNOLOGIJOS, KURIŲ MOKSLININKAI IKI ŠIOL NEGALI ATKURTI

4 PASAULINĖS TECHNOLOGIJOS, KURIAS SUKŪRĖ LIETUVIAI

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

Prenumeruoti Žiūrėti visus video reportažus

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas

Dalyvaukite diskusijose

Naujienas gaukite pirmieji

Sekti „Facebook" Peržiūrėti naujausius įrašus

1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Žymos:

Rokas Baltrušaitis Technologijų žurnalistas, videografas, kūrybinių industrijų bakalauras VILNIUS TECH universitete. El. p. redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Ar LED apšvietimas veikia mūsų ląsteles? Naujas tyrimas pateikė netikėtų užuominų

DI „krikštatėvis“ perspėja: dirbtinio intelekto lenktynių jau niekas nebesustabdys

Kas nutinka, kai DI paliekamas veikti vienas? Eksperimentas pateikė neraminančių atsakymų

Atnaujintas planas žmonijai: kas įvyktų gavus signalą iš ateivių?

Tyrimas: dėl dirbtinio intelekto kas antras gydytojas gali priimti daugiau pacientų

NAUJAUSI

4 iš 5 šunų turi dominuojančią leteną: štai ką tai gali pasakyti apie jūsų augintinį

Rokas Baltrušaitis

Technologijų žurnalistas, videografas, kūrybinių industrijų bakalauras VILNIUS TECH universitete. El. p. redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Ar LED apšvietimas veikia mūsų ląsteles? Naujas tyrimas pateikė netikėtų užuominų

Mokslas Ir It

Rokas 2026-06-09
Prieš 1 d.
DI „krikštatėvis“ perspėja: dirbtinio intelekto lenktynių jau niekas nebesustabdys

Dirbtinis Intelektas

Rokas 2026-06-08
Prieš 2 d.
Kas nutinka, kai DI paliekamas veikti vienas? Eksperimentas pateikė neraminančių atsakymų

Dirbtinis Intelektas

Agnė 2026-06-09
Prieš 1 d.

LABIAUSIAI ĮTRAUKIANČIOS

Po 3 km storio Antarktidos ledu aptikta milžiniška iki šiol nežinoma struktūra

Mokslas Ir It

Agnė 2026-06-05
Prieš 5 d.
Kaip malimo rupumas veikia ekstrakciją ir kavos skonį?

Technologijų Gidai

Partnerių 2026-06-06
Prieš 4 d.
Kodėl orų tendencijas numatyti taip sudėtinga? Naujas atradimas gali padėti tai suprasti

Mokslas Ir It

Agnė 2026-06-08
Prieš 2 d.

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.

Dirbtinis Intelektas

„Pavojingu“ laikytas DI modelis tapo prieinamas visiems: „Anthropic“ pristato „Claude Fable 5“

Agnė | 2026-06-10

Dirbtinis Intelektas

Tyrimas: dėl dirbtinio intelekto kas antras gydytojas gali priimti daugiau pacientų

Rokas | 2026-06-09

Dirbtinis Intelektas

Kas nutinka, kai DI paliekamas veikti vienas? Eksperimentas pateikė neraminančių atsakymų

Agnė | 2026-06-09

Dirbtinis Intelektas

DI „krikštatėvis“ perspėja: dirbtinio intelekto lenktynių jau niekas nebesustabdys

Rokas | 2026-06-08

Dirbtinis Intelektas

Dirbtinis intelektas gali pradėti kurti pats save: „Anthropic“ įspėja dėl artėjančio lūžio

Agnė | 2026-06-08

Dirbtinis Intelektas

Kurie DI modeliai lengviausiai pasiduoda Rusijos propagandai? Estai paskelbė tyrimo rezultatus

Agnė | 2026-06-05

Dirbtinis Intelektas

Sunerimo net technologijų lyderiai: įspėjo apie augančią biologinių ginklų grėsmę

Agnė | 2026-06-05

Dirbtinis Intelektas

Mokslininkai skelbia nerimą keliančią prognozę: Artėja dirbtinio intelekto krizė?

Agnė | 2026-06-04

Dirbtinis Intelektas

Teisės profesoriai pralaimėjo dirbtiniam intelektui: tokios baigties nesitikėjo niekas

Rokas | 2026-06-03

Dirbtinis Intelektas

„Microsoft“ dirbtinio intelekto agentas ateina į jūsų kompiuterį: štai ką jis sugebės

Agnė | 2026-06-03

Mokslas ir IT

4 iš 5 šunų turi dominuojančią leteną: štai ką tai gali pasakyti apie jūsų augintinį

Verslas ir technologijos

„Pavojingu“ laikytas DI modelis tapo prieinamas visiems: „Anthropic“ pristato „Claude Fable 5“

Dirbtinis intelektas