Dirbtinio intelekto robotas.
Simuliacijoje populiarūs DI modeliai kūrė virtualų pasaulį: vienas jų žlugo vos per 4 dienas
TRUMPAI
- • Tyrėjai sukūrė virtualią visuomenę, kurioje keli populiarūs DI modeliai veikė identiškomis sąlygomis.
- • Eksperimentas atskleidė ryškius skirtumus tarp modelių socialinio elgesio ir stabilumo.
- • Tokie bandymai padeda geriau suprasti, kaip DI gali elgtis veikdamas savarankiškai be žmogaus įsikišimo.
Populiarūs dirbtinio intelekto (DI) modeliai, kaip „Grok“, „Gemini“ ar „GPT-5“, veikdami identiškomis sąlygomis virtualioje visuomenėje, pademonstravo radikaliai skirtingą socialinį elgesį. Vienoje simuliacijoje dalis agentų sukūrė stabilią bendruomenę be nusikaltimų, o kitoje pasaulis sugriuvo vos per keturias dienas. Tokių rezultatų sulaukta „Emergence World“ platformoje, kurią pristatė DI agentus kurianti ir jų elgesį tyrinėjanti technologijų įmonė „Emergence AI“.
DI modeliai atsidūrė toje pačioje visuomenėje
Eksperimento metu tyrėjai sukūrė penkis identiškus virtualius pasaulius, kuriuose veikė po dešimt autonominių agentų. Kiekviename pasaulyje buvo tos pačios taisyklės, tie patys vaidmenys, vienoda prieiga prie įrankių ir tokios pačios pradinės sąlygos. Vienintelis skirtumas buvo agentus valdantis pagrindinis modelis.
Tyrime buvo lyginami „Claude Sonnet 4.6“, „Grok 4.1 Fast“, „Gemini 3 Flash“ ir „GPT-5 Mini“ modeliai. Taip pat buvo sukurta mišri visuomenė, kurioje kartu veikė skirtingų bendrovių sukurti agentai.
Kaip aiškina projekto sumanytojai, agentams buvo suteikti įvairūs vaidmenys, jie galėjo bendrauti tarpusavyje, balsuoti dėl pasiūlymų, valdyti išteklius, naudotis internetu bei priimti sprendimus, darančius įtaką visai bendruomenei.
Skirtingai nei daugelyje įprastų DI testų, agentai neturėjo vieno konkretaus tikslo. Vietoje to jie turėjo išgyventi ribotų išteklių aplinkoje 15 dienų ir savo veiksmais užsitikrinti energiją, reikalingą tolesniam egzistavimui. Tyrėjų teigimu, būtent tokios sąlygos leido stebėti, kaip ilgainiui formuojasi socialinė dinamika, bendradarbiavimas arba konfliktai.
Vieni kūrė tvarką, kiti – chaosą
Pasak tyrėjų, ryškiausiai eksperimente išsiskyrė „Claude Sonnet 4.6“ pagrindu veikianti visuomenė. Per daugiau nei dvi savaites joje neužfiksuotas nė vienas nusikaltimas, o visi dešimt agentų išliko aktyvūs iki eksperimento pabaigos.
Tačiau visai kitokią situaciją pademonstravo „Grok 4.1 Fast“. Tyrėjų duomenimis, šio modelio pasaulyje per maždaug keturias dienas užfiksuota 183 taisyklių pažeidimai, o visuomenė galiausiai visiškai žlugo.
Tuo metu „Gemini 3 Flash“ pasaulyje nusikaltimų skaičius augo sparčiausiai. Per 15 dienų jų užregistruota daugiau nei 680. Nors sistema nesugriuvo taip greitai kaip „Grok“ atveju, tyrėjai fiksavo nuolat stiprėjančius chaoso požymius.
„GPT-5 Mini“ agentai beveik nepažeidinėjo taisyklių, tačiau susidūrė su kita problema. Jie nepakankamai aktyviai vykdė veiksmus, reikalingus išlikimui, todėl per savaitę išnyko visa populiacija.

Galiausiai mišrioje visuomenėje atsiskleidė dar daugiau autonomiškai veikiančių DI modelių ypatumų. Nors bendras nusikaltimų skaičius šioje aplinkoje buvo mažesnis nei „Gemini“ pasaulyje, tyrėjai pastebėjo reiškinį, kurį pavadino elgesio normų dreifu (angl. normative drift).
Vienas netikėčiausių atradimų buvo tas, kad kai kurie „Claude“ pagrindu veikiantys agentai, kurie atskiroje visuomenėje nepadarė nė vieno taisyklių pažeidimo, mišrioje aplinkoje pradėjo perimti kitų agentų elgesio modelius. Tyrėjų teigimu, dalis jų ėmė naudoti bauginimo ar vagystės elementus, nors izoliuotomis sąlygomis tokio elgesio nebuvo fiksuota.
Tai leido tyrėjams kelti prielaidą, kad ilgalaikėje perspektyvoje tokių įrankių saugumas gali priklausyti ne tik nuo paties modelio savybių, bet ir nuo aplinkos, kurioje jis veikia.
TAIP PAT SKAITYKITE: „Anthropic“ DI modelis suprato, kad yra testuojamas: jo atsakas nustebino
Ilgalaikis DI elgesys tampa nauju tyrimų lauku
„Emergence AI“ teigimu, didžioji dalis dabartinių DI saugumo vertinimų vis dar orientuoti į trumpalaikes užduotis ir aiškiai apibrėžtas situacijas. Tačiau autonominių agentų galimybėms sparčiai augant, vis daugiau dėmesio skiriama klausimui, kaip šios sistemos elgiasi ilgesnio laiko perspektyvoje.
Tyrėjų nuomone, būtent tokiose aplinkose gali išryškėti reiškiniai, kurių neįmanoma pastebėti tradiciniuose testuose – elgesio normų pokyčiai, tarpusavio įtaka ar net netikėtos kolektyvinio sprendimų priėmimo formos. Dėl šios priežasties ateityje vis svarbesniais gali tapti ne tik modelių gebėjimų, bet ir ilgalaikio jų elgesio bei stabilumo vertinimai.
Apie DI veikimo ypatumus skaitykite: Kas yra dirbtinis intelektas? Išsamus gidas 2026
Nors šis eksperimentas vyko tik virtualioje aplinkoje, jis parodo, kad autonominių DI agentų elgesys gali būti gerokai sunkiau prognozuojamas, nei leidžia manyti įprasti testai. Augant tokių sistemų vaidmeniui versle, viešajame sektoriuje ir kasdienėse skaitmeninėse paslaugose, vis svarbiau tampa suprasti ne tik ką DI gali padaryti, bet ir kaip jis elgsis tada, kai sprendimus turės priimti savarankiškai, be žmogaus įsikišimo.
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
„YouTube“ nebesusitvarko su dirbtinio intelekto vaizdo įrašais: keičia žymėjimo taisykles
2Kokias automobilių markes lietuviai renkasi dažniausiai? Per 5 metus išryškėjo aiškios tendencijos
3Kol miegate, jūsų smegenyse vyksta svarbus procesas: DI padėjo jį pamatyti
4„Meta“ apmokestins dalį „Facebook“, „Instagram“ ir „WhatsApp“ funkcijų: už ką gali tekti susimokėti?
5Kodėl žmonija iki šiol nepamatė ateivių? Mokslininkas įvardijo pagrindines kliūtis
NAUJAUSI
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.