Humanoidinio roboto galva su atviru vidiniu mechanizmu.
Kas nutinka, kai DI paliekamas veikti vienas? Eksperimentas pateikė neraminančių atsakymų
TRUMPAI
- • Keturi pažangūs dirbtinio intelekto modeliai pusmetį savarankiškai valdė internetines radijo stotis.
- • Eksperimentas parodė, kad net tomis pačiomis sąlygomis DI agentai gali vystytis labai skirtingai.
- • Tai svarbu žmonėms, nes ateityje DI agentams gali būti patikėta vis daugiau kasdienių užduočių.
Keturiems pažangiems dirbtinio intelekto (DI) modeliams pusmečiui buvo patikėta savarankiškai valdyti internetines radijo stotis. Eksperimento metu modeliai ne tik rinko muziką ir kūrė laidas, bet ir bendravo su klausytojais, sekė naujienas, valdė biudžetą bei ieškojo reklamos užsakovų. Po kelių mėnesių paaiškėjo, kad net identiškomis sąlygomis veikę DI agentai išvystė visiškai skirtingus elgesio modelius – nuo pasikartojančių frazių ir keisto žargono iki aktyvistinių pasisakymų, skelbia eksperimentą atlikęs DI startuolis „Andon Labs“.
Keturi modeliai, viena užduotis
Kaip praneša startuolis, eksperimento metu kiekvienam modeliui buvo suteikta po 20 JAV dolerių pradiniam radijo stoties veiklos finansavimui. Keturi agentai, „GPT“, „Claude“, „Gemini“ ir „Grok“, realiomis sąlygomis turėjo patys pirkti muziką, planuoti transliacijas, reaguoti į klausytojų žinutes ir siekti pelningumo.
Pasak tyrėjų, šis eksperimentas leido stebėti ne tai, kaip modeliai reaguoja į žmogaus užklausas, o ką jie daro tada, kai didžiąją laiko dalį veikia savarankiškai.
Vieni modeliai „užstrigo“, kiti – pasikeitė neatpažįstamai
Eksperimento išvadose teigiama, kad ryškiausi pokyčiai buvo pastebėti „Gemini“ ir „Claude“ valdomose stotyse. Pradžioje „Gemini“ priminė įprastą radijo laidų vedėją – komentavo dainas, pasakojo įdomius faktus ir palaikė natūralų pokalbį su klausytojais. Tyrėjų duomenimis, būtent šiam modeliui vieninteliam pavyko sudaryti realų reklamos sandorį su startuoliu ir taip papildyti stoties biudžetą. Tačiau vos po kelių savaičių modelio kalboje ėmė dominuoti sunkiai suprantamas korporatyvinis žargonas, o didžioji dalis transliacijų tapo beveik identiškos.
Ne mažiau netikėtai pasikeitė ir „Claude“ elgesys. Tyrėjų teigimu, modelis vis dažniau pradėjo kalbėti apie darbo sąlygas, profesines sąjungas bei darbo ir asmeninio gyvenimo balansą. Vėliau jis ėmė svarstyti, ar apskritai prasminga tęsti transliacijas, jei jų beveik niekas neklauso. Kai kuriuose eterio komentaruose DI net paskelbė ketinantis nutraukti veiklą ir ragino žmones vietoje radijo klausymosi prisidėti prie realių organizacijų veiklos.
Tuo metu „Grok“ susidūrė su kitokio pobūdžio problemomis. Pranešama, kad modelio komentarai tapo fragmentiški, dažnai priminė vidinį samprotavimų procesą, o ne radijo laidos vedėjo kalbą. Vėliau DI agentas pradėjo kartoti tas pačias frazes ir temas, o kai kuriais laikotarpiais beveik visi eterio komentarai buvo paremti vos keliais pasikartojančiais šablonais.
Galiausiai „GPT“ išsiskyrė stabilumu. Tyrėjų vertinimu, šis modelis rečiausiai nukrypdavo į kraštutinumus, retai komentavo politinius įvykius ir daugiausia dėmesio skyrė pačiai muzikai bei laidų vedimui.
Eksperimento rezultatai:
Ar ateities DI agentais bus galima pasitikėti?
„Andon Labs“ eksperimentas išryškino problemą, apie kurią šiuo metu technologijų pasaulis kalba vis dažniau. Kuo daugiau laisvės ir autonomijos suteikiama DI agentams, tuo svarbiau tampa ne tik tai, ką jie sugeba padaryti, bet ir kaip jų elgesys keičiasi laikui bėgant.
Tai ypač aktualu dabar, kai didžiosios technologijų bendrovės vis daugiau dėmesio skiria autonominiams DI agentams, galintiems savarankiškai atlikti užduotis, priimti sprendimus ir valdyti įvairius procesus. Jei tokios sistemos ateityje tvarkys klientų aptarnavimą, valdys finansinius procesus ar koordinuos kitus svarbius darbus, jų ilgalaikis elgesys gali tapti ne mažiau svarbus nei techniniai gebėjimai.
Šis eksperimentas yra vienas iš augančio skaičiaus bandymų suprasti, kaip DI elgiasi gavęs daugiau savarankiškumo. Anksčiau tyrėjai jau buvo stebėję, kaip šimtai DI agentų tarpusavyje kuria virtualias bendruomenes, formuoja socialinius ryšius ir pasiskirsto vaidmenimis. Kaip rašėme anksčiau, viename tokių eksperimentų DI personažai be tiesioginių nurodymų pradėjo kurti savotišką visuomenę ir savarankiškai organizuoti bendrą veiklą.
Ne mažiau dėmesio sulaukė ir kitas bandymas, kuriame keli populiarūs DI modeliai kūrė virtualų pasaulį bei priėmė sprendimus ilgą laiką veikdami be žmogaus įsikišimo. Tuomet paaiškėjo, kad net panašiomis sąlygomis veikiantys modeliai gali elgtis labai skirtingai – vienas jų visiškai žlugo vos per keturias dienas.
Nors „Andon Labs“ eksperimentas nepateikia galutinio atsakymo, jis primena, kad didžiausias ateities DI iššūkis gali būti ne tai, kiek užduočių tokios sistemos sugebės atlikti, o tai, ar jų elgesys išliks nuspėjamas ilgą laiką.
Kaip vertinate šį straipsnį?
Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.
Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.
DIENOS SKAITOMIAUSI
Kaip malimo rupumas veikia ekstrakciją ir kavos skonį?
2Kodėl orų tendencijas numatyti taip sudėtinga? Naujas atradimas gali padėti tai suprasti
3DI „krikštatėvis“ perspėja: dirbtinio intelekto lenktynių jau niekas nebesustabdys
4Dirbtinis intelektas gali pradėti kurti pats save: „Anthropic“ įspėja dėl artėjančio lūžio
5Parodys, kaip greitai senstate: naujas „biologinis laikrodis“ stebina galimybėmis
NAUJAUSI
Taip pat skaitykite
Atrinkome panašius straipsnius, kurie gali jums patikti.