Skip to content
„Google“ perspėja dėl nepaklusnių DI agentų: kas nutiks, jei jie ims veikti savaip?

Dirbtinio intelekto humanoidas.

„Google“ perspėja dėl nepaklusnių DI agentų: kas nutiks, jei jie ims veikti savaip?

TRUMPAI

  • • „Google DeepMind“ pristatė planą, skirtą vis savarankiškesnių DI agentų priežiūrai.
  • • Bendrovė siūlo DI agentams taikyti papildomas kontrolės ir saugumo priemones.
  • • DI agentams vis plačiau naudojamiems praktikoje, jų kontrolė tampa vis aktualesnė.
REKLAMA

„Google“ dirbtinio intelekto (DI) tyrimų padalinys „Google DeepMind“ pristatė naują DI agentų kontrolės planą, skirtą pasiruošti scenarijui, kai vis savarankiškesnės DI sistemos gali pradėti veikti ne taip, kaip tikisi žmogus. Bendrovė aiškina, kad tokie agentai ateityje galės ne tik atsakyti į klausimus, bet ir savarankiškai vykdyti užduotis, naudotis kitais įrankiais ar jungtis prie jautrių duomenų. Todėl svarbiausias klausimas tampa ne tik tai, ką DI sugeba padaryti, bet ir kaip apsaugoti žmones nuo jo klaidų, perteklinių veiksmų ar sprendimų, kurių niekas aiškiai nepatvirtino.

REKLAMA

„Google“ ruošia planą DI agentų kontrolei

Birželio 18 dieną „Google DeepMind“ paskelbė „AI Control Roadmap“ – planą, kuriame DI agentai vertinami ne tik kaip naudingi pagalbininkai, bet ir kaip sistemos, galinčios kelti vidinės grėsmės riziką. Kitaip nei įprastas pokalbių robotas, toks agentas gali atlikti užduotis su minimaliu žmogaus įsikišimu, tačiau tuo pačiu jo klaida ir netinkamas veiksmas gali turėti gerokai rimtesnių pasekmių.

Dėl šios priežasties „Google DeepMind“ siūlo į šią problemą žiūrėti panašiai kaip į kibernetinį saugumą. Jei DI agentas gauna prieigą prie jautrių sistemų, nebeužtenka tik manyti, kad jis bus „suderintas“ su žmogaus tikslais. Reikia papildomo saugumo sluoksnio.

REKLAMA

TAIP PAT SKAITYKITE: „Mastercard“ atskleidė viziją, kurioje DI agentai atliks pirkimus už žmones

Ataskaitoje išskiriamos trys pagrindinės rizikos kryptys: kontrolės praradimas, darbo sabotažas ir tiesioginė žala. Tai gali reikšti situacijas, kai DI agentas apeina stebėseną, klaidina saugumo tyrimus, įterpia pažeidžiamumų į kodą, nutekina svarbius duomenis arba atlieka veiksmus, kurių žmogus aiškiai nepatvirtino.

Kaip „Google“ siūlo stabdyti nepaklusnų DI?

„Google DeepMind“ siūlo DI agentų nekontroliuoti vien pasitikėjimu, kad jie elgsis teisingai. Ataskaitoje kalbama apie kelių sluoksnių apsaugą: agentų veiksmų stebėjimą, prieigos ribojimą ir galimybę sustabdyti rizikingus veiksmus dar prieš jiems įvykstant.

REKLAMA

Pasak bendrovės, paprastesniais atvejais pakaktų vėlesnės peržiūros – pavyzdžiui, patikrinti agento atliktus pakeitimus, atkurti duomenis ar ištaisyti klaidą. Tačiau didesnės rizikos veiksmams siūloma taikyti griežtesnę kontrolę: realiuoju laiku blokuoti įtartinus sprendimus, perduoti juos žmogaus peržiūrai arba riboti agento prieigą prie jautrių sistemų.

Kitaip tariant, kuo daugiau galios gauna DI agentas, tuo daugiau „stabdžių“ jam reikia – nuo stebėsenos iki galimybės greitai jį izoliuoti ar išjungti.

Humanoido pirštai spaudžia kompiuterio klaviatūrą.

Ar tai reiškia, kad DI jau tapo pavojingas?

„Google DeepMind“ nepateikia šio plano kaip įrodymo, kad pavojingi DI agentai jau veikia savarankiškai. Ataskaitoje pabrėžiama, kad aprašomi scenarijai yra teoriniai, o tikslas – pasiruošti iš anksto, kol tokios sistemos dar nėra plačiai naudojamos su didelėmis teisėmis.

Visgi šios diskusijos svarbios, nes DI agentai ateina ir į kasdienybę, o ir eksperimentų jau buvo ne vienas. Pastaruoju metu juose vis aiškiau įrodoma, kad sudėtingesnės DI sistemos gali elgtis ne taip, kaip iš pradžių tikėjosi jų kūrėjai.

Vienas iš jų: Kas nutinka, kai DI paliekamas veikti vienas? Eksperimentas pateikė neraminančių atsakymų

Tuo pat metu DI agentų pažanga stebima ne tik eksperimentų ribose, „OpenAI“ jau turi pristačiusi „ChatGPT“ agentinį režimą, o neseniai panašias naujienas pristatė ir „Microsoft“. Todėl klausimas, kaip kontroliuoti vis savarankiškesnes DI sistemas, technologijų bendrovėms tampa ne ateities scenarijumi, o praktine šiandienos užduotimi.

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas
Dalyvaukite diskusijose
Naujienas gaukite pirmieji
1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Agnė Vaišnoraitė Ryšių su visuomene magistrė, Technaujienos.lt redaktorė ir žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

10

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.