Dirbtinio intelekto humanoidas.

„Google“ perspėja dėl nepaklusnių DI agentų: kas nutiks, jei jie ims veikti savaip?

TRUMPAI

• „Google DeepMind“ pristatė planą, skirtą vis savarankiškesnių DI agentų priežiūrai.
• Bendrovė siūlo DI agentams taikyti papildomas kontrolės ir saugumo priemones.
• DI agentams vis plačiau naudojamiems praktikoje, jų kontrolė tampa vis aktualesnė.

Agnė Vaišnoraitė 2026-06-19

REKLAMA

„Google“ dirbtinio intelekto (DI) tyrimų padalinys „Google DeepMind“ pristatė naują DI agentų kontrolės planą, skirtą pasiruošti scenarijui, kai vis savarankiškesnės DI sistemos gali pradėti veikti ne taip, kaip tikisi žmogus. Bendrovė aiškina, kad tokie agentai ateityje galės ne tik atsakyti į klausimus, bet ir savarankiškai vykdyti užduotis, naudotis kitais įrankiais ar jungtis prie jautrių duomenų. Todėl svarbiausias klausimas tampa ne tik tai, ką DI sugeba padaryti, bet ir kaip apsaugoti žmones nuo jo klaidų, perteklinių veiksmų ar sprendimų, kurių niekas aiškiai nepatvirtino.

REKLAMA

„Google“ ruošia planą DI agentų kontrolei

Birželio 18 dieną „Google DeepMind“ paskelbė „AI Control Roadmap“ – planą, kuriame DI agentai vertinami ne tik kaip naudingi pagalbininkai, bet ir kaip sistemos, galinčios kelti vidinės grėsmės riziką. Kitaip nei įprastas pokalbių robotas, toks agentas gali atlikti užduotis su minimaliu žmogaus įsikišimu, tačiau tuo pačiu jo klaida ir netinkamas veiksmas gali turėti gerokai rimtesnių pasekmių.

Dėl šios priežasties „Google DeepMind“ siūlo į šią problemą žiūrėti panašiai kaip į kibernetinį saugumą. Jei DI agentas gauna prieigą prie jautrių sistemų, nebeužtenka tik manyti, kad jis bus „suderintas“ su žmogaus tikslais. Reikia papildomo saugumo sluoksnio.

REKLAMA

TAIP PAT SKAITYKITE: „Mastercard“ atskleidė viziją, kurioje DI agentai atliks pirkimus už žmones

Naujausi straipsniai

Anthony Fauci. Šaltinis: Wikimedia Commons ir TechNaujienos.lt

3 min. skaitymo • prieš 23 val

COVID-19 skandalas JAV: Anthony Fauci pateikti kaltinimai dėl informacijos slėpimo ir melagingų parodymų Kongresui

Elonas Muskas, SpaceX vadovas. Šaltinis: Shutterstock

3 min. skaitymo • prieš 24 val

Nauji dokumentai meta šešėlį ant SpaceX IPO: atskleisti ankstyvieji investuotojai iš Kinijos ir Rusijos

3 min. skaitymo • prieš 2 d.

Mokslininkai to nepastebėjo: DI atskleidė, kas daugiau nei 20 metų slėpėsi po Antarktidos ledu

Visi naujausi straipsniai →

Ataskaitoje išskiriamos trys pagrindinės rizikos kryptys: kontrolės praradimas, darbo sabotažas ir tiesioginė žala. Tai gali reikšti situacijas, kai DI agentas apeina stebėseną, klaidina saugumo tyrimus, įterpia pažeidžiamumų į kodą, nutekina svarbius duomenis arba atlieka veiksmus, kurių žmogus aiškiai nepatvirtino.

Kaip „Google“ siūlo stabdyti nepaklusnų DI?

„Google DeepMind“ siūlo DI agentų nekontroliuoti vien pasitikėjimu, kad jie elgsis teisingai. Ataskaitoje kalbama apie kelių sluoksnių apsaugą: agentų veiksmų stebėjimą, prieigos ribojimą ir galimybę sustabdyti rizikingus veiksmus dar prieš jiems įvykstant.

REKLAMA

Pasak bendrovės, paprastesniais atvejais pakaktų vėlesnės peržiūros – pavyzdžiui, patikrinti agento atliktus pakeitimus, atkurti duomenis ar ištaisyti klaidą. Tačiau didesnės rizikos veiksmams siūloma taikyti griežtesnę kontrolę: realiuoju laiku blokuoti įtartinus sprendimus, perduoti juos žmogaus peržiūrai arba riboti agento prieigą prie jautrių sistemų.

Kitaip tariant, kuo daugiau galios gauna DI agentas, tuo daugiau „stabdžių“ jam reikia – nuo stebėsenos iki galimybės greitai jį izoliuoti ar išjungti.

Humanoido pirštai spaudžia kompiuterio klaviatūrą.

Ar tai reiškia, kad DI jau tapo pavojingas?

„Google DeepMind“ nepateikia šio plano kaip įrodymo, kad pavojingi DI agentai jau veikia savarankiškai. Ataskaitoje pabrėžiama, kad aprašomi scenarijai yra teoriniai, o tikslas – pasiruošti iš anksto, kol tokios sistemos dar nėra plačiai naudojamos su didelėmis teisėmis.

Visgi šios diskusijos svarbios, nes DI agentai ateina ir į kasdienybę, o ir eksperimentų jau buvo ne vienas. Pastaruoju metu juose vis aiškiau įrodoma, kad sudėtingesnės DI sistemos gali elgtis ne taip, kaip iš pradžių tikėjosi jų kūrėjai.

Vienas iš jų: Kas nutinka, kai DI paliekamas veikti vienas? Eksperimentas pateikė neraminančių atsakymų

Tuo pat metu DI agentų pažanga stebima ne tik eksperimentų ribose, „OpenAI“ jau turi pristačiusi „ChatGPT“ agentinį režimą, o neseniai panašias naujienas pristatė ir „Microsoft“. Todėl klausimas, kaip kontroliuoti vis savarankiškesnes DI sistemas, technologijų bendrovėms tampa ne ateities scenarijumi, o praktine šiandienos užduotimi.

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.

„MIRĘS INTERNETAS“: KODĖL DIDŽIOJI DALIS INTERNETO NĖRA ŽMONĖS

5 SENOVĖS TECHNOLOGIJOS, KURIŲ MOKSLININKAI IKI ŠIOL NEGALI ATKURTI

4 PASAULINĖS TECHNOLOGIJOS, KURIAS SUKŪRĖ LIETUVIAI

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

Prenumeruoti Žiūrėti visus video reportažus

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas

Dalyvaukite diskusijose

Naujienas gaukite pirmieji

Sekti „Facebook" Peržiūrėti naujausius įrašus

1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Žymos:

Agnė Vaišnoraitė Ryšių su visuomene magistrė, Technaujienos.lt redaktorė ir žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

COVID-19 skandalas JAV: Anthony Fauci pateikti kaltinimai dėl informacijos slėpimo ir melagingų parodymų Kongresui

Mokslininkai meteorite iš Marso aptiko tai, kas gali perrašyti dalį planetos istorijos

Visi būdai, kuriais telefonas gali sekti jūsų buvimo vietą – ir ką verta išjungti

Nauji dokumentai meta šešėlį ant SpaceX IPO: atskleisti ankstyvieji investuotojai iš Kinijos ir Rusijos

Mokslininkai to nepastebėjo: DI atskleidė, kas daugiau nei 20 metų slėpėsi po Antarktidos ledu

NAUJAUSI

COVID-19 skandalas JAV: Anthony Fauci pateikti kaltinimai dėl informacijos slėpimo ir melagingų parodymų Kongresui

Agnė Vaišnoraitė

Ryšių su visuomene magistrė, Technaujienos.lt redaktorė ir žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

COVID-19 skandalas JAV: Anthony Fauci pateikti kaltinimai dėl informacijos slėpimo ir melagingų parodymų Kongresui

Mokslas Ir It

Aistė 2026-06-20
Prieš 23 val.
Mokslininkai meteorite iš Marso aptiko tai, kas gali perrašyti dalį planetos istorijos

Kosmosas

Agnė 2026-06-19
Prieš 2 d.
Visi būdai, kuriais telefonas gali sekti jūsų buvimo vietą – ir ką verta išjungti

Kibernetinis Saugumas

Agnė 2026-06-18
Prieš 2 d.

LABIAUSIAI ĮTRAUKIANČIOS

Ukraina parodė naują povandeninį droną: slapta įveiks tūkstančius kilometrų

Gynyba Ir Saugumas

Agnė 2026-06-16
Prieš 5 d.
Žmonės gali būti ne vienintelės sąmoningos būtybės Visatoje, teigia mokslininkai

Kosmosas

Aistė 2026-06-14
Prieš 6 d.
Prognozės keičiasi: apskaičiuota, kiek ilgai dar Žemėje gali egzistuoti gyvybė

Kosmosas

Agnė 2026-06-17
Prieš 3 d.

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.

Mokslas Ir It

Mokslininkai to nepastebėjo: DI atskleidė, kas daugiau nei 20 metų slėpėsi po Antarktidos ledu

Rokas | 2026-06-19

Dirbtinis Intelektas

Ilgiau naudojant DI gali būti sunkiau atskirti melą nuo tiesos, teigia mokslininkai

Agnė | 2026-06-19

Dirbtinis Intelektas

Europa įvertino Lietuvos skaitmeninę pažangą: yra kuo didžiuotis, bet iššūkių netrūksta

Rokas | 2026-06-17

Dirbtinis Intelektas

Augintinių šeimininkams – nauja DI funkcija: sveikatos sutrikimus aptiks iš nuotraukos

Agnė | 2026-06-17

Dirbtinis Intelektas

Naudojate „ChatGPT“ kasdien? Šie 3 nustatymai gali būti naudingesni, nei manote

Agnė | 2026-06-17

Dirbtinis Intelektas

Jūsų vieši „Facebook“ įrašai taps dirbtinio intelekto atsakymų dalimi: „Meta“ pristato pokyčius

Agnė | 2026-06-16

Dirbtinis Intelektas

Europa gali pralaimėti dirbtinio intelekto lenktynes: paskelbtas niūrus 2031 m. scenarijus

Agnė | 2026-06-15

Dirbtinis Intelektas

„Visa“ ir „OpenAI“ susitarė: netrukus „ChatGPT“ galės pirkti jūsų vardu

Rokas | 2026-06-12

Dirbtinis Intelektas

2026 m. FIFA pasaulio čempionatas: kaip dirbtinis intelektas keis žaidimą

Agnė | 2026-06-12

Dirbtinis Intelektas

Svarbioje „Google“ byloje teismas nusprendė: už neteisingus DI atsakymus atsakys bendrovė

Rokas | 2026-06-11

Mokslas ir IT

COVID-19 skandalas JAV: Anthony Fauci pateikti kaltinimai dėl informacijos slėpimo ir melagingų parodymų Kongresui

Verslas ir technologijos

Nauji dokumentai meta šešėlį ant SpaceX IPO: atskleisti ankstyvieji investuotojai iš Kinijos ir Rusijos

Dirbtinis intelektas

Ilgiau naudojant DI gali būti sunkiau atskirti melą nuo tiesos, teigia mokslininkai

Išmanieji įrenginiai

Nutekėjo ambicingi „Apple“ planai: štai ką pristatys jubiliejiniais 2027 metais

Auto / Moto

Lietuvos vairuotojų pasirinkimai keičiasi: elektromobilių registracijos šoktelėjo 60 proc.

Kriptovaliutos

Kriptovaliutų statistika negailestinga: 2,5 trln. JAV dolerių vertės turtui gresia kvantinės atakos

Kosmosas

Mėnulyje gali slypėti ateivių technologijų pėdsakai, mokslininkai ragina nedelsti

Kibernetinis saugumas

Visi būdai, kuriais telefonas gali sekti jūsų buvimo vietą – ir ką verta išjungti

Gynyba ir saugumas

Rusams pergudrauti nepavyko: „neįveikiamu“ turėjęs tapti tankas neatlaikė Ukrainos dronų atakos

Vaizdo žaidimai

Netrukus „Minecraft“ gerbėjus visi keliai ves į Londoną: čia atgims žaidimo pasaulis

„Google“ perspėja dėl nepaklusnių DI agentų: kas nutiks, jei jie ims veikti savaip?

TRUMPAI

„Google“ ruošia planą DI agentų kontrolei

Kaip „Google“ siūlo stabdyti nepaklusnų DI?

Ar tai reiškia, kad DI jau tapo pavojingas?

Kaip vertinate šį straipsnį?

„MIRĘS INTERNETAS“: KODĖL DIDŽIOJI DALIS INTERNETO NĖRA ŽMONĖS

5 SENOVĖS TECHNOLOGIJOS, KURIŲ MOKSLININKAI IKI ŠIOL NEGALI ATKURTI

4 PASAULINĖS TECHNOLOGIJOS, KURIAS SUKŪRĖ LIETUVIAI

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

Žymos:

DIENOS SKAITOMIAUSI

NAUJAUSI

COVID-19 skandalas JAV: Anthony Fauci pateikti kaltinimai dėl informacijos slėpimo ir melagingų parodymų Kongresui

Nauji dokumentai meta šešėlį ant SpaceX IPO: atskleisti ankstyvieji investuotojai iš Kinijos ir Rusijos

Mokslininkai to nepastebėjo: DI atskleidė, kas daugiau nei 20 metų slėpėsi po Antarktidos ledu

Rusams pergudrauti nepavyko: „neįveikiamu“ turėjęs tapti tankas neatlaikė Ukrainos dronų atakos

Mėnulyje gali slypėti ateivių technologijų pėdsakai, mokslininkai ragina nedelsti

DIENOS SKAITOMIAUSI

LABIAUSIAI ĮTRAUKIANČIOS

Taip pat skaitykite

Mokslininkai to nepastebėjo: DI atskleidė, kas daugiau nei 20 metų slėpėsi po Antarktidos ledu

Ilgiau naudojant DI gali būti sunkiau atskirti melą nuo tiesos, teigia mokslininkai

Europa įvertino Lietuvos skaitmeninę pažangą: yra kuo didžiuotis, bet iššūkių netrūksta

Augintinių šeimininkams – nauja DI funkcija: sveikatos sutrikimus aptiks iš nuotraukos

Naudojate „ChatGPT“ kasdien? Šie 3 nustatymai gali būti naudingesni, nei manote

Jūsų vieši „Facebook“ įrašai taps dirbtinio intelekto atsakymų dalimi: „Meta“ pristato pokyčius

Europa gali pralaimėti dirbtinio intelekto lenktynes: paskelbtas niūrus 2031 m. scenarijus

„Visa“ ir „OpenAI“ susitarė: netrukus „ChatGPT“ galės pirkti jūsų vardu

2026 m. FIFA pasaulio čempionatas: kaip dirbtinis intelektas keis žaidimą

Svarbioje „Google“ byloje teismas nusprendė: už neteisingus DI atsakymus atsakys bendrovė

Patikrintos technologijų naujienos iš Lietuvos ir viso pasaulio.