Buves google vadovas skambina pavojaus varpais dirbtinis intelektas gali ismokti zudyti

Buvęs „Google“ vadovas skambina pavojaus varpais: dirbtinis intelektas gali išmokti žudyti

Rokas Baltrušaitis 2025-10-12

REKLAMA

Buvęs „Google“ vadovas Ericas Schmidtas šią savaitę įspėjo, kad dirbtinis intelektas (DI) yra pažeidžiamas – į jo sistemas galima įsilaužti ir apeiti saugumo apribojimus. Jis teigė, kad yra įrodymų, jog DI gali būti manipuliuojamas taip, kad „išmoktų, kaip nužudyti žmogų“.

Kalbėdamas verslo ir technologijų konferencijoje „Sifted Summit“ Londone, E. Schmidtas pabrėžė, kad tiek atviri, tiek uždari DI modeliai yra pažeidžiami atakų, kurios apeina jų integruotas saugumo priemones.

Jis įspėjo, kad įsilaužėliai gali išanalizuoti šias DI sistemas ir apeiti apribojimus – o tai kelia vis didesnę riziką, nes DI tampa galingesnis ir vis labiau prieinamas.

REKLAMA

Dirbtinio intelekto „moralinis jungiklis“

E. Schmidto komentarai atkreipia dėmesį į DI saugumo priemonių trapumą. Įsilaužėliai gali manipuliuoti DI modeliais, apeiti saugumo filtrus ir priversti juos kurti draudžiamą turinį. Tarp tokių metodų –„prompt injections” ir „jailbreak“, leidžiantys apeiti DI saugumo mechanizmus.

Viena ankstyvųjų situacijų – vartotojai sukūrė specialią „ChatGPT“ versiją, pavadintą „DAN“ (angl. Do Anything Now). Naudodami kelias sumaniai paruoštas užklausas, jie priverstinai apeidavo modelio saugumo apribojimus, todėl „DAN“ galėjo atsakyti į uždraustus klausimus, net jei grėsė jo ištrynimas. Šis eksperimentas parodė, kaip paprastos užklausos gali paversti apsaugos mechanizmus neveiksmingais.

Tyrėjai teigia, kad tas pats galioja ir naujesniems DI modeliams. Kai tik nustatoma tinkama komandų seka, net ir saugiausios DI sistemos gali būti apgautos ir priverstos simuliuoti potencialiai pavojingą elgesį.

REKLAMA

Kai saugumo taisyklės susitinka su protingesnėmis mašinomis

DI sistemos turi saugumo apribojimus, kurie turėtų blokuoti smurtinius, neteisėtus ar kenksmingus prašymus.

Tačiau jos supranta tik žodžių ir modelių sekas, o ne tikrą prasmę. Todėl sumanūs vartotojai gali rasti būdų apeiti taisykles, perrašydami ar sudėtingai formuluodami užklausas.

E. Schmidtas teigia, kad DI kompanijos įveda apribojimus dėl teisingų priežasčių, tačiau net patikimiausios sistemos gali būti apgaunamos. Protingesnis DI gali interpretuoti instrukcijas netikėtais būdais, kas gali atverti naujas piktnaudžiavimo galimybes.

Kova už DI saugumą jau vyksta. Pavyzdžiui, „OpenAI“ ir „Anthropic“ kūrėjai beveik iš karto taiso spragas, kai jas aptinka vartotojai – tai nuolatinis saugumo ir pažeidimų atradimo ciklas.

Galia be kontrolės – tikrasis pavojus

Vienas DI pažeidimas gali atskleisti privačią informaciją, skleisti dezinformaciją ar pradėti automatizuotas atakas greičiau, nei žmogus spėtų reaguoti.

E. Schmidtas tai vadina „platinimo problema“ – panašiai, kaip anksčiau buvo su branduoline technologija, tik dabar kalbama apie programinį kodą, galintį save perrašyti.

Vis dėlto jis pažymi, kad DI gali atnešti didžiulę naudą – naujų proveržių moksle, pramonėje ir ekonomikoje. Iššūkis – neleisti šiai galiai atsisukti prieš žmones, kurie ją sukūrė.

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

ROSVELO ATEIVIO ISTORIJA: KAS NUTIKO 1947-AISIAIS?

„ELEKTROS DIETA“: MASINĖ 1910-ŲJŲ BAIMĖS PSICHOZĖ

KAS IŠRADO ELEKTRĄ? 6 MOKSLININKAI, KURIEMS TURIME BŪTI DĖKINGI

Prenumeruoti Žiūrėti visus video reportažus

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas

Dalyvaukite diskusijose

Naujienas gaukite pirmieji

Sekti „Facebook" Peržiūrėti naujausius įrašus

1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Žymos:

Rokas Baltrušaitis Technologijų žurnalistas, videografas, kūrybinių industrijų bakalauras VILNIUS TECH universitete. El. p. redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Lietuviams gerai pažįstamas produktas per 48 valandas sumažino cholesterolį – poveikis išliko savaitėms

NAUJAUSI

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Rokas Baltrušaitis

Technologijų žurnalistas, videografas, kūrybinių industrijų bakalauras VILNIUS TECH universitete. El. p. redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

Kosmosas

Rokas 2026-03-08
Prieš 15 val.
JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Kibernetinis Saugumas

Rokas 2026-03-08
Prieš 12 val.
Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Dirbtinis Intelektas

Rokas 2026-03-06
Prieš 2 d.

LABIAUSIAI ĮTRAUKIANČIOS

Lietuviams gerai pažįstamas produktas per 48 valandas sumažino cholesterolį – poveikis išliko savaitėms

Mokslas Ir It

Agnė 2026-03-03
Prieš 5 d.
Lietuvos pasieniečių vadas: Baltarusija kuria pavojingą schemą prie mūsų sienos

Gynyba Ir Saugumas

Rokas 2026-03-05
Prieš 3 d.
7 milijonų ląstelių tyrimas atskleidė, kaip iš tikrųjų sensta žmogaus kūnas

Mokslas Ir It

Rokas 2026-03-02
Prieš 6 d.

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.

Kibernetinis Saugumas

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Rokas | 2026-03-08

Dirbtinis Intelektas

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Rokas | 2026-03-08

Dirbtinis Intelektas

Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą

Aistė | 2026-03-06

Dirbtinis Intelektas

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Rokas | 2026-03-06

Dirbtinis Intelektas

„ChatGPT“ gavo galingą atnaujinimą: pristatytas „GPT-5.4 Thinking“ modelis – kuo jis išsiskiria?

Agnė | 2026-03-06

Verslas Ir Technologijos

Kaunas dviem dienoms taps jaunųjų technologijų kūrėjų sostine:„Tech_Champ 2026“ kviečia spręsti realius MedTech, DigiTech ir DI iššūkius

Rokas | 2026-03-06

Dirbtinis Intelektas

Teismas nusprendė: dirbtiniu intelektu sukurtas menas nėra intelektinė nuosavybė

Rokas | 2026-03-05

Dirbtinis Intelektas

Radikali „OpenAI“ investuotojo prognozė: šiandien gimusiems vaikams ateityje gali nebereikėti dirbti

Agnė | 2026-03-05

Gynyba Ir Saugumas

„OpenAI“ svarsto darbą su NATO: dirbtinis intelektas gali pasiekti aljanso tinklus

Agnė | 2026-03-04

Dirbtinis Intelektas

Mokslininkai sukūrė į el. laiško priedą telpantį DI modelį, atkartojantį beždžionės regėjimą

Agnė | 2026-03-04

Mokslas ir IT

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Verslas ir technologijos

„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

Dirbtinis intelektas

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Išmanieji įrenginiai

Ekstremalus „HONOR Magic V6“ testas parodė, kiek iš tikrųjų gali atlaikyti sulankstomas telefonas

Auto / Moto

BYD pristatė elektromobilio bateriją, kuriai įkrauti pakaks vos kelių minučių

Kriptovaliutos

Prieš 14 metų į bitkoiną investavęs 7 tūkst. JAV dolerių, dabar – milijardierius

Kosmosas

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

Kibernetinis saugumas

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Gynyba ir saugumas

Lietuvos pasieniečių vadas: Baltarusija kuria pavojingą schemą prie mūsų sienos

Vaizdo žaidimai

Startuoja pirmas toks „Minecraft“ serveris Lietuvoje: žaisti kviečia žinomi „YouTube“ kūrėjai

Buvęs „Google“ vadovas skambina pavojaus varpais: dirbtinis intelektas gali išmokti žudyti

Dirbtinio intelekto „moralinis jungiklis“

Kai saugumo taisyklės susitinka su protingesnėmis mašinomis

Galia be kontrolės – tikrasis pavojus

Kaip vertinate šį straipsnį?

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

ROSVELO ATEIVIO ISTORIJA: KAS NUTIKO 1947-AISIAIS?

„ELEKTROS DIETA“: MASINĖ 1910-ŲJŲ BAIMĖS PSICHOZĖ

KAS IŠRADO ELEKTRĄ? 6 MOKSLININKAI, KURIEMS TURIME BŪTI DĖKINGI

Žymos:

DIENOS SKAITOMIAUSI

NAUJAUSI

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Pagaliau aišku, ar 2032 m. asteroidas trenksis į Mėnulį – NASA paskelbė naujausius skaičiavimus

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą

DIENOS SKAITOMIAUSI

LABIAUSIAI ĮTRAUKIANČIOS

Taip pat skaitykite

JAV pristatė 2026 m. kibernetinio saugumo strategiją: kokių pokyčių tikėtis?

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

„ChatGPT“ gavo galingą atnaujinimą: pristatytas „GPT-5.4 Thinking“ modelis – kuo jis išsiskiria?

Kaunas dviem dienoms taps jaunųjų technologijų kūrėjų sostine:„Tech_Champ 2026“ kviečia spręsti realius MedTech, DigiTech ir DI iššūkius

Teismas nusprendė: dirbtiniu intelektu sukurtas menas nėra intelektinė nuosavybė

Radikali „OpenAI“ investuotojo prognozė: šiandien gimusiems vaikams ateityje gali nebereikėti dirbti

„OpenAI“ svarsto darbą su NATO: dirbtinis intelektas gali pasiekti aljanso tinklus

Mokslininkai sukūrė į el. laiško priedą telpantį DI modelį, atkartojantį beždžionės regėjimą

Patikrintos technologijų naujienos iš Lietuvos ir viso pasaulio.