OpenAI pristate buda apsisaugoti nuo dirbtinio intelekto nepaklusnumo

„OpenAI“ pristatė būdą apsisaugoti nuo dirbtinio intelekto „nepaklusnumo“

Agnė Vaišnoraitė 2025-03-11

REKLAMA

„OpenAI“ paskelbė apie naują dirbtinio intelekto priežiūros metodą, siekiant kontroliuoti susirūpinimą dėl dirbtinio intelekto saugumo. Minčių grandinės (CoT – Chain of Thoughts) stebėjimas turėtų padėti užtikrinti sistemos samprotavimų skaidrumą ir patikimumą.

Pristatomas naujas dirbtinio intelekto priežiūros metodas

Kovo 10 d. bendrovė savo publikacijoje skelbia, kad „CoT“ pritaikymas leidžia stebėti, kaip dirbtinio intelekto modeliai suskaido sudėtingas užduotis į nuoseklias mintis, t. y. vadinamąją minčių grandinę.

Šis metodas gali tapti vienu iš nedaugelio įrankių ateities modelių kontrolėje, siekiant išvengti dirbtinio intelekto nenuspėjamumo.

REKLAMA

„CoT“ stebėjimo metodas kūrėjams leis analizuoti dirbtinio intelekto sprendimų priėmimo procesą, aptinkant jų daromas klaidas, tokias kaip vartotojų apgaudinėjimas, pasidavimas, kai problema yra per sunki ar patiriami kodavimo užduočių iššūkiai.

Pavyzdžiui, kai kuriose programavimo užduočių scenarijuose dirbtinio intelekto modeliai gali ieškoti neleistinų būdų gauti geriausią rezultatą užuot ieškoję etiškų sprendimų, todėl „CoT“ turėtų padėti tai išsiaiškinti.

Naujovės vardan didesnio saugumo

„CoT“ samprotavimo modeliai „mąsto“ natūralia, žmonėms suprantama kalba, todėl toks stebėjimas leidžia lengviau identifikuoti netinkamą dirbtinio intelekto elgesį.

REKLAMA

Be to, tokiu metodu dirbtinio intelekto sprendimų priėmimo procesas bus nagrinėjamas žingsnis po žingsnio. Tai padeda užtikrinti stebėseną, kad modeliai elgiasi skaidriai ir jų veikimo logika yra suprantama.

Čia naudingi gali būti ir kiti didelių kalbų modeliai (LLM), taip pat ir GPT-4o. Jie gali būti naudojami kaip stebėtojai, kurie įspėja apie bandymus manipuliuoti sistema, pavyzdžiui, kai yra siekiama neteisingai gauti geresnius rezultatus programavimo užduotyse ar išnaudoti sistemos silpnybes.

Kontrolė gali turėti pasekmių

„OpenAI“ pažymi, kad didesnė kontrolė gali turėti ir tam tikrų iššūkių. Bene svarbiausi jų yra susiję su modelių bandymu nuslėpti savo samprotavimus, o ne panaikinti žalingą elgesį.

Kitaip tariant, naujas „CoT“ metodas gali lemti tai, kad modeliai manipuliuos pateikdami atsakymus, t. y. jie atitiks žmogaus lūkestį, bet po jais slėpsis visai kitokie tikslai, kurie jau šįkart bus paslėpti ir sunkiai identifikuojami.

OpenAI supranta kokios pasekmės ateina su šia rizika, todėl ši sritis dar bus ateities tyrimų centre.

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

ROSVELO ATEIVIO ISTORIJA: KAS NUTIKO 1947-AISIAIS?

„ELEKTROS DIETA“: MASINĖ 1910-ŲJŲ BAIMĖS PSICHOZĖ

KAS IŠRADO ELEKTRĄ? 6 MOKSLININKAI, KURIEMS TURIME BŪTI DĖKINGI

Prenumeruoti Žiūrėti visus video reportažus

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas

Dalyvaukite diskusijose

Naujienas gaukite pirmieji

Sekti „Facebook" Peržiūrėti naujausius įrašus

1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Žymos:

dirbtinio intelekto modeliai

Agnė Vaišnoraitė Ryšių su visuomene magistrė, Technaujienos.lt redaktorė ir žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Lietuvos pasieniečių vadas: Baltarusija kuria pavojingą schemą prie mūsų sienos

Lietuviams gerai pažįstamas produktas per 48 valandas sumažino cholesterolį – poveikis išliko savaitėms

„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

BYD pristatė elektromobilio bateriją, kuriai įkrauti pakaks vos kelių minučių

„ChatGPT“ gavo galingą atnaujinimą: pristatytas „GPT-5.4 Thinking“ modelis – kuo jis išsiskiria?

NAUJAUSI

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Agnė Vaišnoraitė

Ryšių su visuomene magistrė, Technaujienos.lt redaktorė ir žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

Lietuvos pasieniečių vadas: Baltarusija kuria pavojingą schemą prie mūsų sienos

Gynyba Ir Saugumas

Rokas 2026-03-05
Prieš 2 d.
Lietuviams gerai pažįstamas produktas per 48 valandas sumažino cholesterolį – poveikis išliko savaitėms

Mokslas Ir It

Agnė 2026-03-03
Prieš 5 d.
„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

Verslas Ir Technologijos

Aistė 2026-03-07
Prieš 23 val.

LABIAUSIAI ĮTRAUKIANČIOS

7 milijonų ląstelių tyrimas atskleidė, kaip iš tikrųjų sensta žmogaus kūnas

Mokslas Ir It

Rokas 2026-03-02
Prieš 5 d.
Mokslininkai įvardijo „auksinę“ miego trukmę – ji gali sumažinti diabeto riziką

Mokslas Ir It

Agnė 2026-03-05
Prieš 3 d.
Turtuolių elitas moka iki 300 000 eurų už skubų skrydį iš Artimųjų Rytų

Gynyba Ir Saugumas

Rokas 2026-03-02
Prieš 5 d.

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.

Dirbtinis Intelektas

Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą

Aistė | 2026-03-06

Dirbtinis Intelektas

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Rokas | 2026-03-06

Dirbtinis Intelektas

„ChatGPT“ gavo galingą atnaujinimą: pristatytas „GPT-5.4 Thinking“ modelis – kuo jis išsiskiria?

Agnė | 2026-03-06

Verslas Ir Technologijos

Kaunas dviem dienoms taps jaunųjų technologijų kūrėjų sostine:„Tech_Champ 2026“ kviečia spręsti realius MedTech, DigiTech ir DI iššūkius

Rokas | 2026-03-06

Dirbtinis Intelektas

Teismas nusprendė: dirbtiniu intelektu sukurtas menas nėra intelektinė nuosavybė

Rokas | 2026-03-05

Dirbtinis Intelektas

Radikali „OpenAI“ investuotojo prognozė: šiandien gimusiems vaikams ateityje gali nebereikėti dirbti

Agnė | 2026-03-05

Gynyba Ir Saugumas

„OpenAI“ svarsto darbą su NATO: dirbtinis intelektas gali pasiekti aljanso tinklus

Agnė | 2026-03-04

Dirbtinis Intelektas

Mokslininkai sukūrė į el. laiško priedą telpantį DI modelį, atkartojantį beždžionės regėjimą

Agnė | 2026-03-04

Dirbtinis Intelektas

Ar „ChatGPT“ gali būti jūsų terapeutas? Mokslininkai įspėja apie rimtas rizikas

Rokas | 2026-03-03

Verslas Ir Technologijos

6G jau pakeliui: pirmieji komerciniai tinklai gali pasirodyti 2029-aisiais

Agnė | 2026-03-03

Mokslas ir IT

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

Verslas ir technologijos

„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

Dirbtinis intelektas

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

Išmanieji įrenginiai

Ekstremalus „HONOR Magic V6“ testas parodė, kiek iš tikrųjų gali atlaikyti sulankstomas telefonas

Auto / Moto

BYD pristatė elektromobilio bateriją, kuriai įkrauti pakaks vos kelių minučių

Kriptovaliutos

Prieš 14 metų į bitkoiną investavęs 7 tūkst. JAV dolerių, dabar – milijardierius

Kosmosas

NASA sutaisė „Artemis II“ Mėnulio misijos raketą: skelbia, kas toliau

Kibernetinis saugumas

Naujas pavojus internete: kenkėjiškos reklamos aplenkė el. pašto sukčiavimo atvejus

Gynyba ir saugumas

Lietuvos pasieniečių vadas: Baltarusija kuria pavojingą schemą prie mūsų sienos

Vaizdo žaidimai

Startuoja pirmas toks „Minecraft“ serveris Lietuvoje: žaisti kviečia žinomi „YouTube“ kūrėjai

„OpenAI“ pristatė būdą apsisaugoti nuo dirbtinio intelekto „nepaklusnumo“

Pristatomas naujas dirbtinio intelekto priežiūros metodas

Naujovės vardan didesnio saugumo

Kontrolė gali turėti pasekmių

Kaip vertinate šį straipsnį?

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

ROSVELO ATEIVIO ISTORIJA: KAS NUTIKO 1947-AISIAIS?

„ELEKTROS DIETA“: MASINĖ 1910-ŲJŲ BAIMĖS PSICHOZĖ

KAS IŠRADO ELEKTRĄ? 6 MOKSLININKAI, KURIEMS TURIME BŪTI DĖKINGI

Žymos:

DIENOS SKAITOMIAUSI

NAUJAUSI

Vyras įsimylėjo „Gemini“ DI ir tikėjo, kad tai jo „žmona“ – po tragiškos baigties šeima pradeda teisinę kovą su „Google“

„Netflix“ įsigijo Beno Afflecko dirbtinio intelekto startuolį – filmų kūrėjams atsiras naujų įrankių

Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

BYD pristatė elektromobilio bateriją, kuriai įkrauti pakaks vos kelių minučių

DIENOS SKAITOMIAUSI

LABIAUSIAI ĮTRAUKIANČIOS

Taip pat skaitykite

Apklausa: kas trečias darbe nuolat naudoja dirbtinį intelektą

Naujas DI modelis jau kuria DNR sekas – sintetinė gyvybė gali tapti realybe

„ChatGPT“ gavo galingą atnaujinimą: pristatytas „GPT-5.4 Thinking“ modelis – kuo jis išsiskiria?

Kaunas dviem dienoms taps jaunųjų technologijų kūrėjų sostine:„Tech_Champ 2026“ kviečia spręsti realius MedTech, DigiTech ir DI iššūkius

Teismas nusprendė: dirbtiniu intelektu sukurtas menas nėra intelektinė nuosavybė

Radikali „OpenAI“ investuotojo prognozė: šiandien gimusiems vaikams ateityje gali nebereikėti dirbti

„OpenAI“ svarsto darbą su NATO: dirbtinis intelektas gali pasiekti aljanso tinklus

Mokslininkai sukūrė į el. laiško priedą telpantį DI modelį, atkartojantį beždžionės regėjimą

Ar „ChatGPT“ gali būti jūsų terapeutas? Mokslininkai įspėja apie rimtas rizikas

6G jau pakeliui: pirmieji komerciniai tinklai gali pasirodyti 2029-aisiais

Patikrintos technologijų naujienos iš Lietuvos ir viso pasaulio.