Tech

Naujienos

Daugiau

DI skubios pagalbos diagnozėse aplenkė gydytojus: kaip keisis gydymo kokybė

Dirbtinis Intelektas

DI skubios pagalbos diagnozėse aplenkė gydytojus: kaip keisis gydymo kokybė

Agnė | GEG 1

Surastas greitesnis kelias į Marsą: būsimos misijos gali sutrumpėti perpus

Surastas greitesnis kelias į Marsą: būsimos misijos gali sutrumpėti perpus

Agnė | GEG 1 |

Ekonomistas įvardijo 3 priežastis, kodėl Rusija galėtų pulti Baltijos šalis

Ekonomistas įvardijo 3 priežastis, kodėl Rusija galėtų pulti Baltijos šalis

Agnė | GEG 1 |

Gynyba Ir Saugumas

Saulės elektrinių parkai: kai stogo nepakanka visiems energijos poreikiams

Saulės elektrinių parkai: kai stogo nepakanka visiems energijos poreikiams

Partnerių | BAL 30 |

Technologijų Gidai

Neturite laiko sportui? Ši 10 minučių mankšta gali būti sprendimas

Neturite laiko sportui? Ši 10 minučių mankšta gali būti sprendimas

Rokas | BAL 30 |

Pompėjoje DI atkūrė per Vezuvijaus katastrofą žuvusio vyro veidą: naujas požiūris į praeitį

Pompėjoje DI atkūrė per Vezuvijaus katastrofą žuvusio vyro veidą: naujas požiūris į praeitį

Rokas | BAL 30 |

Eidamas 79-uosius metus mirė žmogaus DNR iššifruoti padėjęs J. Craigas Venteris

Eidamas 79-uosius metus mirė žmogaus DNR iššifruoti padėjęs J. Craigas Venteris

Agnė | BAL 30 |

„OpenAI“ pristatė būdą apsisaugoti nuo dirbtinio intelekto „nepaklusnumo“

OpenAI pristate buda apsisaugoti nuo dirbtinio intelekto nepaklusnumo

„OpenAI“ pristatė būdą apsisaugoti nuo dirbtinio intelekto „nepaklusnumo“

Dirbtinis Intelektas

Agnė Vaišnoraitė 2025-03-11

„OpenAI“ paskelbė apie naują dirbtinio intelekto priežiūros metodą, siekiant kontroliuoti susirūpinimą dėl dirbtinio intelekto saugumo. Minčių grandinės (CoT – Chain of Thoughts) stebėjimas turėtų padėti užtikrinti sistemos samprotavimų skaidrumą ir patikimumą.

REKLAMA

Pristatomas naujas dirbtinio intelekto priežiūros metodas

Kovo 10 d. bendrovė savo publikacijoje skelbia, kad „CoT“ pritaikymas leidžia stebėti, kaip dirbtinio intelekto modeliai suskaido sudėtingas užduotis į nuoseklias mintis, t. y. vadinamąją minčių grandinę.

Šis metodas gali tapti vienu iš nedaugelio įrankių ateities modelių kontrolėje, siekiant išvengti dirbtinio intelekto nenuspėjamumo.

REKLAMA

„CoT“ stebėjimo metodas kūrėjams leis analizuoti dirbtinio intelekto sprendimų priėmimo procesą, aptinkant jų daromas klaidas, tokias kaip vartotojų apgaudinėjimas, pasidavimas, kai problema yra per sunki ar patiriami kodavimo užduočių iššūkiai.

Pavyzdžiui, kai kuriose programavimo užduočių scenarijuose dirbtinio intelekto modeliai gali ieškoti neleistinų būdų gauti geriausią rezultatą užuot ieškoję etiškų sprendimų, todėl „CoT“ turėtų padėti tai išsiaiškinti.

Naujovės vardan didesnio saugumo

„CoT“ samprotavimo modeliai „mąsto“ natūralia, žmonėms suprantama kalba, todėl toks stebėjimas leidžia lengviau identifikuoti netinkamą dirbtinio intelekto elgesį.

REKLAMA

Be to, tokiu metodu dirbtinio intelekto sprendimų priėmimo procesas bus nagrinėjamas žingsnis po žingsnio. Tai padeda užtikrinti stebėseną, kad modeliai elgiasi skaidriai ir jų veikimo logika yra suprantama.

Čia naudingi gali būti ir kiti didelių kalbų modeliai (LLM), taip pat ir GPT-4o. Jie gali būti naudojami kaip stebėtojai, kurie įspėja apie bandymus manipuliuoti sistema, pavyzdžiui, kai yra siekiama neteisingai gauti geresnius rezultatus programavimo užduotyse ar išnaudoti sistemos silpnybes.

Kontrolė gali turėti pasekmių

„OpenAI“ pažymi, kad didesnė kontrolė gali turėti ir tam tikrų iššūkių. Bene svarbiausi jų yra susiję su modelių bandymu nuslėpti savo samprotavimus, o ne panaikinti žalingą elgesį.

Kitaip tariant, naujas „CoT“ metodas gali lemti tai, kad modeliai manipuliuos pateikdami atsakymus, t. y. jie atitiks žmogaus lūkestį, bet po jais slėpsis visai kitokie tikslai, kurie jau šįkart bus paslėpti ir sunkiai identifikuojami.

OpenAI supranta kokios pasekmės ateina su šia rizika, todėl ši sritis dar bus ateities tyrimų centre.

Kaip vertinate šį straipsnį?

NAUJIENOS IŠ INTERNETO

Prenumeruokite mūsų „YouTube“ kanalą ir mėgaukitės įdomiais vaizdo reportažais apie mokslą ir technologijas.

„MIRĘS INTERNETAS“: KODĖL DIDŽIOJI DALIS INTERNETO NĖRA ŽMONĖS

„MIRĘS INTERNETAS“: KODĖL DIDŽIOJI DALIS INTERNETO NĖRA ŽMONĖS

5 SENOVĖS TECHNOLOGIJOS, KURIŲ MOKSLININKAI IKI ŠIOL NEGALI ATKURTI

5 SENOVĖS TECHNOLOGIJOS, KURIŲ MOKSLININKAI IKI ŠIOL NEGALI ATKURTI

4 PASAULINĖS TECHNOLOGIJOS, KURIAS SUKŪRĖ LIETUVIAI

4 PASAULINĖS TECHNOLOGIJOS, KURIAS SUKŪRĖ LIETUVIAI

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 PAVOJINGIAUSIOS VIETOS ŽEMĖJE, KURIAS SUKŪRĖ MOKSLAS

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 TECHNOLOGIJOS, KURIOS ATSIRADO „NETYČIA“

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

5 MOKSLINIAI EKSPERIMENTAI, KURIE SUKRĖTĖ PASAULĮ

Prenumeruoti Žiūrėti visus video reportažus

Trumpai, aiškiai ir be triukšmo – gaukite svarbiausias technologijų ir mokslo naujienas pirmieji.

Sekite mokslo ir technologijų tendencijas

Dalyvaukite diskusijose

Naujienas gaukite pirmieji

Sekti „Facebook" Peržiūrėti naujausius įrašus

1 700+ narių jau seka mūsų puslapį, laukiame tavęs!

Žymos:

dirbtinio intelekto modeliai

dirbtinis intelektas

Minčių grandinė

Agnė Vaišnoraitė

Agnė Vaišnoraitė Ryšių su visuomene magistrė, Technaujienos.lt redaktorė ir žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

3 ženklai, kurie išduoda apgaulingą el. laišką

Mokslininkai paprašė DI sukurti biologinį ginklą – tai, ką gavo, sukėlė nerimą

Pompėjoje DI atkūrė per Vezuvijaus katastrofą žuvusio vyro veidą: naujas požiūris į praeitį

Visur jungiatės per „Google“ paskyrą? Štai kokie pavojai gali slypėti

„Galaxy S26“ DI funkcijos gali pasiekti šiuos senesnius „Samsung“ telefonus

NAUJAUSI

DI skubios pagalbos diagnozėse aplenkė gydytojus: kaip keisis gydymo kokybė

DI skubios pagalbos diagnozėse aplenkė gydytojus: kaip keisis gydymo kokybė

Dirbtinis Intelektas

Agnė | 2026-05-01

Surastas greitesnis kelias į Marsą: būsimos misijos gali sutrumpėti perpus

Surastas greitesnis kelias į Marsą: būsimos misijos gali sutrumpėti perpus

Agnė | 2026-05-01

Ekonomistas įvardijo 3 priežastis, kodėl Rusija galėtų pulti Baltijos šalis

Ekonomistas įvardijo 3 priežastis, kodėl Rusija galėtų pulti Baltijos šalis

Gynyba Ir Saugumas

Agnė | 2026-05-01

Saulės elektrinių parkai: kai stogo nepakanka visiems energijos poreikiams

Saulės elektrinių parkai: kai stogo nepakanka visiems energijos poreikiams

Technologijų Gidai

Partnerių | 2026-04-30

Neturite laiko sportui? Ši 10 minučių mankšta gali būti sprendimas

Neturite laiko sportui? Ši 10 minučių mankšta gali būti sprendimas

Rokas | 2026-04-30

Agnė Vaišnoraitė

Ryšių su visuomene magistrė, Technaujienos.lt redaktorė ir žurnalistė. Turite klausimų? Rašykite mums: redakcija@technaujienos.lt.

DIENOS SKAITOMIAUSI

3 ženklai, kurie išduoda apgaulingą el. laišką

Kibernetinis Saugumas

Rokas 2026-04-29
Prieš 1 d.
Mokslininkai paprašė DI sukurti biologinį ginklą – tai, ką gavo, sukėlė nerimą

Dirbtinis Intelektas

Agnė 2026-04-30
Prieš 1 d.
Pompėjoje DI atkūrė per Vezuvijaus katastrofą žuvusio vyro veidą: naujas požiūris į praeitį

Mokslas Ir It

Rokas 2026-04-30
Prieš 19 val.

LABIAUSIAI ĮTRAUKIANČIOS

DI lūžis jau arti: įvardijo, kada gali priartėti prie žmogaus sąmonės

Dirbtinis Intelektas

Agnė 2026-04-29
Prieš 2 d.
Didžiausi DI mitai, kuriais vis dar tiki žmonės

Dirbtinis Intelektas

Agnė 2026-04-24
Prieš 6 d.
5 telefono naudojimo klaidos, kurios tyliai gadina jūsų įrenginį

Išmanieji Įrenginiai

Agnė 2026-04-28
Prieš 3 d.

10

Taip pat skaitykite

Atrinkome panašius straipsnius, kurie gali jums patikti.

DI skubios pagalbos diagnozėse aplenkė gydytojus: kaip keisis gydymo kokybė

Dirbtinis Intelektas

DI skubios pagalbos diagnozėse aplenkė gydytojus: kaip keisis gydymo kokybė

Agnė | 2026-05-01

Ekonomistas įvardijo 3 priežastis, kodėl Rusija galėtų pulti Baltijos šalis

Gynyba Ir Saugumas

Ekonomistas įvardijo 3 priežastis, kodėl Rusija galėtų pulti Baltijos šalis

Agnė | 2026-05-01

Pompėjoje DI atkūrė per Vezuvijaus katastrofą žuvusio vyro veidą: naujas požiūris į praeitį

Pompėjoje DI atkūrė per Vezuvijaus katastrofą žuvusio vyro veidą: naujas požiūris į praeitį

Rokas | 2026-04-30

„Galaxy S26“ DI funkcijos gali pasiekti šiuos senesnius „Samsung“ telefonus

Išmanieji Įrenginiai

„Galaxy S26“ DI funkcijos gali pasiekti šiuos senesnius „Samsung“ telefonus

Agnė | 2026-04-30

Mokslininkai paprašė DI sukurti biologinį ginklą – tai, ką gavo, sukėlė nerimą

Dirbtinis Intelektas

Mokslininkai paprašė DI sukurti biologinį ginklą – tai, ką gavo, sukėlė nerimą

Agnė | 2026-04-30

DI lūžis jau arti: įvardijo, kada gali priartėti prie žmogaus sąmonės

Dirbtinis Intelektas

DI lūžis jau arti: įvardijo, kada gali priartėti prie žmogaus sąmonės

Agnė | 2026-04-29

Tyrimas: kas trečia nauja svetainė sukurta DI – ar galima jomis pasitikėti?

Dirbtinis Intelektas

Tyrimas: kas trečia nauja svetainė sukurta DI – ar galima jomis pasitikėti?

Agnė | 2026-04-28

Pasaulis ginkluojasi rekordiniu tempu: 2025 m. išlaidos pasiekė beveik 3 trln. JAV dolerių

Gynyba Ir Saugumas

Pasaulis ginkluojasi rekordiniu tempu: 2025 m. išlaidos pasiekė beveik 3 trln. JAV dolerių

Agnė | 2026-04-27

„Apple“ ruošia 6 visiškai naujus įrenginius: štai kas laukia

Išmanieji Įrenginiai

„Apple“ ruošia 6 visiškai naujus įrenginius: štai kas laukia

Rokas | 2026-04-24

Didžiausi DI mitai, kuriais vis dar tiki žmonės

Dirbtinis Intelektas

Didžiausi DI mitai, kuriais vis dar tiki žmonės

Agnė | 2026-04-24