...
TechNaujienos.lt
No Result
View All Result
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės
No Result
View All Result
TechNaujienos.lt
No Result
View All Result

Pradžia » Naujienos » dirbtinio intelekto modeliai » „OpenAI“ pristatė būdą apsisaugoti nuo dirbtinio intelekto „nepaklusnumo“

„OpenAI“ pristatė būdą apsisaugoti nuo dirbtinio intelekto „nepaklusnumo“

Parengė Agnė Vaišnoraitė
2025-03-11
tema: Dirbtinis intelektas
OpenAI pristate buda apsisaugoti nuo dirbtinio intelekto nepaklusnumo

„OpenAI“ paskelbė apie naują dirbtinio intelekto priežiūros metodą, siekiant kontroliuoti susirūpinimą dėl dirbtinio intelekto saugumo. Minčių grandinės (CoT – Chain of Thoughts) stebėjimas turėtų padėti užtikrinti sistemos samprotavimų skaidrumą ir patikimumą.

Pristatomas naujas dirbtinio intelekto priežiūros metodas

Kovo 10 d. bendrovė savo publikacijoje skelbia, kad „CoT“ pritaikymas leidžia stebėti, kaip dirbtinio intelekto modeliai suskaido sudėtingas užduotis į nuoseklias mintis, t. y. vadinamąją minčių grandinę. 

Šis metodas gali tapti vienu iš nedaugelio įrankių ateities modelių kontrolėje, siekiant išvengti dirbtinio intelekto nenuspėjamumo.

„CoT“ stebėjimo metodas kūrėjams leis analizuoti dirbtinio intelekto sprendimų priėmimo procesą, aptinkant jų daromas klaidas, tokias kaip vartotojų apgaudinėjimas, pasidavimas, kai problema yra per sunki ar patiriami kodavimo užduočių iššūkiai. 

Pavyzdžiui, kai kuriose programavimo užduočių scenarijuose dirbtinio intelekto modeliai gali ieškoti neleistinų būdų gauti geriausią rezultatą užuot ieškoję etiškų sprendimų, todėl „CoT“ turėtų padėti tai išsiaiškinti.

Naujovės vardan didesnio saugumo

„CoT“ samprotavimo modeliai „mąsto“ natūralia, žmonėms suprantama kalba, todėl toks stebėjimas leidžia lengviau identifikuoti netinkamą dirbtinio intelekto elgesį. 

Be to, tokiu metodu dirbtinio intelekto sprendimų priėmimo procesas bus nagrinėjamas žingsnis po žingsnio. Tai padeda užtikrinti stebėseną, kad modeliai elgiasi skaidriai ir jų veikimo logika yra suprantama.

Čia naudingi gali būti ir kiti didelių kalbų modeliai (LLM), taip pat ir GPT-4o. Jie gali būti naudojami kaip stebėtojai, kurie įspėja apie bandymus manipuliuoti sistema, pavyzdžiui, kai yra siekiama neteisingai gauti geresnius rezultatus programavimo užduotyse ar išnaudoti sistemos silpnybes.

Kontrolė gali turėti pasekmių

„OpenAI“ pažymi, kad didesnė kontrolė gali turėti ir tam tikrų iššūkių. Bene svarbiausi jų yra susiję su  modelių bandymu nuslėpti savo samprotavimus, o ne panaikinti žalingą elgesį.

Kitaip tariant, naujas „CoT“ metodas gali lemti tai, kad modeliai manipuliuos pateikdami atsakymus, t. y. jie atitiks žmogaus lūkestį, bet po jais slėpsis visai kitokie tikslai, kurie jau šįkart bus paslėpti ir sunkiai identifikuojami. 

OpenAI supranta kokios pasekmės ateina su šia rizika, todėl ši sritis dar bus ateities tyrimų centre.

Žymos: dirbtinio intelekto modeliaidirbtinis intelektasMinčių grandinėOpenAIsaugumas

Toliau skaitykite

Dirbtinis intelektas atskleide Biblijos tekstu autoryste

Dirbtinis intelektas atskleidė Biblijos tekstų autorystę

2025-06-11
Apple kritika dirbtinio intelekto modeliams teigia kad jie negaletu pranokti zmogaus galimybiu

„Apple“ kritika dirbtinio intelekto modeliams: teigia, kad jie negalėtų pranokti žmogaus galimybių

2025-06-10
LEGO zengia i kita lygi LegoGPT kuria konstruktorius tiesiog is teksto

„LEGO“ žengia į kitą lygį: „LegoGPT“ kuria konstruktorius tiesiog iš teksto

2025-05-30

Naujausios

Rusija nuteise A Navalno bendrazygi 18 metu laisves atemimo bausme

Rusija nuteisė A. Navalno bendražygį 18 metų laisvės atėmimo bausme

Parengė Rokas B.
2025-06-12
0

JAV stiprins oro gynyba D Trumpas pasirase isaka del virsgarsiniu dronu gamybos

JAV stiprins oro gynybą: D. Trumpas pasirašė įsaką dėl viršgarsinių dronų gamybos

Parengė Rokas B.
2025-06-12
0

Xiaomi elektromobilis debiutavo Nurburgring trasoje pranoko Porsche rekorda

„Xiaomi“ elektromobilis debiutavo „Nürburgring“ trasoje: pranoko „Porsche“ rekordą

Parengė Agnė Vaišnoraitė
2025-06-12
0

Mokslininkai ispeja ilgos darbo valandos gali pakenkti smegenims

Mokslininkai įspėja: ilgos darbo valandos gali žaloti smegenis

Parengė Rokas B.
2025-06-12
0

Mokslininkai rado atsakyma senejimo zenklu laikoma zilu plauku spalva gali buti atkurta

Mokslininkai rado atsakymą: senėjimo ženklu laikoma žilų plaukų spalva gali būti atkurta

Parengė Agnė Vaišnoraitė
2025-06-12
0

Oficialu Samsung pristato atsinaujinusia Galaxy Z serijos era

Oficialu: „Samsung“ pristato atsinaujinusią „Galaxy Z“ serijos erą

Parengė Agnė Vaišnoraitė
2025-06-12
0

Dirbtinis intelektas atskleide Biblijos tekstu autoryste

Dirbtinis intelektas atskleidė Biblijos tekstų autorystę

Parengė Rokas B.
2025-06-11
0

Mokslininkai ispeja dideja tikimybe kad asteroidas 2024 YR4 atsitrenks i Menuli

Mokslininkai įspėja: didėja tikimybė, kad asteroidas 2024 YR4 atsitrenks į Mėnulį

Parengė Rokas B.
2025-06-11
0

Senu licio jonu akumuliatoriu revoliucija mokslininkai sukure jiems injekcijas

Senų ličio jonų akumuliatorių revoliucija: mokslininkai sukūrė jiems „injekcijas“

Parengė Agnė Vaišnoraitė
2025-06-11
0

Neitiketinas pasiekimas Mokslininkai irode kad sviesa galetu buti sukurta is nieko

Neįtikėtinas pasiekimas: Mokslininkai įrodė, kad šviesa galėtų būti sukurta „iš nieko“

Parengė Agnė Vaišnoraitė
2025-06-11
0

Rodyti daugiau
Facebook Youtube

Technologijų inovacijos ir tendencijos vienoje vietoje. Susisiekite: redakcija@technaujienos.lt.

Ad Image
  • Apie mus, reklama ir kontaktai
  • Privatumo politika
  • Žurnalistikos gairės
  • Naudojimosi sąlygos

ℹ️ Draudžiama kopijuoti ir platinti Technaujienos.lt turinį bei nuotraukas be išankstinio raštiško sutikimo.

Kategorijos

  • Auto / Moto
  • Dirbtinis intelektas
  • Energetika
  • Gynyba ir saugumas
  • Išmanieji įrenginiai
  • Kibernetinis saugumas
  • Kosmosas
  • Kriptovaliutos
  • Mokslas ir IT
  • Vaizdo žaidimai
  • Verslas ir technologijos
  • #13527 (be pavadinimo)

© 2023-2025 Technologijų naujienos - Technaujienos.lt - Visos teisės saugomos.

No Result
View All Result
  • Mokslas/IT
  • Verslas
  • Dirbtinis intelektas
  • Energetika
  • Gynyba
  • Kosmosas
  • Išmanieji
  • Auto/Moto
  • Daugiau naujienų
    • Kibernetinis saugumas
    • Kriptovaliutos
    • Vaizdo žaidimai
    • Rekomenduojami straipsniai
    • Kiti straipsniai
  • Info
    • Apie mus, reklama ir kontaktai
    • Privatumo politika
    • Portalo naudojimosi sąlygos
    • Etikos kodeksas
    • Komentavimo taisyklės

© 2023-2025 Technologijų naujienos - Technaujienos.lt - Visos teisės saugomos.